Keywords – reward policy and learning