changed learner type for clarity (#83)

baedan · clearwaterturbulence · web-flow · commit 57a325e87ca6 · 2022-06-04T22:52:57.000+08:00
Co-authored-by: HU Xinqiao &lt;huxinq@gmail.com&gt;
diff --git a/notebooks/Chapter02_Ten_Armed_Testbed.jl b/notebooks/Chapter02_Ten_Armed_Testbed.jl
@@ -98,16 +98,14 @@ function bandit_testbed(
    env = MultiArmBanditsEnv(;true_reward=true_reward)
    agent = Agent(
 	   policy=QBasedPolicy(
-		   learner = TDLearner(
+		   learner = MonteCarloLearner(
 			   approximator = TabularQApproximator(
 				   n_state=length(state_space(env)),
 				   n_action=length(action_space(env)),
 				   init=init,
 				   opt = opt
 			   ),
-			   γ = 1.0,
-			   method=:SARSA,
-			   n = 0,
+			   γ = 1.0
 		   ),
 		   explorer = explorer
 	   ),