werner-duvaud · egafni · Feb 22, 2020 · Feb 23, 2020 · Feb 23, 2020 · Feb 27, 2020
diff --git a/games/cartpole.py b/games/cartpole.py
@@ -178,12 +178,17 @@ def close(self):
         """
         self.env.close()
 
-    def render(self):
+    def render(self, mode="rgb_array"):
         """
         Display the game observation.
         """
-        self.env.render()
-        input("Press enter to take a step ")
+        if mode == "default":
+            self.env.render()
+            input("Press enter to take a step ")
+        elif mode == "rgb_array":
+            return self.env.render(mode="rgb_array")
+        else:
+            raise ValueError(f'{mode} is not a valid mode')
 
     def action_to_string(self, action_number):
         """

diff --git a/muzero.py b/muzero.py
@@ -362,6 +362,8 @@ def test(
             num_tests (int): Number of games to average. Defaults to 1.
 
             num_gpus (int): Number of GPUs to use, 0 forces to use the CPU. Defaults to 0.
+
+            render_history (bool): whether to store a history of the rendered environment
         """
         opponent = opponent if opponent else self.config.opponent
         muzero_player = muzero_player if muzero_player else self.config.muzero_player