openai-doc openai doc 强化学习(RL)的关键概念 RL能做什么? 关键概念和术语 (可选)相关公式 这个教程旨在介绍强化学习,目的是使你了解以下内容: 强化学习中的术语和符号 强化学习算法的高层次解释(虽然会尽量避免) 算法中的核心数学内容