找考题网-背景图
判断题

强化学习的核心是在每个离散状态发现最优策略,以使期望的环境反馈奖赏和最大。

【参考答案】

错误
热门试题