A.获取观察状态B.环境C.奖励D.智能体
单项选择题下列()问题不适合用强化学习来解决。
A.棋对弈B.自动驾驶C.交通灯识别D.路径规划
单项选择题在强化学习模型中,对环境描述错误的是()
A.环境是客观存在的B.环境是主观存在的C.环境可以是真实的D.环境可以是反应真实的数学模型
单项选择题在强化学习模型中,输入Agent的是()
A.奖励B.动作C.环境D.观察
单项选择题选择研发框架的时候不是必须考虑的问题是()
A.生态B.技术栈C.授权方式D.框架研发者
单项选择题不属于PaddlePaddle优势的是()
A.开发便捷的深度学习框架B.超大规模深度学习模型训练技术C.多端多平台部署的高性能推理引擎D.部署平台单一,不好落地