找考题网-背景图
单项选择题

A.监督学习B.无监督学习C.半监督学习D.策略梯度强化学习算法中,用于优化策略的一种方法是:()。……

强化学习算法中,用于优化策略的一种方法是:()。

A.监督学习
B.无监督学习
C.半监督学习
D.策略梯度