找考题网-背景图
判断题

AdaGrad方法学习率是所有梯度历史平方值总和的平方根的倒数,具有损失大的特性。

【参考答案】

正确