未来题库

强化学习Agent的唯一目标就是最大化在长期运行过程中收到的总奖赏。（）

2023-12-25 26次阅读

奖赏最大化强化

强化学习Agent的唯一目标就是最大化在长期运行过程中收到的总奖赏。（）

A.正确

B.错误

正确答案：A