首页 / 百科 / 内容详情 在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。 2022-03-31 3次阅读 概率 采用 动作 在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。 A.大;小 B.大;大 C.小;小 D.小;大 正确答案:A 在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。 在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()。 猜你喜欢 同一个关键词不同的匹配方式被展现的概率不同,展现概率由大至小顺序依次是()。 虽然创业活动通常由团队开展,但是创业团队规模大小完全不会影响到创业成功的概率。() 同样好的商业机会对不同的创业者或创业团队而言,创业成功的概率都一样。() 回复突变发生的概率很低。 贝叶斯网络会模拟所有事件的概率。