首页
在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
未来题库
→
百科
在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
A.大;小
B.大;大
C.小;小
D.小;大
正确答案:A
Tags:
概率
采用
动作
猜你喜欢
1.
WWW系统采用传输协议是()。
2.
本地域名服务器采用迭代查询获得结果,对其过程描述正确的是:
3.
8255A的A口工作在方式1时,一般C口采用位操作。
4.
采用8086CPU采用存储器映像编址,MIO#引脚可以省略。
5.
8255A的C口采用位操作时,无法读取C口当前状态。
6.
MSP430单片机的存储空间采用 ; 结构。
7.
目前广泛采用的喷射方式是()。
8.
汽车都采用12V电源供电。
9.
需要采用海氏急救法的是()。
10.
同一个关键词不同的匹配方式被展现的概率不同,展现概率由大至小顺序依次是()。