在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用当前Q函数最大动作的概率越()
在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用当前Q函数最大动作的概率越()
A.大,大
B.小,大
C.大,小
D.小,小
正确答案:C
Tags:概率动作epsilongreedy
在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用当前Q函数最大动作的概率越()
A.大,大
B.小,大
C.大,小
D.小,小
正确答案:C
猜你喜欢