当前位置: 答题翼 > 问答 > 大学本科 > 正文
目录: 标题| 题干| 答案| 搜索| 相关
问题

在Q-Learning中,所谓的Q函数是指()。


在Q-Learning中,所谓的Q函数是指()。

参考答案
您可能感兴趣的试题
  • Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。

  • 在Q-Learning中,所谓的Q函数是指A.状态动作函数B.状态值函数C.动作值函数D.策略函数

  • 在需求函数中 需求量 Q 是价格 p 的()

  • 补充程序Ccon062.C 使程序中的fun()函数用二分法在按从小到大排好序的数组a中查找q 若找到第一个q则返回对应的下标 没找到返回-1。

  • Q函数Q(s a)是指在一个给定状态s下 采取某一个动作a之后 后续的各个状态所能得到的回报的()。

  • 在Q-Learning中 所谓的Q函数是指A.状态动作函数B.状态值函数C.动作值函数D.策略函数