lecture2 part1-强化学习纲要 第二课 马尔科夫决策过程 上

AID:
CID:
视频图片:
作者头像:
弹幕地址:
视频描述:

热门回复:

  • SNII629:谢谢老师,让大朋友的心中少了许多小问号
  • 喜呀呀:失眠福利嘛
  • 梦逸清尘:支持!小船的例子很形象[呲牙]
  • 21Sandw1ch:老师30,31页的课件底部,下一步的value function的下标为什么是k-1呢?
  • 张有趣姑娘:贝尔曼方程推导的 Hint 里 R(t+3) 的系数好像写错了,应该没有平方

http://acg.ibilibili.com/cms/yirenzhixia/7.html