微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

257

机器学习系列报告之三:超越AlphaGo,自我学习规则的MuZero有何突破?-20210922-22页

# 机器学习 # AlphaGo 大小:1.73M | 页数:22 | 上架时间:2021-09-23 | 语言:中文

类型: 专题

上传者: YLY.sjz

撰写机构: 申万宏源

出版日期: 2021-09-22

摘要:

MuZero 自我学习规则,降低了对环境信息的依赖,具有更强的泛化能力。2020 年底,DeepMind 提出MuZero。MuZero 取得的一项突破进展是可以对规则进行自我学习,降低了对环境信息的依赖。在之前的几个版本中,应用场景主要还是棋类游戏。而MuZero在Atari 游戏中,也可以取得很好的效果。

 AlphaGo 成功地将深度神经网络、强化学习以及蒙特卡洛树搜索结合到了一起,通过深度神经网络和强化学习来指导蒙特卡洛树搜索。在训练过程中,基于监督学习方法学习策略网络的参数,再使用强化学习中的策略梯度方法进行优化。在对弈过程中,AlphaGo 基于大量自我对弈棋局,对策略进行评估,得到新的价值网络。

展开>> 收起<<

请登录,再发表你的看法

登录/注册

YLY.sjz

相关报告

更多

浏览量

(151)

下载

(6)

收藏

分享

下载

*

投诉主题:

  • 下载 下架函

*

描述:

*

图片:

上传图片

上传图片

最多上传2张图片

提示

取消 确定

提示

取消 确定

提示

取消 确定

积分充值

选择充值金额:

30积分

6.00元

90积分

18.00元

150+8积分

30.00元

340+20积分

68.00元

640+50积分

128.00元

990+70积分

198.00元

1640+140积分

328.00元

微信支付

余额支付

积分充值

填写信息

姓名*

邮箱*

姓名*

邮箱*

注:填写完信息后,该报告便可下载

选择下载内容

全选

取消全选

已选 1