主页 > 产品中心 >

人工智能论坛:AlphaGo团队分享技术细节

时间:2017-05-24 09:27

来源:未知作者:admin点击:

  5月24日,人工智能高峰论坛在浙江桐乡举行。AlphaGo团队向大家分享技术细节。
  大卫席尔瓦:介绍AlphaGo算法。
  为什么选择围棋?它是人类最古老、研究最深入的游戏;是构建理解运算的最佳试验台;人工智能面临巨大挑战:游戏大至可以进行穷举搜索。
  我们利用卷积神经网络来实现,原版AlphaGo有12层,Master有40层。我们用策略网络和价值网络来解决问题,策略网络进行落子选点,价值网络进行评估。通过人类棋谱来进行监督式学习,调整参数来达到理想效果,通过策略网络来进行强化学习,自我对局成千上万盘,通过价值网络来评估,预测每一步棋后终局的输赢。
  如果用穷举搜索,范围实在太大,我们需要简化减少搜索量,通过策略网络来聚焦几个有可能的选项,用价值网络来降低搜索深度。就是AlphaGo的树搜索,从树根开始,一个搜索基础上加上一个新搜索,最终把结果提交给树顶。这个过程会重复成百上千次,直到发现哪一步赢棋概率最高。AlphaGo Lee在谷歌云上有50 TPUs在运作,搜索50个棋步为10000个位置/秒,于2016年在首尔大败李世石。
【责任编辑:admin】
热门文章 更多>>