快捷导航

DeepMind的AI再次打败人类玩家,“攻下”57款雅达利游戏

原作者: 人工智能 收藏 分享 邀请

AI打游戏会比通俗人优异?DeepMind给了必定的谜底。近日,DeepMind公布它们的智能体Agent57初次在一切57款雅达利游戏上逾越人类玩家。

人工智能图片

近年来,DeepMind一向在研讨进步智能体在游戏情况下的智能性,凡是环境下,智能体在游戏中可以或许应对的情况越庞杂,它在真实情况中的顺应才能也会越强。

此次Agent57应战的街机进修情况(Arcade Learning Environment,ALE)包罗57款游戏,为智能体的强化进修供给了庞杂的应战。

而之所以会选择雅达利游戏作为练习的数据集,DeepMind暗示雅达利游戏足够多样化,可以评价智能体的泛化机能,其次它可以模仿在真实情况中能够碰到的环境,而且雅达利游戏是由自力的组织构建,可以防止尝试成见。

据悉,Agent57在多台计较机上并行履行,并启用强化进修算法(Reinforcement learning,RL)驱动智能体采纳步履,使得嘉奖的结果最年夜化。此前,强化进修在游戏范畴就获得不少停顿,好比OpenAI的OpenAI Five和DeepMind的AlphaStar RL智能体别离打败了99.4%的Dota 2玩家和99.8%的星际2玩家。

人工智能图片

图 | Agent57的框架

雅达利游戏中的Montezuma、Revenge和Pitfall都很难,AI必需先测验考试多种分歧的战略,才干找到可行的方式。而在Solaris和Skiing游戏中,需求一段时候才干显示决议计划成果,这意味着AI必需在相当长的时候内搜集尽能够多的信息。

Agent57经由过程让分歧的计较机研讨游戏的各个方面来降服了这些困难,然后将搜集到的信息反应给一个节制器,由节制器对一切这些身分停止阐发以制订出最佳战略。

DeepMind将Agent57与以后最进步前辈的算法MuZero、R2D2和NGU做了比力,Agent57显示出了更高的均匀机能(100)。

人工智能图片

研讨团队暗示,“这并不料味着雅达利游戏研讨的竣事,我们不只要存眷数据效力,也需求存眷总体表示,将来的首要改良能够会是Agent57在摸索、计划和信度分派上。”好比削减AI运转的算力,在调集中的一些较复杂的游戏中变得更好。

Agent57在雅达利游戏中获得逾越人类玩家的成就,为我们构建加倍壮大的AI决议计划模子奠基了根本:AI不只可以主动完成反复性的使命,也可以主动推理情况。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

本文作者2020-4-3 11:42 AM
人工智能
粉丝1 阅读158 回复0

精彩阅读

排行榜

人工智能公众号

扫码微信公众号
我陪你畅想未来

最智能的人工智能网!
QQ:162057003
周一至周五 9:00-18:00
意见反馈:162057003@qq.com

扫一扫关注我们

Powered by Discuz! X3.4   © 2020 ( 鲁ICP备18055727号 )  |  |网站地图