您的位置:首页 >原创 >

新的人工智能系统可以实现最大的吃豆人得分

科学家,包括印度血统之一,已经开发了一种新的人工智能 (AI) 系统,可以在流行的视频游戏吃豆人上实现999,990的最大可能得分。来自加拿大初创公司Maluuba的团队使用AI的一个分支称为强化学习,完美地玩了20世纪80年代街机游戏《吃豆人》。

加拿大麦吉尔大学副教授Doina precup表示,这是AI研究人员的一项重大成就,他们一直在使用各种视频游戏来测试其系统,但发现吃豆人是最难破解的。

为了获得高分,该团队解决了将吃豆人掌握成小块的大问题,然后将其分配给AI代理商。

这种轻取和征服的方法可能对教AI代理执行增强人类能力的复杂任务具有广泛的意义。该方法类似于有关大脑如何工作的一些理论,并且可能对教AIs在有限的信息下完成复杂任务具有广泛的意义。

Maluuuba团队称之为混合奖励体系结构的方法使用了150多个代理,每个代理都与其他代理并行工作,以掌握吃豆人。

例如,一些特工因成功找到一种特定的药丸而获得奖励,而另一些特工则被要求远离鬼魂。

然后,研究人员创建了一个顶级代理商-有点像公司的高级经理-他接受了所有代理商的建议,并利用它们来决定将吃豆人搬到哪里。

顶级代理商考虑了有多少代理商主张朝某个方向前进,但也考虑了他们想要采取这一行动的强度。

例如,如果100特工想向右走,因为那是通往他们的药丸的最佳途径,但是三个人想向左走,因为右边有一个致命的鬼魂,这将给那些注意到鬼魂并向左走的人带来更多的负担。

Maluuuba的项目经理Rahul Mehrotra说,弄清楚如何赢得这些类型的视频游戏实际上非常复杂,因为您在玩游戏时会遇到各种各样的情况。

Mehrotra说: “许多从事人工智能工作的公司都使用游戏来构建智能算法,因为有很多类似人类的智能能力,你需要击败游戏。”

相关推荐

猜你喜欢

特别关注