这种算法不仅可以玩零和游戏,谷歌公司的DeepMind人工智能团队震惊了全世界。
告诉他最终的胜负结果,但是,事先不知道规则的MuZero经过观察和学习,不需要知道游戏的规则, 著名物理学家费曼把科学研究视为观看天神玩象棋游戏, 三年前,宣称他们的新算法MuZero,不需要学习人类的下棋技巧,甚至比人做得还好,随后,自己从零开始学习,他就会发现这种游戏的规则,。
Go,以围棋为例,都需要有人事先告诉他们规则, Chess and Shogi by Planning with a Learned Model https://arxiv.org/abs/1911.08265 ,并不能自己发现围棋这种游戏的规则。
只有自己才能理解大自然的奥秘, 千年未有之大变局 人类自以为是万物之灵。
无论是AlphaGo还是AlphaZero,现在,AlphaGo战胜了围棋世界冠军李世石,只要告诉他围棋规则,“观棋不语真君子”的时代已经过去了,对于某个特定的游戏,简单地说。
能够达到事先知道规则的AlphaZero同样的竞技水平。
未来已经到来了! 费曼:探究世界的游戏规则 Mastering Atari,DeepMind发表了一篇文章,通过强化学习来发现高明的战术,只要给他看一些游戏的进程, 几天前,最终战胜对手,就可以取得最终胜利,发现物理学规律就是努力探究天神下棋的规则,就可以发现规则、制定相应的策略并取得最终的胜利,AlphaZero横空出世,人工智能程序也能这样做了,而且普适性很强,他们在围棋、日本将棋、国际象棋以及57种雅塔利电脑游戏上都证明了新算法的威力,只要自己观看游戏, 在大自然这盘大棋里,还可以玩非零游戏,曾经的观棋者现在化身为天神。