首页>AI资讯>Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取

Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取

发布时间：2023-11-25 09:56:07 浏览量：1047

导语：在最新的《自然》杂志上发表的一篇论文中，研究人员展示了一种名为「游戏学习者」（Student of Games）的新算法，这一人工智能（AI）程序结合了引导式搜索、机器学习和博弈论，成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。与此前的 AlphaZero 算法不同，后者只能解决完全信息游戏（如国际象棋和围棋），而在像德州扑克这样的不完全信息游戏中表现不佳。

在最新的《自然》杂志上发表的一篇论文中，研究人员展示了一种名为「游戏学习者」（Student of Games）的新算法，这一人工智能（AI）程序结合了引导式搜索、机器学习和博弈论，成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。

与此前的 AlphaZero 算法不同，后者只能解决完全信息游戏（如国际象棋和围棋），而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍，实现在多种游戏中的胜利。

此项研究起初由 Google 旗下 AI 研究部门 DeepMind 的专家们进行，但随后几位团队成员于 2022 年 1 月离开 Google，并在今年 1 月 Google 解散了剩余的大部分团队成员。

Finbarr Timbers，目前在 Midjourney 研究实验室工作，同时也是该研究的作者之一，解释说：「我们的算法能够基于游戏规则进行推理。例如，它学习所有这些游戏（国际象棋、扑克、围棋或苏格兰场），仅仅通过规则，而不需要更多信息。」他继续说道：「由此，它可以确定您应该采取的行动，以及您是否获胜。」

「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说：「『遗憾』意味着『如果你进行了最优玩法，你本可以做得多好，减去你实际玩得有多好』。」

研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础，使其在大多数情况下找到最优策略。

「游戏学习者」算法作为一款由人工智能驱动的游戏算法，在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础，还能够随着计算资源的增加而提高性能。

上一篇：报告揭示：71%雇主或因缺乏AI知识而落后

下一篇：IBM在印度甘地讷格尔开设新的客户创新中心聚焦生成式AI

声明： 本站所有文章，如无特殊说明或标注，均为网友发布。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。