DeepMind 新 AI 算法能在多种棋盘游戏取得胜利

站长之家 2023-11-24 17:32:01新闻资讯
61

在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一人工智能(AI)程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。

GOOGLE.webp.jpg

与此前的 AlphaZero 算法不同,后者只能解决完全信息游戏(如国际象棋和围棋),而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍,实现在多种游戏中的胜利。

此项研究起初由Google旗下 AI 研究部门DeepMind的专家们进行,但随后几位团队成员于 2022 年 1 月离开 Google,并在今年 1 月 Google 解散了剩余的大部分团队成员。

Finbarr Timbers,目前在 Midjourney 研究实验室工作,同时也是该研究的作者之一,解释说:「我们的算法能够基于游戏规则进行推理。例如,它学习所有这些游戏(国际象棋、扑克、围棋或苏格兰场),仅仅通过规则,而不需要更多信息。」他继续说道:「由此,它可以确定您应该采取的行动,以及您是否获胜。」

「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说:「『遗憾』意味着『如果你进行了最优玩法,你本可以做得多好,减去你实际玩得有多好』。」

研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础,使其在大多数情况下找到最优策略。

「游戏学习者」算法作为一款由人工智能驱动的游戏算法,在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础,还能够随着计算资源的增加而提高性能。

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

VMix:提升文本到图像扩散模型的交叉注意力混合控制
VMix是一种新颖的即插即用适配器,通过细粒度的美学控制显著提升了文本到图像生成模型的性能。其灵活的设计和强大的功能使其在个性化图像生成、艺术创作、商业应用和教育培训...
2025-01-18 新闻资讯
111

StructLDM:高质量、多样化三维数字人生成模型
StructLDM是一种从2D图像集合中生成3D人体的新型范式。它利用先进的深度学习技术和计算机视觉算法,从图像和视频中学习人体的高维表征,并通过结构化的自动解码器和隐空间扩散...
2025-01-16 新闻资讯
130

ViTPose:基于视觉变换器(ViT)的人体姿态估计模型
ViTPose 是一种基于视觉变换器(ViT)的人体姿态估计模型。视觉变换器最初由 Google Research 提出,用于图像分类任务,其核心思想是将图像分割成多个小块(patch),然后通过自注...
2025-01-15 新闻资讯
122

AudioLCM:浙江大学与阿里巴巴联合推出的高质量文本到音频生成模型
AudioLCM 是一种基于一致性模型(Consistency Models, CMs)和潜在扩散模型(LDMs)的新型文本到音频生成模型。该模型通过集成一致性模型到生成过程中,并引入多步常微分方程(mul...
2025-01-13 新闻资讯
129

HelloMeme:开源AI面部表情与姿态迁移框架
HelloMeme是一款开源的面部表情与姿态迁移框架,它利用先进的AI技术,特别是基于最新的Diffusion生成技术,实现了将视频中的人物表情和姿态迁移到静态图像中,生成个性化、趣...
2025-01-10 新闻资讯
139

站长如何利用AI工具高效的分析网站数据
在当今数字化时代,网站分析对于站长来说至关重要。它不仅能够帮助站长深入了解网站的表现,还能指导优化策略,提升用户体验和搜索引擎排名。随着人工智能(AI)技术的飞速发展...
2025-01-10 站长之家
176