谷歌 DeepMind 推出 SIMA,这是第一个在广泛的 3D 虚拟环境和视频游戏中遵循自然语言指令的通用人工智能 AI 代理
阿吉耶
长期以来,人工智能一直是一个技术前沿,追求能够导航和理解三维环境中的复杂性,同时轻松灵活地适应它们是一个长期目标。 这种探索是由创建人工智能代理的愿望驱动的,这些代理不仅能够理解他们的环境,而且能够遵循用其创建者的语言表达的复杂命令。 研究人员正在通过在数字世界中连接口头抽象命令和动作来将人工智能推向极限。
谷歌 DeepMind、不列颠哥伦比亚大学和微软的研究人员正在研究可扩展、可指导、多世界代理 (SIMA),这是一种革命性的人工智能框架。 这不是另一个人工智能工具,而是一个允许人工智能代理在各种模拟 3D 环境中接受训练的系统。 这些范围从精心设计的研究实验室到广阔的领域和商业视频游戏。 SIMA 的通用应用程序使其与众不同。 它几乎可以在任何环境下理解并遵循指令。 这一功能可能会彻底改变每个人与人工智能交互的方式。
创建一个能够理解自然语言给出的指令并采取行动的多功能人工智能系统并不容易。 人工智能系统经过训练可以在特定环境中工作,这限制了它们适应新情况的能力。 SIMA 的创新方法使其成为游戏规则的改变者。 SIMA 可以通过在虚拟环境中进行训练来学习执行多项任务。 它能够将语言指令和适当的动作联系起来。 它提高了人工智能的适应性,并加深了其在不同 3D 环境中的语言知识。
来源和详细信息:
https://www.marktechpost.com/2024/03/16/google-deepmind-introduces-sima-the-first-generalist-artificial-intelligence-ai-agent-to-follow-natural-language-instructions-in-a-broad-range-of-3d-virtual-environments-and-video-games/