踏入了一个新的矿洞,你用火把照亮前方的黑暗,手上紧握着木制镐头的同时心中充满着期待。
又一个挑战即将开始,身为玩家的你清楚这不仅仅是游戏,这更像是一场探索未知的冒险,这是一种发自内心的呼唤,一种内在的渴望驱使你去构建、去创新、去探索——你正沉浸在《我的世界》中。
然而你可能并不知道这个游戏世界的另一面。这里此时已经成为了人工智能(AI)技术研究的一个试验场,此时“你”的身份,可能是名为“AI”的一行代码。
——是的,你没有听错,《我的世界》已经成为了AI研究者们的新蓝海。
就在最近,英伟达和国内的几家权威科研机构分别对于“AI玩我的世界”这件事发布了相关论文,并介绍了两位全新面世的AI选手。
第一位选手是英伟达最近开发的游戏AI智能体VOYAGER,它将目前大家聊得最火热的AI大模型GPT-4接入了《我的世界》,基于GPT-4的强大能力,它能够在《我的世界》里自主完成建造房屋、挖矿、应对敌人等等基本的一些生存技能,也可能进行开放式探索,去到不同的村庄神庙,哪怕要去的地方需要一个传送门,它也能轻松解决。
涉及论文的专业单词,獭水平有限,勉强翻一个标题出来给大家理解意思
“Voyager:具备大型语言模型的开放式代理功能”
第二位选手则是商汤科技联合清华大学、上海人工智能实验室等机构开发的Ghost in the Minecraft(以下简称为GITM)。它同样选择将大语言模型整合进《我的世界》,不过他选择的是LLM。
GITM在《我的世界》成功通关并解锁了完整的科技树——在这之前所有的AI成绩加一起也只能覆盖30%。值得一提的是在“获取钻石”这个任务上,GITM成功率达67.5%,相比于此前的最佳成绩——OpenAI的方法提高了足足47.5%。
“Minecraft 中的幽灵:通过具有基于文本的知识和记忆的大型语言模型为开放世界环境提供一般情况下的自动代理”
GITM的任务覆盖率远超同行
这个新赛道上的两位明星选手在这个“全新的”沙盒游戏中接受挑战,而他们的AI在不断地学习和进化,直到突破自我超越人类——事实上现在他们已经可以完成人类玩家能完成的所有游戏目标。
这时第一个问题出现了:为什么是《我的世界》?
《我的世界》与其他游戏最大的不同在于,这个游戏并没有一个设定好的主线任务,也没有什么一定要完成的目标。你可以在生存模式中自给自足,或者在创造模式中无拘无束地建造你的建筑或者世界。
比起固定规则的棋类游戏,或者是具有战略的对战游戏,像LOL和王者荣耀,《我的世界》的复杂程度和自由度更高,这对AI的学习和理解能力提出了更高的要求。
在DOTA2游戏中,AI曾向2018年TI8冠军队伍OG发起挑战
尽管是表演赛,AI仍旧展现出了强大的统治能力,全胜获得比赛胜利
王者荣耀kpl秋季赛上AI也曾和顶尖玩家组成的人类战队进行过测试
最终AI战队获得胜利
这就是为什么英伟达和商汤科技选择《我的世界》作为AI训练场地的原因,这款游戏的开放性和多变性,更加接近现实世界的环境,能够帮助AI更好地理解和适应各种环境变化,更深入地模拟和应对人类在复杂问题上的能力。
不过不是所有的开放世界游戏都适合训练AI,参与开发了VOYAGER的英伟达首席科学家Jim Fan回应了网友的疑问。《塞尔达传说 王国之泪》和《艾尔登法环》等游戏看上去虽然宏大,但因为研究者们很难用编程方式去控制游戏的高端控制台所以不太合适。
相较之下,《我的世界》的技术门槛更低,为AI训练创造了更友好的环境。
但有一说一,獭还真想看看AI玩王泪是什么样
那么AI在《我的世界》里究竟是如何学习和成长的呢?
以前,训练AI的主流方法是模仿学习和强化学习。举个例子,如果你想让AI学会挖矿,你首先需要给AI展示大量的挖矿视频,让它从中学习,然后再让AI实际上手操作,反复试错,从而真正掌握挖矿这一技能。这种方法就像是在给AI上一门一对一的“挖矿指导课”。
一名研究员通过“强化学习”训练AI驾驶车辆通过连续的弯道
但是VOYAGER和GITM的开发者们打破了常规,他们引入了大语言模型(LLM)作为AI训练的核心方法。
在这个方法下,AI的学习逻辑被完全重构。我们还是以挖矿为例,AI智能体首先会自我提问,然后自动生成许多小任务,例如找到能帮助挖矿的不同物品。然后AI会根据自己的实际操作和环境反馈,逐步建立起一个挖矿技能库。
以后再遇到挖矿任务,AI就可以直接从这个技能库中检索答案,而不需要像上面的赛车一样反复对着场地外面冲锋,因为AI早就已经知道“我到场地边缘会掉下去”。
如果这项技术可以普及,那么这种重复且利用率低的训练方式将会慢慢淘汰
也就是说这种大语言模型的训练方法可以让AI自主驱动探索,从而掌握更加广泛的技能。这也会让AI比起现在的形态更像一个“学习者”,可以在一个相对较长的时间跨度中,慢慢地获得、更新、积累和迁移所需要的知识。
而且这种方法还能缓解其他同类型的AI持续学习方法中的“灾难性遗忘”事件——通常这种事件被描述为这种情况:你训练了一个AI,但由于某些错误AI忘记了或覆盖了先前的调教,一切从零开始。
ChatGPT能给用户“有记忆”的感觉,是因为它每次对话时都会联系上下文处理
一旦超过了它能处理的长度限制,GPT的“记忆”也就不复存在
这一点就好像是把AI这个学生从学校里放到了真实的社会里,让它在实际的生活环境中学习与成长——这比纯粹的课堂学习要更加生动和有效,也让用大语言模型方法训练出来的AI更像一个真实的“人”。
事实上如果你留意的话就会发现,《我的世界》里的AI已经具有了很多人类的能力。
它能根据当前的环境和自身技能提出合适的任务,也可以根据环境反馈完善技能并将其存入记忆,它还能自我驱动,主动地探索世界,寻找新任务——这些都与人类的决策过程和行为方式非常相近。
AI可以应对各种生物群落、环境、白天或黑夜场景,即便遇到怪物也游刃有余
《我的世界》可能已经成为一个缩小版的现实世界,而AI正是在这个缩小版的现实世界中成长起来。
这个“成长”的周期可能比我们想象的还要长一点,尽管獭称《我的世界》是AI训练者们的新蓝海,但这只是指最近的爆发式的发表成果,早在2019年就有不少公司在这堆马赛克组成的开放世界里调教AI了。
那时候还没有崩的Facebook研发过一款《我的世界》专用AI 助手Craftassist Bot——一个智能协作式的管家机器人,它可以执行玩家指定的各种任务,如驯服马匹、建造村庄、与村民会面及交易等。
到了2021年,由哥本哈根信息技术大学、纽约大学和上海大学的研究者团队,也创建过一个使用3D神经元胞自动机(Neural Cellular Automata,NCA)的系统,并将这个系统架设在了《我的世界》里——它可以创造城市公寓、中世纪城堡等一些复杂的建筑。
这样看来,其实从AI概念被炒得火热的这两年开始往前看,这项技术与咱们打游戏的压根就没那么远,甚至不少游戏的诞生背后都有AI的身影。
獭向来是“AI工具论”的坚定成员,越来越强大的AI会促使整个行业向前行走。尤其是对于游戏开发者来说,AI的出现是一个技术和艺术的融合点。
技术上AI提供了一个全新的工具箱,允许游戏开发者创造出更丰富、更复杂的游戏内容,比如新的关卡设计、自动调整游戏难度,甚至模拟真实世界的物理和生态系统。
到时候可能就不需要打所谓的“光影包”了
在艺术上,AI则提供了一个全新的创作平台。例如,AI可以模拟出富有情感的角色,提供更深入的故事情节,甚至为游戏世界创造出独特的文化和语言。
土屋晓创造,出自RPG游戏《魔塔大陆》系列的“塔语”,就是一个完全原创的语言
但由于人造语言的限制,在游戏中该语言主要是作为诗魔法语言使用
AI的进步也能给游戏设计师提供了新的设计思路,我们可能会看到更多“智能”的游戏元素,比如可以自主学习和进化的NPC,或者可以根据玩家行为自动调整难度的游戏环境——而不是那种根据子弹与血量数据的简单调整。
生化危机7与生化危机4中都有类似的系统,玩家卡在一个场景时游戏会降低难度
这些新元素可以提供更丰富更个性化的游戏体验,也会让游戏的世界变得更加生动和真实。
再大胆点,AI也可能改变玩家的游戏方式——想象一下,如果你的AI游戏队友,它可以理解你的战术指令,了解你的游戏习惯,甚至预测你的下一步动作。这会让你感觉像在和真人队友一起游戏,也会给你带来更多的游戏乐趣和挑战。
整个老头环笑话,被AI气晕的场景每个玩家都经历过
说是这么说,AI作为好用的工具令人期待的同时,也为游戏制作者带来了挑战。
如何避免AI的行为过于机械、如何让AI的行为更符合游戏的主题和氛围、如何让AI的存在不破坏游戏的平衡性等等,都是游戏制作者需要面对的问题。尤其是如何在保护玩家隐私的同时利用AI提供个性化的游戏体验这种比较敏感的问题,也是一个迫切需要解决的矛盾点。
关于如何限制AI的发展,为了保护用户隐私禁止训练的公开信
包括马斯克在内的2300名业内人士签了字,并表示担忧——虽然獭觉得是老马急了
但咱们依旧有理由相信,尽管面临诸多挑战,AI的发展将推动游戏行业向更好的方向前进。
——尽管獭被劣质AI绘图搭配三流制作四流剧本的流水线AI游戏伤了一遍又一遍,獭依然这么相信着。
更多精彩内容请关注微信公众号:游戏水獭