把GPT-4接入我的世界科学家正在发掘AI的新潜力

而当系统生成了这个目标后,GPT-4就会自动生成实现目标所需要的代码,以此让角色完成相应的动作。

这个项目最创新的部分在于是用GPT-4来生成驱使游戏人物行动的代码,而AI的实现逻辑和人类一样,第一次尝试某个任务时难免会失败,但它会收集错误信息和游戏反馈,根据状况调整代码并最终完成任务。

随着游戏时间变长,Voyager建立了一个自己的代码库,以便更快速地建造游戏里种类繁多的道具,这种行为也可以理解为AI正在累计自己的游戏经验。研究人员将Voyager的游戏进度与其他人工智能代理做对比,结果发现Voyager获得的物品数量是其他AI的三倍,探索的距离、建造物品的速度也远胜其他对照组。

相同时间下,Voyager是最先做出钻石剑的

之所以选择《我的世界》作为测试GPT-4的试验场,是因为这款游戏自由度高且没有过于明确的目标,AI如果想做到“玩得好”,那就需要进化出一些和人类玩家类似的能力,研究人员总结了几个关键技能。

比如“根据其当前的技能水平和世界状态提出适合的任务”——当身处沙漠时,AI会考虑先收集仙人掌而不是铁矿。再比如“根据环境反馈改进技能,并将掌握的技能保存在记忆中”——作为敌人,僵尸与蜘蛛类似,那么打僵尸总结的战斗经验就可以用在蜘蛛上。

当然,教AI玩游戏,最终试图实现的目标还是在游戏之外,研究人员表示通过这种方式训练语言模型,将来或许可以使许多日常办公任务自动化,或者根据使用者提出的需求来自动实现某些效果。

不过虽然前景美好,该项实验依旧还停留在初期阶段,想真正把让你头疼的工作交给AI,或许还要等待一段时间。

参考资料:https://voyager.minedojo.org/