近年来,随着算力与深度学习算法的革命性突破,人工智能系统陆续在国际象棋、围棋和电脑游戏上展现出超越人类的智慧,甚至在被认为最具挑战性的即时战略(RTS)游戏之一《星际争霸2》中具备了战胜专业游戏玩家的决策能力。与此同时,人工智能所展现出的超强智能决策和协同进化能力,也为产业发展带来了颠覆性创新,驱动着人类向通用人工智能时代迈进。
过去60年中“人机对战”的大幕从未落下,游戏一直被作为评估与测试人工智能系统性能,探索人工智能技术创新的重要方式。日前,人工智能软件公司商汤科技SenseTime展示了基于原创游戏AI生产平台快速训练打造的,媲美专业玩家水平的《星际争霸2》AI智能体,并发布了其开源版训练平台DI-engine,它可有效帮助开发者高效训练出高智能水平的游戏AI。同时,商汤还将进一步开展针对更复杂场景多智能体RTS游戏的研究,面向更多游戏类型打造通用游戏AI平台,全面加速游戏AI的创新与应用,推动行业的跨越式升级。
基于商汤游戏AI生产平台快速打造人类大师分段水平的《星际争霸2》AI智能体
作为业界公认的具有超高游戏难度和公平竞技性的即时战略游戏,《星际争霸2》涉及多个智能体在复杂环境中的相互竞争和协调合作,由于不存在唯一的最佳策略,给设计AI玩家带来巨大挑战。在长达几十分钟的一局对战中,早期采取的任何策略都不代表能够在长时间的对决中获得回报,因此玩家必须良好地把握短期和长期目标,在宏观的局势发展上和微观的单体控制上做到绝佳的平衡。玩家还需要同时控制数百个不同的单位和建筑,多种多样的行动组合更是指数级增加了游戏的复杂性。
游戏AI进行对局
不仅如此,相比信息完整、逻辑性强的象棋、围棋等其他棋类,《星际争霸2》中的玩家信息是不对称的,属于非完美信息游戏,致使AI在对局的过程中存在大量隐藏信息,具有高度的不确定性。在这种挑战下,仅靠算力无法根本解决问题,需要更强的直觉、预测、推理、和模糊决策能力。这些都给打造出高智能水平的AI Bot带来极大的难题。
商汤科技积极探索决策AI的前沿趋势,打造了包含自研的游戏AI训练平台、生产工具、部署工具等组成部分的原创游戏AI生产平台,率先布局并研发了一系列前沿核心技术。基于游戏AI训练平台,商汤科技快速构建了出了一套大规模分布式游戏AI训练流程,让AI采用自我博弈的方式,同时进行大量对局。结合高效数据采集和多卡同步优化,利用最前沿的多智能体深度强化学习技术,AI在对抗中能够不断进化,最终实现能够战胜人类专业高手的对战水平。今年7月,基于《星际争霸2》的一个使用样例已通过DI-Star项目在GitHub开源。
从竞技体验到内容生成,商汤多元化赋能游戏产业
电子游戏技术日新月异,越来越逼真的画面和交互方式在不断刷新玩家认知的同时,也使得玩家产生了越来越高的要求和期待,给游戏的开发带来了更多挑战。商汤科技在深入游戏AI前沿研究的同时,还将全方位赋能游戏产业,凭借决策智能、内容生成、混合现实等原创AI技术能力,提升玩家的竞技体验,提高游戏开发者的创作效率,并携手合作伙伴探索打造全新游戏类型和游戏形态,为游戏产业发展赋予全新可能。
面向竞技体验,商汤依托大规模分布式训练能力推出的游戏AI训练平台,可帮助开发者高效训练出高智能水平的Bot和NPC,让AI成为人类绝佳的队友和对手。目前,随着游戏世界的复杂度越来越高,传统的算法将会成为Bot和NPC的瓶颈。商汤将在SenseCore商汤AI大装置海量算法和卓越算力的支持下,实现通用决策问题的训练,快速提升Bot和NPC的智能水平,为不同类型的游戏高效打造AI玩家。商汤游戏AI训练平台的推出不仅将带来更具多样化挑战的人机竞技体验,也能更好地辅助职业玩家的训练。
面向游戏内容开发,商汤将通过AI赋能游戏内容创作,实现从人工设计到自动生成的划时代革新。当前,随着游戏元素种类和复杂度不断攀升,超大规模的地图构建、海量的人物对话设计等工作,都会显著拖累游戏的开发效率。很多开发商受到人工成本和制作时间限制,导致游戏中经常存在大量的重复地图、样貌相同的NPC,不仅影响了游戏的品质,也大大降低了代入感。商汤科技自主研发的AI内容生成技术,可通过生成式对抗网络自动批量生产高质量、多样化的游戏地图、人物造型等游戏元素,从而帮助游戏开发者提升游戏整体的开发效率,在解决人工设计重复性劳动过多等难题的同时,还能释放更多的创造性。
商汤还将通过AI+MR技术的融合应用,打造基于“空间元宇宙”的游戏体验,让玩家以数字化身的形态,在虚实融合的数字空间中,与来自真实世界和虚拟世界的玩家跨时空交互。目前,商汤已携手多家知名游戏厂商,围绕基于空间元宇宙的全新游戏类型和游戏形式,展开了联合探索和尝试。未来,商汤科技还将举办人机对战比赛,打造开源社区,共建游戏AI创新生态,推动AI技术在游戏产业中的规模化应用。