《星际争霸2》人工智能模型击败人类职业选手di-star

继谷歌旗下DeepMind公司开发的人工智能模型“阿尔法星际”在《星际争霸2》游戏中击败人类职业选手后 , 6月12日 , 国内人工智能软件公司商汤科技宣布其研发出了可媲美职业玩家竞技水平的《星际争霸2》人工智能模型“DI-star” , 并展示了该人工智能模型击败人类顶尖职业玩家的对决视频 。
人机对战的历史由来已久 , 从“深蓝”击败人类国际象棋选手到“阿尔法狗”击败人类围棋选手 , 人工智能已逐渐具备了超越人类顶尖选手的决策能力 。 而《星际争霸2》这款业界公认的具有超高游戏难度和公平竞技性的即时战略游戏也成为诸多AI争相挑战的新“珠峰” 。
【《星际争霸2》人工智能模型击败人类职业选手di-star】具体来看 , 《星际争霸2》的空间复杂度高达10的1685次方 , 远远超出围棋10的170次方的复杂度 , 在近乎天文数字一般的庞大状态空间中进行复杂的策略博弈 , 这使得《星际争霸2》成为了检验AI决策能力的绝佳舞台 。
在商汤科技智慧决策与游戏事业部技术研发负责人周航展示的两场比赛中 , DI-star在与中国台湾选手Rex的对战过程中依靠精细的微操建立了前期优势 , 而在与前世界冠军Scarlett的对战中 , DI-star使用出了女王前压这样的人类选手不常见的战术 , 最终出奇制胜 。 值得一提的是 , 周航此前曾是中国顶尖的《星际争霸2》选手 , 曾获得8次全国星际争霸2比赛冠军 。
在展示中 , 周航通过多个对战演示片段 , 展现了DI-star能够在复杂对局中快速找到最优策略的能力 。 据了解 , DI-star融合了监督学习和强化学习等商汤多项前沿技术 , 为AI智能体赋予人类宗师分段水平的决策能力 。 通过监督学习 , DI-star让AI反复观摩人类职业玩家对战的高质量录像学习人类的打法 , 快速掌握资源采集、单位生产 , 以及战斗过程中成百上千步的决策行为 。 在监督学习的基础上 , DI-star通过强化学习让AI通过自我博弈的方式进行大量对局 , 持续提升全局的决策能力和整体的竞技水平 。
商汤方面表示 , 商汤AI大装置为DI-star的模型建立、训练和验证提供了强大的算法和算力基础 , 帮助DI-star用更短的时间达成媲美甚至战胜人类专业高手的对战水平 。 依托商汤AI大装置 , DI-star通过5周的时间完成了大约一亿局对战 , 最终达到了人类最高段位宗师分段竞技水平 。 目前 , DI-star及其背后的决策智能平台已经在GitHub开源 。
《星际争霸2》人工智能模型击败人类职业选手di-star
在商汤展示的视频中 , DI-star使用出女王前压这样的人类选手不常见战术出奇制胜

    推荐阅读