《航海王热血航线》ai赋能游戏对战( 二 ) 字节跳动旗下游戏业务品牌朝

处变不惊：AI已经不再频繁的跑动，而是学会了静观其变，在关键时刻出手一击。并且，这一阶段的AI学会了位置上的压制，可以在移动中逐渐逼迫对手落入竞技场边缘以便最后的攻击
经过不断训练， AI能够在不断的自对弈中不断提升智能水平，发现很多新的技巧，逐渐成为一个绝世高手。然后我们通过延迟操作输出、减少连招次数、降低技能使用概率等手段划分出不同难度的AI ，提供给不同段位的玩家匹配使用。并且我们也将AI适配到不同的玩法之中，比如《航海王热血航线》中的烈焰对决玩法中的噩梦难度AI 。
00:16/00:56Loaded: 100.00%
从一开始的技术突破，到后来的在产品中落地使用，我们在这过程不断地积累经验、迭代模型、拓宽我们的技术应用，让AI能够更好地服务于产品。我们在打造新手陪玩AI、挫败温暖AI以此提升留存的同时，也会继续制作人机挑战AI等全新游戏玩法，让玩家体验人工智能的魅力，提升玩家游戏的乐趣。我们会在关注提升竞技性的同时，也会更多关注拟人性，提高玩家体验。
数值平衡性测试
数值平衡性对游戏来说，也很重要，我们在这个应用场景希望解决的问题是，不希望出现某个卡牌角色/某组角色组合阵容过于强大，出现版本通吃的情况（这会降低玩家对其他角色的养成，变相降低游戏收入），以及能为策划提供更有力的决策依据。
首先，回顾一下传统的平衡性测试流程：

文章图片

文章图片

跑大量的对局
这里通常要考虑战前阵容，这个数量非常大（全排列4,389,446,880种），传统的做法是，策划或者测试同学给出一些常见的阵容搭配或者某些搭配规则，将全排列数量降至几万种级别，然后两两对战100局。
自动战斗
在跑大量的对局中，对战过程需要决策，所以一般情况是策划配置行为树（后面简称BT），作为战中模拟玩家的决策。
战中数据记录
我们需要记录每局战斗过程中的关键事件/数据，比如击杀、增益buff次数、治疗量、抗伤量等等数据，以便后面做数据分析
数据分析
经过上面三部，有了大量的对局数据，就可以通过数据统计，分析出每个角色的一些数据，为策划提供决策依据。
从上面的过程中，可以看到，有两个地方有一定的弊端，一个是阵容选择，策划或者测试同学筛选出的阵容，未必是真正的强势阵容，可能会忽略掉更有潜力的阵容。二个是自动战斗AI ，使用BT编辑，通常策略较单一、简单，而无法发挥某些组合的真正能力。
为此，我们希望用强化学习，尝试解决上述两个问题，因为强化学习就是擅长决策最优选择去实现收益最大化，可以打出策划意想不到的套路。我们分为了两步来进行对比验证：
训练局内对战AI ，来代替BT
结论：【随机阵容+局内AI模型】vs【随机阵容+内置BT】前者平均胜率59% 。这个结论说明AI模型能力要强于BT 。
训练阵容选择AI ，来代替预先固定阵容
结论：【阵容AI模型+局内AI模型】vs【人工筛选强势阵容+内置BT】前者平均胜率96% 。结合第一步结果，能说明阵容的重要性，且AI更能发挥阵容/角色的能力。
所以，我们使用了这两个模型代替了阵容选择，和战中决策BT ，其他过程不变。在自研的某游戏平衡性测试过程中，我们做了个对比，发现一个有趣的现象：AI输出的结果中，某个定位前排角色，胜率较高，而传统测试输出他的胜率平平。后来发现是因为策划在配置BT策略的时候，有意的把一些稀缺资源，配置给其他角色，这样导致战斗过程中，这个定位前排的角色，拿不到稀缺资源，就无法发挥出应有的实力。

《航海王热血航线》ai赋能游戏对战( 二 )

推荐阅读

10ml双甲脒兑多少水，双甲脒对人有害吗

迷你世界如何制造巫术骨锤迷你世界如何制造巫术骨锤

西雅图在美国哪里

星际战甲国服狂战士哪里出

新麦45小麦品种介绍新麦45是高产小麦吗

七步成诗文言文翻译七步成诗文言文

侠客风云传打斗没动作是怎么回事? 《侠客风云传》无限切磋BUG解析攻略

csgo被永久封禁了怎么办 csgo怎么会被永久封禁

怎样给孩子讲解20乘以40

酣睡入梦的意思是什么酣睡入梦的解释

闪电侠以光速奔跑为什么他身边的人并没有变老

佛山由来

popkit是什么牌子

兰州西固区2023年高考报名须知兰州西固区2023年高考报名须知图片

舌头根疼是什么原因

含入学要求+咨询电话 2024重庆两江新区小学初中入学政策问答

夫妻共同房产认定标准是什么

饥荒打一字

为什么手机会自动调节亮度为什么手机会自动调节亮度红米

2024兰州红古区小学一年级录取结果什么时候出？