【CS:GO】Leetify rating简介
码字不易,希望各位读者朋友点点关注,多多交流。今后会继续更新更多深度内容,往期内容请见文集:caivar的CS:GO数据分析。 转载本文或摘编本文内容需经本人同意。
一些值得回顾的文章:
【CS】什么是rating:https://www.bilibili.com/read/cv17386549
【CS:GO】赛事分级知多少:https://www.bilibili.com/read/cv17400536
【CS】什么是战队排名:https://www.bilibili.com/read/cv17456217
【CS】HLTV保姆级使用教程【上】:https://www.bilibili.com/read/cv17967780
【CS】HLTV保姆级使用教程【下】:https://www.bilibili.com/read/cv18212922
【CS:GO】科普:HLTV是如何评选TOP 20选手的?:https://www.bilibili.com/read/cv18659547
这篇文章比较枯燥,有兴趣的朋友可以了解一下内容,就不做视频了。
【本文约3500字】
当我们提到rating的时候,我们一般默认指代HLTV rating 2.0。不过用来描述选手表现的指标有很多,除了HLTV rating 2.0外,各大对战平台也有不同算法的rating。而本文则聚焦于Leetify——一个通过AI自动分析比赛并提供即时反馈的软件平台推出的Leetify rating。
1 Leetify rating的原理
为什么我要介绍这套在中文社区几乎没有任何知名度的评价体系?因为Leetify rating非常“科学”,它最大的特点就是通过选手的行为对团队经济和AI分析的获胜概率的影响来评价他们的表现。比起HLTV rating 2.0,它更加关心选手的行为能否帮助团队取胜。
Leetify rating解决了困扰HLTV rating 2.0的两大难题:首先,在HLTV rating 2.0中,选手很容易从“无效击杀”中获得漂亮的数据,这里的“无效击杀”包括面对装备简陋的对手的反eco回合击杀或者保枪时无法改变战局的击杀。而在Leetify rating中,这些“无效击杀”对获胜概率的影响微乎其微,因而得到很少的奖励。其次,HLTV rating 2.0过于关注谁完成了击杀,而对伤害助攻、闪光助攻和交换死亡(被击杀后队友完成补枪)的奖励很少或很机械。Leetify rating则采用更动态的方式奖励这些帮助完成击杀的行为。
有四个主要因素会影响Leetify rating。首先,这套评价体系使用“关键事件发生前后的回合获胜概率变化”来给出rating。回合获胜概率通过AI计算,取决于回合开始时两支战队的经济状况以及关键事件之前每支战队的存活人数。关键事件要么是产生击杀,要么是一回合在两支战队都有选手存活的情况下结束。如果获胜概率提高,选手获得rating,反之则失去rating。比如一位选手在2v3的情况下被击杀且队友完成补枪,由于赢得2v3的概率比赢得1v2的概率更高,所以在一换一之后,这位选手降低了战队获胜的概率,因而被扣除rating。使用获胜概率模型作为Leetify rating的基础的思路是,选手rating的增加或减少应当与他们的行为对战队获胜概率的影响成正比。所以应该考虑到战队的经济状况和存活的选手的数量,而不是像HLTV rating 2.0那样完全不考虑这些背景。
其次,将连续发生的击杀视为补枪链,并在给出rating之前评估击杀顺序的重要性。我们知道,一回合内的击杀情况并不是数次击杀的单纯组合,因为是否完成补枪非常重要。所以,每个回合可以被分解为数个补枪链,只要后一次击杀发生在前一次击杀结束后4秒内,它们就属于同一个补枪链。一旦4秒后没有发生另一次击杀,就会对当前补枪链的结果进行评估。每次击杀都会根据它与前一次击杀的时差进行加权,以计算这次击杀所获得的rating。为什么要采用这种加权算法?因为在补枪链中,获胜概率在每次击杀产生后会有很大的波动。如果孤立地评估获胜概率,选手可能会受到不公平的惩罚。举个例子,对于3v4的情况下迅速发生的一换一,哪一方先完成击杀并不重要,因为在两种不同情况的一换一之后都是2v3的的结果,获胜概率是一致的。如果单纯地计算获胜概率,这两种一换一对rating的影响会有很大的不同。
再次,根据对击杀的贡献来分配rating,而不仅仅奖励最终完成击杀的选手。Leetify rating细分了各种助攻类型,包括造成不同量的伤害、闪光助攻或者分散敌人的注意力让队友完成补枪。对于一次击杀,完成击杀者获得35%的奖励,制造伤害者为30%,交换死亡者为20%,闪光助攻者则为15%。在这里闪光助攻和游戏中的提示不同,包括选手投掷的自助式闪光,但不包括半致盲的情况。如果一次击杀没有上述所有情况发生,发生的情况将按比例增加权重使总权重为100%。例如,如果没有补枪,也没有闪光助攻,那么完成击杀者得到54%的奖励,而制造伤害者得到46%的奖励。一位选手可以同时是完成击杀者、制造伤害者和闪光助攻者。
最后,Leetify rating还会评估save的武器和装备对下一轮获胜概率的影响,以奖励保枪的选手。这很容易理解,因为选手save的装备增加了他们赢得下一回合的概率。
当然,Leetify rating还有非常多极其复杂的规则,力图从各个角度评估选手的行为对团队获胜概率的贡献。想了解更多关于Leetify rating的细则的读者,可以参考Leetify的博文https://blog.leetify.com/。
2 Leetify rating的应用实例
我们可以从两个实例来剖析Leetify rating的特点。首先是两次ace之间的比较,第一次ace出自EPL S14中FaZe对阵MOUZ,broky在反eco回合获得五杀。可以看到由于FaZe与MOUZ之间巨大的经济差,FaZe在开局时就有91%的获胜概率,故而broky看似华丽的ace只不过提高了9%的获胜概率,他得到的Leetify rating相当有限(8.94)。
反观HLTV rating 2.0的体系,broky的五杀就会被视作一次影响力巨大的多杀,得到极高的rating和impact rating奖励。最终broky在这张地图上的HLTV rating 2.0高达1.30,但他的Leetify rating则是并不令人印象深刻的2.06。那么Leetify rating和HLTV rating 2.0,哪个更贴近事情的真相呢?
另一次ace则来自refrezh著名的1v5。可以看到,同样是ace,refrezh的Leetify rating奖励达到惊人的93.25,与broky通过ace获得的8.94产生数量级上的差距。显然,Leetify rating更好地强调了refrezh的五杀的重要性。
但在HLTV的体系中,refrezh与broky的ace很可能并没有太多差别。一方面refrezh赢得残局会获得额外奖励,但broky也通过首杀得到额外的impact rating,而二人的多杀奖励又是相同的。结果是refrezh在这场比赛的HLTV rating 2.0不过是1.29。如果我们没有看到这场比赛,单纯地浏览数据,我们可能会以为他的表现与队友TeSeS相仿。
另一个令人感到意外的例子是PGL安特卫普Major。我们都知道rain在这届赛事的神勇发挥使他成为了最年长的Major MVP,他也是这届赛事HLTV rating 2.0最高的选手。但是在Leetify rating排行榜中,挪威人甚至没有进入前20名。位列榜首的选手是m0NESY,而在FaZe队内领跑的则是broky。
根据Leetify的统计数据,Leetify提名的4位MVP候选人是:
1. stavn:最佳团队协作、制造伤害能力和多杀能力。
2. m0NESY:最高的Leetify rating,特别是其T方Leetify rating甚至高于其他任何选手的CT方Leetify rating,同时提供极高质量的闪光助攻。
3. broky:几乎在每项数据上都排在前10位,尤其是补枪能力出色。
4. karrigan:他每次被击杀都价值连城,在最大程度上帮助了队友和团队经济。
我不敢判断Leetify rating给出的答案就是真理,但它提供了一种HLTV rating 2.0以外的视角,让我们从不同的维度来考量选手对团队胜利的贡献。
3 Leetify rating与HLTV rating 2.0的比较
Leetify rating在最近还引起了HLTV的关注。HLTV的编辑NER0专门对比了Leetify rating与HLTV rating 2.0,得到了一些有趣的结论。首先是AWPer(特别是保守的AWPer)和自由人往往会在Leetify的体系中得到更高的rating,而HLTV则更欣赏激进步枪手。
另一种在Leetify的体系中得到更多奖励的位置是小区防守者。我们经常诟病HLTV的体系忽视了他们的重要性,特别是考虑到他们扮演的角色相当困难。而Leetify rating通过对交换死亡的重视来提升interz和Xyp9x这样的选手的数据。还有一种角色——像JDC这样的回合中期的突破手也得到了Leetify的肯定,但在HLTV rating 2.0中,回合中期的突破自然与首杀无关,因而这类选手的贡献被忽视了不少。
下面的散点图则更加明晰地体现出Leetify rating和HLTV rating 2.0不同的“口味”。AWPer、自由人和辅助等相对保守的位置大多在趋势线的右下方,表明他们在Leetify rating中得到的奖励要高于HLTV rating 2.0。反之,位于趋势线的左上方的激进步枪手则因为他们的鲁莽而受到Leetify的惩罚。YEKINDAR和Patsi有远高于平均值的HLTV rating 2.0,但是他们的Leetify rating几乎为0,表明理论上他们的行为并没有提高团队的获胜概率。这听起来不可思议,但如果我们仔细想想二人的首杀尝试有何特点就可以理解为什么会如此:虽然YEKINDAR和Patsi的首杀尝试率离奇地高,但成功率徘徊在50%左右(分别为50.3%和49.8%),意味着他们因首杀尝试而增加或减少团队获胜概率的可能性是相当的。
为什么Leetify rating和HLTV rating 2.0对不同风格的选手的评价如此不同?NER0认为,这是因为HLTV的impact rating奖励了高风险高回报的行为(比如首杀尝试),而Leetify更倾向于鼓励选手去做持续增加获胜概率的行为(比如成功的补枪)。我们从一对老队友——YEKINDAR和Jame当中也可以认识到一部分原因。在HLTV眼里,YEKINDAR的正面效应来自于高影响力,负面效应则为低生存能力和低回合稳定性。至于Jame,他的高rating得益于高生存能力和高回合稳定性,但因为低影响力而受到惩罚。而在Leetify rating中,Jame的正面贡献得到了更多的肯定,可是YEKINDAR不但收获更少的正面贡献的奖励,而且遭到更多的负面影响的惩罚。
NER0还指出了很有趣的一点:许多人批评Jame等保守AWPer通过save来提升自己的HLTV rating 2.0,但是在Leetify rating中,保枪的奖励甚至变得更多了。这同样值得我们深思,在过去我们往往认为YEKINDAR这样充满侵略性的选手比起Jame更加“有用”,但在VP和Jame取得了巨大的成功之后,我们不应该继续忽视Jame代表的“理性的力量”。YEKINDAR很“有用”,没有人会否认这一点。但在强烈的视觉冲击力的背后,又有多少人注意到,当他在开局就白白死去时,Liquid会陷入何等被动的局面?
所以,NER0给出的最终结论是:我们不应当着迷于某一种评价体系,结合多种指标来评价选手才能得到更完整的图景。从散点图也可以看出,强者恒强,位于右上角的最优秀的选手(ZywOo、KSCERATO、m0NESY、sh1ro、NiKo和frozen等)的HLTV rating 2.0和Leetify rating都非常出色,他们的数据并没有因为游戏风格而遭到额外的损害。