霍夫曼的角色在影片结尾说,虽然我们一生都在从事棒球运动,但实际上,我们从来都不知道。
如果看这部电影的观众不懂棒球,很难理解这部电影里有多少话在说。比如霍夫曼说这话的时候,他一定已经明白为什么线性回归会帮助他们的团队——奥克兰a队。
我想说一下线性回归的局限性和人们的认知盲点。可惜图片不能用。麻省理工学院的教师课程用同样的数据重现了哈佛的主角保罗使用线性回归的过程。只是麻省理工没有用置信区间来得到区间。保罗和麻省理工的结果虽然接近真实结果,但还不够准确,不足以竞争竞技运动。
在棒球运动中,大部分得分来自上垒或跑垒,一小部分来自本垒打。高度相关的数据是基于基础的次数、基于基础的次数和分数。分数直接影响游戏的胜场数。
麻省理工用2011年之前的数据来预测2012年的数据,基地访问次数更接近实际情况。而保罗在垒数和胜场数上更为精准。这两个数据还表明,你得到的本垒打越多,你赢得的比赛就越少。真正重要的是防守率和进攻率。特别是第一点超越了所有球探和教练的经验,这也是霍夫曼在影片中最后一句话的意思。
让我们从本垒打开始。如果我们没有深入到细节,我认为一个人真的不能被事物的广度和深度所启发。
【点球成金 《点球成金》分析和解读】全垒打之间的负相关有两个原因。
首先,棒球有一种情况,一个完美的球员可以打出全垒打,球队就可以轻松赚钱。因为他们吸引眼球,尤其是成绩不好的球队,他们只会花钱买一个优秀的面糊,同时用它来制造一个悲伤的赚钱氛围。但是,一个表现不佳,花大量时间赚钱的团队,可以想象胜率有多高。
第二,球员打出全垒打后,虽然要看具体情况,但很多时候,球员的情绪很容易变得激动,很多时候不是好事。
但排除几率极小的本垒打,正常得分与命中率和防守率有关。大多数经理、教练、球探都没有意识到这一点。他们花太多时间为团队赚钱。
这个我知道。很多人笑。把时间花在这种事情上有什么不好?但是数据不会说谎,我们继续看数据。一个球队的赚钱能力是在一定范围内的,除非能同时开发棒球以外的新领域赚钱。Moneyball做的就是省钱。该团队通过使用技术极客节省了大量的一般侦察费用,并购买了更多符合其数据模型的玩家。这些玩家可能被严重低估,价格低廉。于是,奥克兰A队成为了同胜场数球队中唯一省钱最多的球队,也是同成本球队中胜场数最高的球队。奥克兰A的胜场数与影片结尾的“巨人”红袜队相同,但奥克兰A每年花费30万美元,而红袜队每年花费100万美元。
在棒球领域看到的问题和相关人员的解决方案中,发现大多数从业者忽略了与分数明显相关的确定性的东西。即命中率和防守率与基础率直接相关。这句话在日常生活领域很扯淡,但在统计领域很重要。
其实线性回归只能做一定的估计,学过这个学科的都知道数据不能过拟合。一旦加入太多的变量,确实看起来非常接近真实数据,但是对于未来已经无法预测了。还有一点就是比赛分为常规赛和季后赛,季后赛数据少,赛程短,基本上不可能用之前的任何数据都可以得到确定的结果。这些都是回归模型的局限性。
线性回归还有一个缺陷,就是把均值作为分析工具来确定情况,这是我们每天理解的平均值。例如,平均值是标准差和总偏差平方和的计算方法之一。均值在预测中非常弱。为了得到更准确的情况,回归分析也加入了中值和加权平均的概念,但实际上只是用更大的谎言来掩盖它们的谎言。
推荐阅读
- 《阴阳师:妖怪小班》即将上线,抓内鬼多是一件美事!
- 《2021年全球移动游戏玩家白皮书》,发掘移动游戏领域与TikTok间的新机遇
- 《英雄联盟》中哪些英雄被改版了?
- 《精英律师》:弱势群体的理论,真的很可怕
- 元气骑士五周年礼包码《元气骑士》五周年版本上线
- 《原神》4星角色培养满意度top8出炉
- 疑似《宝可梦传说阿尔宙斯》御三家偷跑画面截图
- 新作《战神:诸神黄昏》预计2022年推出
- 掀起《歪小子斯科特对抗全世界》热潮的主机游戏
- 《剑网3》新外观抄也抄抄好看的,老是揪着丑东西抄来抄去有意思