为大型运动赛事押注乐趣不在钱,而是为看比赛添加一些无伤大雅的乐趣,博彩公司通常是雇用专业统计人员分析过去比赛结果资料库来量化各种配对结果可能性,再依据结果提供赔率。依据不同博彩公司的综合估算,大家最看好的是巴西,其次是德国、西班牙,但根据机器学习法估算,赢面最大的是西班牙。
麻省理工科技评论 (MIT Technology Review) 报导,德国多特蒙德工业大学 (Technical University of Dortmund) 研究人员结合机器学习与传统统计方法,称为随机森林 (Random Forest) 方式来预测赢家。随机森林方法可以避免其他资料挖掘方式的缺陷,是近年来受到瞩目的新兴分析方法。
研究人员对球队可能参加的每场比赛结果进行建模,并根据结果构建赛程的可能发展模式。研究人员先从可能决定结果的广泛潜在因素开始,这些因素包括经济因素,如国家的国内生产总值和人口、国际足球联盟的国家队排名,以及球队本身的属性,如他们的平均年龄,拥有冠军联赛球员的数量,是否拥有主场优势等等。
研究人员还纳入其他博彩公司的排名结果一起估计。将所有这些资料键入模型后,出现一些有趣的见解。例如,模型估计最具影响力的因素就是由其他方法估计的排名,包括来自博彩公司、国际足联和其他方面的排名。
其他重要因素包括国内生产总值和球队中冠军联赛球员的数量。不重要的因素包括国家的人口、教练的国籍等等。随机森林法将西班牙选为最有可能的赢家,机率为 17.8%。但是这个预测结果的关键在于赛程结构,如果德国赢得分组赛,在 8 强赛中很有可能遇到很强的对手,因此随机森林法计算德国进入 4 强赛的机会为 58%,西班牙队在 8 强赛遇到强劲对手机率较低,因此进入 4 强赛的机率有 73%。
如果双方都进入 4 强赛,赢面就五五波,但西班牙仍比德国略胜一筹,主要是因为德国在 8 强赛被淘汰的机率较大。但是研究人员模拟整个比赛 10 万次之后,依据最可能的赛程发展结果却是德国队将赢得世界杯,而不是西班牙队,但是因为比赛的排列组合数量太多,因此德国队要赢的赛程出现机率并不高,而以各种赛程发展机率平均而论,西班牙赢面较高。简而言之,在比赛开始的时候,西班牙获胜机会最高,如果德国队顺利进入 4 强,最后拿下胜利的赢面最大。
但是撇开机器学习技术不谈,Business Insider 总结 ESPN、体育画报、英国每日电讯报和卫报的专家,以及 Business Insider 邀请的专家小组认为,巴西队将赢得本届世界杯的压倒性胜利,原因就是他们一定会为了上一届在自己家乡输掉世界杯而努力雪耻。
(首图来源:Flickr / Crystian Cruz CC By 2.0)