德国世界杯称王实至名归,但本届世界杯恐怕仍然“输死人”,巴西在半决赛和季军争夺战的“神奇”表现,非但令球迷难以置信,运用精密统计模型预测赛果的数学天才,结局同样悲惨。
统计达人之惨
世界杯开锣前,投行高盛推出《2014年世界杯经济学》研究报告,从海量般的数据中寻找规律,利用统计模型对世界杯赛果进行量化分析。另一边厢,2008年于美国大选中一夜扬名的“统计达人”席尔瓦(Nate Silver),期间领导网站Five Thirty Eight对赛果不断进行评估预测。
老毕简略一看,高盛四强预测命中其三,巴西、德国、阿根廷无一落空,但最后一席却大跌眼镜。高盛取西班牙而弃荷兰,其统计模型显然棋差一着。然而,即使四强“算无遗策”,两支南美超强(巴西、阿根廷)碰上两支欧洲劲旅(德国、荷兰),数学天才通过海量数据计算出来的结果,跟茶餐厅边吃下午茶边大声聊球的街坊专家有何分别?
这样说并无贬意,理由是统计模型立足于历史数据,根据特定条件分配概率,像巴西一比七败于德国的赛果,模型是没法计算出来的。这种“黑天鹅”式赛果,虽不足以影响投行或席尔瓦预测四强的准绳度,却绝对可以颠覆根据历史数据推算出来的冠军之选。
巴西在半决赛一败涂地,席尔瓦一方面承认大大走眼(That prediction stunk!),另一方面不忘以数论数检讨“死因”。席尔瓦指出,根据Five Thirty Eight网站编制的预测系统“足球力量指数”(Soccer Power Index〔SPI〕),德军于一场赛事中射进七球或以上,概率仅0.022%,即万分之二点二或四千五百分之一。德国以六球或以上击败巴西,SPI显示的概率亦只有0.025%,即万分之二点五或四千分之一。两强对决而出现这样的赛果,再精密的统计模型只怕亦无用武之地。
德国跟阿根廷争冠军,赛前席尔瓦给予德军的胜算超过六成;德国封王,总算为他挽回一点面子。可是,由于在四强阶段押重注于巴西身上,意味着这位“统计达人”早在半决赛已断缆,冠军战“扳回一城”,安慰奖而已。席尔瓦预测世界杯赛果的成绩,显然不如2008和2012年两届美国大选般光芒四射。
却其实,高盛的统计模型建基于由匈裔美籍物理学家埃洛(Arpad Emrick Elo)开创并以其姓氏命名的系统“埃洛评分”(Elo ratings);而席尔瓦编制的SPI,跟“埃洛评分”的相关性甚高。世界杯开锣前,巴西评分在所有国家之上,高盛和席尔瓦的统计模型对巴西有“偏爱”,合情合理。
“埃洛评分”活引活用
世界杯乃众人之事,中国球迷肯定已从不同渠道接触到“埃洛评分”。“埃洛评分”本为客观评估国际象棋赛选手实力而开发,严格说并非专为预测赛果而设。这套计算法和评分系统后来被广泛应用于体育竞技以至电子游戏等层面,成为预测赛果统计模型的重要依据。
单以本届世界杯而论,老毕认为一位博主去年一文中(《下跌中穿梭》,2013年3月18日)留言中的一段话,分外有意思:“弱队对强队惨败,输在受气,评分输极有限……早几年足总请巴西来港打贺岁杯,一次过满足不止两个愿望(球员现场对巴西,球迷现场看巴西),大败赚经验之余,Elo评分不过减两分而已(双方评分差距太大),值!”
从这段引言可看出两件事:
一、贺岁杯一类国际友谊赛,对球队的“埃洛评分”足以构成影响;二、港队现场对巴西惨败,然则哪支球队于世界杯半决赛落得如此惨败的收场?这种“巧合”,对巴西未免太残忍了吧?
世界杯曲终人散,一个月来彻夜不眠看球的朋友,少不了依依不舍。然而,天下无不散之筵席,四年后又是一个循环。最后一提,德国封王后,“埃洛评分”增添150分,由赛前的2046分上升至2196分。这150分进账,半数拜巴西惨败所赐。更值得德国自豪的是,以世界杯冠军得主而论,德军手上的2196分乃史上最高,把1962年巴西冠军队所得的2153分压落第二位。
本届之前,历来“埃洛评分”最高的世界杯参赛队伍为1954年的匈牙利,该届准决赛胜出后,积分攀升至2166分,可惜决赛败于西德,评分见顶。
可以肯定,2018年德国必以顶头大热身份列阵世界杯,此刻春风得意的德军,会否重蹈本届世界杯开锣前“埃洛评分”高踞首次位的巴西和西班牙覆辙,拭目以待。幸而德国诸将年轻当打,主力球员年龄由22至25岁不等,四年后大勇大熟,能否卫冕言之尚早,惨败或分组赛拜拜的凄惨情景,于德军身上出现的概率估计有限。
本文版权所有:香港信报财经新闻
我来说两句排行榜