預測卡達世界盃冠軍,哪個模型更準確?

南方週末 發佈 2022-11-24T19:04:42.972410+00:00

現在,預測2022年卡達世界盃冠軍得主就是一個大熱門,各種各樣的機構、公司和個人都在預測,其間會摻雜大量的賭注和金錢。

11月20日,卡達世界盃吉祥物出現在開幕式上。 (新華社記者 蘭紅光/圖)

儘管這個世界的所有事件大多是測不準,但還是有人不斷預測未來人類生活方方方面的走向和結果。現在,預測2022年卡達世界盃冠軍得主就是一個大熱門,各種各樣的機構、公司和個人都在預測,其間會摻雜大量的賭注和金錢。

拋開賭博,哪一種預測更可靠?不約而同,人們會傾向於利用科學模型預測。現在,世界著名的計算機和信息研究機構阿蘭·圖靈研究所給出了一個預測,冠軍是巴西,概率為25%;其次是比利時隊和阿根廷隊,概率分別為19%、13%。

圖靈研究所的預測可靠嗎?這得看他們是依據什麼預測的。不過,這個團隊申明,「不建議投注我們的任何預測!」

圖靈研究所的預測團隊有3人,分別是尼克·巴洛博士,高級研究軟體工程師;傑克·羅伯茨博士,國防與安全應用研究中心高級數據科學家;陳瑞安,研究軟體工程師。

他們的預測是基於算法(統計模型),也就是研發了一個軟體艾爾塞納爾(AIrsenal)軟體,這是該研究團隊在 2018 年為玩夢幻超級聯賽而研發的。另外參考了1997 年的模型迪克森和科爾斯,這也是足球預測圈的經典之作,採用球隊進攻實力、防守實力和主場優勢的參數,並使用貝葉斯統計以計算比賽最可能的比分。

現在,研究團隊修改了艾爾塞納爾軟體,使其更適合預測國際比賽。這個軟體也成功預測了 2014 年和 2018 年世界盃結果,因此,研究團隊決定使用 2002 年世界盃以來的所有國際結果作為參數。同時,研究團隊最重視的權重是世界盃比賽,降低洲際錦標賽、預選賽和友誼賽的權重,也對最近的比賽給予更多權重。

研究團隊同樣採用了在各國國內聯賽中常用的計分方法,即為球隊提供防守和進攻得分的方法以預測比賽。研究團隊還調整了模型,以消除卡達本國球隊的主場優勢,以及在國際友誼賽中球隊之間的實力差異。

研究團隊採用他們的模型進行了10萬場比賽的預測後判定,巴西隊的奪冠概率為25%,其次是比利時隊和阿根廷隊,獲勝概率分別為19%、13%。目前英格蘭隊的勢頭相當看好,但圖靈研究團隊對其奪冠的預測只有10%。

除了圖靈研究所的團隊,國際上也有很多信息研究機構在利用算法進行世界盃結果的預測,一些研究機構的預測結果與圖靈研究所的預測相似。如奧地利因斯布魯克大學Achim Zeileis團隊的模型預測就與圖靈研究所的預測結果一致。Achim Zeileis團隊在超級計算機上運行的算法結果是,巴西是最終贏家,獲勝概率為15%。

但是,與圖靈研究所團隊預測結果相左的也有,如英國勞埃德保險公司的預測,他們利用的是不同的參數,即採用每個球隊成員的集體保險價值預測。根據這些參數,他們的預測結果是,英格蘭隊將在決賽中擊敗巴西隊奪冠。此前他們的模型也有成功的例子,該模型正確預測了德國在2014年贏得世界盃和法國在2018年世界盃奪冠。

另外,牛津大學馬修·彭(Matthew Penn)團隊設計的模型預測結果是,比利時最有可能奪冠。他們的模型正確預測了2020年歐洲足球錦標賽的冠軍義大利隊,以及8支進入1/4決賽中的6支隊伍。

圖靈研究所團隊的預測軟體吸引人的另一個優勢是,這種模型是開源的,個人也可以使用,以鼓勵更多的人參與。人們在自己家裡的電腦上就可運行。在普通筆記本電腦上只需運行15分鐘就可得到1000場比賽的預測結果。

不過,圖靈研究所團隊也認為他們的預測結果並非十分可靠,因為有很多因素他們並沒有考慮進去,這些數據要麼難以獲得,要麼無法獲得。

一是球星的作用。此前的世界盃有很多明星球員的巨大作用會左右比賽結果,如1986年的馬拉度納,1998年的齊達內,2002年的羅納爾多(巴西)。在賽前,這些明星的作用都難以預測到。因此,今年的比賽肯定有幾位明星的作用同樣會與此前的一些明星一樣,遺憾的是,最近和現在即便看到了這樣的球星,也難以預測,如法國的姆巴佩、荷蘭的范戴克等,至於C羅和梅西,已經是「美人遲暮」。

其二,一些球隊參賽的數據難以獲得。預測每年只參賽幾次國際比賽的球隊的成績,遠比預測每周有比賽的英超球隊更難。

點球大戰會讓冠軍結果有所不同,但是圖靈團隊並沒有收集點球大戰成功的歷史數據,而是採用了更簡單的方法,即在淘汰賽階段平局的情況下,為球隊分配50/50的機會晉級。

同時,天氣狀況也可能影響成績。雖然過去四屆比賽都是由歐洲球隊贏得的(2006年義大利,2010年西班牙,2014年德國,2018年法國),但直到2010年,所有在歐洲以外舉行的世界盃都是由南美球隊贏得的。卡達的炎熱天氣對巴西和阿根廷的影響大,還是對歐洲人的影響大,這也是難以建模並無法預測的因素。

所以,即便是利用科學模型預測,歸根結底還是概率問題。重要的是,不要以此結果為依據去進行賭球和投注。

張田勘

關鍵字: