當前位置:
首頁 > 新聞 > 大數據預測的世界盃冠軍是這支球隊!你信么?三

大數據預測的世界盃冠軍是這支球隊!你信么?三

大多數 「決策樹」 在後期都會因為不可靠因素過多而影響決策模擬結果的準確性,這些決策由於不一致和分散的訓練數據(training data)而失真,這種現象叫做 「過度擬合」(overfitting)。而 「隨機森林方法」 則通過多次計算隨機分支的結果來盡量讓結果準確。「隨機森林方法」 取多次隨機決策樹的平均值,以此繞過 「過度擬合」。

在這個研究 「到底誰能獲勝」 的模型里,有些考量的因素是我們能想到的,比如該球隊在國際足聯排名、球員平均年齡、球隊里有多少名球員在冠軍聯賽踢球等因素

除了這些明顯對預測結果有幫助的因素,這個模型還包含了一些看似無關緊要的因素,比如國家人口、國內生產總值、甚至包括執教教練的國籍

該團隊模擬了足足 10 萬次足球比賽,並根據 2002 年到 2014 年之前所有比賽的成績(數據可以說是很充分了),使用了三種不同的建模方法。

用這種方式預測出來的本屆世界盃冠軍是...

西班牙!

根據預測結果,西班牙奪冠的概率是 17.8%。如果說這個概率還不是很 「自信」 的話,這個預測說西班牙能衝進四強的概率則高出不少,足足有 73%!可以說是相當有信心了。

而這個研究對衛冕冠軍德國隊的預測是:

「能不能闖出小組賽難說,但如果小組賽沒被淘汰,德國隊進四強的幾率高達 58%。」

這讓小探想起一周前墨西哥 1-0 擊敗德國時,不論中外媒體幾乎都用了 「爆冷」 這個詞,這個結果倒是在一定程度上證明了這項研究有一定的準確性。

好在今天凌晨在德國隊 - 瑞典的比賽中,德國戰車終於發威 2-1 擊敗瑞典!這才是德國戰車的精神!!!德國球迷的心情終於也陰轉晴。

輸給墨西哥的德國:

贏了瑞典:

不過按照這種方法計算,中國男足來自一個人口眾多的國家(加分)、中國 GDP 也全球第二(加分),但連世界盃的門兒都摸不到... 難道這種模型不適用於中國男足?

當然,或許是中國男足的世界排名太低了,拉了這項預測的後腿。中國男足全球排名低到什麼程度了呢?這麼說吧,下次你再抱怨網速太慢的時候請牢牢記住,我們的網速世界排名都比國足要高

話說回來,如果機器學習的預測方法在此次世界盃上被證明很準確的話,恐怕會對賭球行業產生重大影響。小探奉勸大家一句:享受比賽、愛惜錢包、謹慎賭球...

說了這麼多,本屆世界盃你最看好哪支球隊奪冠?歡迎留言討論!

阿根廷:你們聊你們的,別管我...


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 矽谷密探 的精彩文章:

大數據預測的世界盃冠軍是這支球隊!你信么?

TAG:矽谷密探 |