機器學習預測奧斯卡最佳影片,《水形物語》將勝出?
第90屆奧斯卡頒獎典禮即將開始,十分令人期待。不僅在好萊塢,而且在美國乃至全球各地都將關注哪部影片獲得最佳影片。Thinkful決定利用機器學習、數據科學的力量來挑選勝利者。
Thinkful使用監督式學習在過去的結果中建模,以預測未來的模式,即今年獲獎的影片。Thinkful團隊的Adam Levenson表示,通過收集和清理大量數據來預測今年最佳影片獲勝者。從評論家到演員,Thinkful會搜索任何和所有公開提供的有關在過去n年中被提名為最佳影片的電影的信息。這些數據將有助於告訴他們使用SciKit Learn構建演算法。
SciKit Learn是一個開源工具,是全球最流行的學習工具包之一,用於在NumPy,SciPy和matplotlib上構建Python的機器學習。
Levenson指出,通過評估多個模型,我們確定隨機森林分類為以前的奧斯卡獲獎者提供了最準確的預測。隨機森林分類是一種機器學習方法,通過創建和評估決策樹來確定變數之間的關係。
作為一種機器學習方法,雖然並不是特別流行,但隨機森林分類經受了時間的考驗,它被用於地震預測,建模識別汽車司機等。
奧斯卡2018年預測使用了以下決策樹對9個提名的最佳影片應用一系列是/否問題:
Levenson強調,隨機森林分類器演算法認識到,隨著決策樹變得越來越複雜,他們傾向於選擇細微差別,並在被稱為捕獲噪音或過度擬合的過程中創建隨機性規則。因此,隨機森林不是製造大型複雜樹,而是製造許多小樹,並且變化很小,這使我們能夠找到更高層次,更一般化的規則。在過去38年中應用於奧斯卡獲獎者和失敗者時,這種方法在2017年的所有時間段之外的所有時間都做出了正確的預測。
如果你想知道機器學習預測結果話?請查看圖表,看看誰是領先的最佳影片,《水形物語》的可能性為0.47。《三塊廣告牌》有0.28的獲勝概率。
你覺得機器學習預測的是否准呢?
TAG:機器學習 |