當前位置:
首頁 > 最新 > 豆瓣評分9.9分的電影是什麼

豆瓣評分9.9分的電影是什麼

本文主要介紹:數據分布,概率,地圖,數據過濾器,列屬性及圖形生成器的應用。

數據來源:通過爬蟲收集豆瓣電影評分。

收集數據量:1500部電影。

數據截止時間:2018年3月27日 12:00

前幾天無意間聊起了電影評分,說起在豆瓣上評分超過9.9分的電影是什麼?對電影評分超過9.9覺得是一個奇葩存在,那麼豆瓣上有9.9分評分的電影嗎?

正好最近也想學習如何編寫一個爬蟲,去爬一些公開的數據,這正好是一個好的素材,於是就有了今天的分析。

首先我用爬蟲在豆瓣上爬了1500部電影的數據,樣本應該具備一定的代表性,淡然如果願意可以一直爬,但從數據分析角度,1500組左右的數據應該夠了(去除無效數據後分析)。

根據這些數據我們可以做如下分析:(分析軟體使用的是JMP)

9.9分的電影什麼

+

我們先關注第一個問題:有9.9分的電影嗎?如果有是什麼?

超過9.5分的神片,佔比是多少?

相反的,評分只有1分的電影有嗎?

1. 9.9分的電影是什麼?

從以上結果中,我們發現 了最大值為9.9分,這個作品是17年10月份上映的《藍色星球2》

這個片子有18465人評論,5星好評率超過94%,這組紀錄片讓我們看到了大自然造物的神奇,同時記錄了續多溫馨的瞬間。值得推薦。

2. 超過9.5分的電影佔比有多少?

我們了解到,如果豆瓣評分超過9分,就算是比較受歡迎的影片了。如果超過9.5分,那製片方是絕對可以拿出來顯擺了。

如果我們要查看9.5分以上的佔比,我們需要擬合一個分布。遺憾的是我們在擬合的時候並沒有發現哪個分布與這組數據接近。

與數據擬合最近的是3正態混合。你可以簡單理解為 爛片,正常片,神片,三組數據的混合

爛片的均值接近5分,正常片的均值為7分,神片的均值為8.5分。當然這種解釋聽起來比較合理,但似乎沒有什麼根據,同時也加大了分析的難度。

為了統計方便,我們採用比較接近的Johnson分布來計算概率,通過分析結果如下:(高於9.5分的概率)

高於9.5分的理論佔比不到1.6%(扣除超過10分的概率),而我們抽樣的數據裡面超過9.5分的僅僅只有0.57%。簡單來說好片100部才有不到2部,如果你一天看一部電影,三個月才能看到一部好電影,如果你一周才看一部,看到一部好電影的時間是2年,這也是你為什麼看不到好電影的原因。

用數據過濾器篩選出超過9.5分的電影清單如下:

不知道看什麼的小夥伴,可以按上面的清單看了。

3. 被評為最爛的影片是什麼?

從抽樣數據來看,最爛的片子是2.1分的是畢志飛導演的電影《純潔的心靈》

海報宣傳的是「神片送喜」,如他願,真成神片了。

就連泳衣的款式都被吐槽了,你覺得這款泳衣款式老嗎?

評分高低有地域差別嗎?

+

分值看完後我們看下豆瓣網友是否有地獄偏好,是不是外界傳言的國內多爛片呢。首先我們先看一張圖。(用所有影片按地區平均)

在這張圖中,大家對中國電影的評分屬於一般的水平,距離高水平還有一定的距離。

接下來我們看下在中國的影片與總體相比,在各個類型上是否一致?總體評分最低的類別是 戰爭片,最高的是記錄片。當然家庭,和犯罪類型的影片評分也同樣比較高。

而在中國大陸,排在倒數第一名的竟然是「愛情」,看到這個結果你以後還會看大陸導演拍的愛情片嗎?

評分最高的依然是記錄片,寫到這裡讓我們聯想到了《舌尖上的中國》。家庭穩居第二,第三名是脫口替代了犯罪,而犯罪影片的分類,在中國大陸影片的分類中消失了。

影迷喜歡吐槽還是喜歡讚美

+

當然並不是所有的觀影者都會在豆瓣上評分,也不是在豆瓣上進行評分的人都是觀影者,看了不評,評了不看肯定都是存在的。這些都不是我們討論的範圍。我們根據已知的數據看下「是爛片評價的人多,還是優秀的影片評價的人多」我們先看下規律:

對於5分以下的影片,評論人數很少有超過10萬的,而對於6分以上的影片則評論人數明顯增多。最多的評論達到了62萬(砰然心動),並且評分還是比較高的

這裡讓我們思考一個問題:是因為評分高了大家才去看的嗎?而對評分低的影片直接選擇忽視?

毫無懸念,在中國大陸影片中,收穫評論最多的是戰狼2,當然,也是票房最高的影片之一。

當你不優秀的時候,連獲得吐槽的機會都沒有,因為大家都很忙。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 時說 的精彩文章:

TAG:時說 |