當前位置:
首頁 > 最新 > Facebook效應:流量生意背後有哪些數據邏輯-上篇

Facebook效應:流量生意背後有哪些數據邏輯-上篇

文/Weijie Deng

在 facebook 上的曝光重要麼?是的,很重要,它幾乎讓對應話題在維基百科頁面的搜索率翻了一倍,讓「交口相傳」,變成了「爭相搜索」。

2018年2月21日,美國網紅 Kylie Jenner 在個人推特上發帖:「是不是大家都不再打開Snapchat了?還是只有我… 呃這真令人悲傷。」

在這條推文發出後24小時內,Snapchat 的股價大跌6%,大概抹去16億美元市值。

(圖片說明:凱莉·克莉絲汀·珍娜是一位美國電視名人、模特兒她第一次出現在螢光幕是在美國E!頻道的真人秀《與其卡戴珊姊妹同行》,右為她的推特原文;圖片來源:推特)

Kylie Jenner的推特有約2500萬粉絲,單單這一條推特就得到了超過37萬點贊和將近7.5萬次的轉發。她的這條轉發,就是社交媒體吞噬商業運作的縮影——這些行為有時可以帶來巨大利益,而有時,就像發生在Snapchat身上的那樣,會帶來巨大傷害。

在我的項目中,我嘗試研究兩個問題。第一,在社交媒體上流行的事情會帶來什麼影響?以及,如何提高一件事情在社交網路上流行起來的可能性。我選擇的研究對象是最大的社交媒體公司——Facebook。

這一話題我將分為上下兩篇來寫,在這篇文章中,我將集中研究一家公司在 Facebook 上獲得的曝光所帶來的影響。

各類公司一直在撰寫內容、分享鏈接以及評論帖子,以期提高自己在 Facebook 的曝光度,進而提升自己的受歡迎度。但曝光增加帶來的真實影響究竟是什麼呢?

研究這一問題的最好方式,就是看一看 Facebook 平台上的 「Trending」 列表,這是 Facebook 用戶閱覽最多的部分。2014年,Facebook 在主頁增添了 「Trending」 的功能,將用戶們正在討論和分享的話題以列表形式展示出來。

決定這一列表的真實演算法是怎樣的,在我這一項目中並不重要,不可否認的是,進入 Trending 列表的話題會被所有2億 Facebook 用戶(至少在美國是這樣)看到。

所以,如果能找到一種方法來衡量一件事出現在 Trending 後帶來的影響,那麼我們就可以了解在 Facebook 平台的曝光有多麼重要。但這不簡單。除非是 Facebook 僱員或支付一筆費用,否則一般很難知道確切的單個帖子的點擊量。我需要公開的而且直接與之有關的信息。所以我轉向維基百科。

在 Facebook 上流行的話題有一個共同模式,就是人們在之後會希望了解關於它的更多信息。比如,一個演員在 Facebook 上因為結婚或捲入一場醜聞而流行起來,我的第一反應就是去獲取更多信息。根據谷歌的公開說法,當一個人被搜索時,10次中有9次第一個彈出的結果是他的維基百科頁面。

所以,如果我可以將 Facebook 的 Trending 與維基百科的閱讀情況建立顆粒級的關聯,我可能就得到一個研究 Facebook 流行效應的很棒的方法。更棒的是,維基百科會公布每個頁面的每小時閱讀量。

(圖片說明:facebook 中的 Trending 板塊)

所以,我記錄下了從1月30日到2月5日一周的 Facebook 的 Trending 數據。

抓取時間為美東時間每天早上8點,這是 Facebook 用戶最活躍的時間點之一。其次,我下載了同一時間段維基百科各個頁面的每小時閱覽量。

接下來的工作就是將這些數據進行準確結合。

維基百科頁面數據的下載和整理耗費不少時間,這包括:首先,撰寫一個腳本來自動下載維基百科上對應的數據;其次,使用正則表達式將facebook上的流行話題轉為一個獨有字元串,以對應它的維基百科頁面;然後,建立一個循環,完成下載,按照當日Facebook的Trending情況對這些數據進行分類,然後再將每個文檔按照一個組織好的層級結構進行組合。

最終,基於一周的 Facebook Trending 數據,我得到1200多觀測數據。

所以,一個話題在 Facebook 上的流行,會影響它的維基百科頁面閱讀量么?

讓我們來看看結果。

從上圖來看,好像是的。y軸是閱覽量,x軸是一天的不同時間段(對應的圖上的點代表這一時刻的累積閱覽量),藍色線代表一個話題在 Facebook 上流行,黑色線代表流行的話題的平均維基百科頁面瀏覽量。可以看到,藍色線以後,黑色曲線有一個陡增的變化,這說明:一個話題流行後閱覽量急劇增加。

然而,聚合圖會模糊每個具體話題的獨特情況,因此我製作了每一個話題對應的曲線圖。

總的來看, 可以看到,一個在Facebook上流行的話題,會在維基百科上也出現瀏覽量的激增,幾小時後才掉頭向下。幾個很突出的例子包括:

對這些不同話題的表現上的分析則更加有趣:

(圖片說明:紅色表示政治話題,綠色表示流行文化話題,藍色表示體育話題)

我們把 Facebook 的流行話題進行分組,劃分為三類:政治、流行文化和體育,整體上維基百科的閱覽增長趨勢是相似的。然而,體育類話題與其他有明顯區別:它在Facebook上流行後,在維基百科上閱覽了增加的最快,而當風潮過去,它的回落也是最劇烈。所以,Facebook帶來的效應對各種不同話題還是不同的。

那麼,這些不同影響的程度有多大?我做了兩個分析。首先,我製作了一個話題在流行前後維基百科每小時頁面瀏覽量變化的箱線圖,接下來,我對它們進行了T檢驗(即用T分布理論來推論差異發生的概率,適用於這種樣本含量較小的情況)。

結果顯示,當p值小於0.001時,流行後的維基百科瀏覽量的平均值比流行前要高很多。

不過,儘管如此,T檢測並不說明在 Facebook 上流行就是維基百科瀏覽量變化的唯一原因。下面就是一個可以用來反駁的假設關係:

我們假設的關係是:

(圖片說明:真實事件發生——在Facebook Trending流行起來——維基百科瀏覽量變化)

一種可能的反駁為:

(圖片說明:真實事件發生——在Facebook Trending流行起來(上);或者,維基百科瀏覽量變化(下))

所以要弄清楚這一點,我們可以進行一個思想實驗。其中,實驗組(treatment group )就是我們所說的邏輯:現實世界發生了一件流行的事件,之後 Facebook 上也引發討論。而控制組則是,現實世界發生了流行事件,但 Facebook 上並沒有流行起來。當我們使用觀察數據從而讓兩者可控時,這樣的任務是可以完成的。

另外,我們還可以讓兩個對比組只改變一項變數:在 Facebook 上流行。

當然,我們無法直接操控一個事件是否在 Facebook 上流行,但是我們可以用另外一種方法替代:拿在 twitter 上流行但並未在 Facebook 上流行的事件做對比。2017年1月 Facebook 對流行話題的演算法進行調整,此前備受批評的千人千面,改為同一地區的用戶會看到同樣的流行話題。因此,如果我們可以拿到 Twitter 流行話題的歷史數據,就可以進行對比。

於是我重新收集數據。我爬取了收集記錄 Twitter 流行話題的網站 trendogate.com 的數據。我在時間上選擇了 facebook 調整演算法前兩周的數據,以讓它們更加有可比性。

之後我再次對對應的維基百科瀏覽量做了相似處理。兩者對比分析得到下面這組圖。

我也再次進行了相同的T檢測,結果顯示當p小於0.05,平均值方面就會區別不明顯。

因此,對比 Facebook 的實驗組,可以說明,話題在 Facebook 上流行會給他對應的維基百科界面瀏覽量帶來明顯提升,但 Twitter 上流行則並不會帶來明顯變化。

因此回到最初的問題:在 Facebook 上的曝光重要麼?是的,很重要。它幾乎讓對應話題在維基百科頁面的搜索率翻了一倍。

那麼問題來了,既然引爆社交網路這麼重要,那麼我們為了「製造流行」,我們究竟應該做些什麼呢?敬請期待下篇的解答。

註:本文翻譯自技術博客《The Facebook Effect。內容僅為作者觀點,不代表DT財經立場。


▍關於DT×NYCDSA

DT×NYCDSA是DT財經與紐約數據科學學院合作專欄。紐約數據科學學院(NYC Data Science Academy)是由一批活躍在全球的數據科學、大數據專家和SupStat Inc. 的成員共同組建的教育集團。


▍數據俠門派

本文數據俠是William Kye。他擁有美國聖母大學社會學博士學位,對分析和理解人類行為有濃厚興趣並富有經驗。Kye喜歡用數據解決問題,不只將數據看作生硬的數字,他還希望將其置於人類社會行為的大背景下進行理解。他此前做過大量的人口數據與其他數據的交叉分析,比如社區自殺率與種族構成的關係,私立學校的數量與社區士紳化趨勢的關係等。Kye掌握R語言、Python等,同時希望將數據分析以有洞見的故事形式展現出來,並將自己的能力用在解決現實世界的難題上。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DT財經 的精彩文章:

越來越多的網路攻擊背後,你看清黑客的套路了嗎?

TAG:DT財經 |