你方唱罷我登場,什麼樣的社交網路能維持活躍?看個體間的鏈接類型
圖片來源:昵圖網
撰文 林星城
為什麼豆瓣小組長期以來從沒像微博熱門話題一樣出個超級大新聞,但豆瓣小組又能長期維持不錯的用戶活躍度?
為什麼人人網曾經一度比它模仿的對象 Facebook 搞得更加蒸蒸日上、充滿朝氣,結果到後來人人要掛了,Facebook 還沒死?
微博當時怎麼火起來的?後來怎麼又陷入低谷?再後來為啥又走出低谷,比原先更火爆了?
……
拋開具體的企業經營、技術設施和競爭環境等因素,社交網路用戶活躍性的問題可以被抽象提煉成一個純粹由節點(node)和邊(edge)構成的社交關係圖上的問題——如何讓網路中的大量節點持久保持活躍?這一問題對複雜網路的理論研究還有社交網路的實際應用而言,都是一個有趣且有意義的事情。
先前的工作通常在預先生成或給定的網路結構上考慮個體的持久活躍問題;然而,社交網路的發展,是網路在增長的同時伴隨著已加入個體的活躍狀態的級聯反應。
社交網路的持久活躍問題 VS 網路魯棒性研究
個體在社交網路中持久活躍的能力,或稱社交網路持久性(social network persistence)是網路對故障和干擾的容錯能力(即魯棒性,robustness)研究的重要組成部分。
早期魯棒性研究關注網路的靜態魯棒性,即網路在面對節點或連邊出現的隨機錯誤(random error)以及招致目標攻擊(target attack)後的容錯彈性(resilience)。靜態魯棒性研究關注的是網路的拓撲結構,尤其是以節點度數、邊介數等為代表的網路連通性指標。而後,動態魯棒性或稱網路持久性成為研究的重點。持久性關注的是網路長期保持一定狀態或者特定功能的能力。
例如,在高壓電網中級聯失效(cascading failure)是一個常見的事故,當電力系統滿載或者輕微過載時,某個節點的錯誤有可能導致大範圍電力系統的癱瘓,一夜回到解放前。這一現象至今非常普遍,06年歐洲大斷電和12年印度大斷電波及幾百萬、幾億人口的生活。又如,在食物網中,一個營養學物種的消亡有可能威脅食物網的平衡;更別提各國政府不約而同聞之色變的物種入侵問題。食物網的持久性體現在初始物種在受到干擾之後存活下來的比例。類似的,在社交網路中,維持個體的活躍度是促進整個社區繁榮的關鍵一步。
真實的社交網路具備一些特徵,每個特徵都可能影響到個體的活躍度。
1. 多樣的網路增長模式(network growth mode)
社交網路怎樣由小長大?它們的增長模式是複雜多變的。
例如早期新浪微博的策略是綁大V,邀請各路明星名人加入微博,然後這些名人帶動粉絲加入,這是一種個體流行度優先(popularity-first)的增長模式。人人網或稱校內網抓住的是高三畢業大一新生的需求,學生需要跟高中同學保持聯繫,同時在大學結交新朋友,還有用戶是想看同年級中的美女帥哥、學霸、社交達人等;還有一些網上的興趣社區,是用戶根據興趣愛好聯繫起來。這類網路的增長模式是個體的相似度優先(similarity-first)。還有一些社交網站,沒有明確的增長方式,可以看做是自由增長的方式,也可以理解成一種沒有人為干預的自組織的增長方式。
這裡注意到,個體的吸引力來自於個體的流行度(popularity)和相似度(similarity)[1]。同時,個體的差異性以及個體之間鏈接類型的差異使得即便是相同的網路結構、相同的一群個體,不同的網路增長模式會帶來不同的網路持久性。
2. 社交網路中個體的活躍狀態也具有級聯反應
圖論中 k-core 與 k-core 分解的概念就被用來理解社交網路結構對級聯反應的作用;電力系統級聯失效模型和傳染病傳播模型等也被用於研究社交網路中的級聯反應,例如謠言傳播、影響力最大化、病毒營銷等。這裡的 k-core 是圖論中的一個重要概念。如圖1,如果我們稱一個子圖是3-core 或者3-degeneracy,那麼圖中每個節點最少具有3個鄰居是屬於3-core 或更高層的 core;節點鄰居數不超過3的節點是不屬於3-core 的,可能屬於1-core 或者2-core;如果一個節點有超過3個鄰居,但沒有足夠的鄰居屬於3-core,那麼該節點也不屬於3-core。K-core 可以幫助人們理解圖的稀疏程度、連接密度等[2]。
圖1:一個典型的 k-core 分解示意圖。圖片來源[3]。對 t-core 這一層而言,每個節點至少有 t 個鄰居也屬於 t-core 或者更高層的 core。
3. 社交網路的節點總量成增長態勢的同時還伴隨著節點狀態的級聯變化。社交網路的增長與個體狀態級聯的協同過程對網路持久性的影響,還缺乏研究。
不同的社交網站具備不同的增長模式,但這些多樣的增長模式到底對網路中個體的持久活躍意味著什麼呢?這個問題更深一層的是:不同的社交關係,不同的鏈接類型對網路持久性有什麼樣的影響?
社交網路的增長+節點活躍狀態的聯動 一個網路結構與節點狀態協同演化的模型
考慮到獲取各類社交網站的真實數據來促成這項研究有較大難度。我們選擇從網路建模模擬的角度來探索這個問題。我們的工作建立在 Papadopoulos 的網路模型[1]和 k-core 概念的基礎上。
Papadopoulos 的工作提供了一個迄今最為強大的網路增長模型。先前網路的增長模型是以節點的流行度為核心,高流行度的節點更容易具備較高的連接度數(更廣的人脈),而高度數的節點有更大概率優先與新加入的節點鏈接。Papadopoulos 認為,節點之間的相似度也是吸引其他節點與之相連的因素。他們的模型將多種真實世界中的網路(技術網路、生物網路和社交網路)映射到由節點的流行度和相似度構成的極坐標中,並引入流行度和相似度所在雙曲空間中的雙曲距離作為優先鏈接的評判標準。這項工作的意義是,這個改進的優先鏈接模型,不但可以復現先前優先鏈接模型實現的節點度數在統計學上的冪律分布(類似於經濟學裡的馬太效應,度數高節點度數越來越高,度數低的節點度數很低而且數量眾多);而且,由該模型生成的網路可以很好的模擬多種真實世界的網路在雙曲距離上的鏈接概率。
不過,Papadopoulos 的工作只考慮了網路的增長,不涉及節點狀態動態改變的這些問題;此外,在其模型中,節點的流行度與節點加入網路的時間是綁定的,這與真實世界中多樣的網路增長模式不符。
在[4]的工作中,我們提出基於節點的流行度優先(popularity-first)、相似度優先(similarity-first)和隨機加入(random)三種社交網路的增長模式,解綁了節點的流行度和加入時間,同時保留了基於雙曲距離的優先鏈接機制。然後,我們在增長網路基礎上引入了級聯過程,可以描述網路增長與節點狀態級聯的協同演化。這裡需說明的是,我們這裡提出的隨機增長是空白試驗,完全不考慮節點的相關性,就隨機的加入網路;這跟真實世界中一些自由增長的網路不同。
圖2:三種不同增長模式下社交網路演化過程示意。在極坐標系下,每個節點具有兩個屬性,極徑 r 和極角 θ。極徑可看做節點的流行度的大小,極徑越小,流行度越高;而兩個節點的夾角代表它們的相似度。流行度優先就是節點按照極徑由小到大加入網路;相似度優先就是按照夾角的大小(例如從0度開始),由小到大加入網路;隨機模式則是充分隨意的加入節點。節點是否鏈接由雙曲距離的大小等參數決定,節點再經過自發活躍度之後,由活躍鄰居閾值決定是否繼續活躍。如圖所示,即便是相同的節點,因為加入順序的不同,造成節點的鏈接類型、生成的網路結構不同,節點的活躍狀態也呈現明顯的差異。
當新用戶加入網路時具有一個自發活躍(spontaneous activity)的時期,這時個體對網路充滿新鮮感,它的活躍不受其他用戶的影響。當過了自發活躍期之後,如果個體還有一定的活躍鄰居,那個體還可以繼續保持活躍,否則就會變成不活躍。這個活躍鄰居閾值(active neighbour threshold)可以追溯到 k-core。如果每個節點要具有3個活躍鄰居才能保持活躍,那最終這些活躍節點構成的圖可以看做是動態網路下的3-core 退化圖。圖2是模擬模型基於三種網路增長模式的演化過程示意。節點都具有流行度以及與其他節點的相似度。即便是相同的一批節點,遵從相同的規則來建立鏈接和保持活躍,但是因為加入網路的順序不同,網路增長的模式不同,最終網路中活躍節點的比重也會截然不同。詳細的建模過程詳見[4]。
1+1>2——節點流行度和相似度的耦合效應產生意外的網路持久性
我們首先在上文提出的三種簡單的網路增長模式下,探究個體的自發活躍度與最終網路活躍節點比例(FAR)的關係(如圖3)。結果表明,當節點擁有高自發活動(spontaneous activity),流行度優先的增長模式獲得更高的網路持久性;否則,節點在較低的自發活動下,相似度優先的增長模式更好。此外,相似度優先增長模式幾乎不受節點自發活動的影響,保持穩定的持久性;流行度優先的增長模式卻對此非常敏感,成正相關。
圖3:個體自發活躍度h對最終活躍節點所佔比例 FAR 的影響。這裡自發活躍度是相對網路演化總時間的一個相對比例。
節點的流行度和相似度呈現出對持久性截然不同的作用。一個很自然的想法是,將流行度優先與相似度優先的策略耦合起來,形成一個複合的網路增長模式(例如,一種簡單的方式就是把節點的流行度和相似度加權調和,作為新的節點加入順序)。因為這種複合不是簡單的1+1=2,而是可能會產出兩種單一模式所不具有的新的效果,我們稱之為耦合效應。
按正常推理,複合增長模式下 FAR 有可能疊加了兩種簡單增長模式的優點;也可能介於兩種簡單策略之間;當然,還有可能兩種增長模式的優勢抵消,破壞了網路的持久性。幸運的是,我們發現在較短時間內連續加入相似的節點,同時再加入少量高流行度的節點可獲得最佳混合下的持久性。該理論值甚至達到單一的流行度增長方式或單一的相似度優先增長模式下網路持久性的數倍(圖4):
當給定了某個個體活躍度h後,隨著節點流行度所佔的權重w從0到1的增加,網路的最終活躍佔比 FAR 先是快速上升,到達最佳混合比例後會下降,之後又會緩慢提升。最佳混合比例一直位於w< 0.5範圍內,這說明節點的相似度對網路的持久性具有基礎性的作用,而適當考慮流行度帶來兩個因素的耦合效應可以進一步增強網路的持久性。至於混合後 FAR 下降的原因,正如上文所述,如果混合比例在0.5附近時,相當於節點流行度優先和相似度優先的優勢作用被抵消了,網路增長不再是強強疊加,而類似退化成隨機增長的模式(如圖3)。不過這種混合的隨機增長,和完全均勻的隨機增長還是有區別的。
實驗結果的進一步解釋和討論詳見[4]。
圖4:網路最終活躍佔比對混合比例w和個體活躍度h的反應。w表示節點流行度所佔的比重,w= 0退化成相似度優先的增長;w= 1退化成流行度優先的增長。而w介於0~1之間時,則形成複合的增長模式,耦合了節點的流行度和相似度。
啟示 & 展望
我們的研究表明,節點活躍性的演化不僅取決於網路拓撲,而且與節點間的鏈接類型有關。
我們的實驗結果對認識和理解某些社交網路的發展很有意義。論文中考慮的節點的流行度、相似度,節點自發活躍等內容是對真實世界的抽象。在涉及具體的社區類產品的運營時,這些內容對運維策略和產品設計也有啟發。這裡以人人網和新浪微博為例,做一個對比說明。這部分不屬於實驗內容,是用實驗結果反過來理解真實的社交網路。
人人網的增長模式是以用戶相似度為基礎的。高三畢業的用戶需要跟高中同學保持聯繫,同時又結識大學的新朋友,繼而推動了人人網的興起。當用戶的新鮮勁(自發活躍)結束之後,人人網沒能留住一部分用戶。一個普遍的現象是,大一新生在人人網上異常活躍,到了大三、大四、就業之後,便漸漸淡出人人網。其實這一情況在其他社交網站中也非常普遍,人人網還是有機會像豆瓣、Facebook 一樣,保有剩下的活躍用戶,繼續保持不錯的活躍水平。然而,後來的大一新生已經連加入人人網這件事都懶得做、不願做,造成的級聯反應是大範圍的大一新生不再加入人人網。此外,人人網上老是分享老梗、周期性的冒出來老掉牙的消息,已經加入的用戶也對人人網更加失去了興趣。人人網裡失去了大三、大四之後用戶需要的東西。自此,人人網逐漸走向衰落。
圖5:人人網股價走勢。來源:谷歌搜索,renren stock, 2016-03-03
微博早期的增長模式是用戶流行度優先的。微博先是招攬各路名人、明星加入微博;這些名人的粉絲也隨之加入微博,及時了解偶像動態。同樣的,微博在早期的迅速擴張之後,在2013-2015年期間,曾經經歷過類似人人網的低谷,大量用戶在自發活躍一段時間後也失去了新鮮感。微博採用的策略是(也許是今日頭條給的靈感)——挖掘與名人、新聞有關的熱門微博、超級話題;完善微博和話題下的評論和討論;引入了短視頻等多媒體形式。依靠這些高流行度用戶和高流行度的話題帶動用戶積极參与討論互動;同時一些興趣話題又把興趣相近的用戶連接起來,一條微博下方評論的點贊數可能遠遠超過了微博內容本身。在2016年7-8月份期間,奧運會、乒乓球、張繼科、洪荒少女、王寶強、馬蓉等等各類頭條話題、還有這些熱門話題詭異的情節走向,徹底引爆了新浪微博。終於微博的市值也在這一年超過了它全球範圍內的對手,推特。
圖6:新浪微博(上)與推特(下)股價走勢。來源:谷歌搜索,weibo stock, twitter stock, 2016-03-03
不過,這篇文章還無法解釋微信的增長方式,沒有考慮長期不再活躍的社區重新復活的問題。這裡考慮節點的活躍度時採用的活躍/不活躍的二值離散值,活躍度也可以進一步細化為連續值,即活躍程度的概念。此外,在理解社區的活躍程度之後,還有進一步的一類問題:怎樣能在保持社區活躍的同時,讓社區朝著健康、積極、開放的方向發展,而不被例如國際恐怖主義分子等勢力操控。
參考:
[1] Papadopoulos, Fragkiskos, Maksim Kitsak, M. ángeles Serrano, Marián Boguná, and Dmitri Krioukov. "Popularity versus similarity in growing networks."Nature489, no. 7417 (2012): 537-540.
[2]https://en.wikipedia.org/wiki/Degeneracy_(graph_theory)
[3] Kitsak, Maksim, Lazaros K. Gallos, Shlomo Havlin, Fredrik Liljeros, Lev Muchnik, H. Eugene Stanley, and Hernán A. Makse. "Identification of influential spreaders in complex networks."Nature physics6, no. 11 (2010): 888-893.
[4] Xiaogang Jin, Cheng Jin, Jiaxuan Huang, and Yong Min. "Coupling effect of nodes popularity and similarity on social network persistence."Scientific Reports7 (2017): 42956.
註:論文捷報已由作者投稿發布在"混沌巡洋艦"。這篇文章主要分享研究動機和研究方法。
論文信息
【題目】 Coupling effect of nodes popularity and similarity on social network persistence
【作者】 Xiaogang Jin, Cheng Jin, Jiaxuan Huang & Yong Min
【刊期】 Scientific Reports, 7
【日期】 Published February 21, 2017
【doi】 10.1038/srep42956
【摘要】 Network robustness represents the ability of networks to withstand failures and perturbations. In social networks, maintenance of individual activities, also called persistence, is significant towards understanding robustness. Previous works usually consider persistence on pre-generated network structures; while in social networks, the network structure is growing with the cascading inactivity of existed individuals. Here, we address this challenge through analysis for nodes under a coevolution model, which characterizes individual activity changes under three network growth modes: following the descending order of nodes』 popularity, similarity or uniform random. We show that when nodes possess high spontaneous activities, a popularity-first growth mode obtains highly persistent networks; otherwise, with low spontaneous activities, a similarity-first mode does better. Moreover, a compound growth mode, with the consecutive joining of similar nodes in a short period and mixing a few high popularity nodes, obtains the highest persistence. Therefore, nodes similarity is essential for persistent social networks, while properly coupling popularity with similarity further optimizes the persistence. This demonstrates the evolution of nodes activity not only depends on network topology, but also their connective typology.
【鏈接】http://www.nature.com/articles/srep42956
※吳健雄:被諾獎虧待的華人女科學家
※如果我是男性,人生會有哪些不同?
※大黃蜂玩「足球」:小小昆蟲展現驚人學習能力
※一篇值得每個科研人關注的「論文」
※自然語言處理之 VAE for NLP
TAG:科研圈 |
※火遍社交媒體的拍照套路,你怎麼看?
※一個「機器社交」的能源世界是什麼樣子?
※日本網友總結「社交障礙的兩種類型」,來看看你是哪一種……
※從「社交昵稱」就能看出性格,每種都準的爆表,錯一種你來打我!
※發在社交網路上的話收不回,所以你看到了各種各樣的借口
※哪些星座是自殺式社交能手?這些星座在外面混的不好你也看不出
※那些在社交網路「發瘋」的明星,都在想什麼?
※話題|你的社交軟體頭像是哪個角色?
※社交有什麼用?怎麼樣的社交才是正確的社交?
※第一玄幻小說改編成遊戲,特地做了個奇葩的社交功能方面撩妹?
※放不下手機?社交媒體正在綁架你的生活……
※【互動話題】你覺得哪個星座的社交能力最強,說說你的理由。
※心理學:下面4種唇你喜歡哪一種?測你的社交能力如何
※社交關係中,你們都是怎樣敷衍的結束對話的?
※概念鬼才宣美再次出擊,這些「社交網路成癮症」你有嗎?
※月神腳本圈:互聯網社交的方向能「猜」出來嗎?會用它就懂得引流
※打電話顯得有些不禮貌了?互聯網改變社交禮儀
※社交規則:那些沒事給你打個電話的人,你要格外珍惜
※你相信嗎,社交網路可能比你的配偶更了解你
※這些你在社交網路上看過的「神吐槽」漫畫原來都是他畫的!