當前位置:
首頁 > 最新 > 「做號黨」和內容平台的無限戰爭

「做號黨」和內容平台的無限戰爭

黑馬智庫,創業必讀

來源 | 淺黑科技(ID:qianheikeji)

作者 | 謝幺

同樣是在互聯網、人工智慧等新技術的加持之下,複製粘貼、搬運、抄襲、洗稿變得容易,反制卻註定越來越難。原因無他,前者是把鹽和胡椒混在一起,後者卻是把二者分開。

有些仗註定不公平,但對於有的人來講,再難也得打。

不容易看見的事

「媽耶,做號集團真牛逼!敢這麼直接找上門啊。。。」

「太明目張胆了這些人!」

某內容平台的工作群被一張聊天截圖炸開了鍋,一位作者向平台舉報說有「做號黨」主動向他尋求「合作」。

對方不僅聲稱登錄過作者的賬號,還直接甩出了登錄密碼,說「看你做不出來收益,所以才想和你合作」,頗有種「老子找你是看得起你」的架勢。

(對話框左邊是做號黨,右邊是號主)

究竟發生了什麼?

「我估計是平台更新了安全策略,做號黨原來盜來的賬號無法登錄了。」 丁丁告訴我。

丁丁不是天線寶寶四人組裡的「丁丁」,而是騰訊企鵝號平台安全部的一位技術小哥。日常工作是跟黑產們 「貼身肉搏」,防止平台被薅羊毛,確保平台安全。出於尊重個人意願,不透露真實姓名和職務,姑且用「丁丁」代替。

半個月前,丁丁和同事們對做號集團們來了一次「地毯式轟炸」 ——直接停用了「手機號/郵箱登錄 密碼」的登錄方式,只允許用綁定QQ和微信掃碼登錄,這一下就斬斷了不少做號黨的財路。

「做號黨手裡的賬號來源一般有兩種:一是用機器自動化大批量註冊,二是通過撞庫等手段盜過來別人的賬號密碼。」

丁丁告訴我,無論哪種,都免不了用手機號/郵箱號 密碼登錄,現在平台直接停用賬號密碼登錄,做號黨手中的一大批賬號將被廢棄。

在對陣做號集團的漫長戰爭里,丁丁和同事們又贏了一場戰役。但僅僅在一個月之前,他們還深陷在一場眾所周知的因為盜號、做號黨引發的質疑之中。

並非所有幕後努力都能被人看見,所以我決定和他們聊聊日常,看看內容平台和「做號黨」之間究竟發生過怎樣的攻防對抗?以及,為什麼騰訊辣么有錢,依然滅不掉做號黨?

和做號黨的「纏鬥」

「註冊賬號是每個黑灰產薅羊毛的必經之路。」 丁丁告訴我,倘若來者不拒,企鵝號每天得有四到五萬個新增用戶。但用膝蓋也能想到,龐大的註冊量中必然混入了不少黑灰產,所以他的工作之一就是在路口布防,攔截一切可疑註冊者。

透過安全數據,丁丁能感受到做號黨們的脈搏。

他說,「每次實施新的防禦策略,做號黨的活動跡象都以肉眼可見的速度減少,沒過多久又會反彈,像一群總滅不幹凈的小強。」

企鵝號的第一道防禦線——黑產庫,來自盟友騰訊安全平台部。

這個部門相當於整個騰訊公司的保鏢,職責是保護騰訊全線產品的安全,丁丁一般親切地簡稱它「安平」。

安平的一項日常工作就是搜羅各種行為可疑的 IP、手機號、郵箱地址等數據,給他們打上標籤,匯成一個龐大的「黑產庫」,提供給騰訊系的各個產品線,幫小夥伴們鑒別正常註冊和惡意註冊。

丁丁告訴我,「企鵝號接入黑產庫就等於在註冊環節加了一道過濾網。效果立竿見影,每天註冊量一下就降到兩三萬。」 也就是說,有兩三萬次惡意註冊來自做號集團,被攔掉了。

為啥做號集團這麼執著於註冊賬號這件事?很簡單,對做號團伙來說,號就是錢。

「一個企鵝號每天限制發5篇文章,兩個賬號就能一天發10篇,三個就15篇……發得文章越多,收益自然就越高。」

在利益的驅使下,做號團伙非常勤奮,別說一天五篇,十五篇,甚至二十五篇都不在話下,對賬號的需求數當然大。

丁丁告訴我,做號已經形成一條完整的產業鏈。

「有人專門『下號』(提供賬號),有人專門收集個人信息做實名認證,有人負責炮製內容吸引流量,用平台補貼、廣告等方式變現,下游還有人專門給他們提供刷量服務。」

從上至下環環相扣,明確分工。

「下號」是重要的一環,主要通過程序批量註冊、撞庫盜號等手法。依照不同平台的註冊和盜號難度,每個賬號通常就能賣十幾元到幾十元不等,有實名認證、原創認證的賬號則售價更高,有的能賣到幾千塊一個。

丁丁說,「做號團伙很狡猾,每天會換用各種手機號、郵箱,切換IP地址來偽裝成正常註冊,試圖躲避黑產庫的攔截。所以我們當然還有別的招。」

企鵝號的第二道防禦線是實名認證,只有實名認證的賬號才能發布內容。

業內以往最通用的實名認證方法是「上傳手持身份證照片」。簡而言之,讓你捧著自己身份證拍張靚照,傳到平台進行人工審核。講真,這種認證方式體驗不好,總有種犯人拿著號碼牌拍照的感覺。就像這樣:

你可能有點納悶,Google 上怎麼能隨手搜到那麼多手持身份證照片呢?是的,很多人的身份認證信息其實早就泄露了,所以魔高一尺,單純靠上傳手持身份證這種方法其實擋不住做號集團。

去年9月份,溫州警方就破獲了一起公民信息買賣案。據通報,該團伙的手持身份證照片僅售幾毛錢一張。收集到「四件套」(手持身份證、手持報紙、手持白紙、身份證正反面)打包賣給「註冊商」,單價也就百來塊錢。

做號集團便是所謂「註冊商」,典型買家。

(圖片來自警方通報新聞)

丁丁告訴我:「除了直接在地下黑市購買,有的做號集團還會僱人去農村收身份證信息,這並不難。」

道高一丈,企鵝號的對抗方法是人臉識別。

騰訊公司有專門做人臉識別技術的團隊,正好又能幫上忙。「實名認證時只要用人臉識別一查,冒用他人的身份信息肯定通不過,一下子就又把黑產的策略擊破了。」

丁丁說,人臉識別上線才幾天,每天新增的實名認證數量猛降四五千,效果立竿見影。

但事兒還沒完,「做號集團肯定會反撲,這是常態。」

平台用人臉識別「大面積滅火」之後持續監測數據,不到一個月,實名登記數量果然又開始反彈,火星復燃了。

我問他:「是黑產有辦法騙過人臉識別?」

「倒不是,他們用了一種迂迴策略來避開人臉識別。」 丁丁說,之前企鵝號平80%的賬號是個人號,只有不到20%的企業號。人臉識別功能啟用後,個人號的日均實名認證量迅速減少,企業號日均認證量卻開始上漲。

兩三個月時間,企業號佔比竟漲到接近 70%。也就是說,做號團伙們為了躲避平台的打壓,從個人號集體湧入了機構號。

這給企鵝號安全部門帶來一個難題。

「企業號實名認證信息一般要求填企業法人,也就是公司老闆的。但實際操作賬號的人通常是底下負責新媒體運營的普通員工,很少有公司老闆親自來操作媒體賬號的。」

如果強行要求人臉識別,「小編」就得必須拽著自家老闆來刷臉認證,這會給正常企業用戶帶來困擾。

丁丁又想了一招 —— 「要求企業號綁定公司的銀行賬戶,並且賬戶名必須和企業營業執照上的公司名相同。我們往賬戶里打一分錢,就能核對賬號真實性。

到這一步,坑又填上了。

「如此一來,做號黨豈不是無路可走了?」

「你放心,做號黨們一定會想出各種怪招,這場仗得一直打下去。」 丁丁說,就在前不久,他們又發現有大量賬號試圖用PS製作的假營業執照矇混過關,同事們正在商討針對性打壓策略,打算再加一層額外的校驗系統。

他說和做號集團對抗讓他深刻體會到一件事:做號集團背後出活生生的人。

若你把做號團伙當成遊戲里三拳兩腳就幹掉的小兵嘍啰,試圖用一道牆,一個籬笆就攔住,他們就會用一次次反撲來告訴你他們是一個個真實「玩家」,有專業工程師,有統一指揮者,還有黑產盟友………

但平台就無計可施了嗎?

「做號黨的目標是錢,只要作案成本越來越高,他們就會逐漸放棄,或者轉移到其他更容易得手的目。所以,每一次平台打擊都是在擠壓做號黨的生存空間。」丁丁說。

很少有人會注意到,企鵝號僅僅在2019年第一季度就攔截了黑產賬號註冊和登錄235萬次,攔截準確率達到了99%。

不公平的較量

聊完「下號」環節的攻防戰,接下來做號集團就該寫稿了。

丁丁的同事迪西給我發來一個文檔。

迪西是企鵝平台內容部門的,為了知己知彼,她日常會花時間去了解做號集團的內容生產模式,以試圖針對性地打壓。

我打開文檔,做號套路簡直深似海。

翻到「偽原創的方法技巧」一章,裡面詳細記錄著如何用「等價替換法」把炮製出一篇偽原創:

「等價替換法又分為文字排序法、數字替換法、詞語替換法……」

這些方法不僅成體系,且分門別類,可操作性很強,基本屬於義務教育水平以內的人看完都能上手實操。

肉有五花三層,「文章搬運大法」也分三六九等。

「初級搬運」僅僅修改標題和部分詞語;「中級搬運」會對標題段落進行重排;「高級搬運」則會綜合多篇稿件內容,來個「葫蘆娃大合體」;「終極搬運」最厲害,不僅會把原文許多段落換個說法,還會將原文配圖也換成意思相近的其他圖片。

除了僱傭勞工手動搬稿,規模稍大一些的洗稿團伙大多已學會用科技的力量來武裝自己,全面步入工業化時代。

自動化搬運軟體也分為初、中、高、終級。

初級的軟體大多是一鍵直接搬運,特點是替代手動操作,速度快效率高。

一般這類工具還提供「多平台管理」,可以同時管理企鵝號、頭條號、百家號、大魚號等多個內容平台的賬號。

如果某個原創作者在 A 平台發了篇文章,第二天剛打算髮到 B平台,就發現已經被人搶標了原創,那麼很可能對方就是用這類搬運工具打了時間差。

「中級搬運軟體」開始進入「半自動輔助寫稿」時代。

在初級的基礎上,想洗哪篇文章就在軟體里輸入文章鏈接,它會從全網抓取所有相似文章,顯示出閱讀量、相似度、關鍵詞、詞頻統計(特定詞出現的頻率),並用不同顏色標明好。

順著數據引導,分分鐘改出一篇「優秀」的偽原創,既能避免被平台判為抄襲,又能斬獲更多流量。

高級搬運軟體已經進入「以機器為主,以人為輔」的工業自動化生產時代。

在初、中級的基礎上,高級搬運軟體實現抓取、識別、替換等整個流程的自動化,人類唯一需要做的就是審核「機器寫的文章」,把邏輯不太通順的地方捋順。

(某款針對企鵝號的做號軟體)

「終極洗稿軟體」更厲害,全面帶領洗稿集團全面走進 AI 時代,從搬運到洗稿,再到檢測文章重合率,全部自動完成。

具體就不展開聊,反正文檔中提到許多專業AI領域辭彙,什麼NLP自然語言處理、結構化信息抽取演算法、語義聯想、情感分析、文本聚類、關鍵詞提取……

從展示的仿寫結果來看,也非常接近人類。

(某AI仿寫軟體,點開圖片可看仿寫效果)

用這些方法洗完稿發到各大平台,先甭管有沒有人看,讓下游負責灌流量的公司往裡刷些閱讀量,什麼"群控系統」那都是灰產團伙標配。總之,想辦法干擾平台的判斷,讓推薦演算法誤以為文章是用戶愛看的,繼而得到更多推薦量。

(傳說中的群控系統,圖源自網路)

至此,你已經清楚做號集團的洗稿套路和工具了,現在要怎麼對付他們?怎麼在海量的文章中分辨出哪個是原創,哪個是仿寫,哪個是二次創作,哪個是抄襲?鑒定標準是什麼?如何防止誤傷?

這都是擺在迪西以及所有內容平台面前的難題。

迪西說,最初,平台會為每一篇文章生成一個「MD5指紋」,如果比對指紋發現兩篇的指紋相同,則判定為「搬運、抄襲」,給予打壓。

可後來,做號團伙學會拆分文章和段落,學會替換同義詞、更改語序,洗稿技藝越來越精湛,以往那些反抄襲策略便逐漸失效。

我問迪西能不能同樣用 AI 技術來鑒別原創,她說檢測侵權的技術正在不斷升級,也有用到 AI相關技術。但她同時也反問我:「你覺得什麼算是原創?」,我一下被問住了,心想是啊,如果連人類在原創、洗稿問題上都尚有爭議,沒有明確邊界,那訓練出的 AI 又怎麼能準確鑒別?

這不僅是內容平台的困境,也是整個創作環境的困境。

同樣在互聯網、人工智慧技術的加持下,複製粘貼、洗稿、搬運、抄襲變得越來越容易,平台卻越來越難反制。原因很簡單,前者是把鹽和胡椒混在一起,後者卻要把二者分開,這註定是一場不公平的對弈。

但對於內容平台來說,這場仗再難也得打下去。我問迪西,那企鵝號打算怎麼辦?

「慢慢來,情況會一點點好轉。」她告訴我,企鵝號目前在建立原創自動維權機制,作者授權以後,企鵝號會在全網監測侵權行為,並且主動發起維權。

(圖片截取自企鵝號後台)

很多原創作者感慨侵權易,維權難。把維權索賠機制建立起來,提高侵權者的風險成本,這倒是條不錯的路子。

這是「堵」的一方面。「疏」的方面,企鵝號也會通過創建有版權的素材庫、版權二創開放平台以及完善內容服務商體系,幫助創作者提升原創能力。

戰鬥會停止嗎?

「做號黨未來會消失嗎?平台和黑產之間的戰鬥會停止嗎?」 我問丁丁和迪西。他們都說不會,這是一場無止盡的攻防對抗。

但我覺得會。在這件事上,我比較樂觀。

讓我們把鏡頭拉遠,會發現一件有意思的事,最近兩三年,騰訊、百度、位元組跳動等互聯網巨頭們正在打一場激烈的內容「搶位戰」,所有人都往裡砸錢都毫不含糊。

今日頭條說一年補貼個幾十億給原創作者;百度不服,下注100億連眼都不眨;騰訊差那幾個錢?100億是吧?再加十幾個億………

所有人僵持不下,這才給了做號集團留出了生存時機。

這讓我腦補出一個很滑稽的畫面:槍戰電影里,一堆槍神用槍指相互著對方的頭,氣氛緊張,誰都不敢開槍也不敢撒手,此時幾個小蚊子嗡嗡飛過來,美滋滋把所有人吸了個遍。

其實大家都想把那破蚊子一巴掌拍個稀巴爛(這也不難),可是僵局裡,誰顧得上那個蚊子呢?

回想一下,互聯網黑灰產的一次次出現的時機,是不是都對應著一場「鷸蚌相爭漁翁得利」的故事?

出行大戰那會兒,有人註冊一堆司機賬號蹭補貼,月入數萬;共享單車大戰那會兒,有人用麵包車載著單車來回兜風領紅包,月入數萬;外賣平台大戰那會兒,有人刷空訂單騙補貼,又月入過萬。

劇情都差不多:風口出現,巨頭搶位,砸錢補貼,黑(灰)產進場,喜提羊毛。

所幸,如今「內容大戰」僵局持續了好幾年,已經逐漸被網信辦約談、用戶吐槽、媒體質疑等諸多因素打破,大家都開始放下手槍全力先拍死身上的那隻「蚊子」。

迪西說,目前企鵝號正在調低部分內容的收益係數,放棄掉一些流量型KPI,把「全品類內容」作為主要工作目標,包括引入各個領域頭部的優質賬號,給予政策上的傾斜,並且籌備原創專家委員會,建立一套完整的原創權益審核、監督、處罰流程,擠壓掉做號集團的營收空間,優化企鵝號原創生態。

再看看今日頭條、百家號,其實也在陸續實施類似的計劃。

內容平台和做號黨還會經歷一個博弈的過程,但邪不壓終究是亘古不變的真理。

*本文由淺黑科技(ID:qianheikeji)授權i黑馬發布,作者:謝幺。i黑馬,讓創業者不再孤獨。

i黑馬,讓創業者不再孤獨。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 i黑馬 的精彩文章:

特斯拉車庫「自燃」,燒到只剩框架,車主和死神僅差半小時
股權設計「生死劫」,公司該怎麼平安度過?

TAG:i黑馬 |