當前位置:
首頁 > 知識 > 非法信息消除指南

非法信息消除指南

各網路公司既要確保消除非法信息,又要避免影響用戶正常使用,怎樣同時實現這兩個目標?


文|吳松磊


許多中國互聯網公司對自己的內容審核部門有著複雜的感情,因為其他業務可以賺錢,審核則和法務、合規一樣會增加經營成本,但它就像安全帶對司機一樣必不可少。

隨著互聯網用戶和內容的激增,審核技術也需與時俱進。今天,中國網民規模已達 7.13 億,社交網路滲透率達 85.8%,僅用黑名單和禁詞表遠不能勝任日益複雜的網路環境,各大互聯網公司都需要投入更多的資源,才能應對層出不窮的挑戰。

非法信息消除指南 點擊播放 GIF/275K



▍1997 年至 2012 年東亞及中國各地區的互聯網滲透率變化(圖片來自:hanteng,wikimedia)

消失的非正常內容


儘管 1987 年中國就已成功對外發送第一封電子郵件,但直到 1996 年 1 月,中國公用計算機互聯網(CHINANET)建成,互聯網才正式進入民用市場。


同年二月,國務院發布的《計算機信息網路國際聯網管理暫行規定》就已有相關規定,當時的方式還比較傳統,如屏蔽非法網站、人工審核門戶網站新聞等。


禁詞表第一次介入網民生活,是因為即時通信應用的快速發展。


1999 年,騰訊仿造美國軟體 ICQ 開發並發布了 QQ 前身 OICQ,並在競爭中勝出,僅兩年後就擁有了 100 萬最高同時在線用戶,四年後達到了 1000 萬。

非法信息消除指南



▍2000 年至 2010 年騰訊 QQ 最高同時在線用戶數


和今天主要用於熟人通訊不同,早期互聯網是陌生人社會,人們在 QQ 上通過聊天室認識新朋友。非法信息第一次擁有了大規模傳播的可能性,因此禁詞表應運而生。


作為最原始的非法信息攔截方法,禁詞表的規則相當粗暴——只要文本內容包含禁用詞,則文本無法發送,或發送後僅自己可見。由於部分醫療健康類內容很容易因為關鍵詞被判為色情內容,它們除了站方主動發布,基本不可能個人發送張貼傳播。

但禁詞表很快就力不從心了。隨著 Web 2.0 時代的到來,任何信息都有可能一夜間傳遍全網。博客、論壇、社交網路開始成為互聯網主流,在人人都能成為創作者和傳播者的理念下,無論是用戶、內容還是非法信息的傳播風險,都出現了指數級增長。

非法信息消除指南



▍在 Web 2.0 時代,分享互動行為佔據了主導

這樣的背景下,傳統禁詞方案的缺陷開始暴露出來。


首先,完善詞庫就很考驗水平。因為官方並不提供標準的禁詞表,每家公司只能獨自摸索設置哪些關鍵詞才能有效屏蔽非法信息。這就要求詞庫建立者必須有非常廣闊的視野,密切跟蹤各類非法信息傳遞方式的升級,隨時更新詞庫。


另一方面,詞庫只能做到精準匹配,對原詞的同音近型替換或詞義演繹則很難處理。例如「泡麵」等詞就顯然無法進入禁詞表,否則將誤傷大量正常內容。


除此之外,許多需要清除內容也並非單個詞,而是事件,需要多個詞同時出現,才能觸發機制。


以「金正男機場遇刺」為例,則需要「機場」、「金正男」、「遇刺」其中兩個詞同時出現才能觸發清除機制。這就給了其中單個詞相當大的替換空間,例如「機場金大胖」、「胖熊機場一日游」,都可以讓人聯想到該事件。

非法信息消除指南



▍同時,「2001 年金正男在日本成田機場被遣返」這樣的老新聞也會被誤傷


面對這些複雜情況,互聯網企業不得不聘請大量專員來人工處理。他們相比機器,不僅成本高昂,且效率低下。於是,各種計算機演算法被研究了出來。


進擊的演算法


在程序員的眼中,中文天生就比英文等表音書寫語言有更高的識別難度。


除了在傳統禁詞規則下會出現「一台獨立伺服器」被識別出「台獨」等低級錯誤外,如果要對文本進行分析,必須先對其進行分詞處理。這是因為中文單字與整句含義差別極大,只有成詞,才能理解和判斷文本傾向,避免把正常的生理衛生知識識別為色情信息。

非法信息消除指南



▍正確斷句是小學語文老師就開始強調的內容


而英文等表音書寫系統則不存在此問題,因為其文本必須通過分詞確定發音的首尾,否則難以閱讀,所以英文自帶分詞。而中文作為意音語言,每個字都獨立發音,則沒有在文本上分詞的動力。


實現分詞的基礎是字元匹配,如傳統的「正向最大匹配法」即是從左到右掃描文本,與機器詞典進行匹配,再將匹配成功的詞切分,直到無法匹配為止。


但這種方法並不可靠,如「一台獨立伺服器」就還是會被分為「一/台獨/立/伺服器」。為解決歧義問題,則需要對大量真實語料進行統計,計算每個詞的出現概率,再計算不同分詞方案下的總概率。


在之前的例子中,因為「立」作為詞的出現概率極低,因此「一台/獨立/伺服器」的概率將明顯高於「一/台獨/立/伺服器」。更進一步,還可計算兩個詞同時出現的概率,以得到更精確的分詞結果。


今天的分詞演算法可以成功識別插入特殊符號的非法信息。而配合擴展詞表,也可以處理以同音字或拼音替代的信息。但對於聯想類詞語和事件類內容,還是需要其他演算法的加持。


貝葉斯方法就是其中之一。1763 年,英國學者托馬斯·貝葉斯生前的一篇關於「逆概論」文章中提出了貝葉斯公式。

非法信息消除指南



▍貝葉斯公式


貝葉斯方法的核心在於通過已知事件的概率(先驗概率)計算未知事件的概率(後驗概率)。以「金正男機場遇刺」舉例,假設抽取十萬條包含「機場」的文本,其中七萬條為正常內容,三萬條為需要清除的非正常內容。


即正常評論的概率 P(g)=70%,非正常評論的概率 P(b)=30%。


再對所有文本進行分詞,計算每個詞出現的概率。假設「遇刺」在七萬條正常內容中,有七十條包含該詞;而在三萬條非正常內容中,有三百條包含該詞。則「遇刺」一詞出現的概率 P(W)=0.37%,在正常內容中出現的概率 P(W|g)=0.1%,在非正常內容中出現的概率 P(W|b)=1%


那麼,一條提到了機場的內容里出現了「遇刺」,該內容是非正常內容的概率 P(b|W) 是多大呢?根據貝葉斯公式 P(b|W) = P(W|b)P(b) / P(W) = 81.1%。


按此方法可以計算出每個詞的非正常概率,再根據下公式就可以計算出該文本為非正常內容的期望,在根據實際情況設定閾值進行處理。


▍公式中 p1-pN 指的是該文本中每一個詞的非正常內容概率


以「金大胖在機場遇刺」為例,假設這幾個詞的非正常內容概率分別為 P(b|金大胖)=0.9,P(b|機場)=0.3,P(b|遇刺)=0.8,則可算出文本是非正常內容的概率為 93.9%。


而「1963 年 11 月 22 日下午,他在機場聽到了肯尼迪遇刺的消息」,則會因為「1963 年」、「肯尼迪」等詞大大降低該文本的命中概率。


貝葉斯方案的缺陷是需要大量語料數據作為其先驗概率的支撐,因此在許多規模較小的互聯網社區並不普及。


多媒體內容的挑戰


非法內容不僅僅只有文字。隨著智能手機的普及和帶寬速度的提升,大量的圖片、音頻和視頻開始被製作上傳,成為互聯網主流內容。


對於這些新形式,應該如何處理?


最常被審核的是圖片里的文字。此時,中文對英文的識別難度又一次體現了出來。識別圖像中文本的演算法被稱為 OCR(光學字元識別技術)。這項早期用於幫助盲人閱讀的的技術發展至今,對於常見的書寫系統已經實現高於 99%的準確識別率。


儘管如此,仍然可以用模糊、變形、粘連、添加干擾符號等方式讓 OCR 難以正確識別。因為中文字元數量遠超英文字元,而每個字元都可能成為 OCR 演算法的潛在錯誤選項。

非法信息消除指南



▍一項對 5 個中文 OCR 軟體的測試結果(2015 年 6 月)


但深度學習技術的快速發展,正在改善中文 OCR 的問題。


深度學習(Deep Learning)可以追溯到 1958 年的感知機演算法,但直到 2010 年後,才開始在語音和圖像識別取得重大突破。通過從「邊緣—部分—全體」的分層特徵提取,深度學習可以做到遠超傳統演算法的識別精度。


對於 OCR 演算法最頭痛的預處理階段,通過千萬量級的文本圖片對模型進行訓練,可以有效的實現文本的降噪和分割。對色情類圖片和視頻也是如此,今天的鑒黃應用準確率已經達到了 99.95%,其訓練方法和 OCR 唯一的不同在於,色情內容訓練庫難以自動生成,需要依賴大量的人工標註。


相對比較棘手的情況是特定人物頭像和人物表情包。因為許多人物並沒有足夠豐富的圖像資料用來訓練,因此目前的人臉驗證演算法還是相對傳統:校正圖片—提取初始特徵——計算兩張人臉的相似度。

非法信息消除指南



▍人臉相似度計算流程


非色情類視頻的鑒別難度也在於此,因為不像色情內容一樣能夠擁有龐大數據用以訓練,且惹事原因也五花八門,難以統一共性。


因此,此類視頻的清理相當粗暴——直接封禁視頻文件的 MD5 值。MD5 演算法是一種加密散列函數,對任意字元串都能生成一段對應且唯一的 32 位十六進位數字串,即 MD5 值。因此,每個文件都有其獨一無二的 MD5 值,這也意味著只要封禁一個文件的 MD5 值,則該文件的所有複製版本都無法觀看。


當然,躲避 MD5 封禁也很簡單,只要稍微修改文件,MD5 值即會發生改變。


除了傳統社交網路的多媒體內容,語音問答和視頻直播等新內容創業公司更需要保持警惕。2016 年 8 月,某風頭正勁的語音問答平台突然無法訪問,直至48天後才重新上線。不進增加了舉報功能,其所有語言回答都需要經過審核後才能發布。


而直播平台涉黃被約談整頓的新聞更是屢見不鮮。在競爭激烈的業態下,甚至有直播公司安插人手去敵台色情直播。好在面對強烈的業務需求,各大雲服務公司都建立了完整的直播審查系統,面對色情內容可以做到秒級響應。

非法信息消除指南



▍某雲服務平台提供的直播審查系統


在深度學習演算法逐漸成熟的今天,再也沒有什麼內容是無法識別的,距離完美安全的網路世界,差的只有更多非法信息的樣本,只要敏感詞和敏感圖片源源不絕,清除網路非法信息的能力就會在它們的考驗和訓練下不斷提高。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大象公會 的精彩文章:

明晚 7 點,來這裡參加大象公會的選題會
雲南人為什麼愛吃蟲
什麼叫「超乎想像的知識寬度」
廣東人怎麼吃松鼠、水獺、猴子、貓

TAG:大象公會 |

您可能感興趣

土方法消除痘痘
法令紋消除的方法 4點原因你須知
凈空老法師:消除障礙最徹底的方法
《消除者聯盟》手游道具怎麼獲得 通關道具獲得方法
靠佛法知識無法消除內心深處的恐懼
消除罪障最快的方法
消除緊張情緒用 3 法
找到煙癮消除新方法
消除腋氣遵循 5 方法
消除異味的方法······
信用卡逾期記錄的消除方法!
消除關節痛有什麼方法
權威研究!中國教授找到消除煙癮新方法
消除萎縮紋 三大方法為您支招
怎麼消除法令紋 為你普及相關的常識
消除障礙最徹底的方法
眼睛浮腫用什麼辦法消除?
眼袋發黑如何消除 推薦解決方法
中醫理療為抗洪武警官兵消除疲勞