助力網路內容安全 人工智慧走上舞台
每天通過互聯網上傳的視頻、圖片、文字數據,用「海量」形容毫不為過——超過15億條,而且還在呈數量級增長。
將其中涉及恐怖、暴力、色情等違法違規內容過濾出來,使其不污染、威脅網路空間,以前靠的是人工審核,現在人工智慧(AI)開始走上舞台。
21日,由中國互聯網協會和阿里巴巴等共同舉辦的「2018網路安全生態峰會」在北京開幕。AI在助力網路內容安全上扮演的重要角色成為此次峰會的熱點議題之一。
AI是必然選擇
可以說,面對海量互聯網數據,用人工智慧進行互聯網數據的治理,是一個不得不做出的選擇。
「相比AI技術,現有的人工審核方式無論是成本還是效率都處於顯著劣勢。」中國互聯網協會在此次峰會上發布的《AI技術賦能網路內容安全保障研究報告》(以下簡稱《報告》)稱。
根據《報告》,人工智慧已經在網路文本內容檢測、文本分類技術、視頻和圖片內容識別、語音內容檢測等方面發揮重要作用。
例如,阿里巴巴開發的雲盾內容安全系統可以基於深度學習技術,提供文字、圖片、視頻等多媒體的內容風險智能識別服務,有效減少涉及恐怖、暴力、色情等違法違規信息。
國家互聯網應急中心高級工程師徐傑介紹,傳統的網路安全治理方法涉及人工建模和提取特徵,也就是描述某個事物,並構成特徵向量。越是複雜的事物,特徵向量的複雜程度就越呈指數增長。
「AI技術,特別是近期比較火的深度學習技術,為我們處理這些問題提供了新的可能。」徐傑說,因為深度學習技術不再需要人工去描述事物的特徵,而是直接把相關事物的圖片或視頻交給機器去學習,由機器自己建立模型。
阿里巴巴集團資深演算法專家薛暉認為,除了以上優勢,AI技術也增加了網路內容治理的可靠性。因為,人工審核的經驗因人而異,而且這種經驗較難傳承,但是AI技術無論是模型還是數據都更容易被繼承。
還需要更加靠譜
儘管AI在保障網路內容安全方面已顯出種種優勢,但作為一種新興的科技手段,難免還有諸多不足。
「AI本身還有一些問題,比如說AI很大程度上基於模型和演算法,而模型和演算法本身具有脆弱性。」移動安全聯盟秘書長楊正軍說,如果其模型和演算法遭受攻擊,就會失效。另外,AI是基於海量數據進行訓練,假如數據遭到污染,或被攻擊者獲取,後果也不堪設想。
來自科大訊飛的技術專家李劍鋒則認為,AI在網路內容治理方面存在的最大挑戰,是現在AI的能力還有待提升。
李劍鋒舉例說,有用戶發微博表達心情,內容是「黑夜總會過去,白天總會到來」。這句話反覆發不出來,該用戶百思不得其解。後來有朋友提醒他,是因為其中出現了「夜總會」。
「現在我們用AI技術,哪怕是一個非常簡單的技術也很難做到100%正確。」李劍鋒解釋說,因為現在的機器學習屬於統計學機器學習,包括深度學習、神經網路在內都是基於概率論,理論上不能保證100%正確。
※日本計劃在500所學校部署會說英語的機器人
※摩根士丹利:為什麼這家谷歌旗下的無人駕駛公司值1750億美元?
TAG:機器人庫 |