阿里AI語音鑒黃反垃圾服務上線公測可識別多種外語和方言

科技 08-19

以往靠鑒黃圖拿工資的人工鑒黃師，他們的工作可能要「涼涼」了。

近日，阿里AI鑒黃語音反垃圾服務上線公測，能識別語音中存在的涉黃、廣告等違規信息。這意味著，除識別色情圖片、色情視頻和色情文字外，涉黃語音也能通過AI鑒別了。

以往，傳統的人工鑒黃師通過一雙肉眼鑒別色情圖片和視頻。聽起來像是「福利」，但實際上並不輕鬆。如今，伴隨著互聯網上社交媒體、直播、短視頻的發展，每天光上傳的圖片超過10億張，發文數量超過5億條，不少色情、暴力等內容充斥其中。人工鑒黃師一天一人審核1萬張圖片的工作量，遠遠滿足不了這一需求。

2015年10月，阿里巴巴「綠網」上線，用人工智慧識別網路上包括色情、暴力在內的違規信息，阿里AI鑒黃師應運而生。通過人工智慧、深度學習和大數據樣本等技術，阿里巴巴的AI鑒黃師訓練識別千萬張正常圖片與色情圖片，最終生成一個智能鑒黃模型。

「我們要做的就是拿圖片去『餵養』它，讓它不斷學習，變得越來越聰明。」阿里巴巴安全部高級演算法工程師威視介紹：「最初在獲取樣本時，我們篩選了近2000網站、6000多萬色情圖片，經過去重，標註1300多萬張高質量的色情圖片，可以說這是AI鑒黃最重要的一塊基石。」

阿里安全，一向致力於解決社會問題，可以說，高效率、低成本的阿里AI鑒黃技術，正將人工鑒黃師逐漸解放出來。威視表示：AI鑒黃師每天可審核數億張圖片，識別準確率高於99.5%。舉個例子，一天要審核4億張圖片的話，單純由人工來審，一人一天審1萬張，需要4萬人，而AI鑒黃只需將其中20萬張可疑的圖片篩出來，由人工再審一道，這需要20人即可。

更厲害的是，阿里AI鑒黃師不僅能鑒別黃片黃圖，連帶有情色信息的語音內容都能識別。近期上線公測的AI語音鑒黃反垃圾服務，可支持中文、日文、英文等多國語言，還支持東北、四川、廣東等地方言。無語義的呻吟聲也能識別出來。8月21日在北京召開的2018年網路安全生態峰會上，這些成果將集中展示。

當然，AI鑒黃並不能完全取代人工鑒黃，相比人工審核，機器還很難理解內容背後的深意。「最佳的審核方式是智能為主，人工為輔。人工鑒黃師群體數量少了，目前主要做打標和審查可疑圖片的工作。」阿里安全部產品專家念夏說。

阿里AI語音鑒黃反垃圾服務上線公測可識別多種外語和方言

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 快科技 的精彩文章:

※美國研究證實：手機APP雖不會偷偷錄音但卻能記錄屏幕信息並外泄
※Intel處理器再曝安全漏洞！官方：未來幾周內修復

TAG:快科技 |

阿里AI語音鑒黃反垃圾服務上線公測 可識別多種外語和方言

阿里AI語音鑒黃反垃圾服務上線公測可識別多種外語和方言