當前位置:
首頁 > 科技 > 能阻擋TikTok的,只剩了這一件事

能阻擋TikTok的,只剩了這一件事

內容審核技術是一個底層服務,市場需求會持續變大。

全文4090字,閱讀約需8分鐘

文丨劉一諾

編輯丨黃志磊

內容審核是位元組跳動繞不過去的一座大山。抖音在國內所面臨的壓力,TikTok在海外也沒能倖免。

印度一位TikTok創作者上傳了一段向女性潑酸性液體的視頻,再次引發對於TikTok的廣泛爭議。大量印度用戶表示將抵制TikTok,並在Google Play商店中對TikTok給了1星級評價,導致TikTok的評分一度從4.5星陡降至1.2星。

TikTok正高歌猛進海外市場,印度正是下載量最大的市場,迄今為止貢獻了6.11億次下載,佔TikTok全球總下載量的30.3%。

位元組跳動的出海夢想已照進現實,內容問題使TikTok深陷輿論漩渦,升內容審核的精準度和速度,能為Tiktok的全球化進程減少一些阻力。

繞不開的人工審核

TikTok所面臨的內容審核難題,是全球互聯網公司共同心病。

億歐智庫研究院院長由天宇表示,在全球範圍內,隨著內容的數字化程度越來越高,數量越來越龐大,內容類型的複雜度不斷增強,需要構建與之相匹配的內容管理機制。

近幾年,Google、Facebook、Twitter都顯著加強了內容審核的力度,激增的內容包括文字、圖片、視頻和音樂,審核技術正經受著新一輪的考驗。

國內市場內容審核團隊已成為大型互聯網公司的標配。

以短視頻業務為例,2019年1月出台的《網路短視頻平台管理規範》顯示,網路平台開展短視頻服務,應當根據其業務規模,同步建立審核員隊伍。審核員數量與上傳和播出的短視頻條數應當相匹配。原則上,審核員人數應當在本平台每天新增播出短視頻條數的千分之一以上。

位元組跳動為此早已組建了規模龐大的審核團隊,同時也在研發人工智慧審核技術。

2018年,位元組跳動副總裁張輔評曾表示,位元組跳動確保對所有推薦內容進行人工審核,位元組跳動審核團隊人員已超過1萬人,其中大部分從事視頻審核。

同一年,位元組跳動副總裁、位元組跳動人工智慧實驗室主任馬維英透露,抖音一直使用人工智慧輔助審核,構成人機交互的閉環:平台上有 600 多個機器學習模型,能夠自動理解和識別內容;審核人員同時也是標註人員,用標註好的數據訓練模型,再反過來幫助審核。

通過自主研發的AI技術,位元組跳動節省超過十萬的審核人力,人工審核團隊卻仍被保留。究其原因,除了管理規範的要求硬性要求外,AI審核的技術瓶頸也是原因之一。

AI審核的技術瓶頸

人工智慧的局限性在於,不能對所有的媒介形式進行精準識別。

對於圖片和視頻來說,人工智慧介入審核非常有效,因為計算機視覺識別技術相對成熟。機器通過一定時間的訓練,都能夠識別出敏感類別的內容,比如裸體、槍支等。

在對語音、文字進行分析時,不能達到識別圖片和視頻的高準確率。不同的文字在不同的語境下,表達的含義可能有所不同,人工智慧很難像人一樣思考,理解語言的真正含義。背景音和噪音會對識別造成干擾,在方言識別上,AI也略顯吃力。

圖普科技創始人兼CEO李明強坦言,內容審核目前最大的障礙是語音,國內市場面臨方言識別難題,出海企業要針對當地語言配置小語種識別,技術難度大於方言。

在由天宇看來,語音審核在研發階段需要投入較高的成本,語音內容的精準識別難度較大,語義的複雜性也帶來了諸多挑戰。

與人類能夠對新事物進行思考不同,深度學習技術只能根據既有的數據進行訓練,對新出現的不良內容,人工審核進行甄別,對用戶行為進行判斷,在此基礎上,才能總結經驗「傳授」給AI。

如果AI審核出現問題,平台也需要承擔法律風險。

中國政法大學傳播法研究中心副主任朱巍表示,AI審核是基於深度學習的人工智慧,其中的程序、演算法,實際上體現的是一個平台的價值觀和法治觀。「不管這個技術是由平台自主研發,還是由第三方提供,一旦出現問題的話,平台肯定要承擔責任。」

從安全和成本兩個方面來考慮,通過AI審核進行初篩,再將疑似有害內容送達人工審核二次判斷,依然是內容平台普遍採用的審核模式。

自研技術並非標配

涉足UGC內容的平台日益增多,用戶上傳的內容作品質量參差不齊,內容審核方面的需求也隨之不斷增長。引入AI審核工具成為內容平台的必由之路,至於選擇自主研發審核工具,還是與服務商合作,要看平台自身的考量。

億歐從業內人士了解到,位元組跳動並未引入外部內容審核工具,可能是出於數據保護的需要。騰訊、阿里、百度等頭部互聯網企業在內容審核方面都有所布局,如果選擇與外部機構合作,可能有將平台內容和數據泄露給競爭對手的風險。

AI審核工具需要大量數據進行訓練,位元組跳動旗下擁有多個內容平台,能夠建立較為完備的資料庫,工具研發後可以高頻應用。位元組跳動對於內容審核工作十分重視,選擇自主研發可能更適合自身發展需求。

哪些企業會選擇第三方提供的AI審核服務呢?根據李明強的經驗,與頭部企業相比,腰部企業更願意引進內容審核領域的合作夥伴,將資源和精力放在最核心的創新業務上,很少採取自主研發的方式。

AI審核公司相對市場更具審核優勢,李明強表示,某一平台不良樣本的種類和數量都比較有限,服務商介入能夠起到眾包和共享的作用。不良內容在一個平台上出現,可以快速被收入資料庫中,在服務其他公司時更加便捷、安全。

中娛智庫創始人高東旭認可了這一觀點,創業型內容平台資金和技術實力有限,只能通過第三方的工具和平台來進行內容監管。目前國內的數美科技、圖普科技、百度智能雲、金山雲和阿里雲等,都能提供相關的服務和工具。

平台若想從源頭減少內容風險,除了引入第三方機構進行內容審核外,提升團隊的把控能力也十分重要。「在內容生產前,可以請行業專家對內容生產者進行培訓,在內容創作階段就能規避一些風險,同時,還應該加強對於法律法規和相關政策的了解。」高東旭說道。

出海平台如何過審核關

內容平台出海,並不是位元組跳動獨有的戰略。

今年5月初,快手在美國發布了應用Zynn,允許用戶上傳、編輯和分享短視頻。據Sensor Tower提供的數據,在Zynn發布的一個月後,就成為了美國下載量最高的iOS應用。

歡聚時代旗下的泛娛樂直播平台BIGO LIVE也在海外取得了不俗成績。2020年第一季度,歡聚時代的全球平均移動端月活躍用戶達到5.2億,其中77.0%來自海外市場。

作為行業觀察者,由天宇站在時間沿革的角度,回顧了互聯網企業的出海歷程。在互聯網領域,中國公司最早的出海產品主要為工具和遊戲,認知屬性和內容色彩較弱,以B2C模式為主。此後,資訊類產品又成為了出海的熱點,內容多以PGC的形式生產,內容審核方面的壓力仍不算太大。

國內娛樂平台、社交平台陸續出海,帶來了UGC內容的激增,對平台內容審核能力的要求越來越高,十分考驗平台內容和當地文化的兼容程度,以及平台運營商的文化理解能力、溝通協調能力和問題解決邏輯。

AI審核技術的第三方服務也跟隨平台走向海外市場。「圖普針對海外市場研發的圖像審核產品,已經在全球多個地區部署了計算節點,其中海外市場應用最廣泛的是暴力、色情、未成年識別等審核場景。」李明強說道。

AI審核的技術瓶頸也在出海過程中體現。東南亞、印度、非洲是中國互聯網平台出海的主要方向,這些國家和地區都具有語種多樣的特點,AI技術則只能在圖像、視頻審核上沿用國內數據,勢必有所局限。

TikTok在印度市場遇阻正是例證。擁有13億人口的印度擁有巨大的市場空間,對內容提供商的挑戰是複雜的語言體系、多樣的宗教和文化背景,甚至還有當地尖銳的社會議題。

2019年2月,TikTok就曾因內容問題被印度政府封禁。作為應對,位元組跳動在印度沿用了AI技術與審核團隊協作的內容審核流程,審核團隊可以支持14種語言,並用本地語言做出與文化相關的決定。

位元組跳動計劃在2019年12月之前將印度分公司員工人數增加到1000人。此外,位元組跳動還在印度僱傭了超過250名的專職內容審核員。

越來越多的互聯網平台嘗試到海外發展,做好前期準備工作,可以避免內容違規後的被動整改。

作為法律從業者,朱巍為出海平台歸納了避免違規的要點。首先是對兒童權益的保護,杜絕兒童色情等內容的出現,否則在各個國家都將面臨頂格處罰。

做好用戶的個人信息保護也至關重要,在美國、歐盟、新加坡等地,適用的個人信息保護規則可能都不相同,在抓取信息、推薦信息時需要注意當地法規。除此之外,還要遵守當地的文化和風俗

高東旭則給出了進一步的建議:在出海前,互聯網企業必須先行制定適用于海外市場的審核機制,避免平台內容出現問題。「出海平台可以在當地聘請法務人員、熟悉當地文化和宗教的人士,建立配套的審核機制。」

尾聲

媒介形式的進一步多樣化,正給內容審核帶來新的挑戰。

新興的數字娛樂產業是高東旭關注的對象,根據他的觀察,AR、VR的技術門檻正在降低,大量應用AR、VR技術的內容也在不斷湧現,對於如何進行這一部分內容的監管,仍待企業和相關部門關注和進一步研究。

知識付費催化了語音內容的發展,喜馬拉雅FM、荔枝FM、得到等平台的音頻內容數量激增,質量參差不齊,針對語音內容的監管力度也在加強。

李明強十分看好內容審核產品的未來:「隨著5G和融媒體的發展,平台的內容量將會呈幾何級數增長。內容審核技術是一個底層服務,市場需求會持續變大。

致謝:

感謝以下人士為本文提供的豐富案例及觀點,但由於篇幅所限不能全部附上,排名不分先後:中娛智庫創始人高東旭、圖普科技創始人兼CEO李明強、中國政法大學傳播法研究中心副主任朱巍、億歐智庫研究院院長由天宇。

參考資料:

1、《Facebook 審核人員暴增,科技巨頭的漫漫審核路》極客公園 2020年4月15日

2、《位元組跳動印度出海「計」》界面 2020年5月25日

3、《遭美連續攻擊後,TikTok放棄國內審核:尊重不同法律》觀察者網 2020年3月17日

4、《位元組跳動馬維英:人工智慧賦能內容創作和交流》2018年10月28日

5、《位元組跳動副總裁張輔評:上線「靈識系統」打造「內容指紋」保護短視頻版權》中國日報 2018年11月29日

RECOMMEND

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 億歐網 的精彩文章:

報告:一季度全球最暢銷安卓機型中小米佔兩個
美股諾瓦瓦克斯醫藥盤前暴漲超34%