當前位置:
首頁 > 最新 > 獨家專訪:新華社 「媒體大腦」背後的演算法機制

獨家專訪:新華社 「媒體大腦」背後的演算法機制

傳媒論道|智能傳播

編者按

2017年12月26日,新華社在成都發布媒體人工智慧平台——「媒體大腦」。2018年兩會期間,新華社「媒體大腦」以15秒鐘生成發布了全球首條關於兩會內容的MGC(機器生產內容)視頻新聞,瞬間引爆媒體圈。「媒體大腦」究竟有哪些強大功能?背後採用了哪些演算法機制?它將如何重塑傳播格局?《網路傳播》獨家對話新華智雲聯席CEO傅丕毅、徐常亮,來聽關於 「媒體大腦」背後演算法的深入解析。

傳播君:今年兩會報道期間,「媒體大腦」大放異彩,備受業界關注。除了快速生產MGC視頻新聞,「媒體大腦」還有哪些我們不知道的功能?

傅丕毅:「兩會」向來都是媒體的角力場,今年也不例外,我們首次在全國重大報道中全面使用智能採集、智能語音、人臉識別、版權監測、MGC(機器生產內容)等技術功能,打造系列融合的產品矩陣。MGC視頻新聞由「媒體大腦」中的2410(智能媒體生產平台)生成,這是媒體大腦綜合能力和技術的運用。

「媒體大腦」首先意味著對記者感官的強化和延伸。2410(智能媒體生產平台)通過攝像頭、感測器、無人機、行車記錄儀等智能採集設備,結合新聞發生地附近的多維數據,實時檢測新聞事件,可以幫助記者發現第一手的新聞線索,並給記者提供多維度信息和數據,這樣記者寫出的報道就會更具有廣度和深度。

與此同時,記者的耳朵也得到了新的賦能,專業級錄音應用「采蜜」實現了將錄音內容自動轉寫為文字的功能,適用於採訪、會議等多類場景,並無縫銜接移動端和PC端,提高了記者的工作效率和內容生產力。

人臉核查功能將為新聞的真實性保駕護航。基於精準的人臉識別系統,可以在海量的圖片、視頻素材中確認特定人物,大大減輕事實核查環節的工作量,在源頭上防止虛假新聞出現。

基於新華智雲的大數據能力,用戶畫像功能可以為媒體提供讀者閱讀習慣、位置變化、行為偏好等更詳細、精確的信息。而智能分發系統則依託國內一流的新聞分發渠道,通過大數據在智能硬體等設備上,為讀者精準推送新聞資訊。這兩者相輔相成,拉近了媒體與用戶間的距離,從而達到媒體影響力擴大、用戶體驗提升的雙贏效果。

版權監測是「媒體大腦」為原創者開闢的一道護城河,各類原創內容都將納入「媒體大腦」的保護下。通過對全網近300萬個站點的監控,各類內容侵權行為將無所遁形,抄襲、洗稿等亂象將受到有效遏制。

「媒體大腦」同時賦予了傳統新聞新的呈現方式。新聞會話機器人可通過對新聞大數據的學習,與網友實時進行新聞對話和互動。智能語音合成系統可以將文字生成音頻,使文字新聞通過智能家居、汽車音響等各類渠道到達用戶,進一步延伸新聞內容的傳播路徑。

兩會MGC視頻

傳播君:可否介紹一下「媒體大腦」背後的演算法機制?

徐常亮:「媒體大腦」的演算法機制是一個大話題。這首先包括了2410(智能媒體生產平台)中的場景識別能力、采蜜根據語音轉換成文字的能力等。這部分演算法是為了從外界發掘信息,需要我們一種一種模式、一個一個場景地去積累,各類別的演算法則是相對獨立的。目前在火災、爆炸、碰撞等特定場景中,「媒體大腦」的識別演算法已經達到了良好的準確率。

在內容生產智能方面,「媒體大腦」的演算法機制體現在MGC引擎,可以概括為一個「業務數據化-數據業務化」的閉環反饋過程:一是讓傳統的業務資料成為數據,讓線下的數據走向線上,和計算相接,這個過程對應的就是業務數據化,二是讓數據形成閉環,回到業務的使用場景中,對業務進行改善並讓人工智慧不斷自我進化,這個過程對應的就是數據業務化。

2410(智能媒體生產平台)

傳播君:機器演算法需要人來調教。「媒體大腦」是否也需要人工審核?機器和人如何配合?

傅丕毅:對目前的「媒體大腦」來說,人工參與和觀察的角色是不可避免的,人的智慧+機器的智能,這是一種全量數據+人機協同的工作模式。首先,「媒體大腦」產出的內容以及質量在一定程度上依賴於人工的經驗和反饋。其次,在判斷黃色、暴力、敏感等內容方面,現有的智能技術可以進行初步篩選和校對,但最終還是需要人的再校對。最後,我們相信隨著人工智慧技術和計算資源量的提高,人工審核的依賴度會逐漸下降。

傳播君:演算法是一把雙刃劍,其帶來的優勢與風險並存。為預防演算法風險,「媒體大腦」採取了哪些舉措?

徐常亮:「媒體大腦」在兩個方面做了預防工作:首先從源頭上,「媒體大腦」嚴控數據源。新聞記錄的是歷史,更沉澱下了數據。「媒體大腦」正在建立一個全球最大的新聞資訊庫,包括主流媒體和自媒體,形式上會包含規整的新聞類文字、圖文、音頻、視頻稿件,也會包含微博、短視頻等用戶產生的看似雜亂無章的各類UGC內容。我們會對這些內容再來做結構化、標籤化等各方面的工作,使傳統的資料成為與計算相接的、可供大規模使用的數據。維護一個可信的媒資列表,內容生產僅在此範圍內取材。這就相當於大量有經驗的媒體工作者已經為「媒體大腦」把了第一道關,從而降低了出現不良內容的概率。

其次在出口上,「媒體大腦」擁有一支自己的審核隊伍,只有達到一定質量標準的MGC視頻才會被發布。其它的MGC視頻也並沒有浪費,而是作為內容反饋和反向樣本促成了下一批MGC視頻的改進。

傳播君:「媒體大腦」將如何重塑傳播格局?記者會被機器取代嗎?

傅丕毅:「媒體大腦」和MGC視頻新聞的出現,不是要取代記者和編輯,而是要在更高層面上,把人與物的延伸連接起來,更快、更准、更智能地獲得新聞線索和新聞素材,賦能記者和編輯,幫助媒體提高生產力。

第一,「媒體大腦」是一個智聯的平台,可以將人、物、視頻、文本等所有的信息串聯在一起,它扮演智能時代新聞生產基礎設施的角色,來定義智能媒體時代行業的核心競爭力。智媒的前提就是萬物皆媒,萬物成為數據採集、產生新聞資源的媒介,成為可傳遞信息和發布信息的埠。

第二,增加了新聞資源。從攝像頭和感測器、無人機來的數據,相當於記者的眼睛、手、腳,讓記者可以觸達更遠、更廣、更深的內容,對突發事件報道線索的獲取也更快、更准、更強。

第三,存量數據和新增數據都即將被管理起來。媒資庫的智能使用,方便記者進行檢索和調用生產資料。記者藉助智能工具應用,可避免簡單枯燥的工作,提升效率。在機器智能的武裝下,記者可以探尋背後龐大的新聞資源。這樣的人機結合與協同,將帶來媒體完全不同的跨界融合。

第四、智能工具的普遍使用,比如采蜜——實時聲音轉文本的技術,避免了簡單枯燥的聽錄音的工作,解放了記者的勞動力。比如,數據可視化模版,降低了數據新聞門檻,使記者很容易上手。

「媒體大腦」的出現是一次技術革命,意味著內容的生產效率和傳播效率進入了一個新時代,這是機器的智能+人的智能的雙贏和重生,這將開啟一個全新的AI內容生態系統。「媒體大腦」的目標是成為智能媒體時代的基礎設施,成為AI內容的定義者和發布者。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 網路傳播雜誌 的精彩文章:

BAT等互聯網大佬為何齊聚貴陽?
2017中國電視網路傳播力榜單發布

TAG:網路傳播雜誌 |