獨家專訪：新華社「媒體大腦」背後的演算法機制

最新 05-31

傳媒論道|智能傳播

編者按

2017年12月26日，新華社在成都發布媒體人工智慧平台——「媒體大腦」。2018年兩會期間，新華社「媒體大腦」以15秒鐘生成發布了全球首條關於兩會內容的MGC(機器生產內容)視頻新聞，瞬間引爆媒體圈。「媒體大腦」究竟有哪些強大功能？背後採用了哪些演算法機制？它將如何重塑傳播格局？《網路傳播》獨家對話新華智雲聯席CEO傅丕毅、徐常亮，來聽關於「媒體大腦」背後演算法的深入解析。

傳播君：今年兩會報道期間，「媒體大腦」大放異彩，備受業界關注。除了快速生產MGC視頻新聞，「媒體大腦」還有哪些我們不知道的功能？

傅丕毅：「兩會」向來都是媒體的角力場，今年也不例外，我們首次在全國重大報道中全面使用智能採集、智能語音、人臉識別、版權監測、MGC（機器生產內容）等技術功能，打造系列融合的產品矩陣。MGC視頻新聞由「媒體大腦」中的2410（智能媒體生產平台）生成，這是媒體大腦綜合能力和技術的運用。

「媒體大腦」首先意味著對記者感官的強化和延伸。2410（智能媒體生產平台）通過攝像頭、感測器、無人機、行車記錄儀等智能採集設備，結合新聞發生地附近的多維數據，實時檢測新聞事件，可以幫助記者發現第一手的新聞線索，並給記者提供多維度信息和數據，這樣記者寫出的報道就會更具有廣度和深度。

與此同時，記者的耳朵也得到了新的賦能，專業級錄音應用「采蜜」實現了將錄音內容自動轉寫為文字的功能，適用於採訪、會議等多類場景，並無縫銜接移動端和PC端，提高了記者的工作效率和內容生產力。

人臉核查功能將為新聞的真實性保駕護航。基於精準的人臉識別系統，可以在海量的圖片、視頻素材中確認特定人物，大大減輕事實核查環節的工作量，在源頭上防止虛假新聞出現。

基於新華智雲的大數據能力，用戶畫像功能可以為媒體提供讀者閱讀習慣、位置變化、行為偏好等更詳細、精確的信息。而智能分發系統則依託國內一流的新聞分發渠道，通過大數據在智能硬體等設備上，為讀者精準推送新聞資訊。這兩者相輔相成，拉近了媒體與用戶間的距離，從而達到媒體影響力擴大、用戶體驗提升的雙贏效果。

版權監測是「媒體大腦」為原創者開闢的一道護城河，各類原創內容都將納入「媒體大腦」的保護下。通過對全網近300萬個站點的監控，各類內容侵權行為將無所遁形，抄襲、洗稿等亂象將受到有效遏制。

「媒體大腦」同時賦予了傳統新聞新的呈現方式。新聞會話機器人可通過對新聞大數據的學習，與網友實時進行新聞對話和互動。智能語音合成系統可以將文字生成音頻，使文字新聞通過智能家居、汽車音響等各類渠道到達用戶，進一步延伸新聞內容的傳播路徑。

兩會MGC視頻

傳播君：可否介紹一下「媒體大腦」背後的演算法機制？

徐常亮：「媒體大腦」的演算法機制是一個大話題。這首先包括了2410（智能媒體生產平台）中的場景識別能力、采蜜根據語音轉換成文字的能力等。這部分演算法是為了從外界發掘信息，需要我們一種一種模式、一個一個場景地去積累，各類別的演算法則是相對獨立的。目前在火災、爆炸、碰撞等特定場景中，「媒體大腦」的識別演算法已經達到了良好的準確率。

在內容生產智能方面，「媒體大腦」的演算法機制體現在MGC引擎，可以概括為一個「業務數據化-數據業務化」的閉環反饋過程：一是讓傳統的業務資料成為數據，讓線下的數據走向線上，和計算相接，這個過程對應的就是業務數據化，二是讓數據形成閉環，回到業務的使用場景中，對業務進行改善並讓人工智慧不斷自我進化，這個過程對應的就是數據業務化。

2410（智能媒體生產平台）

傳播君：機器演算法需要人來調教。「媒體大腦」是否也需要人工審核？機器和人如何配合？

傅丕毅：對目前的「媒體大腦」來說，人工參與和觀察的角色是不可避免的，人的智慧+機器的智能，這是一種全量數據+人機協同的工作模式。首先，「媒體大腦」產出的內容以及質量在一定程度上依賴於人工的經驗和反饋。其次，在判斷黃色、暴力、敏感等內容方面，現有的智能技術可以進行初步篩選和校對，但最終還是需要人的再校對。最後，我們相信隨著人工智慧技術和計算資源量的提高，人工審核的依賴度會逐漸下降。

傳播君：演算法是一把雙刃劍，其帶來的優勢與風險並存。為預防演算法風險，「媒體大腦」採取了哪些舉措？

徐常亮：「媒體大腦」在兩個方面做了預防工作：首先從源頭上，「媒體大腦」嚴控數據源。新聞記錄的是歷史，更沉澱下了數據。「媒體大腦」正在建立一個全球最大的新聞資訊庫，包括主流媒體和自媒體，形式上會包含規整的新聞類文字、圖文、音頻、視頻稿件，也會包含微博、短視頻等用戶產生的看似雜亂無章的各類UGC內容。我們會對這些內容再來做結構化、標籤化等各方面的工作，使傳統的資料成為與計算相接的、可供大規模使用的數據。維護一個可信的媒資列表，內容生產僅在此範圍內取材。這就相當於大量有經驗的媒體工作者已經為「媒體大腦」把了第一道關，從而降低了出現不良內容的概率。

其次在出口上，「媒體大腦」擁有一支自己的審核隊伍，只有達到一定質量標準的MGC視頻才會被發布。其它的MGC視頻也並沒有浪費，而是作為內容反饋和反向樣本促成了下一批MGC視頻的改進。

傳播君：「媒體大腦」將如何重塑傳播格局？記者會被機器取代嗎？

傅丕毅：「媒體大腦」和MGC視頻新聞的出現，不是要取代記者和編輯，而是要在更高層面上，把人與物的延伸連接起來，更快、更准、更智能地獲得新聞線索和新聞素材，賦能記者和編輯，幫助媒體提高生產力。

第一，「媒體大腦」是一個智聯的平台，可以將人、物、視頻、文本等所有的信息串聯在一起，它扮演智能時代新聞生產基礎設施的角色，來定義智能媒體時代行業的核心競爭力。智媒的前提就是萬物皆媒，萬物成為數據採集、產生新聞資源的媒介，成為可傳遞信息和發布信息的埠。

第二，增加了新聞資源。從攝像頭和感測器、無人機來的數據，相當於記者的眼睛、手、腳，讓記者可以觸達更遠、更廣、更深的內容，對突發事件報道線索的獲取也更快、更准、更強。

第三，存量數據和新增數據都即將被管理起來。媒資庫的智能使用，方便記者進行檢索和調用生產資料。記者藉助智能工具應用，可避免簡單枯燥的工作，提升效率。在機器智能的武裝下，記者可以探尋背後龐大的新聞資源。這樣的人機結合與協同，將帶來媒體完全不同的跨界融合。

第四、智能工具的普遍使用，比如采蜜——實時聲音轉文本的技術，避免了簡單枯燥的聽錄音的工作，解放了記者的勞動力。比如，數據可視化模版，降低了數據新聞門檻，使記者很容易上手。

「媒體大腦」的出現是一次技術革命，意味著內容的生產效率和傳播效率進入了一個新時代，這是機器的智能+人的智能的雙贏和重生，這將開啟一個全新的AI內容生態系統。「媒體大腦」的目標是成為智能媒體時代的基礎設施，成為AI內容的定義者和發布者。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 網路傳播雜誌 的精彩文章:

※BAT等互聯網大佬為何齊聚貴陽？
※2017中國電視網路傳播力榜單發布

TAG:網路傳播雜誌 |

獨家專訪：新華社 「媒體大腦」背後的演算法機制

獨家專訪：新華社「媒體大腦」背後的演算法機制