當前位置:
首頁 > 最新 > 北京大學計算機科學技術研究所研究員萬小軍:機器寫稿技術與應用

北京大學計算機科學技術研究所研究員萬小軍:機器寫稿技術與應用

導語:寫稿機器人與記者的目前為止還是一種分工協作的關係。

本文作者:蔣鴻昌

雷鋒網消息,7月8日,CCF-GAIR全球人工智慧與機器人峰會進入第二天,在AI+專場,北京大學計算機科學技術研究所研究員萬小軍,作為AI+專場的開場嘉賓,為我們帶來了主題為《機器寫稿技術與應用》的演講。

機器寫稿的背景與現狀

在國外,已經有三家著名的提供機器寫稿技術的公司,包括ARRIA、AI、 NARRATIVESCIENCE,為美聯社等多家知名媒體寫了數千萬篇稿件,當然這是面向英文或者是西方的語言。

隨著人工智慧技術的發展,國內的機器寫稿也逐漸受到關注,有很多的媒體在和一些學術機構進行合作,推出一些寫稿機器人;另外是互聯網巨頭,包括微軟、百度、騰訊、今日頭條,也在研發機器寫稿技術。寫稿的內容主要側重在體育、財經、民生領域。

以新華社寫稿機器人快筆小新撰寫的財報新聞為例,其技術流程為:數據採集 - 數據加工 - 自動寫稿 - 編輯簽發,它的寫作方式還是比較死板的。

對於原創新聞和二次創作,前者指直接從數據生成原始稿件,比如天氣預報,年報財報;後者指基於已有稿件內容創作新稿件,兩種稿件涉及到不同的技術:第一種是自然語言處理技術,即從我語義的表達生成自然語言;第二種是自動摘要,從已有的文字素材去給它摘要,生成一個新的稿件。

還有一些其他相關的技術,包括文本信息推薦技術,文本複述技術,前者指自動為你插入你想引用的唐詩宋詞、名人名言等,後者指在保持同樣的語義的前提下,自動使用不同的語言表達,以規避版權問題。這裡有一個例子是說「梅西獲得了5座金球獎」,你可以改為「梅西是五屆金球獎得主」,也可以改寫為「金球獎5次頒給了梅西」。

對於更受關注的寫稿機器人與記者的關係:目前為止應該是一種分工協作的關係,就是說機器人現在可能不具有邏輯思維的能力,也不具有深度總結的能力,它只能去把一個基本的新聞事實描述清楚,但是我們記者就可以寫深度報道。

我們在機器寫稿方面的技術研究

我們做了很多的基礎技術性的研究,包括基礎的自動文摘、自然語言生成等等,另外也做了很多的應用研究,包括新聞資訊生成、綜述生成以及用戶評論自動生成。我們介紹幾個代表性的結果。

除了根據結構化數據和素材生成的新聞簡訊,我們還可以生成體育賽事的長篇報道。怎麼生成呢?我們發現有一個很重要的素材,就是體育的直播文字。我們經常發現一個很著名的體育比賽下面都有文字直播,或者是通過視頻直播轉成文字直播,這個文字直播中通常包含主持人對這樣一個比賽的精彩細節的描述,我們通過機器學習的手段,能夠把這些精彩的描述挑選出來,放到我們最終的報道中,這個報道就寫得比較長,可以達到上千字以上。

這是一個生成長篇報道的過程,首先對直播文字進行語句的智能排序,再進行智能選擇,這都是藉助機器學習的手段,最後生成一個平均長度超過1000字的賽事的報道。

另外,在娛樂新聞和自動生成評論上,我們也有不錯的成果。

?

?

目前,我們分別和今日頭條、南方都市報及廣州日報合作推出了小明、小南和阿同機器人。

未來的趨勢展望

機器寫稿不光是在媒體行業,現在也在跟一些遊戲行業和情報行業合作。未來,只要什麼時候你需要寫這樣一些報告,比如一些行業報告,或者寫一些稿件,都會用到機器寫稿,不光是媒體,其它的行業也會用到。

第二個方向,我們現在寫的稿件還主要側重對客觀事實的描寫,還沒有加入太多的態度和立場,因此顯得人性化方面不太理想,下一步會讓我們的稿件自己具有一定的立場。

第三點也是最難的一點,就是讓機器學會推理和歸納,寫出真正的深度報道,比如說我們報道一場足球比賽以後,我們要分析一下為什麼是這樣的結果,把這個原因進行推理總結出來,這樣的報道就是真正的智能的,這是下一步要研究的目標。

雷鋒網原創文章,網站轉載請至雷鋒網官網申請授權。歡迎熱情討論,轉發分享~


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

微型機器人:源於科幻的人體旅行
香港大學席寧:談談醫療納米機器人的三大成功案例 | CCF-GAIR 2017
微軟亞洲研究院資深研究員梅濤:原來視頻可以這麼玩了! | CCF-GAIR 2017
商湯科技林倞:堅持原創技術,用AI推動產業升級
速騰CEO邱純鑫:激光雷達 自動駕駛不可或缺的感測器 | CCF-GAIR 2017

TAG:雷鋒網 |

您可能感興趣

科技頂天 市場立地 對話北京大學計算機科學技術研究所
RPA信息技術服務機器人研究
中國科學技術大學
機器學習SVM模型分類技術應用
中國科學技術大學類腦智能技術及應用國家工程實驗室2018年誠聘英才
光學相控陣技術研究進展及應用領域
李鋒:克拉克的「技術模式」與中國舊石器技術演化研究
技術是科學的應用嗎
【智能技術】大哈機器人
韓國科學技術院開發人工智慧武器
專業鋸片的研發設計與實用技術的研究 博野精密工具
籃球技術:實用中鋒技術教學
專業之生物科學與技術
【科技動向】法國啟動將人工智慧技術用於空中作戰的研究項目
石器技術研究取得新進展
美國家標準技術研究院發布區塊鏈技術報告
PP雲技術副總監:如何使用機器學習演算法優化分發鏈路
清華大學計算機系副教授陳康:區塊鏈技術並不神秘
數說上海市科學技術獎
全國政協委員萬鋼:核科學技術可以用於癌症治療