機器人會寫稿之後,騰訊還想讓它實時整理出一份新聞簡報
2015 年 9 月騰訊財經曾推出了一個名為「Dreamwriter」的自動化新聞寫作機器人,一時間讓廣大媒體同行紛紛感嘆要「失業」了。不過,寫稿機器人受限於一些消息、快訊,也主要應用於體育、財經類報道中,並不能夠完全取代編輯記者們的工作。據騰訊財經主編,也是內容機器人團隊的負責人劉康回憶,當時需求非常強烈,推出 Dreamwriter 主要是想讓新人能把更多精力放在更有創造力的事情上。
4 月 17 日下午,在一場媒體溝通會上,劉康總結了 Dreamwriter 此前所做的一些事情。從 2016 年奧運會期間的 3600 篇稿件,到騰訊體育 APP 上小夢戰報的機器人稿件專欄,寫稿機器人功勞可不小。
劉康認為,「機器寫作從 0 到 1 大家都可以有,但從 1 到 2、到 3 要花費相當大的精力。」他表示「今天的數據量非常細,我們可以描述到每一個數據的顆粒還原。」
他舉例此前奧運期間的一篇跳水的稿件。「因為跳水是一個評分制的比賽,比如說我現在是評委,大家在進行比賽,我要給每個動作打分,這些打分都是記錄在資料庫里的,比如走板、空中姿態、落水姿態、水花這些都是有詳實的數據的,它會被錄進資料庫。然後我們再怎麼寫它呢?這些數據會被我們通過一定的演算法和機器自己的識別,我們先讓機器跑幾十萬篇的數據,跑一個規則出來,它會自己把這些數據重新還原。因為每一個分數都可以還原成一個動作,這樣通過一定的演算法把它還原成原先的場面。」
但是要做的很好,就非常難。劉康解釋到,像財經和體育兩個領域都難,但又不難。這是因為,財經本身有強烈的規則和演算法模型,做簡單的報道沒有太多的技術含量,而難在對數據的解讀、認知需要一套模型來判斷它,甚至將來的預測。至於體育,關於球隊比分可以從數據里抓取,但難在描述本身,「只有表示精彩才會看,如果不夠精彩我會想去看視頻。」
目前,寫稿機器人主要針對的稿件領域為財經、體育、科技和新聞,其中新聞則偏向於社會類的、天氣等。劉康還提供了一份機器人寫稿的數據量。半年的稿件量是 30 萬篇,稿件字數 600 萬,運營事故 0 起。
針對運營事故,劉康表示他們有一個專門的安全管理平台:
機器自己寫的時候會單獨做一個演算法和規則判斷機器寫的有沒有問題;接著會經過人工安全審核;最後才會推送出來。
三個步驟中間銜接的時間越少,意味著出來的作品越準確越迅速。
現在,他們的三項技術已經拿到了國家專利,包括:智能撰文技術 Dreamwriter、內容抽取技術 Dreamreader、要聞萃取技術 Secretary。接下來,他們希望在不同的領域,不同的頻道嘗試。
除了回顧此前寫稿機器人達到的成果外,這次溝通會劉康特別介紹了一款基於寫稿機器人而孵化的新產品——Dreamreader(新聞超秘)。在劉康看來,現在一些資訊應用佔據了人們日常的太多時間,有時候不知不覺已經在一款應用上耗費了一兩個小時。而 Dreamreader 是想讓大家「用完即走」,它可以成為人們的資訊秘書,通過智能演算法,將每天的最重要的新聞篩選出來呈現給用戶。
據介紹,Dreamreader 是基於 Dreamwriter 的機器寫作技術和內容抽取技術而產生的。溝通會現場,雷鋒網試用了這款應用。目前該應用還是 1.0 版本,整個界面只有兩個欄目,一個是精選新聞,一個是新聞詳情。
同時,一些由 Dreamwriter 撰寫的最新資訊會不時進行更新,而精選後的資訊則會用語音讀給用戶。未來,他們的目標是把它做成一個新聞 AI-個性化資訊生產和服務平台。劉康強調,對於這款產品,重要的是將每天那麼多的資訊,按照用戶的需求整理成簡報,就像秘書一樣。
不過,儘管在設計時,採用了「能解放雙手」的語音交互方式,但語音朗讀十分生硬,而且沒有匹配的文字版本,畢竟我們聽一段語音要比看一段文字花費的時間長的多。劉康稱在之後的 1.5 版本會弱化語音本身,並增加文字版本。
現場雷鋒網所看到的 Dreamreader 所抓取的信息源全部由 Dreamwriter 撰寫,至於未來會不會抓取其他信息源,劉康表示,「會抓取騰訊所有版權內容,內容源的使用是合法合規的。」從全網抓取信息整理成簡報也是可行的,但是否會涉及到版權問題,這還需要考慮。他稱從技術上來說並不難實現。
劉康現在還無法給出 Dreamreader 確定的上線時間,還想把它完善的更好。
雖說這次溝通會的主題是 Dreamreader,但當看到寫稿機器人已經能完成大量的快訊後,當天在做的媒體也不禁問道,「騰訊什麼時候會把寫稿機器人開放給第三方使用?」
劉康透露,現在
「要把全品類兼容好,把像娛樂其他品類全部搞定,優化後可以使用了,然後我們才可以對外開放,不可能在一兩個場景內單獨開放。如果覺得某一個垂直領域不錯,想用的話也可以探討,因為單獨開放之前是沒有放在日程上。」
此刻雷鋒網編輯已經不怕機器人搶走「飯碗」了,反倒希望機器人能幫忙出快訊。
TAG:雷鋒網 |
※TP簡報:提醒一下,猴子可能已經進入新石器時代了
※ACG簡報:沒事沒事,還能再拖
※TP簡報:騰訊和阿里達成了音樂版權協議,再也不用裝那麼多客戶端了
※科技簡報:所有的市場競爭最終都會走上資本之路,用錢來解決一切
※本周新聞簡報,一份微型播報,眾覽天下事!
※VICE 賴床簡報:或許跟你聽說的不一樣——主人意外死亡後,狗比貓更可能把屍體吃掉
※VICE 賴床簡報:想要自拍出漂亮的裸照其實很簡單
※特朗普再一次命令白宮簡報會禁止拍照,CNN不得已派出畫家作畫
※簡報:這幾天蘋果公司都發布了4款怎樣的新產品?
※TP簡報:證據顯示人類還在進化中,胖子和痴呆將會被自然淘汰
※大兵簡報|如果你是個電影迷加槍迷,一定不能錯過!
※一周行情簡報
※VICE 賴床簡報:打擊報復確實能讓人感到心曠神怡
※股市簡報:中途歇息,無需害怕
※TP簡報:是直是Gay?讓這個人工智慧看看照片就知道了
※TP簡報:禁令解除!國內航班上很快就可以玩手機了
※VICE 賴床簡報:特朗普顯靈!他的頭像出現在了廁所瓷磚上
※總統每日簡報是什麼,特朗普何以自詡不用看
※VICE 賴床簡報:人們對戀物癖的想法都是錯的