當前位置:
首頁 > 最新 > AI替代內容創作者?「讓機器服務於人才是未來趨勢」

AI替代內容創作者?「讓機器服務於人才是未來趨勢」

關注「騰訊媒體研究院」

在2009年美國的職業棒球大聯盟季後賽上,一款名為「StatsMonkey」的人工軟體完成了世界上第一篇機器稿件。隨後的兩年內,包括《福布斯》在內的頂級媒體里已經開始嘗試機器人寫稿,其完成的文章應用在商業,政治等各個領域,依靠強大的大數據平台,其30s生成一篇稿件的速度無人能及。一時間「寫稿機器人入侵傳媒界,記者編輯要失業了」的論調弄得滿城風雨,記者編輯們也惶惶不可終日,都開始擔心起自己的前途。

時間來到了2015年,騰訊作為國內「第一個吃螃蟹的人」率先啟用機器人寫稿,並發布了一篇出自寫作機器人「Dreamwriter」之手的文章。官方稱Dreamwriter是騰訊財經開發的自動化新聞寫作機器人,能夠根據演算法在第一時間自動生成稿件,瞬時輸出分析和研判,一分鐘內將重要資訊和解讀送達用戶。

自那以後,國內無論是傳統媒體還是互聯網巨頭,都紛紛開始使用人工智慧進行內容創作,機器人寫的文章也在潛移默化之中融入進我們的資訊世界。那麼,在當下這個時間節點,機器寫稿究竟發展到了什麼程度?與人相比機器在內容創作方面的優勢與劣勢在哪?

本期內容我們採訪到了Dreamwriter的負責人劉康,並結合當下的研究資料整理成文,期待能夠解答內容創作者朋友們內心的疑問與焦慮。

1

從Dreamwriter的寫稿邏輯看人工智慧在內容領域的應用

總體上看寫稿機器人總共可分為三類,都依賴「自然語言處理」技術,第一類是模板式寫稿,即使用一個文章模板套用,將資料庫中的結構化信息包括具體數字、百分比等填充進去,進行傳統意義上的「照本宣科」工作。第二類是提取後整理,即對包含無用信息的長自然語言文本進行分析,提取文章中的關鍵信息,重新組織語言後輸出。第三種是自己生成,其通常方法是通過訓練語言模型,對語言進行數學建模,然後不使用原文的原話,使用自己的方式逐句地生成演算法認為「最能夠體現原文包含意思而且看起來像一句話」的文字。

Dreamwriter在這三種模式中均有嘗試,但模板式寫稿和提取後整理是最常用的兩種。Dreamwriter進行寫作的整個流程主要經歷以上五個環節:資料庫的建立、機器對資料庫的學習、就具體項目進行寫作、內容審核、分發。通俗來說,即是騰訊要先通過購買或自己創建資料庫(即要進行機器寫稿的行業稿件);然後讓Dreamwriter機器對資料庫內的各項數據進行分析,得出字、詞在某個句子中相互匹配的概率,接著在寫作時選用最有可能匹配的字、詞、句進行匹配,生成一篇完整的文章;寫作完成後經過審核環節,最後通過騰訊的內容發布平台到達用戶端。

需要強調的是,機器人寫作的重要前提是資料庫的購買和建立。沒有數據,機器就無法進行數據的分析與學習,也無法自動量化生成生動的文章。所謂機器學習,即是專門的技術人員通過演算法設計和數據分析技術讓Dreamwriter去理解資料庫。這種理解不只是對數據本身的理解,還要理解每一項數據所對應的寫作模板。

劉康舉了一個例子:「體育新聞報道要求欣賞到其中的細節,因此Dreamwriter要把每一個點都打得很『碎』,最後『組合』起來。比如說報道奧運會的跳水比賽,這是Dreamwriter表達最生動的一個範例。比賽中,每一個運動員都一套專業得分,包含了走板、空中姿態、入水水花效果等。在Dreamwriter學習過程中,它把每一步的得分都打散了,在資料庫里隨意組合抓取,同時綜合賽事本身的規則,最終把這些分數還原成一套表述。」

2

把人從枯燥而繁瑣的工作中解放出來

劉康指出Dreamwriter最初誕生時要解決的最核心的問題就是「財經新聞的生產能力滿足不了內容的需要」。據統計,中國的金融市場平均每天發布大約1900篇公告,而這1900篇公告,一位資深證券編輯需要100個小時才能看完。Dreamwriter的意義便是解放了一大部分記者編輯的人力,讓他們不再花時間盯著公司財報和證監會的網站,通過模板式的文章生產與數據抓取來為用戶供給這些信息。

就目前來看,寫稿機器人能夠贏過人類記者,主要優勢在兩個方面——「數量」和「效率」。和傳統媒體人相比,寫稿機器人可以瞬間完成海量閱讀、分析並根據互聯網活躍點擊量數據,瞬時篩選出下一個熱點新聞,然後通過後台演算法快速合成新聞。總體來看,寫稿機器人在速度和數量上有著絕對優勢。依靠海量數據和不斷演進的演算法設計,生成一篇深度報道的時間已經由最初的30秒縮短到2秒以內,其精確度還在不斷提升,而且擬人化、情感化的技能也在不斷增強。

劉康把機器的優勢歸納為「多、快、好、省」,善於處理數據、在海量信息中摸爬滾打等等,機器人的這些「天性」,使得他們不僅在處理涉及數據的新聞時更不易出錯,有時甚至還能成為抵制虛假信息的「打假鬥士」。海量的新聞抓取,精準的數據加工,實時監控、快速報道,這些都是人類所無法輕易達到的。

3

機器替代人?No,機器服務於人

當我們問劉康記者、編輯是否會失業時,他堅決地予以否定,並講到:「機器服務於人才是未來的趨勢。」

國外曾有一位資深商業記者與智能機器人進行了一次「寫稿比賽」,雙方坐等一家公司出財報,兩「人」同時開寫一篇短報道。最終結果,速度上機器人以2分鐘完稿大勝人類的7分鐘。質量上,機器人的文章獲得912票支持,而記者的文章獲得了9916票的支持。

「人們難以期望機器人會變換著語氣在採訪中進行觀點交鋒,也不能指望它在鏡頭前隨機應變或深入背街小巷明察暗訪。」曾有一位媒體從業者這樣說,新聞字裡行間與鏡頭之下都包含著記者的判斷、價值觀與人文關懷。機器人寫手卻無法完全具備人的靈活性和創造力。

究其根本,機器始終是機器,它並不具備和人一樣的思考能力,所有AI作品的完成都或多或少得到了人類的指點,而人給的指點越少,AI的最終作品就越慘不忍睹。另一方面,機器寫稿的核心是利用大數據對信息進行分析,然後套用固定演算法進行重新排列組合,再用人們能夠接受的或新聞報道要求的格式呈現,這就造成了寫作模式固定,適用面窄。劉康也在採訪中提到目前應用領域最多的為體育、天氣、財經等資訊性較強的新聞報道,而人文社科類則有待進一步開發。

所以機器替代人在未來很長一段時間內是不可能發生的事情,機器要取代的,只是機械式、無創造力的編輯工作。從這一角度出發,劉康認為記者和編輯以後會越來越有價值,因為專業性更高,從業門檻也更高了。

當問及未來人與機器之間的關係,劉康作了一番暢想:「很有可能未來每個編輯都會配一個人工智慧寫稿軟體,以幫助人來抓取熱點信息或解決掉繁瑣、重複、無創造力的工作,把人放在更高層級的工作上,讓機器幫助人提高工作效率。」

或許正如北京師範大學新聞傳播學院執行院長喻國明所說,隨著機器人寫稿能夠實現在災害、體育、財報等規格化新聞資訊的精確、迅捷發布,並對不同語言風格的智能化學習,未來新聞人應該把精力重點放在機器人無法完成的調查性、深度解釋性報道上——聯繫採訪對象,觀察對方,用心感受人物,再對大量資料進行整理,做出取捨。

新聞稿件的字裡行間里都飽含著記者的判斷、價值觀與人文關懷,這都是機器所無法企及的。就如人民日報副總編輯盧新寧在2017年媒體融合發展論壇上所言:「作為記者,我為地震顫抖,但機器人不會。」

#End#


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 騰訊媒體研究院 的精彩文章:

TAG:騰訊媒體研究院 |