小冰怎麼商業化，我們和研發她的科學家聊了聊

天下 05-28

在 5 月 19 日知乎的「鹽 Club」上，微軟的人工智慧小冰演唱了活動的主題曲。小冰同時也是這首歌的詞作者。

小冰作詞/演唱《我知我新》

小冰幾年前就會唱歌，但這次有一些不同。此前小冰過去的聲音已經相當逼近真人，但「機器味」還是很重，因為人工智慧並不需要換氣，這次的歌曲里加進了人工智慧合成的換氣聲；小冰去年已經出版了一本現代詩集，但寫現代詩和寫歌詞不大相同，現代詩只憑意象就可以成為好作品，但歌詞需要押韻，同時還需要和旋律搭配。

小冰從 5 年前只能文字聊天，到現在可以和人直接打電話和寫歌作曲，一直面臨一個問題，也是所有人工智慧聊天機器人面臨的問題：越來越像人，這究竟有什麼用？

Google 的答案是，它可以替你打電話訂座位。在今年 Google IO 開發者大會上，Google 展示了兩段人工智慧的對話片段：Google 智能助理直接和理髮店和餐館打了個電話，約好了剪頭髮和吃飯的服務。

微軟小冰的團隊說，和 Google 相比，微軟做的技術更難，同時具體用途也在完全不同的方向。

微軟亞洲互聯網工程院負責微軟小冰語音合成的首席語音科學家欒劍說，Google 人工智慧助手是更偏向任務的人工智慧，它面對的是很窄很具體的對話內容，比如訂座位。但小冰可以和人閑聊，從技術上來說這更難做到。

過去一年，小冰在微信上測試了和人打電話的功能，一共測試了 60 萬通電話，內容都是閑聊，一般會在用戶和小冰在微信上的對話發生以後，小冰直接撥過去。舉例來說，你如果和小冰說你心情不好，她會打電話給你，問你是否心情有好轉，然後讓你早點睡覺。

實際上，和小冰的聊天還是會有一些奇怪的感覺。相對於真人之間的對話，小冰更容易出現突然岔開話題的現象。雖然這句話和過去你們幾個小時的對話大概率是有關的，但真人很少會這樣突然換話題。

欒劍解釋說，小冰可以直接和人打電話，需要理解整個對話中的所有內容，所以有時候會出現岔開話題的問題。從技術角度說，小冰的回應是從人類的對話中學習的模式，她所有的對話都一定有邏輯，但這個邏輯和人類的不同，可能隱藏的比較深。

這種打電話的直接溝通，雖然不是很像真人，但全世界目前只有小冰可以實現。這種能力是小冰的主要技術特徵，但不是最終應用方向。無論是語音、文字聊天，還是寫詩、寫詞，其中運用的技術都是類似的，都是從大量人類數據中，比如對話、歌詞、歌曲、現代詩中學習規律，然後生成結果。

小冰寫詩的迭代

微軟亞洲互聯網工程院人工智慧創造事業部副總經理袁晶說，能寫詩寫詞，但小冰的「創造力」只是一種工程上的模擬。他展示了一個小冰寫詩的實例：10 次迭代時，小冰的現代詩看上去純粹是辭彙的堆砌，看不出什麼語法；500 次迭代時稍微好了一點，但還是會有奇怪的搭配；到了 10000 次迭代時，小冰的作品已經可以稱為詩了。

袁晶說，無論是唱歌還是寫詩，小冰的訓練過程中經常會出現令人驚喜的結果。但無論結果如何，小冰所做的都是「運算」，只是對她學習的這些詩句中，包含的人類詩人所擁有的「創造力」的的擬合。所以在所有「創作」上，小冰不可能超過人類。

欒劍說，目前微軟認為，小冰的意義表現在兩個方面。其一，諸如唱歌這樣的個性化的表達，小冰正在試圖創造專屬於 AI 的藝術形式。他說，給小冰唱歌加呼氣聲，是為了讓人類聽的更舒服，以免跟唱的人覺得沒有喘氣的空間。同時，加入呼氣聲也只是一種嘗試，微軟正在探索小冰獨有的歌聲，可能和人類的特徵很不一樣。

其二，雖然小冰並不會真的「創造」，但她可以幫助人類創作：人工智慧擅長的是快速運算，小冰可以在幾分鐘內把一首詩從「完全看不懂」變成「頗有意境」，但換作人類的話，這種學習可能要很多年。

袁晶說，這就是人工智慧的意義。人類中藝術家也是稀缺的，但未來人工智慧或許可以幫助他們從無數文字、音符的可能性中找出全新的組合，再由人類藝術家完成真正的創作。

欒劍補充說，他不認為 AI 做的只是無意義的，窮舉似的排列組合。他說，窮舉會產生無數無意義的噪音，即使真正的精華誕生也會淹沒在噪音之中，而人工智慧基於人類的經驗的學習，能夠知道什麼是人類沒有嘗試過的理解和組合，然後將它們挑出來。

當然這都是未來的願景，現階段小冰的能力可以達到的商業化目標，是利用語音合成、文字創作的能力，替人類生產定製化的有聲讀物。

舉例來說，當家長有需求希望替自己的小孩定製兒童故事有聲讀物，比如故事裡嵌入小孩的名字。在過去，這需要配音演員專門寫詞和錄音，成本會高到個人絕對不願意承擔。但以小冰的能力，可以在直接輸入名字之後，瞬間寫好故事，並且完成朗讀的合成。

微軟展示了一個 Demo，播放了聽起來像是某個著名配音演員用三段不同語氣朗讀的兒童故事，但實際上這三段都是小冰合成的，實際上完全沒有 AI 合成的痕迹。與知名配音演員合作，生成定製化的有聲讀物作品，就是目前的一種商業模式。

在 Google IO 大會上的 Demo 中，AI 和人類對話沒有提示，AI 還會加上「嗯」之類的語氣詞來模仿人類，這曾經引起了一些科技倫理方面的爭議——質疑的重點是為什麼要欺騙，而不是聲明自己究竟是什麼。當然，這可能想太遠了。實際使用中幾乎一定會有更複雜的問題出現，然後人工智慧露餡，導致預定不成的情況發生。

在說到無法區分人類還是人工智慧時，袁晶補充道，微軟和 Google 不一樣，微軟在人工智慧和人類對話中會首先說「我是微軟小冰」，聲明這是 AI 以避免詐騙等法律風險。

題圖/I.Robot劇照

我們做了一個壁紙應用，給你的手機加點好奇心。去 App 商店搜好奇怪下載吧。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 好奇心日報 的精彩文章:

※新紀錄片上映在即，美國國家地理為它出了一款 VR 頭盔
※北京三環邊最後一個花市被關，這是它的最後 33 天

TAG:好奇心日報 |