麻省理工科技評論:想理解中文,人工智慧還得繼續努力
【綜合/觀察者網 韓京霏】會寫散文的百度大腦、阿里巴巴的天貓精靈,戰勝了柯潔的AlphaGo……近年來,人工智慧不再只是科學家口中的超前概念,而是逐漸進入到大眾的視野當中。
不過,麻省理工科技評論網站7月25日發表了一篇文章,認為識別中文這件事情,不只是對於歪果仁來說有點難度,對於人工智慧也不是非常容易。人工智慧想要高效識別中文的話,還得再努把力。
麻省理工科技在評論中,列舉了來自阿里、百度等中國企業在國內目前具有較強代表性的聲音識別類人工智慧。
實際上,美國類似產品的火爆,已經引起了中國科技投資者的興趣。研究公司IDC預測,到2020年,51%的智能駕駛產業、68%的手機和可穿戴設備產業,都會覆蓋基於會話的人工智慧系統。
最著名的可穿戴設備之一:Google Glass(資料圖)
不過,評論認為,人工智慧在真正「理解」中文的路上,可能還需要再努力一些。
首先,在輸入文字方面,輸入中文就要稍微難一些。現在,如果想用鍵盤輸入中文,我們最常用的途徑就是拼音輸入法。
但是,中文的特點是它有四個音調,於是同一個拼音組合下可能會出現不同音調的漢字,而且還存在著非常多的同音字。這樣的話,我們就不得不進行一個「選字」的工作,在很多同音字中,選出自己想要的那一個。
畢竟,如果不選字的話,「季姬急極屐擊雞」和「石室詩士施氏,嗜獅,誓食十獅」這種千古奇文,實在是不知道應該怎麼打出來……
面對博大精深的中華文化,我的心情非常複雜
一些比較智能的輸入法,可能會根據上下文去試著推薦一些字元,但是這種推薦的精度也相對有限。
所以,可能正因為如此,中國的主流通信應用程序(如微信),是主打用語音來傳遞信息的。而在美國,這種程序的主要溝通方式一般是文本。
面對這個問題,一些人工智慧的開發者,會試圖用語音命令的方式實現人機溝通。在這種方式下,機器將用戶的語音轉換為文本,再根據文本的意義作出反饋。
這種方法在針對某些特定任務時非常有效,比如,用戶可以對機器說話,要求手機實現「查詢天氣」或者「把某個詞語翻譯為英文」之類的特定指令。但是,一旦對話里有多個不同的話題,或者有上下文的話,這個方法就不太靈了。
解決中文對話的另外一個挑戰,就是作為一種語言,中文本來就很複雜。比如,即使是完全相同的文字,以不同的順序排列可能也會出現完全不同的含義,比如「腦滿腸肥」和「滿腦肥腸」……或者「霧鎖山頭山鎖霧,天連水尾水連天」。
這種情況下,想要理解一句話的含義,就必須得通過上下文了。
而且,中文句子也不會像英文句子那樣,用空格把單詞之間彼此隔開。所以語言處理人員就必須要讓演算法能夠正確地斷開單詞。
另外,中文沒有時態,所以機器在判斷時間軸方面,也存在著一定的困難。
「我不知道怎麼調戲Siri,反正它已經調戲得我快哭了」 圖/知乎用戶@姚米兔
圖/@同桌來成為我機智的幼馴染吧
人工智慧面對的挑戰,還包括對中文語義的理解。
中國幅員遼闊,存在著大量的方言,而方言與方言之間彼此可能完全不同,比如福建人和廣東人雖然長期相愛相殺,但是未必能順利對話。
而且,同一句話在不同語境下的意義,可能也會變得完全不同,最典型的就是逼瘋外國人的「如果你來早了,你就等著吧;如果你來晚了,你就等著吧。」
那麼,應當怎麼解決處理中文指令時遇到的這些問題呢?
一位清華大學教授指出,如果想真正理解講話者的意圖,實現恰當的溝通,計算機就需要把語調和壓力這些細微的線索也考慮進來。
另一位副教授也表示,計算機需要適當地理解人類的情緒,因為人類的決策並不是完全依賴於邏輯的。
會說方言的siri 圖自華人街/@我和siri的故事
好在,中國研究人員的一大優勢是,數量巨大的用戶群提供了海量的數據——由於支持電腦進行語音理解的神經網路需要大量的數據進行訓練,因此,公司擁有的數據越多,它的神經網路就會越來越智能化。
百度和阿里巴巴這樣的公司,就都受益於廣泛的用戶群。麻省理工科技評論給出的數據顯示,截至2016年底,百度的月活躍移動用戶達到了6.65億;而截至今年3月份,阿里巴巴的月活躍移動用戶也達到了5.07億。
除此之外,阿里巴巴的一位研究人員也給出了另外的解決方法:運用關聯主題下的數據來調教神經網路,而不是全部都依靠大數據。
比如說,如果想要訓練神經網路理解與「運動醫學」這個主題有關的指令,就可以利用「運動」和「醫學」兩個話題中的數據來進行。
這種方法不如大數據好用,但是如果缺少大數據的話,這種方法至少能確保,在某些話題下,技術人員依舊能夠對神經網路進行訓練。
這樣看來的話,說不定,能否順利掌握中文,可以成為測試人工智慧語言理解功能的試金石呢~
GIF/547K
※微軟本想取消畫圖工具 卻因粉絲勢力作罷了
※特朗普繪有紐約輪廓的畫作將拍賣 起拍價9000美元
※看外媒如何花樣翻譯:「撼山易,撼解放軍難」
※在美留學生感嘆中國安全:永遠不用擔心突然被警察一槍蹦了
※菲律賓總統杜特爾特:中菲將在南海聯合勘探石油
TAG:觀察者網國際頻道 |
※《麻省理工科技評論》發布全球十大突破性技術
※「中國的AI覺醒」!《麻省理工科技評論》新興科技峰會召開
※「遠見者」魏思上榜《麻省理工科技評論》中國科技創新青年:不懼怕、不怯場
※評論:「設計需要工匠精神」
※神評論|曹操、劉備、孫權三位君主的綜合能力該如何排名?網友:劉備的政治能力強於曹操,也很善於治理內政。
※《麻省理工科技評論》駁斥李彥宏:誰說中國人不在乎隱私!中國新隱私法要等多久?
※宜信、《麻省理工科技評論》共同揭曉:35歲以前最有可能改變世界的中國科技精英
※《麻省理工科技評論》2018年「全球十大突破性技術」 哈工大加入「巴別魚耳塞」主要研究者
※谷歌說「不作惡」?Nature評論:人工智慧研究應當成為軍事發展的助力
※聯想智能顯示評論
※《復仇者聯盟4》導演評論格魯特從雷神新武器手柄復活的理論
※聯想智能顯示評論:谷歌設備
※與評論員工作衝突,皮爾洛不會回國家隊工作
※任法融書法:只能說寫字很努力,功力如何?大家來評論吧
※《麻省理工科技評論》18年科技十大突破之基因給算命提供科學依據
※軍報評論員:努力把我軍黨的領導和黨的建設工作抓得更緊更實
※陸朝陽——榮登《麻省理工科技評論》中國科技青年英雄榜
※文明評論︱博物館,文明歷史魅力所在
※文藝評論·畫家董殿富的藝術追求
※張丹峰工作室終於發聲:希望大家理智對待尊重實情,網友評論卻炸鍋了