當前位置:
首頁 > 科技 > AI合成技術亮相世界互聯網大會,我們的聲音是否會被壞人利用?

AI合成技術亮相世界互聯網大會,我們的聲音是否會被壞人利用?

一直被傳聞將支撐不下去的鎚子科技在11月6日舉行新品發布會,其中AI智能音箱是這場發布會三款重磅產品中,唯一一款與科技數碼搭邊的科技硬體產品,智能音箱依託於語音交互系統,能夠識別用戶每句話的基本含義,未來的發展目標是能夠理解人類的情緒語言,聽起來似乎科技能夠讓產品更加靈活。

鎚子科技本場發布會的音箱被命名為「大衛和希瑞D1」,這款智能音箱搭載的是獵戶星空的語音交互系統,雖然獵戶星空的負責人——傅盛沒有到發布會現場,但羅永浩還是放出兩段傅盛對於這場發布會的祝福,而其中一段的祝福語是憑藉AI技術利用傅盛的錄音合成指定的幾句話,羅永浩在發布會現場詢問大家能否分辨出哪一段是傅盛的真聲時,還是有很多人沒能分辨出來。

羅永浩透露自己去年到高德地圖錄製語音導航的時候,大約需要採樣一萬句左右的錄音,如果現在想要達到和去年同樣的水平,只需要採樣一千句左右就可以實現,同時羅永浩也表示不久的將來,這種AI合成技術可能會更加廉價,用戶將一段錄音上傳至此類網站,AI機器很快就可以學習到這款錄音的語音語調,同時能夠用同樣的語音語調閱讀指定的文字語言。

羅永浩認為這種技術可能還需要再等一兩年左右的時間,然而鎚子科技的新品發布會剛剛結束,一直專註於AI語音識別技術的科大訊飛就放出一張海報圖,表示自己品牌旗下的訊飛閱讀已經能夠實現羅永浩所說的通過10句錄音模擬相同人聲閱讀指定文字,而這種技術也並不是當今最牛的技術,因為正在浙江烏鎮舉行的第五屆世界互聯網大會上,搜狗亮相了一項更牛的AI合成技術——AI合成主播。

通過AI合成技術不僅可以合成聲音,而且還能夠合成指定的人形,這項技術是由搜狗和新華社聯合開發的技術,被命名為「搜狗分身技術」。與普通的機器人相比,這種技術能夠通過對人臉結構掃描、人臉特徵提取以及人臉重構等方式進行人物合成技術,而更細微的前沿技術還有唇語識別以及情感遷移能夠讓AI合成的人形更加靈活,包括說話的嘴唇動作以及面部表情都能與真人實現幾乎一樣的效果。

搜狗公司官方認為這種技術的實現目前主要應用在媒體領域,通過這種創新的信息傳播形式,幫助傳統媒體在新聞的時效性以及跨語種傳播方面能夠得以加強,目前這樣的技術當然還不夠成熟,未來這些技術還將會被應用到醫療、教育、娛樂以及法律等多個行業領域,其主要目的是為了進一步提升社會服務的效率。

AI人工智慧技術的發展卻是讓很多領域的服務都更加便捷,但與此同時也帶來一些問題,人們對於AI合成技術的看法多數是認為將會引領一股失業潮,但羽度非凡第一時間想到的是網路安全問題,如果這種AI聲音合成技術的成本降到足夠低,真的像羅永浩所說只需要將一段錄音上傳到網站即可交給機器學習並進行模擬,那是否意味著只需要通過電話等方面進行錄音之後,就可以交給機器學習並模擬出任何指定文字呢?

這種技術不僅僅是對於聲紋支付的安全性增加考驗,同時對於詐騙等犯罪行為的成本可以也會有所降低,因此在AI合成技術高速發展的同時,相應的安全防禦技術也必然是需要各家科技公司需要考慮的另一問題。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 羽度非凡 的精彩文章:

三防手機也講性價比,AGM X3搭上驍龍845,售價與堅果R1相近!

TAG:羽度非凡 |