新系統能根據音頻剪輯創建與演講者對口型的視頻

科技 07-12

此前已經有一家創業公司推出語音合成服務，通過對60秒語音文檔的部分信息進行篩選採集，隨後進行重組，最後可以變成任何人的聲音。現在華盛頓大學的研究人員已經創建了一個將音頻剪輯轉換成與演講者對口型的視頻的系統。

為了使這個系統工作，需要分析大約14個小時的現場演講視頻- 研究人員希望能夠顯著減少這個數字，也許減少至一個小時。隨後他們利用神經網路進行改進。當系統被提供包括演講人員的「目標視頻」（他們可以在其中談論任何東西）時，連同他們的音頻文件說出所需的單詞，它將兩者組合在一起。它可以通過放棄視頻的原始音頻，將其替換為所需的音頻，並將計算機模擬版本的演講者的口型加入到視頻中。最終的結果是，人們聽到他們說出所需要的話，而且看起來也是這樣。

助理教授 Ira Kemelmacher-Shlizerman表示：「現實的音頻-視頻轉換具有實際應用，例如會議的改進視頻會議，以及能夠通過從音頻創建視覺來與虛擬現實中的歷史人物進行對話等。這是一種有助於實現下一步措施的突破。」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 cnbeta 的精彩文章:

※墨子號量子糾纏實驗：科學家首次將光子遠程傳送至500公里外太空
※宇航員在海底模擬救援「受傷」月球漫步者

TAG:cnbeta |

您可能感興趣

※新技能！B站視頻轉音頻
※抖音頻繁出現涉黃視頻，抖音：有人惡意推動傳播
※直播、音頻、視頻網站入局短視頻，沒有產品就贏不了
※音頻行業創新不足？荔枝說要走短音頻和聲音社交路線
※音頻版
※移動音頻平台的知識傳播研究
※窩被暖音專註生活成長情感優質美文音頻的社交型音頻文化傳播平台
※小鵝通圖文、視頻、音頻專欄精選1
※電腦音頻解決方案
※科技版「傳音入密」：音頻聚光燈現在怎麼樣了？
※傑士推出真無線耳機等音頻新品
※索尼音頻新品：播放器、耳機、音箱都在這
※模型也能實現「雞尾酒會效應」：谷歌新型音頻-視覺語音分離模型
※運營推廣之音頻型傳播平台的運用
※開心麻花探索音頻行業，「劇好聽」要用影視工業標準降維打擊音頻內容領域
※蜻蜓FM與封面傳媒強強聯手打通音頻傳播雙向渠道共同打造優質內容
※《現代漢語詞典》App上線，新聞聯播主播作標準音頻
※耳機、音響都來了，索尼推出秋季音頻新品
※全觸屏操作便攜與專業HiFi，樂彼L6音頻播放器評測
※LOL：拳頭更新遊戲底層文件，開發全新音頻引擎和英雄數據格式