當前位置:
首頁 > 科技 > Google發布視聽語音分離技術 可取出影片中的人物語言

Google發布視聽語音分離技術 可取出影片中的人物語言

玩懂手機網4月14日消息,谷歌發布了一個叫做Audio-Visual Speech Separation視聽語音分離技術,能夠通過分析影片中人物聲音的特徵,將影片中人物聲音分離成獨立音軌,可以讓觀眾自由選擇聽哪位人物的聲音。

谷歌研發團隊在《Looking to Listen at the Cocktail Party》中,表示通過深度學習聲音,圖像模型分離語音的技術,對影片中特定人物的音質進行強化,並消除其它人的聲音和環境音。

這個技術可以可以分析影片中的圖像和聲音,通過自動辨別人物表情的變化,提升辨別的精準度,同時它也能應用於一般單聲道影片,系統會自動辨別影片中的人物與聲音,觀眾需要做的只要點選影片中出現的人臉,就能夠聽到他的聲音。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 玩懂手機 的精彩文章:

樂高LEGO版《戰神金剛》售價流出 或將成為最貴LEGO Ideas
三星Galaxy S9對比蘋果iPhone X:更加成熟的挑戰者

TAG:玩懂手機 |