Google發布視聽語音分離技術可取出影片中的人物語言

科技 04-14

玩懂手機網4月14日消息，谷歌發布了一個叫做Audio-Visual Speech Separation視聽語音分離技術，能夠通過分析影片中人物聲音的特徵，將影片中人物聲音分離成獨立音軌，可以讓觀眾自由選擇聽哪位人物的聲音。

谷歌研發團隊在《Looking to Listen at the Cocktail Party》中，表示通過深度學習聲音，圖像模型分離語音的技術，對影片中特定人物的音質進行強化，並消除其它人的聲音和環境音。

這個技術可以可以分析影片中的圖像和聲音，通過自動辨別人物表情的變化，提升辨別的精準度，同時它也能應用於一般單聲道影片，系統會自動辨別影片中的人物與聲音，觀眾需要做的只要點選影片中出現的人臉，就能夠聽到他的聲音。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 玩懂手機 的精彩文章:

Google發布視聽語音分離技術 可取出影片中的人物語言