Google發布視聽語音分離技術 可取出影片中的人物語言
科技
04-14
玩懂手機網4月14日消息,谷歌發布了一個叫做Audio-Visual Speech Separation視聽語音分離技術,能夠通過分析影片中人物聲音的特徵,將影片中人物聲音分離成獨立音軌,可以讓觀眾自由選擇聽哪位人物的聲音。
谷歌研發團隊在《Looking to Listen at the Cocktail Party》中,表示通過深度學習聲音,圖像模型分離語音的技術,對影片中特定人物的音質進行強化,並消除其它人的聲音和環境音。
這個技術可以可以分析影片中的圖像和聲音,通過自動辨別人物表情的變化,提升辨別的精準度,同時它也能應用於一般單聲道影片,系統會自動辨別影片中的人物與聲音,觀眾需要做的只要點選影片中出現的人臉,就能夠聽到他的聲音。
※樂高LEGO版《戰神金剛》售價流出 或將成為最貴LEGO Ideas
※三星Galaxy S9對比蘋果iPhone X:更加成熟的挑戰者
TAG:玩懂手機 |