搜狗「唇語識別」技術演示視頻:歌詞、繞口令都能識別!
昨天,搜狗推出新一代人機交互——「唇語識別」,能識別人的唇部動作,動動嘴皮,不發出聲音,就能識別你說的什麼。
視頻連接:http://www.miaopai.com/show/P4PdLsYTZ12OznuWlvx2knMcJ~AXajnr0DKVVg__.htm
從視頻中可以看出將面部放入橢圓形區域內,不發聲的說出一段話,幾乎說完的瞬間,識別的文字就出現在屏幕上,無論是口語、詩詞、歌詞還是繞口令,都能很好的識別。
同時,在屏幕右下角,我們能看到唇語識別類似面部識別,通過檢測嘴唇多個部位點的動作,進行語意的識別。搜狗表示,通過複雜端到端深度神經網路技術進行中文唇語序列建模,經過數千小時的真實唇語數據訓練,終於取得了唇語識別效果。
根據官方數據,搜狗唇語識別在非特定人開放口語測試集上,該系統達到60%以上的準確率,超過google發布的英文唇語系統50%以上的準確率。在垂直場景如車載、智能家居等場景下甚至已經達到90%的準確率。
未來唇語識別技術可以輔助語音交互及圖像識別,日常周圍噪音過大或不便發聲的場所更加適用,既能保證識別準確性和穩定性,也可以保證說話內容的私密性。
此外,唇語識別技術可以幫助公安人員獲取無聲視頻中重要的講話信息,還能幫助先天性聽障人群。
能動嘴的就堅決不動手~以後再也不敢小聲的罵人咯~
GIF/506K
好了~今天的分享就到這裡。
如果你有優秀的作品,歡迎小夥伴加入我們的交流群。
這樣你的作品,就有機會在我們的視頻頻道發布,
和眾多小夥伴一同分享。我們在群里等著你喲
~好~我們下期視頻再見嘍~拜拜~
玩數碼頻道致力於成為互動性最強的手機評測自媒體!
※最強安卓旗艦三星S9+驍龍845跑分曝光:仍不敵蘋果A11!
※國內首發驍龍845!小米7多方消息匯總——黑科技!
※歐盟公布穀歌7年調查報告:28億美元罰款是警告!
※華為P11也採用「劉海」設計,4000萬像素,後置徠卡三攝!
TAG:玩數碼頻道 |