小米加入 AI 研究大家庭!聯合西工大推出基於注意力機制的普通話語音識別演算法
雷鋒網 AI 科技評論按:小米近期發布了自己的 AI 音箱,加入了智能家居的戰局。正當我們覺得小米會不會只是蹭「人工智慧」熱點的時候,小米的這篇論文證明了自己真的是把人工智慧作為一件嚴肅的公司業務來做。請允許我們代表人工智慧研究大家庭對小米公司表示歡迎,對小米的研究員們致以敬意!
這篇論文是西北工業大學、陝西省語音與圖像信息處理重點實驗室與小米科技公司的研究員聯合研究的成果。該項工作主要針對普通話識別任務,提出了一種基於注意力機制的端到端學習模型。
以下是雷鋒網 AI 科技評論根據論文摘要進行的編譯簡介。
論文摘要
在最近,語言識別領域的研究越來越多地採用了端到端(End-to-End)學習模式。這種學習模式可以直接將輸入的語音轉錄成相應的文本,而不需要使用到任何預定義的校準規則。據雷鋒網 AI 科技評論了解,該論文中的研究員們在端到端學習模式基礎上,探討了一種基於注意力機制的編解碼模型(Attention-based encoder-decoder model),而該模型主要針對普通話語音識別(Mandarin speech recognition)任務,並且取得了很不錯的效果。
圖一,上圖展示了編碼模型。該編碼模型是一個BLSTM,它從輸入x中提取出h。
在訓練期間還使用了幀子採樣(Frame sub-sampling)技術。在該項工作中,研究員通過跳幀(Skipping frames)的方式來縮小原序列的長度,並且正則化了權重以取得更好的泛化能力和收斂效果。除此之外,本項工作還探究了卷積注意力(Convoluional attention)和注意力平滑(Attention smoothing)這兩種不同的注意力機制所產生的不同影響,以及模型的性能和波束搜索(Beam search)的寬度之間的關聯性。
圖二,上圖展示了AttendAndSpell模型。該模型由MLP(注意力機制)和LSTM(解碼模型)組成。在每一次時間步驟(time step)t,MLP將結合隱含狀態s
t-1和輸入h計算出上下文向量(context vector)ct。從而生成新的隱含狀態st和新的標籤yt。
最終,該論文所提出的演算法,在MiTV數據集上,在沒有使用任何辭彙(Lexicon)或語言模型(Language model)的情況下,實現了僅為 3.58%的字元錯誤率(Character error rate, CER)以及7.43%的句子錯誤率(Sentence error rate, SER)。另外值得一提的,該模型在結合了三元語言模型(Trigram language model)之後,進一步取得了2.81%的字元錯誤率以及5.77%的句子錯誤率。相比另兩種基於內容的注意力演算法和卷積注意力演算法,論文中提出的注意力平滑演算法都取得了更好的表現。
論文中還表示,他們的下一步研究目標是把現有的技術和非常深的卷積網路結合,以期獲得更好的表現。他們的後續成果我們拭目以待,我們期待小米進一步深化人工智慧在自家產品中的應用,也希望更多國內企業都參與到人工智慧相關技術的研究和應用中來。
ViaAttention-Based End-to-End Speech Recognition in Mandarin
雷鋒網 AI 科技評論編譯。
※OpenAI最新發現:在參數空間增加雜訊,易於實現,並能輕鬆加快學習速度
※愛爾眼科與英特爾合力打造AI眼科診斷系統;平安科技布局AI創新 | AI掘金晚報
※中國正在研製新一代原子鐘,或用於下一代北斗導航衛星
※好未來用「AI 教育」改變原有的學習模式
※CVPR 2017精彩論文解讀:顯著降低模型訓練成本的主動增量學習
TAG:雷鋒網 |
※加入人工智慧技術 LG推出新旗艦手機
※韓國軍工特別熱衷加入「印度製造」計劃 密集推銷陸海空武器
※「DARPA加入爭霸賽」用量子計算解決機器學習問題,發布四大挑戰!
※麥當勞通用中糧組團加入阿里打假聯盟 合力賦能創新保護正品
※《荒野大鏢客OL》將會加入GTA的對抗模式和編輯器
※華爾街金融巨頭的AI投資:CMU機器學習系主任加入摩根大通
※漢語博大精深,未來中文有機會加入編程行列
※技術大神加入蘋果 將主導Siri等產品研發
※蘋果將給Siri加入機器學習技術 能識別設備主人
※多位業界大佬加入水晶動力 助力《復仇者聯盟》項目
※全球第二大奢侈品集團歷峰加入阿里打假聯盟 合力保護創新捍衛正品
※大范甘迪正式加入ESPN,成為比賽評論員
※AliOS加入中國汽車質量技術聯盟 將參與智能網聯汽車標準制定
※特朗普亮相達沃斯力推「投資美國」 可考慮重新加入TPP
※印度科技巨頭HCL宣布加入區塊鏈運輸聯盟
※四家德國公司加入微軟MR項目,強化歐洲德語系MR合作網路
※《RPG製作大師MV》公開追加情報 加入大量新素材!
※廣東省骨科醫院環骨盆創傷聯盟啟動 申請加入可接受3D列印相關技術培訓等
※加拿大大型信貸聯盟LCUC加入區塊鏈R3聯盟
※外媒評印度加入澳大利亞集團:擴大武器出口 想當核供應國