Gboard輸入法離線語音識別上線
科技
03-14
IT之家3月13日消息 今日,谷歌通過博客悄然宣布實時語音識別技術的突破。使用人工智慧技術並利用其Pixel手機的神經處理功能,Gboard用戶現在可以進行離線實時語音識別。
圖源:谷歌
目前,如果用戶在Pixel設備上使用Gboard,要進行語音識別並轉化成文本,實時語音處理需要使用Wi-Fi或蜂窩數據連接進行。谷歌宣布,自從它首次引入神經學習來處理人類語音以來,它一直在繼續開發軟體架構,以便使用其Pixel設備的神經處理功能完全離線工作。
據介紹,谷歌新型遞歸神經網路感測器(RNN-T)體積已經足夠小,可以完全安裝在手機上,消除網路延遲和零散連接,這是隨時使用該技術的障礙。它可以實時輸出逐字輸出的字樣,就好像有人在說出你說的那樣。
谷歌已經能夠通過將數據處理要求從2GB(需要無線連接進行離線處理)降低到僅僅80 MB進行處理來實現這一目標。
雖然最初只適用於使用Pixel設備並僅使用美國英語的Gboard用戶,但Google希望其開發的研究技術將被用於更多語言和更多設備以及用於其他環境。
※三星Galaxy Fold可摺疊屏手機正式發布
※今日婦女節
TAG:IT之家 |