當前位置:
首頁 > 最新 > 2018年的AI第一戰,竟然由輸入法掀起

2018年的AI第一戰,竟然由輸入法掀起

百度副總裁、AIG平台總負責人王海峰

人工智慧的戰火從2017燒到2018,從國內的各大峰會到美國的CES,絲毫沒有偃旗息鼓的意思。而這一次引發關注的,卻是我們往往不會和AI聯繫在一起的輸入法。

易觀發布的《中國手機輸入法市場系列分析2017》顯示,2017年第一季度,手機輸入法活躍用戶超過4.1億,相較於2016年Q4增長13.83%。作為手機主要的輸入工具,輸入法用戶規模和用戶數量都保持著持續穩定增長。

AI技術的發展,使人工智慧、搜索技術與輸入法的結合日益緊密。隨著用戶對輸入法輔助功能和場景的需求越來越多樣,輸入法也在這過程中不斷迭代自身,不斷優化用戶體驗。在百度輸入法《AI輸入——開啟全感官輸入時代》為主題的發布會上,百度副總裁王海峰就表示:「輸入法是百度AI技術的橋頭堡,未來將用更多人工智慧技術打造AI輸入,讓輸入法更懂用戶的表達。」

一款人人都在用的輸入法,為何能受到如此重視?

1

當AI遇見輸入法之前,我們每個人都是程序員

輸入法,IME(input method editor),即輸入策略編輯器。上世紀80年代,電腦開始在中國普及,如何將漢字輸入到電腦上成了當時亟需解決的問題。這個時期,五筆輸入法的誕生,開創了中文輸入法的先河,掀起了一陣全民學五筆輸入法的潮流。

到了90年代,隨著電腦用戶的增加,五筆輸入法入門難、強背字根的問題逐漸凸顯,用戶需要一款使用簡單,入門輕鬆的輸入法來代替它。這個時期,智能ABC應運而生。這款只要懂拼音就能使用的輸入法,迅速受到用戶喜愛,並得到了廣泛的普及。

進入21世紀以來,拼音輸入法得到了全面的發展。智能聯想、自我學習、模糊、細分專業詞庫等功能不斷完善。這個時期,市場上的各種輸入法爭奇鬥豔,但最終拼音輸入法以其高速的文字錄入、簡便的使用方法獲得用戶青睞,奠定了市場的主流地位。

總體來看,PC時代,輸入法存在的作用是,用戶把腦子裡想的文字,轉碼成五筆或拼音等,再用英文鍵盤,按照某種策略輸入,從而得到了漢字。換句話說,使用輸入法,其實就是在進行一種編程行為,這個階段,每個用戶都像是一名程序員。

隨著移動互聯網的發展和手機用戶規模的增長,手機輸入法在用戶的日常生活中扮演著越來越重要的角色,輸入法的競爭也從PC端轉移到了手機端。隨著用戶流量的轉移,手機輸入法逐漸成為用戶搜索、表達的重要工具,而用戶的持續增長,也將助力輸入法搜索功能成為新的流量入口。對於各大輸入法來說,如何搶佔這一波流量,成了一個巨大的考驗。

誰滿足用戶需求,誰就搶佔市場先機,在互聯網行業,這是亘古不變的定律,對輸入法來說也一樣。移動互聯網時代,簡單的文字錄入已經不能滿足用戶多元化的需求。手寫、語音等輸入形態的出現,使用戶和手機等移動終端的交互不再依賴鍵盤。在用戶時間逐漸碎片化的今天,這種高效率的文字錄入形式進一步推動了輸入法的革新。

那麼,AI時代,輸入法還會有哪些可能呢?

2

AI輸入,未來一切皆有可能

對於移動互聯網用戶來說,網路環境、智能手機和輸入法是上網必備的「三件套」,不論是社交、網購、遊戲、搜索,只要用手機上網,用戶就必然會用到輸入法。對於輸入法行業來說,超過4.1億的活躍用戶,是十分具有吸引力的。

作為國內搜索巨頭的百度,在成立之初就開始了對智能輸入法的布局,把輸入法作為自身的主打產品之一。依靠著多年的語音、圖像、NLP、知識圖譜等能力的積累,早就幾年前,百度輸入法就已經成為和手機百度、百度地圖一樣量級的超級APP。在AI時代,搭載了AI技術的百度輸入法儼然成了一款人人可用的免費AI產品,讓用戶的輸入體驗得到了進一步提升。

移動互聯網的發展與迭代,改變了用戶的上網習慣。《中國手機輸入法市場系列分析2017》報告顯示,目前,在各類輸入方式的用戶規模上,語音輸入佔比18.85%,而這個數字在一年前還是6%。其中,單是百度輸入法一家,語音輸入日流量就超過2.5億。為了滿足日益增長的輸入法語音用戶及其需求,百度輸入法在語音技術方面實現了新的突破——Deep Peak 2模型,全稱為「基於 LSTM 和 CTC 的上下文無關音素組合建模」。該模型突破了沿用十幾年的傳統模型,能夠更充分地發揮神經網路模型的參數優勢,大幅提升中英文、多種口音、多種風格(如朗讀、聊天、輕聲)混合輸入的識別準確率,聊天場景下的相對正確率較行業領先水平提升20%,讓機器更能適應用戶的聊天、遊戲、搜索、地圖、人名等。

百度語音技術部總監高亮

遊戲鍵盤也是百度將輸入法與AI技術融合的一個亮點之一。這個鍵盤適配用戶多遊戲場景,將輸入面板簡化為一條語音輸入的工具條,不遮擋遊戲頁面的內容,提供語音輸入、懸浮鍵盤、遊戲短語、和諧轉換等遊戲輔助功能,更好地提升遊戲中的輸入體驗。對於廣大喜歡一邊交流一邊打遊戲的玩家來說,這個功能確實十分友好。

語音指令功能在一定程度上,推動了百度構建輸入法生態的步伐。作為國內最大搜索引擎,百度擁有龐大的用戶流量和資料資料庫。在輸入法中,百度將搜索功能與AI技術相結合,用戶可直接通過輸入法的面板搜索全網內容,無需切換應用,最大限度地提高用戶的搜索效率。通過語音指令找表情、打電話、查天氣等功能,使用戶的相關操作都能在輸入法中直接進行,無需切換APP,甚至連盲人等殘障人士也可以輕鬆體驗移動互聯網帶來的各種便利。

將聲紋識別技術應用到輸入法中,是百度輸入法的又一個大招。針對許多用戶在會議記錄中手忙腳亂的速記痛點,百度輸入法的語音速記功能不僅支持對會議進行錄音並自動識別為文本,還能根據聲紋自動區分發言人。在筆記模式中,語音速記功能則可以滿足用戶通過語音快速記錄大段文本的需求,同時支持回放該段錄音或者語音指令修改識別內容。

而「AR表情」功能是百度輸入法基於百度的人臉識別技術和 AR 技術推出的新功能。用戶可以根據相機或相冊進行人臉識別,製作表情包,甚至通過自己的表情控制虛擬人物形象。製作出來的AR表情,可以直接通過輸入法搜索、語音輸入和鍵盤輸入時展示出來,更加貼近用戶聊天的個性化需求。

百度輸入法的AR表情功能

此外,百度輸入法的多語種語音識別,語音實時翻譯,有效地幫助用戶在不同的場景中,提供更為智能化的信息。

隨著AI技術的進一步發展及在輸入法應用中的深度滲透,未來,輸入法的交互方式將有更多的可能,而用戶的體驗也將因此不斷變化和提升。

3

全感官輸入時代到來

讀懂人類的語言,識別人類的命令並做出相應的反饋,是AI技術最基本的體現。而搭載了AI技術的輸入法,除了早期的詞根聯想外,下一步要做的是突破「轉錄」的單一價值,從聲音、圖片,甚至有望從動作、眼神中捕捉信息,讓用戶擁有更自然、更個性化的體驗。

在國外,備受用戶喜愛的Moment Keyboard輸入法搭載AI技術後,在原有的翻譯、聯繫人、天氣查詢等功能基礎上,增添了 Smart bar 功能。這個功能可以根據語義分析以及人工智慧自動匹配相應的服務,比如用戶在打字時,可以聯想他們常用的表情,免去用戶到圖庫和微信表情里苦苦尋找的步驟。

而在國內,百度輸入法早已實現這個功能。未來,百度還將通過AI開放平台,與開發者、合作夥伴共同探索人機交互和信息輸入的進化路徑,並將語音、圖像等支撐輸入法進化的AI能力開放,推動AI落地。正如王海峰所言:「基於百度人工智慧技術,全感官輸入時代的序幕已經拉開,未來將會有更多AI能力應用到輸入法中,讓輸入變得更便捷,讓人與機器的交互方式更自然。」

作者:高靈靈

編輯:南七道


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 南七道 的精彩文章:

陸奇:AI無國界,創新無國界,世界AI看中國

TAG:南七道 |