當前位置:
首頁 > 科技 > 搜狗AI,正在搶灘智能手機

搜狗AI,正在搶灘智能手機

乾明 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

搜狗AI最近打出一組攻擊波。

近期,先是在MegaFace百萬級人臉識別競賽中奪冠,接著又亮相了世界首個AI合成主播,在國內外引發大量關注。搜狗有AI,AI能力挺厲害,這些成果都是明證。

但也不乏好事者抬杠:有沒有人人可用、大家看得見摸得著的AI?有,還不少。

除了AI加持搜索、輸入法等自身主營業務,搜狗AI,還正在搶灘智能手機。這算是惠及人人的AI落地了。

搶灘智能手機

按照目前行業流行的說法,可以說這是AI+智能手機,也可以看作是AI深入產業,而且是蓬勃發展的手機產業。

搜狗在該領域的布局早已開始,他們在去年10月正式推出深智引擎平台,目前分三個板塊:機器翻譯圖像識別與OCR智能問答與對話

不完全統計,使用vivo、鎚子、小米、華為等品牌智能手機或智能音箱等硬體產品的用戶,都多多多少少直接或者間接享受著搜狗提供的AI服務。

其中,vivo與搜狗的合作主要在機器翻譯與OCR方面,鎚子、小米主要在圖像識別方面,華為則是聚焦在智能問答與對話領域。

機器翻譯

比如,vivo最新旗艦機NEX的用戶,在進行AR實景翻譯和日韓小語種離線語音翻譯等個性化翻譯時,已感受到AI魅力。

這背後,便是搜狗的身影。

今年6月份,搜狗與vivo達成合作,為其提供AI支持的個性化翻譯服務。

此次合作是國內首次實現在安卓平台上的視頻流實時翻譯。

經過深度優化,搜狗的AR實景翻譯技術不僅能夠自動適配各種性能的安卓手機硬體,視頻流處理區域屏佔比也達到了60%以上。

為了保證移動端上有更好的體驗,搜狗還開發了一個移動端多目標跟蹤及運動軌跡預測演算法。據搜狗介紹,在這個演算法的加持下,加速多目標跟蹤的整體跟蹤速度達到了100fps,這有力地保證了AR實景翻譯的實時性。

搜狗在OCR組段分析、AR渲染、AR翻譯融合動態跟蹤等技術領域的進一步突破,也讓AR翻譯體驗更加流暢便捷。

在此次合作中,還有一個容易被忽視的方面——離線翻譯

通常,機器翻譯都是在線的,能夠使用的資源、資料庫都是海量。但在離線情況下,因為資源和數據存儲在本地,相對受限,翻譯效果會大打折扣。

用一個比喻來說,在線與離線,就是「開卷考試」與「閉卷考試」。但是,搜狗翻譯的在線和離線翻譯結果的精度相差無幾,它是怎麼做到的?一共有三點:

第一,基於神經網路壓縮技術,解決了在離線情況下常見的模型存儲與識別精度下降的問題。

第二,搜狗機器翻譯模型能力為離線的模型訓練提供了知識提純的基礎,避免了學習雜亂無效的信息,增加額外負擔。

第三,搜狗設計了小型的神經網路,針對不同的翻譯場景進行訓練,以確保離線翻譯的更快速度與更精準結果。

機器翻譯,一直都是搜狗的強項。藉助自主研發的深度學習並行訓練平台,搜狗能夠高效利用海量的語料進行模型訓練,推動翻譯精準度達到國際領先水平。

最佳的例證,就是在去年的國際頂級機器翻譯賽事WMT,搜狗一舉斬獲中英和英中機器翻譯雙向第一。

而且,圍繞機器翻譯,搜狗已經有了不少直接提供給用戶使用的軟體與硬體產品。比如搜狗翻譯APP、搜狗旅行翻譯寶等,都在市場上得到了認可。

現在,凝練於這些產品中的搜狗AI技術,伴隨著搜狗深智引擎的不斷完善,正在注入到每一個智能手機等移動設備之中。

圖像識別與OCR

該項技術的合作如鎚子和小米。

2017年,搜狗就在圖像識別方面與鎚子合作,一同為用戶提供OneStep1.5「以圖搜圖」功能,只需要一步拖拽,就能夠使用搜狗圖片搜索快速查詢相關信息。

前不久,搜狗又與小米合作,將其AI圖像識別功能注入到了小米MIX 2S、6X、小米8三款手機中。

在小米的這些手機上,用戶打開相機功能,切換至「智能識物」模式,對準需識別的物體拍攝,就可以快速識別出圖片中的物體。點擊「搜圖」,就會跳轉到搜狗圖片的識圖搜索頁面,進行全網搜圖。

圖像識別,是搜狗搜索業務的自然延伸。據悉,搜狗圖片搜索截至目前已積累了海量的圖像訓練數據,為圖像搜索效果的提升奠定了堅實的基礎。

而且,隨著技術的不斷完善,搜狗已經成功地將深度學習技術應用於圖像識別整個系統中,並在特徵學習、特徵壓縮、海量高維數據索引、近鄰計算、細粒度分類環節進行了深度優化。

在進行整個圖像搜索的過程中,搜狗也把技術覆蓋到了用戶搜索需求理解環節,智能化識別需求,以更好地提供用戶想要的答案。

今年3月底,搜狗AI刷新了圖像識別國際頂級賽事Pascal VOC挑戰賽的最佳成績,創造了最新記錄,就是這些努力的一個佐證。

在OCR方面,據搜狗介紹,OCR深度學習檢測與識別模型的訓練,是基於大規模數據集訓練出來的。不僅避免了傳統演算法步驟繁瑣、錯誤疊加的問題,還能夠將這項技術適用於多角度、多尺寸、多語種、多種風格的文字識別場景。

此外,針對移動端計算設備特點,搜狗不僅優化設計了適用於移動端的結構模型,還基於CPU&GPU底層計算單元進行了統籌開發,使其能力在移動端設備上更好地展現了出來,在檢測與識別模型上,實現了3倍加速。

智能問答與對話

在華為Mate 20 系列產品國內的發布會上,華為AI音箱首次登場,搜狗為其提供了智能問答服務。

和圖像識別一樣,搜狗研發問答技術,有天然的優勢。

搜狗搜索,作為國內第二大搜索引擎,也是當前人們獲取信息的重要手段。自2004年誕生以來,已經積累了百億級中文網頁索引量,有大規模高質量的問答數據可作技術研發支持。

但,數據只是基礎,重要的是怎麼充分利用這些數據。

如上圖所示,智能問答的整個過程,至少包含三個步驟:用戶意圖分析,結構化知識和精準呈現答案。

在用戶意圖分析上,用戶在使用搜狗搜索引擎時反覆輸入的信息與反饋,被充分利用了起來。而且,近年來搜狗在翻譯APP及硬體上的探索,也豐富了人機交互技術的研究場景。

在結構化知識方面,挑戰在於把龐雜的內容建立起關聯網路,這對於搜狗來說並不是難事。據悉,搜狗知識圖譜在國內最早提供大規模知識圖譜搜索服務。

在手機這類移動設備上,用戶對答案精確度的需求要遠遠高於在電腦設備上的需求。換句話說,用戶要的是一個答案,而不是一堆答案。

搜狗方面表示,基於搜狗的知識圖譜,搜狗的問答系統,已經能夠在分析類問題、觀點類問題、數字類問題等開放領域提供精確的答案了。

在搜狗搜索上,搜狗也推出了基於智能問答的服務「搜狗立知」。據悉,這個應用已經能夠滿足80%以上的用戶問答需求,已達到業內最高水平。

同時,搜狗在智能問答技術方面並不只是「閉門造車」,還聯合了業界及學術界主辦技術大賽,提供大規模真實用戶問答數據集,集「眾智」來推動AI在問答方面的發展。

需要注意的是,這三個方面的技術能力並非各自獨立,而是交叉融合。比如,在使用AI翻譯服務的時候,也會用到圖像識別與OCR方面的技術、也會應用到智能問答與對話方面的服務。

「智能」手機新標準

搜狗AI搶灘智能手機,可能只是一個新時代的縮影。

因為,現在儼然已經到了一個發布新手機必談AI的時代。經歷了十年爆髮式增長,智能手機市場已經飽和,增長乏力,亟待新技術新革命。

AI作為近年來的當紅炸子雞,成了各大手機廠商提高用戶體驗、實現差異化,以及提高競爭力的新法寶。在手機廠商的新品發布會上,AI所佔的「權重」越來越大,甚至成了主角。

有一些激進的觀點更是認為,沒有AI加持的手機,已不能稱得上是智能手機。

檢驗智能手機是否智能的核心標準,在於AI。

但是,手機廠商需致力於「專攻」硬體產品的工業設計等方面。這種情況下,再抽出精力,同時發展AI技術難免會心有餘而力有不足。再加上,人工智慧技術的研發需要龐大的數據做基礎支撐,這也成為手機廠商發展AI的一個不小阻力。於是,在賦予手機AI能力的時候,「合作」可謂水到渠成。

而如此一來,智能手機的供應鏈上,搜狗一樣的AI技術方案提供商,開始越來越重要。

隨著搜狗AI技術的開放,智能手機廠商無需「重新發明輪子」,可以直接快速獲取相關的優勢,將精力聚焦在硬體設計與用戶體驗提升上,從而推動智能手機行業更好的向前發展。

同樣,對AI的應用與落地來說,智能手機是一個非常好的終端,不僅使用頻繁,承載著大量的使用場景,而且還有針對性。從智能手機場景中反饋過來的數據,將會反哺搜狗,推動搜狗在AI技術上實現進一步的提升。

堪稱雙贏。

此外,更有意思的是,之前憑藉智能手機發展壯大的搜狗,如今一朝「反哺」,又成為了智能手機的AI賦能者。

這樣的趨勢可能才剛剛開始,這樣的故事會越來越多。

你發現了嗎?

年度評選申請

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

人工智慧還能怎麼玩?谷歌反手就是一個紅獅子雕塑
Waymo也商業化了!「早期乘客」項目開始測試收費,鳳凰城人民掏了腰包

TAG:量子位 |