當前位置:
首頁 > 最新 > 機器翻譯的巨輪勢不可擋,搜狗正在嘗試引領航向

機器翻譯的巨輪勢不可擋,搜狗正在嘗試引領航向

文 | 闌夕

無論是在《星際迷航》、《神秘博士》還是《銀河系漫遊指南》里,翻譯機都是一項理所當然且相當基礎的發明,而它之所以總是出現在科幻題材的文藝作品裡,正是因為某種程度還是超出人類的技術想像,從而成為「托物言志」的敘事素材。

事實上,讓科技解決語言障礙——而不必使用成本極其不划算的人力中介——一直以來都是一種頗具未來感的期待,早在上世紀九十年代初,聯合國就將計算機翻譯技術的開發(在當時被稱作是多語種通信環境工程)列為全球性的計劃,鼓勵各國投入研究,而中國亦在1997年成立了機器翻譯委員會,把程序員和翻譯員兩種可能「風馬牛不相及」的職業劃在一起共謀大業。

通譯、漢神、東方快車、即時通乃至日後大展宏圖的金山詞霸都是那個時代的標準產物,但是直到機器學習的概念和應用問世之前,一切努力都顯得僵和呆板,因為就原理而言,早期的翻譯軟體只是利用計算機的資源特點構建了一個龐大的詞庫系統,達意的往往只有辭彙而無語句,更不必提語義理解,和科幻作品裡那種「一機在手,天下我有」的便利不可同日而語。

就連時至今日的Google,都會在相當粗淺的翻譯內容上鬧笑話:

*這個錯誤的原因,其實只是Google翻譯不知道「卡頓」是什麼意思,然後自作聰明地聯繫上下文補進去了關聯辭彙

幾乎是和人工智慧在歷史上的數輪浪潮呈現相同軌跡,翻譯技術能否達到公眾理想中的自然,也幾經波折,且度過了從敬畏機器到重新敬畏人類的過程:電腦的計算速度和儲存規模千萬倍地勝過人類,然而在分辨一隻生物究竟是不是貓的考驗上,它的表現連三歲的嬰孩都不如。

《人類簡史》的作者尤瓦爾·赫拉利認為,語言是人類有別於其他動物擁有智慧之名的「最獨特功能」,儘管從螞蟻、蜜蜂到鯨魚、大象,它們都具備著獨特的溝通方式,但是唯有人類可以通過語言進行虛構、創作、邏輯、想像乃至沉澱思想等等行為,最終推動了心智的進化。

換句話說,在沒有接近理解並模擬大腦運作的原理之前,所謂「奇點」降臨的憧憬就很難說得上實現,卡殼的不止是翻譯這件工作,幾乎所有生產力的再次解放都被阻攔在巨大的山谷入口處。

在和搜狗IOT事業部首席產品經理李健濤的交流里,他將臨界點標註於神經網路的大規模訓練開始成為互聯網公司的突破日程上,它意味著只要給予足夠豐富的學習資源和能夠自主運行的智能程序,加上遠遠小於代際尺度的時間成本,調教出能夠滿足日常會話的即時翻譯產品已經不是難以企及的預期。

而搜狗則在今年三月,直接發布了一款概念感十足的量產硬體:搜狗旅行翻譯寶。

其實早在六年前,Google就萌生了把翻譯工具裝入硬體終端的念頭,當時還在負責Android業務的Hugo Barra——對,就是後來去了小米的那個——曾向媒體透露,Google正在開發的系統功能之一,就是可以讓手機通話的雙方可以各說各的母語,系統將自動翻譯轉化,讓不同語種的聯繫一氣呵成。

但是,因為以NMT(Nueural Machine Translation)為代表的翻譯技術尚未成熟,這項雄心勃勃的重建巴別塔計劃最終還是擱淺了數年,直到2017年,Google才以耳機配件的形式,發布了內置語言翻譯應用的Pixel Buds,重返前線。

同時,搜索引擎似乎天然適合解決這類需求,這不止是因為它的產品形態決定了本身有著與信息打交道的高密度吞吐工作,還包括用戶的輸入數據——無論是文字還是語音——都會向搜索公司提供幾乎無窮無極的學習素材。

和Google相似,搜狗的語音識別系統也在最初就寫進了搜索引擎的產品底層,在今天,每天3.6億次語音請求的請求、26萬小時的語料構成了機器學習的最佳教材,最終這項能力被封裝到了搜狗旅行翻譯寶里,用於解決像是出境游這類場景的痛點上。

根據中國旅遊研究院的統計顯示,在整個2017年,中國的出境游總人數超過1.3億人次,繼續保持7%的高速增長,這個龐大且上升的市場,早已表現出極其明顯的消費升級的特徵。

而為了改善出境游的體驗而將翻譯工具納入消費清單,正是檢驗產品是否擁有真實價值的最佳方式,從開售表現來看,這款定價並不算低廉——1498元人民幣——的智能硬體在京東的銷售額已經突破1000萬人民幣,相當不俗。

另一方面,從解決方案的落地路徑來看,搜狗旅行翻譯寶的選擇其實是最難的一條,也就是說服用戶購買一款獨立的專業設備。

與之相比,無論是軟體路徑(比如依託於智能手機的翻譯類應用),還是如同Pixel Buds那樣借力手機配件(用戶總是需要購買耳機的)的,都顯得門檻更低,所以問題在於,為什麼搜狗要棄易從艱?

其實還是為了追求相對完美的體驗。

比如搜狗旅行翻譯寶的大量功能——識別、翻譯、合成——都支持離線模式,可以不必過度依賴網路,而出境游場景的不確定性之一,就是網路的穩定問題。

比如搜狗旅行翻譯寶同時支持語音翻譯和拍照翻譯,可以滿足體驗者不同的出行場景,體現產品的真實價值。

比如智能手機的麥克風拾音優先顧及的是通話效果,也就是放大近場拾音、抑制遠場拾音,但在出境溝通時,往往需要拾取一米開外的聲音——比如隔著櫃檯詢問營業員某款商品的情況——這就需要麥克風陣列的特別設計。

包括之後翻譯寶會考慮與搜狗自身的一些長處進行融合——比如導航能力、搜索能力——也都被整合到了翻譯寶的產品里,這個方向實際上是將語音交互作為下一代操作系統的雛形進行試探的。

李健濤甚至拿搜狗旅行翻譯寶的OCR功能舉例:「如果你在盧浮宮博物館,看到舉世聞名的蒙娜麗莎畫作,但它背後代表著什麼、有怎樣的藝術意義,對著一堆英文法文如果看不懂,那麼旅遊的樂趣和價值就會大打折扣,而我們的產品,其實是可以實拍實譯,直接把它的背景故事同步呈現在屏幕上,這就要比那些沒有屏幕、沒有攝像頭的翻譯硬體要更有效率一些。」

而本次訊飛在亞洲博鰲論壇露出的新品翻譯機,雖然新增了拍照翻譯等功能,卻不禁讓人唏噓,入局雖早,卻逐漸成為這個行業的跟隨者。搜狗旅行翻譯寶獨家的AI技術與優秀的商業化能力不僅帶來了市場的良好反饋,更成為AI翻譯機混亂市場的破局者。

說來有趣,與AlphaGo對弈的時候,柯潔曾在被央視國際電視台記者用英文提問時抬杠,怒懟「如果你是中國人的話就應該用中文向我提問題。」

事實證明,這種基於語言的分歧越來越不會成為真正的難題,如同那些持續了數十年的人機競賽越來越讓人類驚訝,當互聯網公司相繼掌握了智能的鑰匙,用什麼語言提問、用什麼語言回答,都將成為觀眾可以自定義設置的基礎選項罷了。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 闌夕 的精彩文章:

對話當下年輕女性,優酷女生季大膽「敢」變
衣二三:一件衣服從所有權到使用權的物權革命

TAG:闌夕 |