當前位置:
首頁 > 科技 > 突破多模態深度語義理解技術,深思考打造智能座艙「AI大腦」

突破多模態深度語義理解技術,深思考打造智能座艙「AI大腦」

理想中的智能汽車應該是什麼樣子?

——「懂用戶,有溫度」理應成為必備條件之一。

在大家的設想中,未來的智能汽車不再是冷冰冰的機器,而將成為家、公司外的第三生活空間,能夠識別和解碼人類的表情、語言乃至情感,並作出正確反饋。

因此,數字座艙隨即成為眾多相關企業的重點研發方向。深思考、未動科技等初創企業,博世、采埃孚等國際Tier1,以及眾多車企都是研發大軍之一。

目前,由於語音交互、手勢交互等AI技術的成熟度還不夠高,所以大多數企業將中控大屏作為優先落地的部分。但實際上,如何使汽車真正理解人,才是最能體現智能汽車未來模樣的關鍵,也是企業接下來需要深耕與突破的方向。

在人機交互領域,過去企業專註的都是單純的語音識別或圖像識別方面的工作,但這些技術只停留在使機器聽見或看見層面,無法更深層次「讀懂人」。當下,這種情況正在發生變化。

2019世界人工智慧大會上,深思考CEO兼AI演算法科學家楊志明博士在演講中表示,車內的人機交互正從簡單語音識別走向深度語義理解,從視覺聽覺等單一信號識別走向多模態信息的融合,從簡單的指令走向智能人機交互。

換句話說,人機交互分為兩個境界:一是基於人類已發出的指令,機器識別並完成工作;二是機器能夠在人類發出指令之前,讀懂人的心思並預測指令內容,主動完成工作。兩種境界之間,多模態深度語義理解成為關鍵。

楊志明認為,當前汽車內的多項服務分布在不同的應用中,訂餐廳、訂酒店等操作十分繁瑣,語音助手也沒有實現統一的融合和交互。因此,用戶對多模態、一站式智能人機交互方式的需求更為迫切,只有融合了包括硬體上的HUD、液晶顯示屏、中控CID,以及軟體上的語音識別、語義理解、車載信息娛樂系統、ADAS等技術,形成數字座艙AI「大腦」,才能全面而深入理解車內外各種場景,提供更好的人機交互服務。

對此,深思考基於多模態深度語義理解技術,在識別語音和視覺信號的同時,對多模態信息做統一的語義理解,構建數字座艙的AI「大腦」,打造AI交互機器人。

行車前期,深思考數字座艙AI「大腦」可以將AI引擎與RPA(機器人流程自動化)相結合,減少用戶在簡單工作上的消耗時間,提升車內人機交互體驗。如AI一旦識別用戶正在上班途中,就能完成自動播報工作安排、自動預訂會議室、會餐地點、機票酒店等服務。具體到訂餐場景,該系統能通過機器人自動調用餐廳的預訂介面完成預定,避免中間人工預訂可能產生的誤解與麻煩,實現一站式服務。

行車過程中,深思考數字座艙AI「大腦」能夠實現車路協同、車車協同智能交互。具體而言,深思考數字座艙AI「大腦」可以實時感知和理解前方路況和周圍車輛駕駛行為。如當前方發生交通事故、擁堵緩行或周圍車輛存在變道傾向時,AI在感知後可以語音提醒用戶,降低意外發生概率。

當抵達某一地點時,智能交互機器人可以自動判斷下一個目的地類型,如停車場、酒店等場景,隨後根據V2X信息為用戶進行智能導航和推薦。

在行車場景外,深思考數字座艙AI「大腦」還可以將智能家居與車輛信息融合同步。其通過車載系統連接智能家居,可實現對智能家居的遠程控制。同時,可以語音提醒用戶日程安排,並提供適合建議或決策。

不難看出,深思考數字座艙AI「大腦」將多模態深度語義理解技術貫穿用戶行車始終。從用戶進入車輛,到行駛過程中,再到抵達目的地後,深思考能夠持續為用戶提供預定、導航推薦、危險提醒、智能家居控制等服務,打造行車一站式服務閉環,以此增加用戶粘性。

以上場景非常令人期待,深思考之所以能夠做到這一點,是因為深思考具備多模態深度語義理解核心技術。這是深思考的研發重點,也是其技術壁壘。近日在由中國計算機學會(中國計算機領域最權威學會)、中國中文信息學會(人工智慧自然語義理解最權威學會)和百度公司聯合舉辦的「2019機器閱讀理解競賽」上。經過全球2502個團隊長達2個月的激烈角逐,深思考人工智慧在兩項評測指標中均登頂全球榜首,成功奪取全球冠軍。

楊志明介紹道,在多模態深度語義理解技術的支持下,深思考能夠通過車身外部感測器360°全景智能感知周圍環境,AI預測周圍車輛和行人行為;而通過車內攝像頭和語音感測器,深思考不僅能同時理解視覺、文本、語音多模態非結構化數據的深度語義,還可以實現自由跨域上下文理解和多輪對話交互。

除此之外,深思考還自主研發多模態深度語義理解專用深度學習處理器,支持多模態深度語義理解技術能夠終端上運行,實現深思考機器人產品在終端邊緣計算與大規模應用。

近兩年,眾多國際Tier 1和車企都陸續推出數字智能座艙解決方案,業界正在為打造「更有溫度的汽車」而努力。理論上來說,「溫度」實現的關鍵在於人機交互,人機交互的重點則在機器能否在特定場景內真正理解和掌握用戶需求。

良好的人機交互能夠與用戶形成不開口就能實現協同的默契,增加用戶信任度,提高用戶粘性,促進銷量。同濟大學汽車學院院長張立軍曾表示,在當前車市下行的趨勢下,數字智能座艙作為一個產品亮點,能夠降低品牌市場推廣的難度。

而當下,多模態深度語義理解技術成為全新突破口。當AI能夠真正理解人之時,就意味著汽車完成了從出行工具到生活空間的華麗轉變。

RECOMMEND

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 億歐網 的精彩文章:

互聯網巨頭「扎堆」網路互助,用戶如何選?相互寶回應!

TAG:億歐網 |