智慧生活,說說就有——方得智能CEO彭黔平
隨著智能語音技術的不斷發展,它已被廣泛應用於人工智慧相關的各個領域中。去年,智能音箱界更是掀起了「百箱大戰」。那麼又經過了近一年的時間,智能語音在真實應用場景中的落地與發展又是怎樣?近日,門羅公園拜訪了一家專註於智能語音交互技術與產品研發的企業——杭州方得智能科技有限公司,並對其CEO彭黔平先生進行了專訪,請他就智能語音產品與技術等進行一次分享。
門羅公園(Menlo Park)
門羅公園是門羅機器人科技旗下的新媒體平台,專註於人工智慧與機器人,圍繞AI+Robot產業提供著專業的媒體服務,並為讀者帶來最新最潮的人工智慧及機器人資訊。
方得智能CEO彭黔平先生
門羅公園原創漫畫形像:方得智能CEO彭黔平先生
門羅公園:彭總,您好!據我們了解,方得智能正準備發布一款智能音箱——愛芽智家。請問與市場上眾多的智能音箱相比,它有哪些特色?
彭黔平:您好!是這樣的,「愛芽智家」是業內第一個以多輪交互為主要交互形式的智能音箱,可為消費者提供家居控制、娛樂、出行、購物和跨場景應用等服務。該音箱有輕交互、輕享受、輕改造和輕智能四個特色。
在輕交互方面,它可以方便快捷地滿足用戶需求,如減少喚醒次數和一次性完成多個任務等。在輕享受方面,「愛芽智家」依託我們自有的多輪對話技術,以多輪交互的形式為消費者提供諸如語音叫車、語音買票等服務。而依託輕改造的特色,它具備全屋智能的消費級解決方案。用戶只需要安裝LifeSmart和BroadLink等廠商的智能硬體後,它就能全方位智能升級居住空間,讓消費者的生活更便利……
「愛芽智家」智能音箱
門羅公園:在這款智能音箱的特色背後,有什麼樣的技術平台在做支撐?
彭黔平:首先,這款產品的核心技術是「愛芽智能助理」(又稱為「FitME個人智能助理」)雲平台智能助理引擎。它承擔著在不同終端、不同場景及時滿足每個人個性化需求的重任。其角色定位是每個人都可以擁有的高效率工具。
其次,支持「愛芽智能助理」的是我們的「愛芽故事線開放平台」。它是「愛芽智能助理」的技能開發平台和運營平台,是目前國內唯一一個可以同時支持多輪對話交互設計、主動服務設計和複雜任務流設計等多種場景類型的功能平台。在今年年中,該平台將面向廣大的開發者及合作夥伴開放,使大家對於智能助理的各種創意都能夠快速地變現。
另外,我們基於「愛芽智能助理」這款雲平台智能助理引擎,還推出了手機端的APP。這款APP不僅僅是相關智能硬體的管理和配置中心,還是「愛芽智家」音箱的顯示中樞和支付中樞。
門羅公園梳理:產品與後台技術的關係圖
門羅公園:那你們是如何打造核心技術——「愛芽智能助理」 的?有什麼優勢支撐其研發團隊完成了這款智能音箱?
彭黔平:我們認為助理包括「幫助」和「打理」兩個層面的意思,所以我們對於個人智能助理的理解是:它是一個為用戶提供極致管家式服務的效率工具。這就要求智能助理不僅僅可以語音控制、語音搜索和聊天,更為重要的是要能夠感知用戶、懂用戶,隨時隨地主動或被動地給用戶提供個性化的貼心服務。能夠幫助人們提升處理日常事務的效率,讓人們生活得更輕鬆,這才是智能助理的真正價值。所以我們一直在個性化、自主學習、智能場景聯動和主動感知等方面持續發力,儘力為用戶打造完美的智能助理產品。
同時,「愛芽智家」的研發團隊具有堅實的自然語言理解和深度學習的技術實力。他們擺脫了傳統的對話系統Pipeline式的處理工作流,取而代之的是採用全套端到端的神經網路引擎,來高效地讓機器學習任務型多輪對話,以及處理序列化的多模輸入。這些能力使這款智能音箱在任務多輪交互的可用性上,相對於其他同類產品有明顯的優勢。
方得智能團隊
門羅公園:聽您解讀了貴公司的產品、技術及團隊後,我們很想知道它是如何為硬體廠商開展ODM/OEM服務的?在行業中具有哪些競爭優勢?
彭黔平:基於研發的產品以及研發經驗,我們為硬體廠商提供包括智能助理引擎、技能接入和硬體產品等一站式的解決方案。同時,由於智能助理系統的複雜性,我們還為客戶提供智能助理代運營的服務。
憑藉「愛芽故事線開放平台」,我們已經顯著降低了具有業務價值的深度功能的研發周期和研發成本。譬如我們已經將諸如預訂火車票這樣複雜的多輪交互功能的開發成本降低到了僅需5萬元左右。我們的技術體系和成果在性價比、功能深度、功能多樣性,以及功能開發難易程度等方面,較現有的一些平台更具競爭優勢。
定製化服務
門羅公園:方得智能致力於智能語音技術的研發,那您認為目前的自然語言理解技術處於什麼樣的階段?而方得智能語音交互平台的特色又是什麼?
彭黔平:我認為目前的自然語言理解技術還處在早期階段。人與人的高效交流依賴於大量的知識、共識、目標、妥協以及多感官的情景洞察和邏輯把握等。但是當前的自然語言理解技術還停留在槽值的抽取和意圖的分類。在用深度學習研發自然語言理解技術時,還沒有一種高效可靠的方法可以把上述特徵有效地加入進去,這也就導致了機器暫時還無法精準地理解用戶的表達和行為。
方得智能的語音交互技術主打多輪交互、多模輸入以及序列化決策。現階段重點關注的是多任務場景下交互的邏輯性,以及任務的完成度。在這樣的目標下,我們的語音交互技術還要保障交互的流暢性,所以我們拋棄了傳統的Pipeline的處理方式,進而選擇了利用海量數據端到端地訓練機器去掌握這些不同業務的場景邏輯和對話流程。同時,機器採用了多任務學習的方式進行學習,從而使機器能夠自主把握動態的主題切換、主題漂移以及任務之間的關聯關係。這樣的語音交互平台極大地簡化了傳統多輪對話技能開發的複雜度,是對傳統多輪系統的一種顛覆。
方得智能辦公場景
門羅公園:您對目前智能語音在真實應用場景中的落地與發展有哪些看法?
彭黔平:我認為如果智能語音僅僅完成控制、搜索和聊天等非必要性的簡單任務,那麼從2017年就熱鬧起來的智能音箱風潮接下來就可能會遭遇滑鐵盧。所以2018年將會是各家智能語音產品的價值再發現年,具體體現在技能的深度、實用性以及智能化水平。在真實的應用場景中,越來越多的品質消費者一定會為他們的時間和體驗買單,所以從信息傳輸速率的角度來考慮,如何在並不高效的語音交互中協助用戶高效地滿足需求,是各家產品競爭的重中之重。以客廳場景為例,當我對智能音箱說我想看今天的新聞聯播時,除了它自己,是否還能與電視等進行聯動播放也很重要。
所以在真實的應用場景中,智能語音只是交互媒介之一,智能音箱或智能助理真正的生命力來自於背後的實時感知、數據融合、場景聯動以及決策輔助。這些才是給用戶生活帶來顯著改善的東西。最後,感謝門羅公園的採訪,也感謝大家能傾聽我的分享,謝謝!
場景落地示例
門羅觀點:
方得智能在智能語音領域中有著自己明確的主攻方向,而旗下的產品覆蓋了B端企業和C端消費者,其核心產品智能助理也正逐漸切入人們的家居生活。我們有理由相信,在彭黔平先生及其團隊的共同努力下,方得智能將為大家帶來一種說說就有的智慧生活。
精彩預告:
「愛芽智家」將於今年四月上市。門羅機器人評測實驗室即將對它展開評測工作。敬請各位讀者和廠商合作夥伴關注,謝謝!
※CES 2018上最酷炫的10大機器人
※讓家更完美,海爾正式進軍服務機器人領域
TAG:門羅公園 |