發布了 1000 種語義技能的 DeepBrain,想做一個能與萬物對話的大腦
我們預計,到 2020 年前後,手機之外的語音交互設備出貨量將會達到 1 億。
——DeepBrain 聯合創始人李傳豐
-shenzhenware-
Echo 賣瘋了,國內幾乎所有的智能語音技術廠商都將目光投向了智能音箱。在「風口」的鼓動下,語音技術廠家、音頻硬體設備廠家、互聯網平台廠商、以及各種內容 IP 商,也都紛紛向著智能音箱的方向靠近。似乎是一片欣欣向榮的繁榮場景,卻有不少人擔憂泡沫在悄然滋生。
然而,當市場在熱捧類 Echo 產品時,卻忘了一個很重要的事實:用戶愛上的其實並不是 Echo,而是其背後的語音助手 Alexa;而 Alexa 背後,更是一條以人工智慧技術為核心締造的生態鏈。
▎這家想賦予機器思考能力的公司,要做中國本土版的 Alexa
DeepBrain 核心團隊是國內最早專註於自然語言處理技術(NLP)領域的團隊之一,曾推出過國內第一款基於智能手機的中文語音助手——智能 360,並積累了千萬級的用戶。
目前,公司研發團隊主要來自於英國布里斯託大學、英國牛津大學、美國亞利桑那大學、法國巴黎大學、上海交通大學、復旦大學、同濟大學、中科院等著名高校。
李傳豐表示,在 2013 年物聯網剛剛興起時,他們意識到物聯網是拓展手機之外的重要語音交互場景,於是在 2014 年做出國內第一款語音智能音箱小智超級音箱,比 Echo 的推出還要早半年。
到 2015 年,Echo 音箱開始爆發,同時他們意識到以智能語音為中心的物聯網場景應用,可能會迎來爆髮式增長。未來的語音交互技術,將會蔓延至整個物聯網場景。也就是說,未來的機器人、智能家居、辦公會議,孩童教育,都可能會成為語音技術的應用場景,而不會局限於音箱。
在這種情形下,開發一個能與萬物對話的智能大腦,將會是一件對整個物聯網產業都會有推動意義的事。經過長時間的準備,DeepBrain於 2017 年 5 月推出了 DeepBrain AI 雲平台。
▎要做中國版的 Alexa ,需要具備技術實力
在經歷了很多年的研發積澱之後,在語義認知技術方面,DeepBrain 能讓技能開發者開發出具備複雜上下文對話能力的技能,甚至做到讓技能具備超過 20 輪以上的對話能力,語義準確率達到 98% 以上,並且可以不斷自我訓練,做到依據廠商、用戶數據特性的不同而實現個性化定製。
目前 DeepBrain 已經擁有了語義技能商店、AI 人機對話引擎、機器人功能組件、精細化大數據及家居互聯網服務等五大核心能力。而其中語義技能商店這一塊,或許是語義為中心的生態計劃中最關鍵的一環。
▎要做中國版的 Alexa ,語義技能商店或是重要一環
由於支持語言的限制(目前 Alexa 僅支持英德兩種語音),Alexa 開放生態體系雖然強大,但目前尚不能覆蓋到中國用戶。而目前,國內做語義技能平台的公司卻不多,更多是一些技術上已有多年積澱的語音和語義技術型創業公司在推出智能語音行業解決方案。
DeepBrain 不同的地方在於,繞開了行業解決方案,而是和更多做語音識別的公司形成戰略合作關係,自己專註於做語義技能平台。據介紹,他們是國內第一家發布語義技能平台的公司。
所謂語義技能應用,是配合語音、圖像、文本等輸入方式,以語義理解為核心技術,結合內容廠商生成的一種全新形態地第三方應用。
這些豐富的語義技能,使得語義技能平台在物聯網時代的地位,就相當於智能手機時代的蘋果 App Store,或者安卓的應用商店。
面對千千萬萬個性化的應用場景,硬體本身不需要去進行差異化定製,那麼用戶的個性化需求就要交給豐富的語義技能商店去滿足了。就好比有不同需求的人,根據需要從手機應用商店下載不同的 App 一樣。
而在這個將用戶需求進行數字化、數據化成為千萬小技能的過程中,開發者所佔的角色十分重要。
DeepBrain 目前已經上線的語義技能超過了 1000 種,以音頻與兒童教育為主,而 DeepBrain 正在籌備的開發者大賽,也將進一步擴充這個數字,預計在今年年底將超過 3000 種。
▎要做中國版的 Alexa ,將經歷一個從混亂到清晰的過程
DeepBrain 打造這樣一個雲 AI 大腦的目的,是想要做適合中國開發者的語義技能生態平台。但實際上,要做中國本土版的 Alexa 並不容易,這不僅意味著要做好語義技術上的沉澱,更意味著要對整個語義技能生態發展有精準的把握能力。
正如前面說到的,目前國內的智能音箱市場發展節奏很亂。不過回過頭看 20 年前互聯網產業剛剛興起的時候,也經歷了這樣一個從雜亂到清晰的發展過程。
儘管眼前的問題與擔憂很多,語音交互還是承載著很多人的期望,並被認為將是下一代革命性的人機交互形式。對此,李傳豐也表示,隨著行業的逐漸深入發展,大家會意識到開放、合作對於行業發展、向前推動的重要意義,而整個智能語音行業的脈絡也會在行業更迭洗牌的過程中逐漸清晰。
而對於 DeepBrain 這類的創業公司來說,專註於打透產業鏈中的一個環節,尋找語義技術與應用場景最合適的落地點,做用戶體驗極致的產品,實實在在解決硬體廠商與用戶的痛點需求,為生態鏈貢獻自己獨有的價值,是核心關注點所在。
畢竟,只要方向對了,走的人多了,路慢慢自然就會清晰的。(主筆:談喆@深圳灣;編輯:Lynn@深圳灣)
當前,以Alexa+Echo為代表的語音智能終端設備,憑藉著「智能」與「連接」,逐漸出現在大眾的視野。有人把它看成是鋼鐵俠中 JARVIS 那樣的虛擬管家,也有人認為它提供了新的交互方式和交互界面……而應運而生的各種平台、技術、集成方案,也讓這個生態更加的繁榮。
2017 年 7 月 15 日,在平台廠商、解決方案廠商、應用終端廠商、系統集成商、以及上下游企業的推動下,我們將在深圳灣迎來「WARE 2017 語音智能平台與應用峰會」的第 2 季!
四大主題論壇,首度深度呈現;多為重磅嘉賓,喚醒產業生態!語音先行,語見未來!
※嗨鏡要革電視的命?「頭戴電視」的激進與躊躇
※把一手好牌打得稀爛的完美幻境能否憑藉 PTU Wink 回春?
※YUNEEC 想做商用無人機的瑞士軍刀?後航拍時代的無人機商用探索
※黑膠音樂不再是高端的文青玩物,HYM 推出一體化黑膠音箱
※寶馬、谷歌投資 4500 萬美元,Desktop Metal 將金屬 3D 印表機做到了桌面級
TAG:深圳灣 |
※DeepLabv1 & DeepLabv2 - 空洞卷積(語義分割)
※語義分割網路DeepLab-v3的架構設計思想和TensorFlow實現
※2018 SEO 相關性關鍵是語義semantic,不是關鍵字
※蘋果Siri涼涼!三星Bixby 2.0將發布:語義識別增強
※WolframAlpha-未來的語義知識引擎
※Keras】基於SegNet和U-Net的遙感圖像語義分割
※DilatedNet - 擴張卷積(語義分割)
※Stanford NLP 解讀 ACL 2018 論文——用於調試 NLP 模型的語義等價對立規則
※一文概覽主要語義分割網路:FCN,SegNet,U-Net……
※Github 代碼實踐:Pytorch 實現的語義分割器
※Github代碼實踐:Pytorch實現的語義分割器
※Auto-DeepLab:自動搜索圖像語義分割架構
※谷歌開源其語義圖像分割模型DeepLab-v3+
※谷歌開源語義圖像分割模型DeepLab-v3+
※語義圖像分割 解密谷歌DeepLab-v3+
※谷歌最新語義圖像分割模型DeepLab-v3+現已開源
※基於IR-transformer、IRGAN模型,解讀搜狗語義匹配技術
※谷歌發布MobileNetV2:可做語義分割下一代移動端計算機視覺架構
※無綠幕MR特效,谷歌開源AI語義分割模型DeepLab-v3+
※專欄 | 基於IR-transformer、IRGAN模型,解讀搜狗語義匹配技術