科大訊飛:我們和華為基因相似,板凳能坐十年冷,如今向C端強勁發力
新智元報道
編輯:木青、金磊
【新智元導讀】To B業務已穩,科大訊飛瞄準利潤更大、規模更廣的C端市場開始發力。在5月21日的年度發布會上,訊飛重磅發布了5款面向消費者的硬體產品,其中訊飛翻譯機3.0能實現0.5秒閃譯。坐穿十年冷板凳,不斷積累技術經驗,這支「AI國家隊」終於要實現AI應用紅利兌現。
向C端強勁發力,瞄準用戶規模更大的消費者市場,AI應用紅利得以兌現。
這是「AI國家隊」科大訊飛正在探索的新路。與互聯網不同,在人工智慧領域中,To C業務反而未經大範圍開拓。
不變的是,先布局的玩家,先佔據優勢。
5月21日,在上海世博舉辦的年度發布會上,科大訊飛大秀技術肌肉,針對用戶痛點發布6款新品,其中5款為面向消費者的硬體產品。
其中包括能實現0.5秒閃譯、支持四大方言與英文互譯的訊飛翻譯機3.0,售價3499元;以及一小時錄音5分鐘出稿的訊飛錄音筆,分為1999元和2999元兩個版本。
今年是科大訊飛成立20周年,恰逢國際貿易摩擦升級的歷史關卡,訊飛表示要在技術上未雨綢繆,做好十年磨一劍的準備。
科大訊飛董事長劉慶峰:20年不斷累積,AI技術價值今年將開始兌現
與往年發布會流程相似,發布新品前,科大訊飛董事長劉慶峰進行開場演講。
與往年發布會有所不同,這是全球首場人工智慧多語種直播發布會。
開場的「AI虛擬主播」主持人便吸引了不少人的眼球。不僅如此,這位虛擬主播還同時支持多語言同步報道。
技術肌肉秀不止於此,隨後科大訊飛董事長劉慶峰親自表演了一場類似「柯南領夾」的AI變聲秀。
劉慶峰登場進行自我介紹,一開口,現場卻傳出來的是「老羅」羅永浩的聲音,「大家好,我是科大訊飛劉慶峰」,劉羅難辨。
不一會兒,他的聲音又開始變成清脆的女聲,雖然是志玲姐姐的聲音,但說活語氣、節奏卻和劉慶峰本人完全一致,來看下視頻:
劉慶峰現場演示AI變聲秀
這背後正是運用科大訊飛的音色轉換技術,可通過提取原聲語音中的內容信息,包括原聲的節奏和情感,再結合特定人的音色進行轉換結合。
該項技術在voice conversion Challenge 2018國際音色轉換大賽中獲得全部指標第一名,也是音色和相似度上唯一一家超過4.0MOS分的系統。
另外,在嘉賓的同時,舞台旁邊都有「訊飛聽見」直接進行現場實時語音識別並準確呈現出來,同時機器自動將講話內容翻譯成英文。
這其中的技術又有了革新——科大訊飛採用自主研發的新一代語音識別模型,實現了中英文語音混合輸入,識別無縫切換,且識別率達到95%以上。
關於所謂的中英文語音混合輸入,舉個例子:
「看最後一集Game of Thrones了嗎,囧雪竟然做出了這樣的事兒,很bad很sad很drama。」
有了這項技術,不管「訊飛聽見」有沒有被劇透,它都能準確識別並且翻譯你說的話。
除此之外,劉慶峰還介紹了科大訊飛在國際上取得的技術突破:
語音識別:語音識別準確率全面超過速記員。目前,科大訊飛的中文語音轉寫準確率已經突破98%,英文達到95%。
機器翻譯:系統通過CATTI全國翻譯專業資格(水平)測試,達到專業資格合格標準;讓更多「語言間的高效溝通」成為可能,讓機器翻譯能力確有保障。
機器閱讀理解:2019年3月,機器閱讀理解國際權威評測SQuAD 2.0任務科大訊飛再次登頂冠軍,並同時在EM和F1兩個指標上全球首次均超越人類水平,一舉創下比賽的全新紀錄。
2019年伊始,不少人認為這將是大量人工智慧創業倒閉的時候,大潮退去,泡沫破滅,因為人工智慧並沒有核心技術。
對於這樣的論調,劉慶峰在現場明確表示:「2019年就是人工智慧的應用價值兌現年,今年開始真的紅利已經到來。」他提出了A.I.技術價值兌現的三大標準:
一、真實可見的實際應用案例
二、能規模化應用的核心產品
三、能夠統計數據的應用成效
技術肌肉已秀,接下來讓我們看看實際落地、將要幫助訊飛獲得紅利的硬體新品:
新品強勁發力C端:訊飛翻譯機3.0實現「0.5閃譯」,售價3499元
訊飛此次一口氣發布5款消費者硬體產品,覆蓋生活、工作、學習等方面,每一款都針對消費者痛點。
先來看下訊飛翻譯機3.0。
說話是世界上最常見的事情,又是世界上最不簡單的事情,不同國家之間語音不同,不同的省份地區也有著各自的方言。
然而一個人精通多種語音需要花費大量的時間和精力,就像劉慶峰在現場所說的那樣「不可能每個人都是錢鍾書轉世」,但AI讓不可能變成可能。
訊飛翻譯機3.0全新升級,翻譯速度達到「0.5秒閃譯」,實現清楚拾音、響亮外放和智能識別多音多義詞。
對消費者更實用的是支持多種語言互譯,訊飛翻譯機3.0支持普通話與粵語、東北話、河南話、四川話等翻譯,及粵語和英語互譯、維吾爾語與普通話互譯、藏語與普通話互譯。
其中的英語,不僅限於標準的英文發音,在現場演示中,訊飛翻譯機3.0能將帶有咖喱味的、法國乳酪味的、德國啤酒味的、俄羅斯伏特加味的英文統統翻譯成標準的普通話。
另外,繼去年首發行業A.I.翻譯功能後,訊飛翻譯機3.0實現金融、醫療、外貿、計算機、法律、體育、能源七大領域的A.I.行業翻譯。
除此之外,翻譯機3.0還優化了拍照翻譯功能,升級高清攝像頭和視網膜屏,出國旅遊看不懂菜單的尷尬將不再出現。
拍照翻譯採用科大訊飛最新國際領先的OCR技術,該技術去年包攬ICPR 2018國際大賽全部三項冠軍。劉慶峰表示,科大訊飛為何開始做圖像識別?因為語音識別和圖像識別的底層演算法是相通的。
相比於訊飛翻譯機2.0(售價2999元),翻譯機3.0售價為3499元。
接下來是另一重磅產品:訊飛智能錄音筆,這也是訊飛5款硬體新品中,價格最低的一款,分為1999元標準配置和2999元兩款,來看下性能:
採用2 6麥克風陣列頂級配置,2顆哈曼大直徑麥克風和6個矩陣麥克風位列機身;
收音距離可達15米;
語音識別準確率達到98%,1小時錄音5分鐘出稿;
支持語音實時轉文字、中英邊錄邊譯、要點標記、語音搜索、多平台同步和後端編輯功能。
除此之外,還有針對辦公所出的訊飛轉寫機、訊飛辦公本,以及針對教育所處的訊飛學習機,這三款價格均高於3000元:
商務人士的專屬:訊飛轉寫機是一體化的專業語音轉文字設備,面向會議、培訓、講座等場景下可實現實時轉寫、純離線識別、識別內容翻譯成英文投屏展示,同時可為視頻會議實時生成配套字幕輸出,會議、演講結束後可自動生成二維碼回看PPT、文稿和錄音。
可書寫的智能辦公本:訊飛智能辦公本擁有10.3英寸E ink高清柔性護眼墨水屏,即時語音轉寫文字、智能語音搜索、一鍵分享查看編輯、收發郵件手寫親筆信等功能,售價4999元
輔導數理化的學習機:訊飛學習機,針對數理化、英語聽說讀寫進行提升,售價3999元。
iFLYOS 2.0來了:開放超200項核心技能,未雨綢繆以備十年磨一劍
除5款針對C端的硬體產品外,科大訊飛在本次發布會發布iFLYOS 2.0,開放超200項核心技能。
iFLYOS是什麼?它是科大飛訊於2018年推出的一套基於雲端的智能物聯網操作系統。
2018 年訊飛開放平台相繼發布了人機交互界面 AIUI3.0和iFLYOS形成端到端解決方案和實現路徑。
到現在,全新升級的iFLYOS 2.0將AIUI與iFLYOS融合為一體,打造出以語音為主要交互形式,以智能硬體為載體,融合雲端與終端的AI Agent(智能物聯網操作系統)。
當談到日前美國將華為列為「實體名單」一事,訊飛表示華為早就未雨綢繆,有「備胎」頂替。身為國內AI代表企業,訊飛認為中國企業應該為未來備戰,除了智能通訊,AIoT也是其中一個方向。
科大訊飛在2017年就同BAT並列為「國家新一代人工智慧開放創新平台」四大金剛,入職「國家隊」。這次iFLYOS2.0的亮相亦是訊飛為維持原創技術系統、先行布局AIoT買的一份「保險」。
全新升級的iFLYOS 2.0將AIUI與iFLYOS融合為一體,打造出以語音為主要交互形式,以智能硬體為載體,融合雲端與終端的AI Agent(智能物聯網操作系統)。
科大訊飛輪值總裁胡郁介紹,它具備「人性化交互」、「深度自定義」、「端到端集成」、「高效率開發」四大特點。
為解決接入方SDK集成慢,語音能力接入複雜,硬體設計鏈條過長的問題,iFLYOS直接提供SDK和API,並有晶元、PCBA公版和整機參考設計等解決方案供接入方選擇。
一方面為開發者提供高度集成的軟硬一體化智能硬體解決方案和強大的集成開發環境;另外一方面,也能為消費者提供流暢的交互體驗和多樣的場景服務。
訊飛即將「弱冠」:出鞘消費者市場,技術成熟才能做C端產品
此次科大訊飛全面發力C端市場,事實上早在去年就有跡象。
今年4月,科大訊飛公布2018年度財報,其中一大亮點就是該公司業務賽道加速奔跑,To C業務增長迅猛。
2018年,訊飛TO C業務開始發力,佔比顯著提升,全年實現營收收入25.17億,同比增長96.54%,在整體營收中佔比達31.80%;實現毛利12.96億,同比增長70.77%,毛利佔比達32.72%。
在產品方面,訊飛翻譯機2018年賣出30萬台,佔據品類銷售額70%,品類份額第一;訊飛輸入法活躍用戶超過1.3億;以訊飛聽見為代表的移動網產品及服務較上年同期增長369.36%。
如果說移動互聯網的主戰場正從上半場的消費互聯網(To C),向下半場的產業互聯網(To B)方向轉變。
那麼,AI領域正好相反,被稱為「人工智慧國家隊」的訊飛早早就布局To B業務,實現智慧政法、智慧醫療、智慧教育等業務的突破。
而人工智慧To C市場此前難以進入的僵局如今正有被打破的跡象。據科大訊飛輪值總裁胡郁透露,當科大訊飛剛成立的時候,他們也做過一款面向C端的統一輸入法,但結果很不成功。
胡郁解釋稱,要做C端產品的,基本上都是做產品創新和模式創新的公司,所用的技術一定是成熟的。就像當年的互聯網創新,技術上都是成熟的。但如果是做核心技術創新的公司,一開始就做C端的話是很困難的。
那麼科大訊飛決定發力C端的真正原因是什麼?
人工智慧技術已經走向成熟,AI將實現應用紅利兌現。
胡郁具體解釋了其中原因:
C端有足夠大的利潤空間,有更廣泛的市場規模,而在人工智慧方向的To C,目前市場潛力仍非常大,訊飛跟很多的公司處於同一個陣地、同一個起跑線;
想要把最好的技術展現給用戶時,需要做完整的事情,訊飛有足夠的技術積累,將技術從軟體到硬體、完整地呈現給用戶。
20年的技術累積終於將訊飛強勢帶入了C端的戰場。
科大訊飛輪值總裁胡郁:我們和華為有著相似基因,都曾坐十年「冷板凳」
最後當談轉向C端面臨的挑戰時,胡郁表示:科大訊飛在源頭核心技術、系統創新上都佔據優勢,但最終做成C端的最重要一環——模式創新上,訊飛仍面臨著挑戰。
胡郁表示,相比於互聯網產品,我贊成互聯網的創新模式思維,但是我並不贊同很多互聯網公司去通過燒錢的方法去做推廣,這種推廣效果並不一定能呈現剛需。
作為一個技術創新型的AI公司,而不是一個互聯網公司,科大訊飛要用互聯網思維來優化我們的核心技術,來優化產品,迭代產品。
胡郁提到為何華為可以把消費者業務做成功:
首先,華為擁有一群學習能力極強的員工,去學習鑽研如何從To B向To C轉變;
其次,能夠耐得住寂寞,保持定力,朝你自己認為正確的方向堅持下去,華為與訊飛的一些基因上是比較類似的,都是做那種板凳能坐十年冷、十年磨一劍的公司;
最後,不斷地吸引業界最好的知識經驗與血液。
在發布會現場談到AI應用紅利兌現的基礎——AI核心技術鴻溝的突破時,科大訊飛董事長劉慶峰表示這不是一蹴而就,需要源於熱愛的長期堅守。
這是任何一家成功的AI公司都必須擁有的基因。
※恐懼吧,AI!
※【超級乾貨】自動化所宗成慶:108頁PPT完全梳理NLP
TAG:新智元 |