雲知聲造芯再邁一步，推多模態AI戰略，打響AI晶元場景落地戰

科技 01-04

智東西（公眾號：zhidxcom）文 | 寓揚

2019年的第一個工作日，雲知聲創始人、CEO黃偉以一句「少有人走的路」，為其多模態AI晶元戰略拉開帷幕。

雲知聲創始人、CEO黃偉

2014年人工智慧還遠未如此火熱，黃偉在面向B端市場的商業探索中，就意識到算力、演算法結合在一起的重要性，於是確定了「雲端芯」一體化的戰略，並於2015年啟動自研AI晶元。

在AI前夜的那個節點來看，作為一家剛成立2年的創業公司，雲知聲當時的策略無疑飽受質疑。

然而隨著阿爾法狗（AlphaGo）戰勝世界頂級圍棋選手李世石後，AI浪潮襲來，並逐漸落地走嚮應用。2018年在場景驅動、中美貿易摩擦的背景下，AI晶元走向時代前台。

歷時3年，雲知聲也終於2018年5月推出第一款語音AI晶元雨燕，交出造芯答卷。而2019年，雲知聲將在雲端芯戰略的基礎上再邁進一步，並提出多模態AI晶元的構想。

先行業一步提出多模態AI晶元戰略，這背後是雲知聲怎樣的思考，這一構想又能否引領雲知聲下一階段的發展？

多模態AI晶元戰略浮出水面

過去6年來，雲知聲大概走過了四個階段，2012~2014年即剛成立的前兩年，布局演算法平台構建技術優勢；緊接著雲知聲確立「雲端芯」一體化的策略，並啟動自研AI晶元；到了2017~2018年雲知聲加速AI的商業擴展和應用，並推出首款語音AI晶元雨燕。

站在2019年的起跑線上，黃偉稱，接下來就是依託雲知聲的AI演算法與AI晶元構建場景優勢。而構建場景優勢的關鍵就在於多模態AI晶元戰略。

之所以提出這一戰略，黃偉重點講述了他面向5G與AIoT的思考。他認為，5G將推動行業產生質變，引發連接大爆炸、應用大爆炸，尤其是工業領域。

可以預見，隨著5G的到來，語音、圖像、視頻等多維數據將會海量增長，此時多維數據的處理能力成為剛需。

與此同時，IoT場景下AI應用對於端雲互動有著強需求，強大的雲會讓端側能力更強，而強大的端則可提升數據處理的實時性和有效性，進而增強雲的能力。

在多維數據處理能力與邊緣計算的需求下，具備更強算力的多模態AI晶元就成為了場景的關鍵競爭力之一。

黃偉指出，面向5G場景，只有更強的算力還不夠，還需要有深入場景提供服務的能力，並在此基礎上對傳統SoC（System On Chip，片上系統）做了進一步的解讀。

他認為，S應該代表不同的 AI 服務能力即 Skills，O 代表雲端與邊緣側的互動 On/Off Cloud，C 代表具備智能處理能力的 AI 晶元。

從雲端芯一體化，到多模態AI晶元戰略，再到對SoC全新的理解，雲知聲對AI晶元的理解和布局都保持著行業領先性。

戰略背後是多模態AI技術的積澱

從2018年開始，多模態交互就成為業界研究的一個重點。簡單來說，模態可以理解為感官，多模態交互即是調用多種感官的交互方式，它跨過了自然語言，其方式也更加貼近人，也代表了AI未來的一個發展方向。

雲知聲在2019年開年提出多模態AI晶元戰略，無疑在多模態探索的道路上又邁出一步，但多模態不應該成為一句口號，而應該真正落實到技術研發中。

智東西發現，在語音技術主賽道外，雲知聲在2018年也加緊布局圖像識別、機器翻譯等領域，進行多模態技術的儲備。

去年，在國際權威人臉識別標準評測資料庫 LFW 和 MegaFace 上，雲知聲團隊研發的人臉識別系統，在上述兩項標準評測中，性能分別達到 99.80%和 98.47%，得分位居業內前列。

WMT2018國際機器翻譯大賽成績

去年5月份的WMT2018國際機器翻譯大賽的中英翻譯比賽中，組建不足1年的雲知聲機器翻譯團隊，也拿下英中第二、中英第四，綜合第三的優異成績。

本次發布會上，雲知聲聯合創始人李霄寒進一步分享了雲知聲在人臉識別、表情分析、標籤化、多目標唇動狀態追蹤等視覺AI方面的進展，進一步儲備多模態技術基礎。

另一方面，雲知聲還發布了多模態人工智慧核心 IP——DeepNet2.0，其AI處理能力也有1.0的語音進化到2.0的多模態，支持語音、圖像等處理能力。DeepNet2.0可兼容 LSTM/CNN/RNN/TDNN 等多種推理網路，支持可重構計算與 Winograd 處理，最高可配置算力達 4T。

目前雲知聲 DeepNet2.0 已在 FPGA 上得到驗證，將在2019年落地多模態AI晶元海豚（Dolphin）。

可見，在硬體層面與演算法層面，雲知聲都在儲備多模態技術，為其多模態AI晶元的落地打下地基。

造芯之路：從雲端芯一體化到多模態AI晶元

2014年，雲知聲就確定了「雲端芯」的發展戰略，2015年推出IVM（通用晶元方案），並落地格力、美的、海爾、長虹等一線家電廠商，從客戶需求切入，布局AI晶元更具場景優勢和時間窗口優勢。

在此基礎上，雲知聲在2015年啟動AI晶元研發，歷時3年終於推出第一代語音AI晶元雨燕。基於此，雲知聲又在去年9月推出Turnkey方案，加速雨燕晶元的落地。李霄寒透露，預計落地產品最快會在今年Q1季度面世。

針對面向物聯網時代的AI晶元，雲知聲又在2019開年之分享了一些新的思考。李霄寒指出，當前物聯網產品線的 AI 晶元越來越明顯地體現出三個趨勢：

場景化。所謂場景化是晶元設計要堅持場景導向、需求導向，面向垂直領域的具體場景，通過晶元以及解決方案解決實際場景中的問題。

端雲互動。在物聯網的不同應用場景下，海量終端設備要實現功能智能化必須端雲配合，即形成邊緣算力和雲端算力的動態平衡。這意味著從晶元設計開始，就要考慮端雲互動能力。

數據多模態。在5G驅動的萬物智聯場景下，數據類型由原來的單一化走向多元化，晶元所需處理的數據也由單模態變成多模態。

以此來看，面向物聯網終端場景的AI晶元核心是解決垂直場景問題的能力，其呈現形式將不再是一個單一的硬體，而是承載著邊緣能力與雲端能力的多模態AI軟硬一體解決方案。

在此基礎上，雲知聲在多模態AI晶元戰略的引領下，拋出2019年的AI晶元布局藍圖，今年將推出3款晶元，搶灘IoT場景。

在去年5月份發布的雨燕晶元的基礎上，今年雲知聲將面向智能語音場景，推出一款適用性更廣的輕量級AI晶元雨燕Lite，比如可以應用在智能開關、智能燈泡等場景，實現設備的智能化，相比第一代其成本也將更低。

面向智慧城市場景，雲知聲將推出支持語音和圖像等計算的多模態AI晶元海豚（Dolphin），預計將在今年Q3季度投產。

面向智慧出行場景，雲知聲將與吉利集團旗下生態鏈企業億咖通科技共同打造車規級 AI 晶元雪豹（Leopard），預計將在2019年Q3/Q4季度投產。

相比行業其他公司造芯，雲知聲的優勢在於自主設計，尤其是DSP、深度神經網路處理器都為雲知聲自主研發，能夠真正面向場景，使AI晶元滿足真實場景中的需求。

而AI晶元戰略布局的領先性，雨燕晶元在行業的率先推出，給了雲知聲更多的時間窗口優勢。把握這一優勢，從而率先導入客戶，搶佔場景，則更有利於率先在行業中形成規模優勢。

今年雲知聲再進一步，面向語音、視覺、車載等場景再推3款AI晶元，可見其對AI晶元的戰略積極且堅定，在晶元落地的節奏上領先行業。

結語：場景落地戰剛剛打響！

物聯網時代是一個場景導向的時代，很難形成PC時代或者移動互聯網時代在晶元領域形成一家獨大的局面，因此業內也有一種觀點，物聯網時代是應用定義演算法，演算法定義硬體（晶元）。

這一觀點也與雲知聲強調的場景化、端雲互動不謀而合。以雲知聲為代表的AI技術公司，最早面向行業場景探索技術落地，能夠率先發現場景中客戶的真實需求，從而定製出更加滿足行業需求的AI晶元。這也是AI技術公司布局AI晶元的優勢所在。

從雲知聲2019年布局的三款AI晶元可以看出，輕量版的雨燕Lite面向智能語音場景，成本更低，可以與第一代雨燕（算力更強）配合，滿足智慧家庭領域更廣闊的終端設備。車規級的雪豹AI晶元是面向智慧出行領域，多模態語音和圖像的海豚AI晶元則是面向智慧城市領域。

通過這三款AI晶元，雲知聲正在搭建一整套滿足語音、多模態、車載等場景的AI晶元能力。

目前AI晶元正處於場景落地的初期，場景的真正需求尚不明確，哪些場景最終能夠成為有潛力的市場也尚需探索。可以看出雲知聲的策略是，從自身深耕的智能家居、車載、醫療、教育出發，快速搭建一整套覆蓋語音、視覺等能力的AI晶元，搭建好能力框架之後，就可以在市場中一面探索場景需求，一面快速基於能力框架量體裁衣，推出更加適合場景需求的AI晶元。

而雨燕Lite這款輕量級、低成本的語音AI晶元，很有可能就是這一打法下的產物。

無論是在多模態AI晶元戰略，還是AI晶元的推出、落地速度上，雲知聲都走到了行業前列，但迎接它的是更加艱巨的AI晶元落地戰、卡位戰。

只有經受場景與市場的考驗，真正解決現實場景的實際痛點，才能真正被行業與市場認可，而這一戰役剛剛打響。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 智東西 的精彩文章:

※金立系盧偉冰將操盤小米命根子？雷軍放手紅米背後到底有何大招
※AI芯生態，產業新格局！2019年首場AI晶元峰會3月開幕

TAG:智東西 |