當前位置:
首頁 > 新聞 > 思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

AI熱潮催生了很多初創公司,其中有不少AI晶元公司。我們看到許多巨頭和初創公司都把目光鎖定在AI視覺晶元。不過,從2018年上半年開始AI語音晶元也陸續發布,2019年1月4日,思必馳在北京正式發布第一代AI語音晶元TAIHANG。值得注意的是,這款晶元出自思必馳與中芯國際下屬投資公司中芯聚源的合資公司上海深聰智能,這究竟是為什麼?

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

AI語音技術真的比圖像挑戰小嗎?

AI圖像和語音是AI技術應用的兩大方向,相比之下圖像如今受到了更大的關注,一方面是因為有安防和自動駕駛汽車等應用市場的驅動,另一方面也有政策的支持。與此同時,有人認為相比圖像,語音的技術挑戰更小,現有的晶元也已經能夠滿足AI語音的需求,這是否存在一些誤解?

思必馳CTO/深聰智能CEO周偉達接受雷鋒網專訪時表示:「目前AI圖像處理大部分使用CNN,CNN最大的瓶頸不是帶寬和存儲,而是並行計算,但解決並行計算問題用馮諾依曼CPU架構做乘法的加速相對而言是好做的事。AI語音則使用DNN,RNN系列的LSTM、BLSTM,這其實有比圖像更大的挑戰,一個是並行乘法計算,另一個是模型參數更大,這會讓目前的CPU架構面臨很大的帶寬瓶頸。

「之所以AI圖像更先受到業界的關注,一方面是市場的需求,另一方面是因為學術圈和工業界認為CNN的硬體優化難度小於LSTM的大規模參數模型。」周偉達進一步說明。

因此,可以明確的是深度學習演算法從2005年提出到現在,其在語音識別、圖像視覺領域相比傳統演算法都帶來了明顯的改進。並且,無論是AI圖像還是AI語音,現有的晶元都能夠處理,但算力不夠效率不高,都需要專用的AI晶元。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

思必馳CTO/深聰智能CEO周偉達

為什麼選擇自研AI晶元?

AI的火熱讓市場上湧現了不少AI晶元初創公司,但晶元是一個技術密集、人才密集、資金密集的高門檻的行業,並且晶元真正的成功並非量產,還有後續的落地應用以及不斷的迭代。這也讓晶元的投資回報周期比較長。思必馳作為一家以演算法和軟體見長的公司,是什麼讓他們下定決心自主研發晶元?

周偉達在言由芯生——2019年思必馳AI晶元暨戰略發布會上舉了個例子,他表示思必馳曾經對接過一個最複雜的場景,演算法運行在4核Arm的晶元上,佔用了晶元50%-60%的計算量,語音作為一種交互手段佔用這麼高的計算量在許多應用場景是難以接受的。

因此,思必馳決定做AI語音專用晶元希望解決通用晶元的三個閉環:通用晶元無法和數據產生連接;通用晶元無法和市場產生連接;更重要的是通用晶元沒有演算法,演算法是靈魂,晶元是框架。沒有靈魂的框架產生不了價值的,必須藉由專用晶元才能夠實現晶元未來的潛能。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

AI語音對專用晶元的需求毋庸置疑,但市場需求才是更強的驅動力。思必馳CEO高始興在發布會上提到,思必馳打通了全鏈路對話技術,深化軟硬結合,藉助DUI平台推進定製規模化,通過「會話精靈」提供互動式信息服務,實現快速落地。在車聯網後裝、智能音箱、兒童平板/故事機、知識機器人等領域市場佔有率均第一,在汽車前裝、電視/白電、智能客服等重點領域市場增速第一。未來,思必馳將整合智能終端方案能力與會話精靈智慧服務能力,形成All In One解決方案,進入酒店、地產、物流、養老、醫療、教育、安全、社區等更多行業。

雷鋒網也了解到,思必馳在2017年實現了收支平衡,2018年邁向了盈利。這其中有市場對語音需求的快速增長的大背景,比如智能音箱的出貨量將從2018年的1800萬增加到2000萬,故事機在2018年出貨也將超過2000萬,以及智能手機在2018年都陸續加入了語音助手的功能。當然,思必馳在各個領域保持市場佔有率第一更是他們最終選擇進入晶元領域的底氣。但是,周偉達接受採訪時表示思必馳擅長的是演算法和軟體,最終決定最AI晶元也有很多顧慮。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

為何走出不一樣的AI晶元路?

既然已經決定自主研發AI晶元,如何做就是接下來的關鍵問題。周偉達告訴雷鋒網,思必馳進從2017年開始行了一年的調研,剛開始想與IP提供方合作,包括將思必馳的演算法移植到他們的CPU、DSP上,但最終發現不對硬體做優化,直接進行演算法的移植效率並沒有明顯提升。

與IP提供方的合作帶來的提升這與思必馳的期待相差甚遠,接下來,思必馳又接觸了晶元外包設計公司,這類公司可以根據給定的晶元需求設計出晶元,但由於晶元外包設計公司採用項目制,在晶元實現之後,後續PPA(Performance、Power、Area)的優化他們不會繼續進行。高效能的晶元可能設計需要20%的精力,後續的優化則需要80%的工作量。

與晶元外包公司的合作也行不通,思必馳又嘗試與具備豐富晶元設計經驗和市場經驗的SoC公司合作,但是即便思必馳免費投入演算法團隊與SoC公司聯合設計和優化,一年下來計算效率也只改進了20%。

思必馳發現與晶元設計公司合作的方式也走不通,因此想到能否建立更深度的合作,也就是晶元公司出設計團隊,思必馳出演算法團隊組建合資公司。但這其中也有不少困難,比如SoC公司意願不強,以及未來還會涉及知識產權的問題。

同樣是深度合作的模式,思必馳又想到與晶元代工廠合作,因為晶元代工廠對IP的驗證以及晶元的生產非常有經驗,也與晶元產業鏈的上下游都有很好的對接,對晶元的量產、良率、訂貨和交貨周期都有很好的保障,對思必馳而言是一個不錯的選擇,當然,代工廠希望合作的是成熟的IP。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

最終,思必馳在拜訪了晶元產業鏈上大大小小的近百家企業,並在調研的過程中付諸了行動之後,2018年3月,思必馳攜手中芯國際下屬投資公司中芯聚源,共同注資成立上海深聰半導體有限責任公司(簡稱「深聰智能」)正式開啟造芯之路,8月開始流片,11月點亮驗證。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

首代AI晶元典型工作場景功耗實現毫瓦級

基於此前的調研以及在2017年12月份通過傳統對接平台就已經完善了所有演算法的移植定點化和優化,深聰智能成立之後就開始正式定義思必馳的第一款人工智慧語音晶元,一個月的時間定義了晶元完整的規格書,4月份開始進行了晶元的底層的技術研發,集成驗證以及模擬以及優化,不到5個月的時間思必馳的第一款晶元在8月7日成功流片,並在當天點亮。

不過,AI演算法還在不斷演進,這對終端AI晶元的設計提出了更大的挑戰。對此,周偉達表示,得益於思必馳在市場上對接過大量的這IoT智能設備,我們對市場的需求非常了解。另外我們14篇論文入選ICASSP刷新國家級自主創新能力新記錄,我們的演算法研究是超前的,對未來兩三年或者更長時間都有規劃預測。思必馳的AI晶元已經做好了設計和規劃,首先是保證目前的演算法能很快的移植進去,其次是我們對接下來兩三年內的做優化留了一定的空間。

這款快速流片的AI晶元就是深聰TH1520,據深聰智能CTO朱澄宇介紹,TH1520進行了演算法硬體優化,基於雙DSP架構,內部集成codec編解碼器以及大容量的內置存儲單元,同時,TH1520採用了AI指令集擴展和演算法硬體加速的方式,使其相較於傳統通用晶元具有10X以上的效率提升。此外,TH1520在架構上具有算力及存儲資源的靈活性,支持未來演算法的升級和擴展。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

TH1520兼具低功耗及實用性,採用多級喚醒模式,內置低功耗IP,使其在always-on監聽階段的功耗低至毫瓦級,典型工作場景功耗僅需幾十毫瓦,極端場景峰值功耗不超過百毫瓦。

對比來看,如果使用Arm晶元,工作場景性能表現優化好的至少需要500毫瓦,有些則是瓦級功耗。周偉達接受專訪時表示,毫不誇張的說,我們做AI演算法跟硬體結合做優化的時候,演算法優化到指令集,內存優化到byte級。當然,這個過程中也經歷了軟硬體團隊從互相不理解到最終的默契配合。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

另外,TH1520支持單麥、雙麥、線性4麥、環形4麥、環形6麥等全系列麥克風陣列,同時支持USB/SPI/UART/I2S/I2C/GPIO等應用介面和多種格式的參考音,能在各類IoT產品中靈活部署應用。

周偉達也表示,TH1520定位於各類終端設備,並針對家居環境進行演算法優化,能夠快速落地,降低成本、降低功耗,大幅度提升電視、盒子、白電、平板、燈具等產品的用戶體驗。

發布會現場,思必馳展示了TH1520在音箱、電視以及洗碗機的三個Demo,並表示更高級的功能還在調試中。

另外,周偉達向雷鋒網透露TH1520最晚將在今年Q2產量。他還透露思必馳對於晶元也有自己明確的規劃,目標是能夠研發出合適的類腦晶元,目前已經取得了一些進展。

開放是思必馳的態度

有了自研的AI晶元之後,思必馳能讓終端語音處理能力的提升,這不僅能夠實現更多的離線語音功能提升體驗,減少數據傳輸到雲端,同時基於晶元中加入的晶元密碼,能夠更好地保護用戶的隱私。

當然,更重要的是思必馳-深聰將打造更貼合產品需求的人工智慧交互 「雲+芯」 整體解決方案。這是否意味著思必馳更傾向於提供完整的解決方案,周偉達表示我們會根據客戶的需求,可以提供軟硬一體的IP,晶元到Turnkey解決方案,我們更希望以產品的性價比吸引用戶,也希大家能夠一起先把語音市場做大。

思必馳自研AI晶元不僅方式獨特,首代毫瓦級AI語音晶元也僅用1年

思必馳的開放不僅僅體現在最終的產品方案上,周偉達表示深聰智能也希望能與晶元產業鏈的各方合作,包括IP提供方,晶元設計外包公司。另外,深聰智能希望不僅做人機語音的交互,未來也可能做圖像,深聰智能歡迎更多做視覺,做圖像甚至做AI金融的公司一起與跟深聰智能合作研發更智能的類人腦的高效能的人工智慧計算晶元。

雷鋒網小結

晶元是AI發展的關鍵要素之一,當然對於算力的追求也讓更多的晶元公司意識到需要與演算法和軟體公司合作。不過在思必馳AI晶元的研發中則是思必馳這家以AI語音演算法見長的公司從語音演算法和市場需求的角度出發,進入晶元市場,經過長期調研和慎重考慮最終以合資公司的方式完成AI晶元的研發,這個過程克服了許多挑戰,現在還很難說這種模式一定能獲得最好的成果,但卻是思必馳經過探索後最合理的選擇。

在採訪的過程中,也能明顯的感受到思必馳開放的態度,不僅是對於研發AI晶元合作的開放,更是以開放的態度聯合更多的人去推動AI語音技術的普及。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

中國安防「遇冷」的 2018
深度學習中不均衡數據集的處理

TAG:雷鋒網 |