當前位置:
首頁 > 科技 > 從試用到使用:計算機視覺產業新一輪發展的起步年

從試用到使用:計算機視覺產業新一輪發展的起步年

參加 2018 AI開發者大會,請點擊

CSDN 出品的《2018-2019 中國人工智慧產業路線圖》V2.0 版即將重磅面世!

V1.0 版發布以來,我們有幸得到了諸多讀者朋友及行業專家的鼎力支持,在此表示由衷感謝。此次 V2.0 版路線圖將進行新一輪大升級,內容包括 3 大 AI 前沿產業趨勢分析,10 位 AI 特邀專家的深度技術分析,15 家一線互聯網企業的 AI 實力大巡展,以及 20 個 AI 優秀應用案例,力求為讀者呈現更全面的中國人工智慧產業發展概況和趨勢判斷。

V2.0 版將於 11 月 8 日舉辦的 2018 AI 開發者大會上正式發布,在此之前,我們將不間斷公布精要內容,以饗讀者。此為 V2.0 版中深度技術分析系列稿件第 1 篇,作者為 CSDN 特邀 AI 專家大華股份研發中心副總裁殷俊。

視覺是最重要的感官之一,我們通過眼睛看到大千世界,通過大腦分析看懂場景,並能回憶過往的視覺記憶。計算機視覺,就是利用電子、信息、計算機等技術,採用電子成像系統作為基礎的感知單元採集視頻圖像,並通過信息化技術,分析並解釋採集到的視頻圖像。計算機視覺從學術上分類,包括圖像處理、模式與圖像識別、事件分析、場景理解等眾多圖像相關的技術學科,以及計算機、信號處理、物理學、數學、生物學等多個基礎學科,且隨著人工智慧技術的演進還在不斷發展。

利用計算機視覺,我們最終期望通過技術的發展,計算機能和人一樣通過視覺觀察和理解世界,並且能夠具備自主適應和認知環境的能力。

計算機視覺技術百花齊放,加速多個產業升級

深度學習是當前人工智慧領域最為熱點的技術之一,其發展非常迅猛,通過深度學習技術,可以在短時間內達到傳統模式識別技術的性能。深度學習技術源於 80 年代的神經網路技術,最近兩年的發展才真正實現大規模商業化落地,背後驅動這項人工智慧技術的突飛猛進源於晶元技術發展帶來的計算能力指數級提升,互聯網和物聯網技術發展提供了海量的數據,深度學習技術開源推動演算法的快速工程化與迭代升級。

2018 年是深度學習為代表的計算機視覺技術百花齊放的元年,創業公司和成熟企業在人工智慧的浪潮里相互競爭,加速多個產業的升級。在演算法層面,眾多創業公司推出了很多高性能的人工智慧演算法,成熟的行業領導企業也迅速完成了技術突破和解決方案升級;在晶元層面,創業公司和巨頭企業也發布了各類神經網路的 IP 和晶元,形成 GPU、DSP、xNN、FPGA 各自發力的格局,滿足邊緣計算、中心計算和雲計算的計算力需求。從計算機視覺應用的產業板塊上分析,以視頻應用為基礎的視頻安防、工業視覺是目前最快落地的行業,醫療、智能駕駛領域的技術正在快速發展中,未來技術突破將會產生巨大的商業應用價值。

人工智慧技術和計算能力的突破勢必帶來產品和解決方案的全面升級,從而加速客戶應用的規模化效應。我們現在在交通道路上可以看到非常多的攝像機拍攝路面的情況,這些基本都具備人工智慧能力,能夠對道路上車輛的行駛情況分析,比如判斷是否違章。

以前要使用智能化分析交通行為,攝像機要連接到工控伺服器,在伺服器里部署視頻處理的演算法實現智能分析。直到 2007 年,以大華股份為代表的企業通過技術創新,推出了業內一體化智能交通攝像機,把當時高性能的 DSP 嵌入到攝像機,利用一台攝像機實現了交通違章和車牌識別功能,從而加速行業的快速升級和新型產品的普及。現在隨著深度學習技術的引入以及晶元計算能力的革命性提升,一台交通攝像機可以處理幾十種的違章行為,而且還能進一步分析行人、非機動車的行為,實現對視頻的全結構化解析,這又是一次里程碑式的發展。

同樣以人臉識別技術的應用為例,2017 年人臉識別技術取得關鍵性突破,大規模的人臉識別率達到 90% 以上,引發商業和產品化的快速落地。現在我們可以使用刷臉支付、刷臉開門、刷臉考勤等便捷的服務,我們同樣可以採用這項人工智慧技術實現商業的分析和數據服務。另一方面,隨著產品計算能力的大幅提升,新型人工智慧的一體化產品取代了傳統解決方案里需要部署的一套複雜的系統。

儘管計算機視覺在深度學習技術推動下取得驚人的成果,但我們也需要清醒的看到人工智慧技術還存在很多瓶頸。當前的人工智慧還不夠真正的智能,離機器自主認知還有很長的路要走,現有技術還只能做到高效地解決單一或特定的任務。此外深度學習演算法是個黑盒子,網路內部各層的解釋性差,在實際工程過中存在不可預見性,尤其是演算法還無法達到普適性要求,複雜性和融合性應用帶來很多誤差和相互干擾。

由於深度學習技術採用的是大規模數據驅動,大規模的數據訓練本身對超算中心的能力是很大的挑戰,同時在實際工程化應用中場景非常複雜多變,這會出現很多無法預測的干擾數據,導致很容易計算出未知的異常結果。更為重要的是雖然人工智慧已經有了非常高的性能指標,但客戶對人工智慧應用的期望卻往往超越現有的演算法表現結果,這也需要計算機視覺技術持續突破來解決的實際問題。

視頻安防和工業視覺領域應用發展最快

2018 年計算機視覺技術在視頻安防和工業視覺領域應用是發展最快的兩個領域,尤其在視頻安防領域,也是業內公認最適合落地的行業。安防應用的攝像機每天產生超 3000PB 的數據,這些數據里 99% 的數據都是無效的,而依靠人工智慧技術可以快速對視頻數據進行結構化分析,可以挖掘出其中的價值數據,進一步結合大數據技術將數據進行時空碰撞,從而實現數據關聯和數據檢索應用。

計算機視覺作為物聯網的視覺感知和視覺認知的重要環節,除了視頻安防的智慧城市和智能交通的應用外,已廣泛應用於在智慧金融、智慧樓宇、智慧教育、智慧環保、智慧城管等各個採用視頻應用的行業,即使是傳統的視頻安防行業應用也已經從安全管理延伸到城市管理、綠色出行等新型應用。

以視頻結構化技術的應用為例,這是一種基於視頻內容進行信息提取的技術。視頻結構化解析技術實現了人、機動車、非機動車和行為的解析,其中人的基本特徵包括面部、性別、年齡、身高、髮飾、衣著、帽子、包、口罩、傘等;機動車的基本特徵包括車牌、車標、顏色、車型車系、車貼、駕駛座人員、車飾、車窗等;非機動車的特徵包括車型、顏色、非機動車牌、乘車人等;行為的基本特徵包括絆線入侵、穿越圍欄、區域入侵、徘徊檢測、物品遺留、物品搬移、快速奔跑、打架鬥毆、人員聚集等。

道路擁堵治理也是當前城市道路管理的痛點之一,人工智慧技術可以發揮巨大的價值,在管理區域內的每個攝像機可以識別出視頻中的人、車的行為,即時分析違章,還能獲取到道路實時通行的人流、車流、密度等數據,依靠大量攝像機數據聯動,結合紅綠燈管理系統,對道路車輛通行按需管理並進行分流提醒,可以達到有效提升道路通行平均速度的目的。

同樣在生產製造過程中,質檢環節需要大量工人靠人眼去評判生產零件、整機的質量。現在計算機視覺高速發展,可以通過攝像機安裝在流水線上,高幀率拍攝視頻圖像並實時分析零部件的表面各種工藝缺陷,例如液晶屏的劃傷、裂紋,金屬零件的完整性,整件安裝的角度一致性等,同時還可以直接掃碼,實現生產過程自動化錄入。因此在工業視覺領域,隨著人工智慧的能力快速適配,機器開始逐步取代人工,再極大程度上降低生產成本的同時還提升了產品質量。

此外,現在在人臉識別、文字識別、物品識別、行為識別、肢體識別等各個領域都有非常豐富的應用出現,人工智慧已經融入到人們的生活、出行等各個方面,比如刷臉支付、拍攝翻譯、動植物分類識別、體感遊戲等等。可見,視覺技術的升級和應用的拓展,將帶來相關產業升級和用戶體驗創新。

計算機視覺產業新一輪發展的起步年

2017 年計算機視覺產業處於井噴期,眾多的創業公司、巨頭企業以及跨界公司參與到了這個產業里,各類的新技術和新應用出現在視野內。2018 年更多的是技術到產業的落地,成熟達到商用的視覺技術結合市場的需求在行業中持續開拓市場,尚在演進中的技術正在探索挖掘試點應用,一些偽智能的技術則被快速淘汰,同時學術界和工業界也在創新地研究新的技術點並尋求突破。

2018 年是計算機視覺產業新一輪發展的起步年,市場才剛剛啟動,經歷過去兩年市場和用戶認知的培養,當前業務應用開始逐步從試用走向使用,在這個過程中技術也得到持續發展,解決了試用過程中碰到的種種問題。

隨著市場需求的打開,在晶元、演算法、應用各個層面有了更多的企業參與。從個別的算力平台到多元化計算晶元的格局,從早期少數演算法公司技術創新到當前眾多成熟公司共同參與,從演算法單點爆發吸引眼球到現在人工智慧推動產業升級與應用融合,目前市場格局已經發生重大的轉變,走向了從技術驅動型轉換到應用驅動型的發展。

計算機視覺的市場規模非常巨大,這是一種推動各個產業升級的力量,我們無法單純衡量它的市場價值。可以預見,佔據應用市場以及技術領先型的公司將在未來人工智慧浪潮中獲取核心價值,並引領行業的發展。

未來 2-3 年發展趨勢

展望未來 2-3 年,計算機視覺領域在技術、應用、產業各個層面必然會有新的突破。在演算法方面,深度學習技術會繼續發展,但可能會有新的技術方法誕生引發新的變革。晶元方面,市場上會有更多高性能低功耗的神經網路 SoC 晶元發布,同時部分固化的視覺演算法會內嵌集成到晶元里。

應用方面未來應該會持續蓬勃發展,這對於企業和用戶而言都是非常巨大的市場和想像空間:

首先在現有的基礎上,會更貼近用戶的實際使用需求,演算法的迭代升級也會快速提升用戶體驗;

其次新演算法的推出也會帶來更多的應用場景和業務需求;

最後,應用的拓展將推動產業的發展,隨著新一代產品和解決方案的發布和普及,更多融合型、跨界型的業務模式會產生。

當下人工智慧、物聯網、雲與大數據、5G、雲計算等主導未來的核心技術正在加速發展與演進,計算機視覺行業生態在這些技術力量的驅動下,必將形成新的技術和市場格局。

【完】

2018 AI開發者大會

只講技術,拒絕空談

2018 AI開發者大會是一場由中美人工智慧技術高手聯袂打造的AI技術與產業的年度盛會!是一場以技術落地為導向的乾貨會議!大會設置了10場技術專題論壇,力邀15+矽谷實力講師團和80+AI領軍企業技術核心人物,多位一線經驗大咖帶你將AI從雲端落地。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

機器學習決策樹演算法實戰——理論+詳細的Python3代碼實現
ICLR 2019論文投稿近1600篇,強化學習最熱門

TAG:AI科技大本營 |