中國在計算機視覺領域的人工智慧公司

最新 07-24

2018年4月7日至6月9日，張學友在南昌、贛州、嘉興、金華舉辦了4場巡迴演唱會，警方在前三場演唱會現場各抓獲了一名在逃犯人，在金華演唱會上更有兩名逃犯落網。「歌神」張學友也成了「逃犯剋星」。

這一切是怎麼發生的呢？原來，在演唱會的安檢門，公安部門設置的攝像頭可以逐一捕捉到進入演唱會人員的人臉圖像。之後通過和後端資料庫進行人臉識別比對，這樣就可以幫助警方抓獲逃犯。

這就是人工智慧「人臉識別」的威力。

人臉識別，是計算機視覺領域的一個重要的應用。

5億4000萬年前，地球上出現了第一個擁有視覺的動物三葉蟲。今天的人類所擁有的視覺能力，也是經歷了漫長的歲月進化迭代才形成的。

對於人類的視覺來說，眼睛只是捕捉光線的鏡頭，真正能夠對人眼看到的圖像進行處理識別的是大腦。我們人類的大腦皮層有三分之一是用於視覺計算的。

視覺是人類最重要的感知系統，人類所接受的大部分信息來自視覺。

模仿人類的視覺，計算機也可以擁有視覺。

要想讓計算機擁有視覺，必須使用人工智慧技術。在計算機視覺領域，中國湧現了很多有創造力的人工智慧公司。

什麼是計算機視覺？

計算機視覺是用電腦去識別物體的一種新技術。作為視覺來講，必須要有眼睛與大腦兩部分。計算機視覺的主要組成部分不是「眼睛」，而是「大腦」。

2011年，計算機視覺迎來了最偉大的突破。當年，谷歌人工智慧實驗室的傑夫·迪恩與斯坦福大學計算機系教授吳恩達合作，他們動用上萬台電腦的計算資源，讓計算機用深度學習演算法在YouTube上觀看了一千萬段關於貓的視頻，最後計算機終於完成了「貓臉識別」。這個項目是谷歌大腦在計算機視覺領域取得的巨大成功。

到了2014年，計算機視覺領域的ImageNet比賽第一次超越了人類肉眼識別圖片的準確率——這標誌著計算機視覺已經比人眼更加精準，因此具有極大地應用價值。

ImageNet國際挑戰賽是計算機視覺領域最著名的比賽，被譽為國際計算機視覺領域的「奧林匹克」。它是2010年由美國斯坦福大學人工智慧實驗室的李飛飛教授主導推出的。早在2009年，ImageNet對1500萬張圖片進行了標註，涉及22000個類別的物體，李飛飛她們建立了一個規模空前的資料庫。而且，她們公開了整個資料庫，免費提供給全世界的人工智慧研究團隊。有了這個培育計算機大腦的資料庫，科研工作者教會了計算機識別物體。

計算機視覺的基本原理

想要實現計算機視覺，首先需要有一個攝像頭，然後把拍攝的照片成像在CCD上形成電子照片。這些電子照片是以像素為單位存儲在計算機上的。每一個像素都可以看成是三個矩陣元，這些矩陣元給出了像素的RGB數值（每個數值都是整數，取值在0到255之間）。其中，R表示紅色，是red的首字母； G表示綠色，是green的首字母；B表示藍色，是blue的首字母。有了這三種基本顏色，就可以按照不同的權重疊加出千變萬化的色彩。

計算機視覺所處理的主要對象就是這個RGB數值，因為每一張照片的像素很多，因此整張照片可以被看成是三個大的矩陣。

計算機視覺的本質，其實就是處理這三個矩陣，然後從這三個矩陣中提取出「特徵信息」，比如對於動物的圖片，可以提取的特徵是「有沒有尾巴？」以及「有沒有毛？」等。通過對特徵信息的提取與判斷，可以實現「貓臉識別」或者「人臉識別」。人工智慧是通過機器學習的方法，提取不同物體的特徵，然後用分類器對各種事物進行分類識別。

計算機視覺的頭部公司之一商湯科技與華東師範大學合作，編寫了中國第一本人工智慧教材《人工智慧基礎（高中版）》，在書中詳細介紹了計算機視覺的演算法實現及其基本原理。

計算機視覺有哪些相關企業與落地應用？

計算機視覺領域的應用非常廣泛，其主要的落地應用有以下幾個大類。

在安防攝像頭領域，主要有無人值守的場地看管、刷臉門禁、以及發現異常自動報警裝置等。在這裡主要的代表性公司有海康威視、大華股份等傳統大公司與商湯科技、雲從科技、依圖科技以及曠視科技等獨角獸企業，這四家公司被稱為人工智慧計算機視覺的「四小龍」，它們的產品在本文一開頭提到的張學友演唱會上抓逃犯的過程中發揮了重要作用。

在交通攝像頭領域，主要是識別車輛車牌，進而進行車輛套牌分析、交通違章分析等智慧城市解決方案。在這個領域的人工智慧計算機視覺的頭部公司有格靈深瞳等。

在金融領域，計算機視覺主要用於快速信貸審核、刷臉支付與刷臉開戶等應用。在這個行業的代表性企業有商湯科技、曠視科技Face++等。

在醫療領域，計算機視覺主要用於智能診斷與疾病研究和精準醫療方面。在這個垂直領域的代表性企業有阿里雲ET醫療大腦等。

在汽車領域，計算機視覺主要用於無人駕駛，代表性的企業是百度。百度最近與金龍汽車合作發布了阿波龍無人駕駛汽車。

在無人機領域，計算機視覺主要應用於物流運輸以及路徑規劃、地質災害監控等。在這個領域的代表性企業是大疆科技。

除了以上的垂直領域，人工智慧計算機視覺還有非常多的應用領域，比如在手機領域，計算機視覺主要用在美圖拍照與直播特效等領域；在虛擬現實領域，計算機視覺主要用於虛擬現實遊戲以及3維電影等領域。

計算機視覺已經落地並且全面開花，《互聯網周刊》整理了中國在計算機視覺領域的人工智慧公司排行榜。

人工智慧計算機視覺的核心競爭力分析

深度學習演算法已經打破了圖片分類的瓶頸，而且也突破了物體識別的技術瓶頸。物體識別的技術難度比圖像分類要高。圖片分類問題只需要判斷圖片中包含哪個物體，而物體識別則需要在同一張圖片包含多個物體時，給出所包含物體的具體位置。

目前，基於深度學習演算法的計算機視覺已經實用化，張學友演唱會上警方抓逃犯的成功案例說明人工智慧在計算機視覺方面已經真正落地了。

當然，人才依然是人工智慧計算機視覺的核心競爭力。以商湯科技為例，商湯科技的創始人之一是香港中文大學的湯曉鷗教授，其CEO徐立也擁有人工智慧的博士學位。在商湯科技，有120個博士，這無疑是其核心競爭力的體現。

計算機視覺的核心並不在於攝像頭，也不在GPU，因為這些都可以在公開市場上買到。對於企業來說，買不到的核心技術是人工智慧的演算法——這些演算法需要相應的人才去編寫去改進，只有不斷研究新的演算法，改進現有的演算法，才可能讓人工智慧工作地越來越好。

人工智慧計算機視覺雖然取得了長足的發展，但想要在這一領域擁有一席之地，企業必須擁有真正掌握人工智慧演算法的核心技術人員。否則隨著時間的推移，在人工智慧的融資退潮之後，那些沒有掌握人工智慧演算法的企業都會被人發現其實是在「裸泳」。

（文/軒中）

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 互聯網周刊 的精彩文章:

※用人口和土地的歷史數據分析中國房價的未來走勢
※2018區塊鏈分類排行榜

TAG:互聯網周刊 |