當前位置:
首頁 > 科技 > 360 首席科學家顏水成:有關機器視覺的六個洞見

360 首席科學家顏水成:有關機器視覺的六個洞見

從飛鳥到飛機,從蝙蝠到雷達。人類對自然界的每一次致敬都能把自己帶入一個新時代。而人工智慧,恰恰是向自然界的王者——人類——致敬。


自從有計算機那天開始,人們就從未中斷讓機器擁有智慧的夢想。在這條路上,有一位廣受世界學界尊重的大師,他就是來自360的首席科學家、國際知名計算機視覺與深度學習專家顏水成。


他不僅在國際上領域數次引領了計算機視覺的研究方向,還進行了大量前瞻的實踐,讓計算機模仿嬰兒大腦的運作方式,一步步觀察學習這個世界。

在 2016 CCF-GAIR 全球人工智慧與機器人峰會上,顏水成接受了雷鋒網的專訪,分享了他對於人工智慧和計算機視覺的洞見。

360 首席科學家顏水成:有關機器視覺的六個洞見



【360 首席科學家,360 人工智慧研究院院長 顏水成】

1、端上的智能


目前的人工智慧很多都依靠雲端的計算,但是有些場景並不適合雲端。例如:


特斯拉的自動駕駛技術,對於面前的路況進行圖像採集之後,如果發送到雲端進行處理,會有明顯的延時,這樣等結果返回本地,往往已經錯失了處理的時機,就失去了意義。


直播業務中為主播實時加上裝飾的技術,例如為主播加上虛擬的耳環。這種場景下,如果從伺服器上拉回來計算結果,會有時延,由於主播在運動,所以沒辦法精確對位,體驗就會很差。


有的智能攝像頭會提供一個功能:查看是否有可疑人員進入監控區域。如果設備銷量很大,大量用戶同時使用這個功能,這時如果在伺服器端進行計算,就會對伺服器造成很大壓力。

還有很多智能設備的應用環境是沒有網路的,無法和伺服器交互。

360 首席科學家顏水成:有關機器視覺的六個洞見



以上這些場景,如果將運算任務直接下發到智能設備終端上,這些瓶頸就會迎刃而解。


但是,把運算載荷放到設備上,顯然要克服諸多問題。其中最大的一個就是:終端設備的運算能力存在天花板。(由於智能設備成本有限,大多不可能配備頂級運算晶元)

1、降低運算的精度。例如在手機端識別人臉和年齡,精確度必然難以比肩專業的識別系統。但是這種從95%到85%的精度損失,是人們可以承受的。


2、改進計算模型。當然,最好的情況是能夠開發出新的更優計算模型。但是在現有模型下,也可以通過改進策略實現演算法精簡。例如顏水成帶領團隊研究了一些演算法調整,在原有演算法基礎上增加了一些判斷那些邏輯不用計算的策略。這樣雖然看起來規則更複雜了,但是總體來看計算量是減少了。


顏水成認為,這些策略的優化是非常有意義的,因為成本往往是實現商業化的重要因素。


2、人工智慧專用計算晶元

目前最主流的人工智慧晶元,全部採用 GPU。但是 GPU 的體量大,耗能高,無法在手機等設備中使用。目前看來,在手機或硬體上智能使用性能稍好的 CPU。


從目前來看,市面上還沒有一款專門為端設備研發的深度學習晶元。而中國人也在試圖給出在這個領域的專用晶元。


例如中國科學院計算技術研究所的「寒武紀」晶元,和由前百度深度學習研究院院長余凱創建的地平線機器人科技,都在試圖製造這樣的專用晶元。

360 首席科學家顏水成:有關機器視覺的六個洞見



【寒武紀晶元】


由於晶元生產是一個非常重的產業。一款晶元從流片到量產往往需要一年到一年半的時間,耗費數百萬美元。如果無法大規模銷售,那麼將會造成成本無法控制。


在成熟的晶元可用之前,用各種方法降低端晶元的運算量,不失為一個好的方法。


3、類腦計算


當你看到一個人的照片,有關他的很多故事就會自動湧現在你的腦海里,這就是人腦的奇妙之處。


類腦研究一直以來都是人工智慧領域很超前的研究方向。簡單來說,就是要準確掌握人腦的工作原理,在此基礎之上用相同的原理設計深度學習網路。


但是顏水成說,人腦研究領域的發展並沒有想像中快。但是他非常欣賞以人腦為啟發研究出來的計算模型。


例如當一個人看到某個物體時,這個物體是不斷地對視網膜進行衝擊,這個信號就像流水一樣,在神經的各個部位達到了一個新的平衡。

360 首席科學家顏水成:有關機器視覺的六個洞見 點擊播放 GIF/985K



這就像一個水管網路,在入口加壓,會層層推導,造成整個網路的各個節點的壓力同時改變。


「對於大腦而言,某個圖像對整個系統加電信號,會導致與之相關的所有記憶和知識瞬間湧現。」


這樣的效率會遠遠高於目前人工智慧所使用的線性計算。


雖然這種模型聽上去很奇妙,但是在實際的方程求解方面,仍然面臨重重問題。不過顏水成表示,在這個方向上,也許未來能有新的解決方法。


4、無監督學習和自學習


目前的深度學習,無一例外需要大量的數據。例如要想讓機器可以準確識別出一隻狗,需要先讓系統「看」成千上萬隻狗。但這顯然和人類的學習方式不同。


一個小孩子,可能只需要看到一兩隻狗,就可以認識全世界所有的狗。

360 首席科學家顏水成:有關機器視覺的六個洞見



【無監督學習】


從這一點上看,「小樣本」「無監督」「自學習」是人類完勝機器的方面。那麼機器有沒有可能實現小樣本無監督學習和自學習呢?


這也許就要回到每個人最初認識世界的那一刻。


顏水成說:


根據一些研究,每個小孩子最初的視覺學習都是從運動的物體開始的。嬰兒就像青蛙一樣只能識別運動的物體。因為物體只有運動,才能分割出眼前世界的區塊。而從這裡出發,才有了物體的概念。這以後才是小樣本學習和自學習的過程。


顏水成對這種學說非常感興趣,這實際上展現了機器視覺的新入口:視頻。


從視頻切入,發現人類和機器學習的密碼。這也是顏水成帶領團隊正在進行的工作之一。


5、人腦的兩套識別系統


這個人腦特有的現象,不經意間揭示了一個人腦運作的巨大秘密。

360 首席科學家顏水成:有關機器視覺的六個洞見



這可能說明人腦分為兩套識別系統:參數模型和非參數模型。


對於不常見到的人或物體,大腦會選擇把他們放置在非參數模型中;直到你經常看到這個對象,大腦才會把它轉移到參數模型中;如果接下來又長時間不見面,這個對象又會被移動回非參數模型中。


這大概就是動畫片《頭腦特工隊》所描述的規則。

360 首席科學家顏水成:有關機器視覺的六個洞見



而這個規則,恰恰可以和人類的學習模型相聯繫。


例如父母剛剛教會了小孩「馬」。這時「馬」就進入到了他大腦的非參數模型中,直到他有一天到了動物園,觀察到新的「馬」。這些樣本累積到了一定程度,就會使得「馬」進入到了參數模型。


這種認知模型,對於改進機器學習的架構有著重大的意義。機器的無監督學習和自學習似乎露出了一絲曙光。但是顏水成說,人類的學習遠遠不是這麼簡單,因為人的學習不僅是依靠圖像,還結合了聲音、語義。而在這些方面,研究空白很大。


6、語義理解


對於 AI 來說,最重要的有四個方向:視覺,語音、語義、大數據。


而目前科學家在視覺,語音和大數據方面,都實現了可用性比較強的人工智慧。唯獨在「語義理解」這個最重要和易感知的方面徘徊不前。


這也是為什麼目前的所有人工智慧機器人感覺都有些「辭不達意」的原因。


究其原因,仍然是之前提到的:人類現有的語義理解實現技術和人大腦的工作架構完全不同。人對於語義的理解,不僅僅是建立在對方的話語本身之上,還要綜合考慮話語環境,知識背景、情緒等等因素。這些因素中的任何一個,目前都不能被人類科學家很好地控制。


顏水成坦言,這方面的研究非常困難,已經超越了他的能力範圍。但也是正是專註於自己的視覺和大數據研究領域,才能專心做出更多的成績。


AI,這兩個字母充滿了神秘和浪漫的氣息。這不僅代表了我們對於未知的渴望,對於創造的期待,也代表了我們對於自身智慧的無上虔誠。


在人工智慧領域的每一個洞見,都可以讓我們更加接近那個終極的答案。


這讓我們感到欣喜。

360 首席科學家顏水成:有關機器視覺的六個洞見



顏水成,360 首席科學家,360人工智慧研究院院長。曾在新加坡國立大學領導機器學習與計算機視覺實驗室。顏水成的主要研究領域是計算機視覺,深度學習,與多媒體分析。他的團隊提出的「Network in Network」 對深度學習產生了很大的推動力,他的團隊在五年內曾7次問鼎計算機視覺領域「World Cup」競賽PASCALVOC 和 ILSVRC的世界冠軍和亞軍獎項。


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

南佛羅里達大學孫宇教授:機器人靈巧手抓取的復興
機器人3定律被打破,我們可以做些什麼
「半機器人」奧林匹克運動會:這裡沒有冠軍,只有科技的勝利
比鴉片還管用?VR或將代替你的止痛藥
Nature:迄今最精確人類大腦圖譜出爐

TAG:雷鋒網 |

您可能感興趣

360副總裁顏水成教授:深度學習的研發目標及1×1的卷積的功能 | CCF-GAIR 2017
360副總裁顏水成博士:技術與產品並重,1×1卷積讓深度學習更出彩
「超越200層ResNet」顏水成團隊 CVPR 新架構,提速300%
顏水成團隊 CVPR 新架構,提速300%
顏水成:像素級標註數據集將引領計算機視覺下一個時代
最後一屆ImageNet榜單出爐:顏水成等中國團隊奪多項冠軍
「ImageNet最後的冠軍」顏水成:像素級標註數據集將引領計算機視覺下一個時代
「致敬ImageNet」ResNet 6大變體:何愷明,孫劍,顏水成引領計算機視覺這兩年
「鹽水」=「顏水」,用了二十歲變十八歲
42歲胡可全家近照,素顏水嫩甜美,把大兒子寵上天送讀天價學校
陳小春一家戶外出遊照,小16歲美嬌妻素顏水嫩,兒子名字好獨特
三連敗!圍棋5高手群毆難敵AIphaGo!田淵棟、顏水成、鄧侃解讀人機協作與團體對戰
美女們偷偷吃的10種養顏水果,你知道幾個?
每日精選 | 日本暢銷的百年神水美顏水,黑頭OUT,毛孔隱形,痘痘不再來!
「鹽水」等於「顏水」?看了讓你今年二十,明年十八!
姜文一家近照,小15歲嬌妻素顏水嫩白皙,愛女美艷,趙薇是媒婆
顏水成和馮佳時團隊一作詳解CVPR錄用論文:基於對抗擦除的物體區域挖掘
黃豆豆全家近照,演員妻子素顏水嫩白皙,兒子超萌,女兒顏值逆天
幾種養顏水能擊退皺紋、眼袋,奔四奔五的女性吃最適合!