孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

新聞 02-09

【新智元導讀】昨天，「2018北京人工智慧產業高峰論壇」舉辦，北京前沿國際人工智慧研究院也在會上宣告成立。在論壇上，來自中科院、商湯、曠視、騰訊AI Lab等學術與產業界大佬分享了人工智慧當下的技術創新、發展趨勢和存在的問題，乾貨滿滿。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

2月8日，在北京市經信委和海淀區人民政府共同主辦的「2018北京人工智慧產業高峰論壇」上，北京前沿國際人工智慧研究院宣布成立，李開復任首任院長，陳東平為理事長。

在論壇上，北京市經信委相關負責人介紹了北京人工智慧產業的工作思路和新模式探索，中國科學院院士陳潤生，歐洲科學院院士漢斯·烏思克爾特，商湯科技CEO徐立、曠視科技首席科學家孫劍，騰訊AI Lab計算機視覺負責人劉威等做了人工智慧產業落地案例和技術突破的演講，中國科學院副院長李樹深，北京市委常委、副市長陰和俊做大會致辭。

以下為新智元整理的論壇乾貨：

李樹深：深度學習並非理論方法的突破，人工智慧仍處於初始階段

人工智慧依舊是2018年科技界和互聯網行業最為熱門的話題。過去幾年，在國務院和各級地方政府層面的政策推動下，人工智慧迎來了黃金髮展期。中國科學院副院長李樹深在論壇致辭中說，在人工智慧發展熱潮之下，我們仍需要始終保持清醒認識。

李樹深認為，當前雖然數據量呈現爆炸式增長，但是支撐人工智慧發展的兩大核心基礎：計算能力和演算法仍然未取得根本性的突破。

從計算行業看，在過去五六十年中，自集成電路發展之後一直遵循摩爾定律，並保持非常驚人的發展趨勢。但是隨著納米尺度的晶體管越來越小，面臨物理極限的挑戰越來越明顯，在存儲空間、計算速度方面難以按照摩爾定律無限發展下去。這需要材料科學革命性的突破。

從演算法上來看，雖然近年來深度學習演算法推動人工智慧實現了快速發展，但是深度學習的成功不是理論方法上的突破，而是在大數據和大規模計算資源驅動下的基於基礎理論的技術突破，這也證明人工智慧仍處於一個較為初始的發展階段。不管是基礎理論的研究和產業技術的發展，都需要科技界和產業界共同作出更大的努力。

北京新機遇：成立北京前沿國際人工智慧研究院，探索政產學研用協同

北京發展人工智慧產業具有人才集中、產業集聚、政策導向明確等突出優勢。北京市經濟和信息化委員會主任張伯旭介紹，目前北京正大力推動機制創新，積極探索政產學研用，協同推進人工智慧創新產業培育模式。

北京前沿國際人工智慧研究院（以下簡稱「研究院」），就是北京探索這一模式的重要實踐。

它的組織架構是一個研究院+N個創新中心+N個科研學院平台，為三層開放式組織架構，可以動態承載不同的創新資源目標。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

研究院是在政府指導下民辦非企業法人，主要職能是做好產業的頂層設計和協同政產學研用各方面創新資源；

創新中心是專註人工智慧不同領域，彼此獨立運營的企業，具體承接和落實研究院規劃的各項研究任務。研究院第一批設立三個創新中心，分別是北京人工智慧基礎研究創新中心、北京智慧社會創新中心和北京人工智慧專利創新中心。

科研產業平台主要是為降低協同創新的門檻，加快技術成果轉化，針對技術創新所需的共性科研要素統一搭建的開放式平台。中科院計算機網路信息中心負責搭建人工智慧計算及數據應用服務平台。

中國科學院計算機網路信息中心副主任遲學斌介紹，這個平台具備高性能計算能力和分散式計算資源，支持主流的開源人工智慧開源工具，比如Caffe、TensorFlow等，主要解決計算機視覺、圖象處理、智能語音、自然語言理解四大領域問題。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

在論壇上，由創客天下、薊門農工商公司聯合打造的「中關村人工智慧創新創業基地」由北京市海淀區區長戴彬彬授牌。

「中關村人工智慧創新創業基地」是人工智慧產業領域的垂直創新孵化平台，目前已攜手微軟、百度、intel、京東、IBM、北航等國內外企業和院校、機構，促進人工智慧領域的產業創新與技術落地，為人工智慧領域的創新企業提供人才培訓、成果轉化、企業服務、金融支持等領域的專業服務。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

北京市海淀區區長戴彬彬（左）和創客天下集團總裁蒙洋

創客天下集團總裁蒙洋介紹，「中關村人工智慧創新創業基地」去年初改造，總投資接近1個億，目前已經入駐無人機研發、無人零售等領域的初創企業，共同探索人工智慧產業創新發展的海淀模式。

AI+產業案例：DNA計算機、智慧城市、智能客服還有想像空間

生物醫學的發展，需要AI技術的幫助，而生物技術和AI的結合，也從另外一個層面為人工智慧技術落地提供了很好的依據。

例如，利用人工智慧技術，將掃描視網膜的圖像來進行分析，能夠對網膜的病變得出更加精確的結果。中國科學院院士陳潤生說，利用人工智慧還可以用來分析基因組，並且已經建立了很多深度學習的演算法。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

此外，生物科學家們也在研究DNA計算機，希望通過深度學習，以DNA為材料建立DNA計算機，將來有望成為跟常規的計算機並列的新型計算機。

智慧城市也是人工智慧技術落地的重要場景。北京智慧社會創新中心由商湯科技牽頭成立，主要聚焦人工智慧在三大領域落地的城市功能：

1、城市的治理創新。商湯科技聯合創始人兼CEO徐立介紹，成立智慧社會研究院主要是解決大城市病的問題，人工智慧介入城市的規劃和服務，城市治理將由人治轉為機器治，有了這樣一個更智能的狀態，整個城市的治理會走上新的台階。

2、城市規劃創新。目前很多城市規劃還是基於專家的支持，今後可以通過大量的大數據分析，甚至是從天上遙感的數據、衛星的數據進行路面分析，進行路網提取；對路上的擁堵情況進行大規模的分析，從而對城市的交通治理進行優化。除此之外城市土地面積使用，可以進行實時分析給出建議。從現在的治理走向未來的規劃。

3、城市公共機構服務優化。城市的服務隨著人口的大規模的擴張，出現服務跟不上的情況，現在有了人工智慧技術，能夠提高業務處理效率。比如在北京西站出入口加入了人工智慧（攝像頭），就會這個整個城市的服務質量有整體的把握，並且能夠用統一的標準更好的服務更多人。

百度計算機視覺首席科學家楊睿剛目前在百度研究院任三維視覺首席科學家、機器人和自動駕駛實驗室負責人，介紹了百度AI的發展歷程和技術布局。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

目前，通過人工智慧可以把信息進行分類，每天把低俗內容分發量減少1億以上，對編輯的效率提高60%以上。AI提供的個性化短視頻的推薦，通過視頻分析的方法，對視頻分類達到90%的正確率，節約人工成本達到80%以上。此外，百度還和聯通做了智能客戶的系統，可以和用戶進行多輪對話，把人工客服的成本下降20%以上。

孫劍：很多問題很難用函數逼近解決，計算機視覺存六大困難

曠視研究院院長孫劍博士帶領研發的「深度殘差網路（ResNet）」和「基於區域的快速物體檢測（Faster-RCNN）」技術已經在學術界和工業界廣泛應用，AlphaGo Zero也使用到了ResNet。

不過，在論壇上孫劍博士認為，儘管依靠深度神經網路計算機視覺技術有了突破，但是它只能解決函數逼近問題，還有很多問題很難用函數逼近去解決。雖說視覺是感知問題，但是視覺背後有很多認知問題，目前主要存在以下幾個問題：

1、定義物體（Functional Object）。首先定義很難，如果定義不清楚，就沒法做精確的物體識別。同時，還有很多定義的概念是包容性的，千差萬別。只有對這些概念有很好的建模，才能做場景理解。

2、遮擋（Occlusion）。今天物體檢測方法非常非常好了，但遇到遮擋，依然做的不太好。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

3、上下文理解。下圖中，兩個紅框里是什麼東西？對於大多數人來講可能是人，但是機器還沒有這個能力去推理出是人。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

4、物體跟蹤。下圖中，物體的重疊非常嚴重，人類有很強的跟蹤能力，但是如果使用當前最好的跟蹤系統，機器也很難做到人類的水平，我們檢測方法並沒有非常好的推理機制應用到裡面。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

5、手眼配合。為什麼很多家庭機器人賣不出去？因為現在的機器人做不好手眼配合，它們不能像人類一樣能做家務、做飯。

6、精度問題。不管是做無人車，還是做自動駕駛，在一定程度上要求的精度是非常高的，甚至只有高過現在的標準，人工智慧技術才能順利推廣下去。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

不過，目前孫劍團隊也正在解決上述問題，並探索出幾個有價值的方向。如在物體識別領域，曠視研究院推出的業界第一個多機(128卡)訓練的MegDet，曾在國際權威圖像識別競賽COCO中奪得世界第一。

劉威：騰訊AI Lab演算法三大能力創新，多媒體AI探索六大應用

騰訊AI Lab計算機視覺負責人劉威則介紹了在演算法當中的創新，一是網路結構的創新，二是損失函數，三是優化技巧。這三塊能力應用到六大實例：

1、OCR刷新世界紀錄。OCR是除了人臉識別之外非常基礎的圖象識別能力，它要求從圖象裡面把出現的所有文字識別出來。在權威的ICDAR上，騰訊AILab在網路圖片識別和聚焦識別上，刷新了世界紀錄，並保持七項任務的冠軍，處於國內外第一。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

2、人臉識別。騰訊AI Lab在MegaFace Challenge中，常規任務和跨年齡任務中都取得了長足的進步。這項技術已經在騰訊各平台使用，初步估計在騰訊的平台上每天的調用量超過6億。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

3、圖像描述生成。圖像首先經過卷積神經網路→提取圖像的全部和局部的特徵表述→進入到一個陣列的LSTM中。騰訊AI Lab提出「多階段的注意力」，論文已經發表在AAAI的會議上。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

4、視頻濾鏡。視頻濾鏡首先保證高層語義信息，再保持時域一致性，最後是高效實時呈現。目前，這一功能應用到影視特效、短視頻拍攝和增強現實等領域。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

5、視頻人體姿態估計。目前國內有很多公司在做，但騰訊算是較早把這項技術產品化的公司。主要過程為：輸入實時的圖像序列，經過基礎模型，再經過提煉（Refinement）、分組，去掉噪音點，最後得到人的主要的骨骼關鍵點。這項技術的難度主要在於一直停留在PC端，騰訊AL Lab 做了很多網路剪枝和壓縮，形成移動端網路模型，並同時在安卓和iOS端推出。

孫劍：計算機視覺存六大困難，很多問題很難用函數逼近解決

6、AR和3D。利用3D視覺演算法估計相機的位置和朝向，並在圖像上插入渲染虛擬物體。目前產品還在研發中，未來將應用於移動應用、遊戲娛樂等場景。

【加入社群】

新智元AI技術+產業社群招募中，歡迎對AI技術+產業落地感興趣的同學，加小助手微信號: aiera2015_1 入群；通過審核後我們將邀請進群，加入社群後務必修改群備註（姓名-公司-職位；專業群審核較嚴，敬請諒解）。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※潘建偉團隊完成首個光量子計算機上拓撲數據分析演算法的驗證演示
※本周六，華為AI邀請你參加新智元×華為Mobile AI公開課

TAG:新智元 |