深度學習「瓶頸」已至計算機視覺如何突破困局？

科技 02-13

近期，計算機視覺奠基者之一，霍金的弟子，約翰霍普金斯大學教授Alan Yuille提出「深度學習在計算機視覺領域的瓶頸已至。」

從人工智慧的發展過程看，深度學習是繼專家系統之後人工智慧應用的又一重要研究領域，也是人工智慧和神經計算的核心研究課題之一。Alan Yuille認為，現在做AI不提神經網路，成果都很難發表了，這不是一個好勢頭。如果人們只追求神經網路的潮流，拋棄所有老方法，也不去想如何應對深度網路的局限性，那麼這個領域可能很難有更好的發展。

深度學習確實是一個讓人嚮往的技術，這無可辯駁。其實，神經網路這個概念自上個世紀60年代就已經出現了，只是因為最近在大數據、計算機性能上面出現的飛躍，使得它真正變得有用起來，由此也衍生出來一門叫做「深度學習」的專業，當前國內涉及計算機視覺領域中，越來越多的人工智慧公司或者研究機構投身到「深度學習」的浪潮中了，國內誕生了如曠視科技、商湯科技、極鏈科技Video 、依圖科技等優秀的初創AI企業。旨在將複雜的神經網路架構應用在數據建模上，最終帶來前所未有的準確性。

現在的技術開發成果也確實讓人印象深刻。計算機現在可以辨識圖片和視頻里的東西都是什麼，可以將語音轉化成為文字，其效率已經超過了人力範疇。Google也將GoogleTranslate服務中添加了神經網路，現在的機器學習在翻譯水平上已經逐步逼近人工翻譯。現實中的一些應用也讓人大開眼界，就比如說計算機可以預測農田作物產量，其準確性比美國農業部還高。機器還能更加精準的診斷癌症，其準確度也比從醫多年的老醫師還要高。

美國國防部高級研究計劃局的一名負責人John Lauchbury形容如今人工智慧領域內存在著三股浪潮：

第一股浪潮：知識庫，或是類似於IBM所開發的「深藍」和Waston專家系統。

第二股浪潮：數據學習，包括了機器學習和深度學習。

第三股浪潮：情境適應，其中涉及通過利用少量數據，在現實生活中構建出一個可靠的，解釋型的模型。

從這三股浪潮中，可以發現目前深度學習演算法的研究工作進展不錯。

但深度學習的成果是建立在極其苛刻的前提條件之上。

不管是「監督學習」，亦或者是「強化學習」，它們都需要大量的數據進行支撐，而且在提前計划上面表現的非常差，只能做某些最簡單直接的模式辨認工作。

相比之下，人就能夠從極少數的例子上學到有價值的信息，並且善於在時間跨度很長的計劃，在針對某個情境上有能力自己建造一個抽象模型，並利用這樣的模型來做站在最高處的歸納總結。

以自動駕駛汽車為例，如果你是採用的「監督學習路徑」，那麼你需要從汽車駕駛的情境中提取海量的數據，而且還要以明確標示出來的「動作標籤」進行分類挑揀，比如「停止」「行駛」等。再接下來，你還需要訓練一個神經網路，使得它能夠從眼下的情景和所與之相對應的行動之間構建因果聯繫。

如果你是採用的「強化學習路徑」，那麼你應該給演算法一個目標，讓它能夠獨立地判斷當下最優解是什麼，電腦在不同的情境之下，為了實現避免撞車的這個動作，它估計要宕機上幾千次。雖然現在已經有了比較大的進展，一些神經網路可以從數據層面，在相當大的樣本數量上給出一個驚人的成果，但是它們如果單獨拿出一個出來，還是不可靠的，所犯的錯誤也是人一輩子都不可能犯的。

數據質量的不穩定性帶來的是不可靠、不準確，以及不公平。同樣，輸出的結果，還得取決於輸入的數據質量如何。神經網路中如果輸入的數據是不準確的，不完整的，那麼結果也會錯的離譜，有些時候會造成巨大的損失。不要小看這樣的風險，錯誤的輸出可能會造成極大的危害，以GAN為例，有一些不軌之徒可以以一種人類肉眼無法識別的方式篡改圖片，讓機器錯誤的辨識圖片。篡改的圖片和最初的圖片在我們看來可能是一致的，但是無人駕駛汽車中，汽車就會受到威脅。

深度學習依然存在瓶頸，但目前它要發揮的作用所需要的前置條件太過苛刻，輸入數據對其最終的結果有著決定性的影響。如果要真正達到理想中的人工智慧，這些瓶頸還有待於人們的進一步突破。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 驅動網 的精彩文章:

※交通運輸部：春運期間累計發送旅客13.95億人次

TAG:驅動網 |

深度學習「瓶頸」已至 計算機視覺如何突破困局？

深度學習「瓶頸」已至計算機視覺如何突破困局？