當前位置:
首頁 > 新聞 > GMIS 2017 大會吳思演講:視覺信息處理的動態法則

GMIS 2017 大會吳思演講:視覺信息處理的動態法則


全球機器智能峰會(GMIS 2017),是全球人工智慧產業信息服務平台機器之心舉辦的首屆大會,邀請了來自美國、歐洲、加拿大及國內的眾多頂級專家參會演講。本次大會共計 47 位嘉賓、5 個 Session、32 場演講、4 場圓桌論壇、1 場人機大戰,兼顧學界與產業、科技巨頭與創業公司,以專業化、全球化的視角為人工智慧從業者和愛好者奉上一場機器智能盛宴。

GMIS 2017 大會吳思演講:視覺信息處理的動態法則

5 月 27 日,機器之心主辦的為期兩天的全球機器智能峰會(GMIS 2017)在北京 898 創新空間順利開幕。中國科學院自動化研究所複雜系統管理與控制國家重點實驗室主任王飛躍為本次大會做了開幕式致辭,他表示:「我個人的看法是再過幾年,我們 90% 的工作是人工智慧提供的,就像我們今天大部分工作是機器提供的一樣。我們知道人工智慧會給我們提供一個更美好的未來。」大會第一天重要嘉賓「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智慧官鄧力、騰訊 AI Lab 副主任俞棟、英特爾 AIPG 數據科學部主任 Yinyin Liu、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智慧專家參與峰會,並在主題演講、圓桌論壇等互動形式下,從科學家、企業家、技術專家的視角,解讀人工智慧的未來發展。

下午,北師大認知神經科學與學習國家重點實驗室教授吳思發表了主題為《視覺信息處理的動態法則》的演講,他認為,人工智慧應該向生物智能學習動態信息的處理,而要處理動態信息,預測是關鍵。以下是他的演講內容。

機器學習取得的成功,有目共睹。但我今天是給機器學習目前的框架挑錯的。對我們人類來說非常簡單的任務,現在最好的深度學習也做不到。實際上,我們還可以從生物智能中獲取靈感,引導下一步 AI 的發展。

這段時間我在思考,什麼是深度學習,或者說對我們生物智能而言,什麼是我們最需要緊迫解決的問題,我個人認為是動態信息處理。

有一種名為海鞘的古生物,小時候有大腦,它會游來游去尋找食物。但成年以後,它附在礁石上,不僅不活動,還吃掉大腦,不需要大腦了。

這隱含著什麼意思呢?如果我們只做靜態圖片的分類任務,實際上,不需要大腦,我們的大腦更多地是處理複雜的運動環境當中、自然場景中的東西。所以,動態信息處理過程非常重要,這是生物智能與目前以深度學習為框架的人工智慧之間重大的區別,值得大家去關注。

說到動態信息處理,我認為,最關鍵的是預測。由於時間有限,我就談三個生物系統做預測的例子,給大家看看生物智能與目前的人工智慧有什麼樣的區別。

第一,預測補償信息傳遞的延遲。我們能快速地處理運動信息,因為運動信息處理對我們大腦來說,非常簡單。再舉一個簡單的任務,我們看到一個光斑,然後我們就按鍵。整個過程,我們的時間花費是,首先,光信號變成電信號,花費我們 35 毫秒,其次,傳到初級視皮層,我們意識到看到了它,這花費 55-75 毫秒。再次,視覺皮層識別這個物體,然後產生一個指令,通過脊髓控制我們手指的肌肉去按鍵,花費是 250 毫秒。

如果我們的大腦沒有實時預測機制,我們是無法處理生活中的很多事情的。

舉個菲勒打網球的例子,他的發球速度大約是每小時 200 公里,只有信號傳到初級視皮層,才意識到看到網球。如果這花費 50 毫秒的話,就會帶來 3 米誤差。所以我們的大腦必須有一種內在機制,通過實時預測處理運動信息。這只是人類打網球,但對大自然的動物來說,看見獵物能否抓住,看見天敵能否逃跑,就是生與死的關鍵。所以這在我們的神經計算中非常重要。

實驗神經科學家通過大量實驗發現大腦有很好的預測系統,實驗神經科學家經常研究頭朝向的系統。

比如頭現在頭晃來晃去,實際上我內在有一組神經元,這個神經元就建立我內在的關於頭朝向的表象。實驗神經科學家發現,大腦很多腦區都存在這樣頭朝向的神經元,非常有意思的是,這個頭朝向的神經元,它的內在表象是指向了未來。比如,有一個腦區是指向 25 毫秒之後的地方。

我的研究方向是計算神經科學,因此構建了一個網路模型來解釋這種現象,我們發現,如果我們構建一個神經網路,再考慮神經元之間的負反饋的話,就容易產生這樣一種 direction 的現象,可以很好地解釋實驗數據。

我們知道,生物學中非常重要的學說是達爾文的《進化論》。你或許會問,經過長久的進化,我們的信號傳得還這麼慢,為什麼不能傳得快一點?實際上,傳遞得慢對生物是有正面意義的,比如它可以幫我們整合多模態的信息,大家知道恆大隊的孔卡,他踢球速度不快,但我覺得他很聰明,因為他充分利用場上的形勢,做出很優化的選擇、判斷如何傳球,所以,慢是有道理的。

實際上,生物進化,一方面每種動物會根據它自然生存的環境以及最適合生存的環境,適應到用特別的時間窗口處理信息。另一方面,如果物體高速運動,它又有補償信息,那麼它會補償這個時間延遲。

我有一個樸素的願望,我們是生物進化的結果,我們的大腦進化成如今的樣子,是為了更好地適應環境。假設機器人,在日常環境中跟我們交流,一方面它需要慢,另一方面如果快速處理的話,又需要快。因此這兩樣要共同發展。個人認為,未來的機器人也會面臨這樣的問題。

第二個有關預測的例子,是我們圖像理解的關鍵。我給大家做一個實驗。如果你過去沒有看過這張圖,你很難猜測它的樣子。我先把這張圖片遮擋起來,你可以說它是牛,我也可以說這裡面是手,可以說它是魚。這表明,計算機視覺在我們生物大腦,面臨一個問題,那就是我們做圖象理解的時候,有兩個操作。一個是圖象分割,一個是圖象識別。比如說,我把它分割成牛,那麼,就識別成牛。分割成手或魚,就識別成手或魚。這就是雞生蛋和蛋生雞的問題,我沒有分割我怎麼識別,我沒有識別我怎麼分割。這也是計算機視覺在圖象世界始終解決不了問題。

那麼,人腦是如何做的呢?雖然不知道具體的機制,但大概的策略我們能明白,人腦的做法是猜測與印證,初級視皮層對輸入不斷地解析,然後傳到高級視皮層,高級視皮層做猜測,猜測反傳到初級視皮層,反覆猜測與印證,最終進行識別。大量的實驗表明,深度學習不具備這樣的策略。

這只是一個框架,裡面涉及很多細節,比如,如何猜測涉及記憶系統,如何表達物體的知識,知道知識後,如何去處理,很多計算神經科學家在攻克這樣的問題。

第三個預測的例子,有關主動視覺。人的眼睛在每秒鐘都會眨動三四次(這叫快速眼動),而眼睛會跳動著關注某些重要的地方,比如鼻子和嘴巴。我們選擇性地看自然場景中對我們重要的信息。實際上,這是人類高級智能的表現,只有高等動物才有。

這涉及一個問題,物體沒動,只是眼睛動,那麼造成的結果,就是外界靜止的物體在視網膜上來回亂跳,我們平時沒有意識到這點,說明我們的大腦在區分由於眼動導致的物體跳動,而不是物體真正的運動。

我們和實驗神經科學家合作,給猴子做這樣的實驗,記錄神經元的感受葉,就是大腦的編碼。簡單理解,就是每個神經元負責一個空間區域。快速眼動,將要動,動了之後的那點時間,會把這個神經元的感受葉,神經元負責編碼的區域,原來將要達到的位置,像香蕉一樣拉長覆蓋整個區域,因此,你眼動但不會覺得物體在動。這是發生在具體的眼動之前,所以也是預測。

最後,我總結一下,動態信息的處理,是生物智能的關鍵,要實現動態信息的處理,預測是關鍵。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

GMIS2017Schmidhuber演講:人工智慧改變一切
GMIS 2017大會鄧力演講:無監督學習的最新進展
GMIS 2017 馬維英演講:信息流的未來與人工智慧的機會
GMIS 2017 YinyinLiu:演變的AI與模型俱進
GMIS 2017 Wesly Mukai:智能運輸的未來

TAG:機器之心 |

您可能感興趣

ICLR 2018|論文:視覺模仿系統GSP,僅觀察演示就學會執行任務
三星推出Exynos 9610新處理器:提升AI視覺處理和480幀高速視頻
何愷明CVPR演講:深入理解ResNet和視覺識別的表示學習(41 PPT)
NIPS 2018 | MIT等提出NS-VQA:結合深度學習與符號推理的視覺問答
CVPR 2018 中國論文分享會之「視覺與語言」
中國最需要的國產IC推介——VC0718P:集成國標SVAC2.0編碼與NPU(神經網路處理器)的機器視覺SOC
可愛聖誕裝!Anime JAM2018主視覺圖公開
「GOT7」「新聞」190411 王嘉爾新歌《Oxygen》MV預告公開 強烈的視覺效果+耳蝸享受
三星發布了Eynos 9610處理器,支持視覺深度處理、480fps回放
雲天勵飛李愛軍:視覺AI晶元正在賦能5AIoT整個網路的端、邊、雲 | CCF-GAIR 2019
CVPR 2018最佳論文作者親筆解讀:研究視覺任務間關聯的Taskonomy
HCP Lab 12篇論文入選世界頂級計算機視覺會議 CVPR 2019
CVPR 2018最佳論文作者親筆解讀:研究視覺任務關聯性的Taskonomy
ROCK YOU!AnimeJapan2019視覺圖公布
NIPS 2018|Spotlight論文:憑藉幻想的目標進行視覺強化學習
GDC 2019:唯美少女之詩 最佳視覺效果大獎《Gris》
AI「去偽存真」期,你必須關注的「智慧城市·視覺智能」專場丨CCF-GAIR 2019
一文看懂英特爾 2018 視覺解決方案及策略,OpenVINO 是關鍵
《B-PROJECT》第1彈單獨演唱會主視覺圖公開
「GOT7」「新聞」190629 GOT7朴珍榮,日常也像畫報一樣的優越視覺