當前位置:
首頁 > 新聞 > 上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

雷鋒網AI研習社按:計算機視覺是一門研究如何使機器「看」的科學,掌握解決具體計算機視覺任務的方法則會幫助我們解決大規模系統的複雜問題,其應用相當廣泛,最常見的如人臉識別,文字識別等等。這篇文章就來為大家從頭普及一下計算機視覺相關知識,包括計算機視覺的定義、研究方法和應用舉例,還會重點介紹深度學習歷史發展歷史,常見深度學習網路介紹和開發平台,幫助計算機視覺入門者和從業者進行有效的基礎夯實和系統梳理。

近日,在雷鋒網AI研習社舉辦的線上直播課上,來自上海交通大學的盧憲凱博士為大家分享了計算機視覺領域的入門知識。這也是盧博士CV系列課線上直播的第一期,後期會陸續由淺入深,為關注AI研習社的小夥伴持們續產出乾貨,歡迎訂閱盧憲凱博士的免費直播課。

盧憲凱,上海交通大學博士,主要研究方向是目標跟蹤與深度學習。在多個計算機視覺期刊會議上發表多篇學術論文,包括IEEE Transaction on Multimedia、MTA、Neurocomputing、ICASSP。

分享內容


  1. 計算機視覺定義和研究方法

  2. 計算機視覺的應用舉例:圖像分類,人臉識別;車輛檢測,行人檢測;語義分割,實例分割;目標跟蹤,視頻分割;圖像生成,視頻生成

  3. 深度學習歷史回顧

  4. 常見深度學習網路介紹和開發平台

計算機視覺概述和深度學習簡介

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

計算機視覺是指從圖像和視頻中提出數值或符合信息的計算系統。更形象一點講就是說,計算機視覺是讓計算機具備像人類一樣的眼睛,看到圖像,並理解圖像。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

人類的視覺首先是通過眼睛看到一幅圖片,大腦來理解這個圖片。對於計算機來說,就會通過攝像頭或攝像機獲取這張圖片,然後利用計算機演算法來看圖片,讀取信息。

計算機視覺最核心部分就是理解。第一步是提供數據,包括靜態圖片,視頻。第二步是設計演算法,讓計算機像人的大腦一樣理解數據,這個過程需要機器學習和演算法,或者現在比較火的神經網路深度學習的方法。計算機視覺歸根結底就是做一個回歸或者分類的問題。後面講到的大部分關於計算機視覺的任務都可以用回歸或分類的問題對它建模。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

計算機視覺非常重要的應用之一就是圖像分類。李飛飛創建的ImageNet數據集極大推動了計算機視覺的發展,也讓大家更理解了計算機視覺對大家的生活是起著非常重要的作用。

除了圖像識別任務外,還有特定目標的識別,比如車牌識別,人臉識別,還有比較精細的識別,年齡,性別,是否戴眼鏡,表情的識別,判斷一個人是否笑了。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

計算機視覺里的第二個任務——目標檢測。目標檢測是在給定一個圖像,把我感興趣的前景目標檢測出來,並添加類別。目標檢測是頭像識別的進一步發展。目標檢測要知道圖片中有哪些類別,還有知道他們的位置。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

行人檢測和車輛檢測。對人群密集處的檢測,對將來可能發生的異常事件起到預警作用。右邊的車輛檢測,可以統計車輛個數,實時估計車流密度,這樣的話對於疏解城市交通是非常有幫助的。這兩個是做目標檢測中的兩個細化應用。

計算機視覺的第三個任務分割。分割包括兩種,圖像語義分割和個體分割。圖像語義分割是指給你一個張圖片,把圖中的物體分割開來。個體分割比語義分割更難,相當於在檢測任務上加上了分割。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

視覺目標跟蹤,也有很多廣泛應用。如果拓展到多目標跟蹤,可應用在候機大廳或商場裡面,對每個人實時跟蹤,建立每一個人的軌跡,比如某人突然和另一個人有了交互,就可判斷是否在打架。

還可應用在自動駕駛上面,比如前置攝像頭拍到前面的幾輛車,實時跟蹤,並計算出當前車與前車的距離。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

視頻分割,前置攝像頭拍出街景照片,可用於無人駕駛。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

視頻生成,有了當前幀可以預測下一幀,再結合攝像頭得到下一幀的樣子。可以減少計算資源消耗。

深度學習簡介

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

這幾年計算機視覺已經和深度學習變得密不可分。計算機視覺研究已經有很多有趣應用,比如圖像風格遷移。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

生成對抗網路(GAN)的有趣應用,比如可以將女性臉龐逐漸演化為男性臉龐。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

直播換臉的應用

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

深度學習在人臉識別的應用。目前利用深度學習在LFW資料庫訓練人臉識別,錯誤率5%下降到0.5%

後期的課程會詳細介紹這幾個網路VGGNet, GoogLeNet ,ResNet ,DenseNet。

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

常見的深度學習開發平台

上海交大盧憲凱系列公開課:計算機視覺概述和深度學習簡介 | 分享總結

以上是計算機視覺系統課程的第一課,簡單介紹了一下計算機視覺的圖像識別,目標檢測,圖像和視頻分割,目標追蹤,圖像和視頻生成的一些常見應用,接下來盧憲凱博士還會結合深度學習講解實現這些任務需要的演算法,模型以及實戰應用。下一次直播課程是深度卷積網路的原理及模型介紹,以及如何搭建和訓練一個深度學習網路。

雷鋒網提示:如想在第一時間獲取課程直播預告時間,請關注微信公眾號:AI研習社。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

TAG:雷鋒網 |