人臉識別三大經典演算法
特徵臉法(Eigenface)
特徵臉技術是近期發展起來的用於人臉或者一般性剛體識別以及其它涉及到人臉處理的一種方法。使用特徵臉進行人臉識別的方法首先由Sirovich和Kirby(1987)提出(《Low-dimensional procedure forthe characterization of human faces》),並由Matthew Turk和Alex Pentland用於人臉分類(《Eigenfaces for recognition》)。首先把一批人臉圖像轉換成一個特徵向量集,稱為「Eigenfaces」,即「特徵臉」,它們是最初訓練圖像集的基本組件。識別的過程是把一副新的圖像投影到特徵臉子空間,並通過它的投影點在子空間的位置以及投影線的長度來進行判定和識別。
將圖像變換到另一個空間後,同一個類別的圖像會聚到一起,不同類別的圖像會聚力比較遠,在原像素空間中不同類別的圖像在分布上很難用簡單的線或者面切分,變換到另一個空間,就可以很好的把他們分開了。
Eigenfaces選擇的空間變換方法是PCA(主成分分析),利用PCA得到人臉分布的主要成分,具體實現是對訓練集中所有人臉圖像的協方差矩陣進行本徵值分解,得到對應的本徵向量,這些本徵向量就是「特徵臉」。每個特徵向量或者特徵臉相當於捕捉或者描述人臉之間的一種變化或者特性。這就意味著每個人臉都可以表示為這些特徵臉的線性組合。
局部二值模式(Local Binary Patterns,LBP)
局部二值模式(Local binary patterns LBP)是計算機視覺領域裡用於分類的視覺運算元。LBP,一種用來描述圖像紋理特徵的運算元,該運算元由芬蘭奧盧大學的T.Ojala等人在1996年提出(《A comparative study of texturemeasures with classification based on featured distributions》)。2002年,T.Ojala等人在PAMI上又發表了一篇關於LBP的文章(《Multiresolution gray-scale androtation invariant texture classification with local binary patterns》)。這一文章非常清楚的闡述了多解析度、灰度尺度不變和旋轉不變、等價模式的改進的LBP特徵。LBP的核心思想就是:以中心像素的灰度值作為閾值,與他的領域相比較得到相對應的二進位碼來表示局部紋理特徵。
LBP是提取局部特徵作為判別依據的。LBP方法顯著的優點是對光照不敏感,但是依然沒有解決姿態和表情的問題。不過相比於特徵臉方法,LBP的識別率已經有了很大的提升。
Fisherface
線性鑒別分析在降維的同時考慮類別信息,由統計學家Sir R. A.Fisher1936年發明(《The useof multiple measurements in taxonomic problems》)。為了找到一種特徵組合方式,達到最大的類間離散度和最小的類內離散度。這個想法很簡單:在低維表示下,相同的類應該緊緊的聚在一起,而不同的類別盡量距離越遠。1997年,Belhumer成功將Fisher判別準則應用於人臉分類,提出了基於線性判別分析的Fisherface方法(《Eigenfaces vs. fisherfaces:Recognition using class specific linear projection》)。
經典論文
Sirovich,L.,&Kirby,M.(1987).
Low-dimensional procedure for the characterization of human faces.
Josa a,4(3),519-524.
研究證明任何的特殊人臉都可以通過稱為eigenpictures的坐標系統來表示。Eigenpictures是面部集合的平均協方差的本徵函數。
Turk,M.,&Pentland,A.(1991).
Eigenfaces forrecognition.
Journal of cognitive neuroscience,3(1), 71-86.
研究開發了一種近實時的計算機系統,可以定位和追蹤人的頭部,然後通過比較面部特徵和已知個體的特徵來識別該人。該方法將面部識別問題視為二維識別問題。識別的過程是把一副新的圖像投影到特徵臉子空間,該特徵空間捕捉到已知面部圖像之間的顯著變化。重要特徵稱為特徵臉,因為它們是面集的特徵向量。
Ojala,T.,Pietik?inen,M.,&Harwood,D.(1996).
Acomparative study of texture measures with classification based on featureddistributions.
Pattern recognition,29(1),51-59.
研究對不同的圖形紋理進行比較,並提出了用來描述圖像紋理特徵的LBP運算元。
Ojala,T.,Pietikainen,M.,&Maenpaa,T.(2002).
Multiresolutiongray-scale and rotation invariant texture classification with local binarypatterns.
IEEE Transactions on pattern analysis and machineintelligence,24(7),971-987.
研究提出了一種理論上非常簡單而有效的灰度和旋轉不變紋理分類方法,該方法基於局部二值模式和樣本和原型分布的非參數判別。該方法具有灰度變化穩健、計算簡單的特點。
Fisher,R.A.(1936).
The use of multiple measurementsin taxonomic problems.
Annals of eugenics,7(2),179-188.
研究找到一種特徵組合方式,以達到最大的類間離散度和最小的類內離散度。解決方式為:在低維表示下,相同的類應該緊緊的聚在一起,而不同的類別盡量距離越遠。
Belhumeur,P.N.,Hespanha,J.P.,&Kriegman,D.J(1997).
Eigenfacesvs.fisherfaces:Recognition using class specificlinear projection. Yale University New Haven United States.
研究基於Fisher的線性判別進行面部投影,能夠在低維子空間中產生良好分離的類,即使在光照和面部表情的變化較大情況下也是如此。廣泛的實驗結果表明,所提出的「Fisherface」方法的誤差率低於哈佛和耶魯人臉資料庫測試的特徵臉技術。
報告內容速覽
概述篇:基本概念/發展歷程/中國政策支持/發展熱點/相關會議
技術篇:人臉識別流程/人臉識別主要方法/人臉識別三大經典演算法/常用的人臉資料庫
人才篇:學者概況/國外人才簡介/國內人才簡介
應用篇:國內人臉識別領頭企業/應用領域
趨勢篇:機器識別與人工識別相結合/3D人臉識別技術的廣泛應用/基於深度學習的人臉識別技術的廣泛應用/人臉圖像資料庫的實質提升
版權聲明
AMiner屬於清華-青島數據科學研究院科技大數據研究中心。
AMiner諮詢產品版權為AMiner團隊獨家所有,擁有唯一著作權。AMiner諮詢產品是AMiner團隊的研究與統計成果,其性質是供客戶內部參考的商業資料。
AMiner諮詢產品為有償提供給購買該產品的客戶使用,並僅限於該客戶內部使用。未獲得AMiner團隊書面授權,任何人不得以任何方式在任何媒體上(包括互聯網)公開發布、複製,且不得以任何方式將本產品的內容提供給其他單位或個人使用。如引用、刊發,需註明出處為「AMiner.org」,且不得對本報告進行有悖原意的刪節與修改。否則引起的一切法律後果由該客戶自行承擔,同時AMiner團隊亦認為其行為侵犯了AMiner團隊著作權,AMiner團隊有權依法追究其法律責任。
AMiner諮詢產品是基於AMiner團隊及其研究員認為可信的公開資料,但AMiner團隊及其研究員均不保證所使用的公開資料的準確性和完整性,也不承擔任何投資者因使用本產品與服務而產生的任何責任。
行業研究報告是AMiner團隊智能服務體系的重要組成部分。如對有關信息或問題有深入需求的客戶,歡迎使用AMiner團隊專項研究智能服務。
※一文讀懂最大似然估計
※YOCSEF TDS專題探索班——《工業互聯網與邊緣計算》
TAG:數據派THU |