掌紋識別近十年進展綜述
AI綜述專欄簡介
在科學研究中,從方法論上來講,都應先見森林,再見樹木。當前,人工智慧科技迅猛發展,萬木爭榮,更應系統梳理脈絡。為此,我們特別精選國內外優秀的綜述論文,開闢「綜述」專欄,敬請關注。
導讀
本期文章來源於中國自動化學會模式識別與機器智能專業委員會(CAA-PRMI)通訊。CAA-PRMI成立於 1979 年,是國內模式識別和人工智慧領域最早成立的專業委員會。自成立開始,專委會在普及、推動國內模式識別領域的研究和學科發展上發揮了巨大的作用。在以譚鐵牛院士為首的中國學者的努力下, ICPR 2018(國際模式識別聯合會議)即將於2018年8月20-24日北京召開,組織工作正在有序進行。從研究水平和影響以及在國際組織的話語權來看,中國模式識別學術界的國際影響力與30年前相比已大不相同了。早在 2012 年 ICPR(可能更早),中國學者投稿和發表的論文數就已在所有國家中位列第一。
本文作者鍾德星是CCF計算機視覺專委會委員,西安交通大學電子與信息工程學院副教授, 美國伊利諾伊大學厄巴納-香檳分校的訪問學者,2005年和2010年在西安交通大學分別獲得學士和博士學位,主要研究方向是生物識別和計算機視覺。作者杜學峰是西安交通大學電子信息工程學院本科生,信息新蕾計劃(ITP)參與學生。本文主要綜述掌紋識別近十年的研究進展,並對未來的掌紋識別研究提出了展望和建議。
一.引言
作為生物特徵識別的研究課題之一,掌紋識別已經有二十多年的歷史。由於其擁有較高的識別準確度和實際應用的便捷性,過去十年中出現了許多掌紋識別的研究新成果。經典的掌紋識別過程主要包括五個部分:掌紋圖像採集、資料庫、 預處理、特徵提取和匹配,如圖 1 所示。
圖 1 掌紋識別系統框圖採集裝置可得到不同的掌紋圖像。
採集裝置可得到不同的掌紋圖像。感興趣區域(ROI)是預處理階段的核心,通常使用的是參考坐標系方法[1],如圖2所示。對於特徵提取, 常見的有基於子空間、基於學習、基於主線和基於編碼等方法,每種方法都從全局或局部範圍中提取特徵。而匹配是基於某個預定的匹配器將測試樣本與資料庫中的樣本進行匹配。
圖 2 經典的預處理步驟:(a)原始圖像,(b)二值 圖像,(c)邊界跟蹤,(d)建立坐標系統,(e)提 取中心部分和(f)ROI樣本[1]
2009 年,Kong等人完成了一篇綜述[2],描述獲取設備、預處理、驗證演算法、掌紋相關融合以及隱私保護的識別措施。最近,一些新的識別方法出現了,本文主要綜述掌紋識別近十年的研究進展,包括數據採集、預處理、特徵提取、匹配和融合等。 除了揭示最新的演算法之外,我們還對未來的掌紋識別研究提出了展望和建議。
二、圖像獲取與預處理
2.1 圖像採集
採集過程一般在特定的實驗室環境中進行。 由於現實環境多變,理想條件下提出的演算法不能很好的適合掌紋識別的實際應用。因此,建立有針對性的資料庫以模擬不同的環境並測試後續識別演算法尤為重要。
近十年來,很多新的資料庫已經建立[3]。除 了一些傳統的採集方式,即基於 CCD 掃描儀、數碼相機、攝像機外,許多資料庫都採用新設備來捕獲不同類型的圖像。例如,Aykut 等人[4]使用CCD 攝像頭,直流自動光圈鏡頭和均勻的 LED 光源完成在線手掌圖像採集,如圖 3 所示。2D 掌紋數據是使用最廣泛的數據,因為它易於訪問和處 理。同時,也有包含其他信息的資料庫,如3D圖像,多光譜和掌紋細節。
圖3圖片獲取系統的外觀. [4]
2.2 預處理
除了圖像增強、濾波等步驟,提取 ROI 的演算法是預處理階段的關鍵步驟。近十年來,距離是ROI 提取中最重要的指標。即保持ROI邊緣與谷點連線之間有固定像素距離。然而,由於掌紋圖像的大小多變,如果僅使用該方法,ROI 區域將不會被精確提取,識別的結果不佳。因此,研究人員提出了比率和角度法。前者使 ROI 的大小占掌紋圖像中的固定比例,後者使 ROI 邊界點和谷點連接線與谷點連線之間具有恆定角度。實驗結果顯示,45°或 60°最適合精確特徵提取[5]。由於圖像中出現重疊,不同的谷點數量將導致 ROI 提取結果不同。大多數文章使用 2~6 個谷點數,也有一些使用 12 和 15 谷點,平均使用谷點數為 5。
三、特徵提取與匹配
3.1 特徵提取
特徵提取的目的是為了最大限度地區分不同類的掌紋。近十年,特徵類型越來越多,特徵表徵的方法也更加有效。
最近十年主要特徵對象是紋理、方向、細節和頻率等。而許多新特徵也相繼出現了,如Laplacialpalm、LRV(Local relative variance)、GMP(Gabor magnitude and phase)信息、Blur不變相、能量信息等。多特徵融合也是特徵提取的趨勢,使得特徵之間可以互補。
現有的特徵表徵的方式可以分為三種類型: 編碼、圖片和學習。圖片方法直接使用圖像信息, 我們又將其劃分為三個子類,即基於結構、統計和子空間的演算法。
(1)基於編碼的演算法
編碼將圖像轉換成數字信息,可以減少空間複雜度。常用的編碼方法首先使用預定義的濾波器對圖像濾波,然後根據特定原理編碼,並使用位編碼存儲。之後,使用二進位運算獲得相似度。 為了研究 Gabor 濾波器的數量和方向的影響,一種改進的模糊C均值聚類演算法被提出來確定每個Gabor 濾波器的方向。 Kim 等人[6]設計了一種使用主線和傾斜方向的新型混合方法,以減少照明條件對位置信息的影響。該方法可以處理非手掌線周圍的像素,從而優化了魯棒線方向編碼(RLOC) 和二進位方向共生矢量(BOCV)這兩個演算法。
(2)基於結構的方法
基於結構的方法關鍵在於利用邊緣檢測演算法提取脊線、主線或特徵點的方位信息。Huang 等人[7]基於方向和頻率提出了一種新的脊特徵提取方法,使用了一組 Gabor 濾波器來捕獲局部和全局細節,將脊線表示為不同的點集。相應的等錯誤率(EER)低至 1.5%。Li 等人[8]首先減少圖像中的噪點,然後基於多樣性和對比度來檢測手掌線,接著改進了Hilditch演算法並應用邊緣跟蹤方法來消除分支,最後獲得單像素主掌紋圖像。
(3)基於統計的方法
這類方法使用圖像的統計概念,即方差、平均值、不變矩等。目前有兩個研究方向,一個基於變換,另一個是非變換法。經典變換由小波變換, 傅里葉變換組成,可以完美地表示掌紋圖像在頻域的多尺度信息,但是該法是局部的。近十年,離散曲波變換、Riesz 變換、力場變換和數字剪切變換已經被引入。在變換後,統計指標被轉換為對應的向量。科研人員還改進了局部二值模式直方圖(LBPH),並將其與雙樹複數小波變換(DT- CWT)相結合,提出一種基於 DT-CWT 的 LBPWH 方 法。無變換統計方法一般來自 Zernike 矩的研究。Gayathri 等人[10]設計了一個使用高階Zernike矩的魯棒識別系統。 該方法不受旋轉影響,並且擁有正交性和旋轉不變特性。
(4)子空間方法
子空間方法將圖像視為高維矩陣或矢量,並通過投影或數學變換將其轉換為低維矢量。通常, 需要建立不同類型的掌紋訓練集,並且選擇最優投影方式來表示特徵。
為了消除過度擬合,Bai 等人[11]結合了分塊表面類型(ST-Surface Type)特徵和 PCA 進行 3D掌紋識別,並採用分塊 ST 的直方圖作為掌紋特徵,降低了計算複雜度。此外,PCA還與其他方法 (如矩不變性)融合,以獲得高識別率。對於線性判別分析(LDA),基於圖像的 LDA 被提出來完成多光譜融合。研究人員還將後處理方法擴展到掌紋識別,並使用兩個資料庫來評估後處理的 LDA方法,取得了很好的效果。文獻[12]中提出一種基 於獨立成分分析(ICA)的掌紋識別演算法,滿足了高維計算需求。關於局部保持投影(LPP),Pan 等 人[13]基於Gabor特徵(I2DLPPG)改進2DLPP。最後,基於核的方法將圖像表示為更高維的特徵空 間。除 KPCA、KLPP、KFD、KDA 外,文獻[14]提出 了基於核映射的稀疏表示(KSR)演算法,稀疏編碼效率提高,同時也降低了量化誤差。
(5)機器學習和深度學習方法
傳統的機器學習可以分為兩類,監督學習如卷積神經網路和非監督學習如深度置信網路。學習系統中的三個關鍵點是激活函數、損失函數和優化策略。在最近幾年中,由於對人工神經網路的深入理解,Zhao 等人[15]提出了掌紋識別深度學習的概述。Liu 等人[16]使用 CNN 進行非接觸式識別。除此之外,研究人員還基於 CNN 提出了一種新的預處理措施。深度學習的平均準確度遠高於傳統方法,甚至達到 100%。因此,這是一個有前景的研究方向。
3.2 匹配
匹配的目的是找出測試掌紋圖像屬於哪一類。 本文主要討論匹配器。對於不同的圖像資料庫, 計算出的不同距離會導致同一人掌紋的不同分類結果。許多傳統距離仍然適用,如歐幾里德距離、 漢明距離和卡方距離。一些新的距離,如角距離、CW-SSIM(復小波-結構相似性)距離、峰-旁瓣比 (PSR)和餘弦馬氏距離被充分研究。多距離融合也是一個新現象。它通常使用多個匹配器的加權之和來計算差異。
四、融合
融合規則包括最小值、最大值、總和、平均值、SVM 和神經網路等。與掌紋相關的融合包括對象融合以及提取和匹配方法的融合。前者可分為很多類,例如不同生物特徵信息,不同圖像類型。 另外,融合級別也可不同,例如像素級[17]、特徵 級[18],分數[19]和決策層[20]。
五、進一步研究的建議
首先是面嚮應用的問題。圖像的旋轉、平移、 模糊、失真和異構數據阻礙了掌紋識別的實際應用。需要在非接觸方式採集圖像時設計更加合適的演算法。隨著互聯網的發展,應該重視在線掌紋識別及其在手機中的使用,這將成為網上支付或個人認證中的一種新的識別方法。
第二個方向是深度學習。一般來說,深度學習需要的訓練樣本太多,泛化能力也不強。最近,George 等人[21]提出了一種稱為遞歸皮層網路的概率生成模型來進行基於消息傳遞的推理。該方法統一了識別,分割和推理,展示出色的通用性和推理能力,實驗結果甚至優於CNN,計算效率高出 300 倍。因此,這是一個值得關注點。
第三是融合。它可以用於數據採集、預處理、 特徵提取和匹配,提高識別性能,但當前的融合應用對象未超過三個,應考慮更多的對象,而同時平衡總時間消耗。此外,在融合中忽略的大量信息導致了識別率有限,進一步的研究應考慮融合的魯棒性,以減少約束條件對識別系統的影響。
掌紋識別的另一個關鍵方向是活體檢測。儘管掌紋不會丟失,但偽造和複製問題仍然會對識別系統產生不利影響。活體檢測作為檢測人體生命體征的方法可以防止這種破壞,最近的研究如多光譜識別可能是一個良好的解決方案。
(相關參考文獻請參閱PDF)
※李航:深度學習與自然語言處理—優勢和挑戰「全文翻譯」
※張宇 楊強:多任務學習概述「全文翻譯」
TAG:人工智慧前沿講習班 |