WIDER FACE評測結果出爐:滴滴人臉檢測DFS演算法獲世界第一
近日,世界最權威的人臉檢測公開評測集WIDER FACE公布最新評測結果,滴滴AI Labs團隊聯合北京郵電大學PRIS團隊提出的人臉檢測DFS演算法,在WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結果中, 超過了國內外眾多科技公司和高校院所,取得了五項第一、一項第二的好成績,充分彰顯了滴滴在人臉檢測領域的創新能力。
WIDER FACE是目前業界公開的數據規模最大、檢測難度最高的人臉檢測數據集之一,由香港中文大學於2016年建立,共包含32,203張圖像和393,703個人臉標註。其中40%的數據為訓練集(Training),10%的數據為驗證集(Validation),50%的數據為測試集(Testing)。每個集合中的數據根據人臉檢測的難易程度分為「Easy」、「Medium」、「Hard」。
由於彙集了人臉尺寸大小變化、拍照角度引起的人臉姿態變化、不同程度的人臉遮擋、表情變化、光照強弱差異以及化妝等多種影響因素,該數據集在全球人臉檢測領域極具挑戰性,每次評測均會吸引多家國內外科技巨頭及高校院所(包含卡耐基梅隆大學、加州大學聖地亞哥分校、北航、浙大、京東、騰訊優圖、百度、華為雲、IBM沃森研究院等)在這個數據集上驗證了自己的演算法效果。
最新評測結果顯示, AI Labs團隊提出的DFS演算法在WIDER FACE人臉檢測平台中,在官方驗證集和測試集的六項評估結果中取得五項第一、一項第二。其中在「Easy」、「Medium」和「Hard」三個測試子集中,DFS演算法性能分別達到96.3% AP,95.4% AP,90.7% AP。
圖1. 驗證集性能曲線圖
圖2.測試集性能曲線圖
*圖文來源:http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html
DFS演算法以卷積神經網路中的特徵融合為切入點,為了防止高層特徵圖上的語義信息覆蓋低層特徵圖上的細節信息,提出了特徵融合金字塔(Feature Fusion Pyramid)結構,其以空間和通道注意力機制的方式融合高低層特徵,在不失細節信息的同時將語義信息作為上下文線索(contextual cues)增強低層特徵;另外,DFS演算法提出了一種輔助訓練單階段檢測器的語義分割分支(Semantic Segmentation branch),促使檢測網路以一種自監督的方式實現注意力機制以及學到更好的特徵。具體地說,DFS演算法獨特的語義分割分支分層地利用更強的語義分割監督信息監督訓練網路,使得用於預測人臉的各級特徵圖專註於各自最適宜檢測到的不同尺寸的人臉。
圖3.DFS演算法網路框架圖
目前人臉檢測和識別技術已經在滴滴平台廣泛使用,用於司機人不符檢測、行程中車內錄像時的乘客隱私保護等場景,並已形成成熟的技術解決方案,幫助外部合作夥伴進一步提高效率。
實際上,滴滴已經多次在圖像視頻領域相關競賽或評測中獲得世界級第一。在去年7月的CVPR 2018 WAD自動駕駛挑戰賽中,攬獲了二、三、四名的好成績;而在去年9月ECCV2018 COCO&Mapillary挑戰賽中,滴滴技術團隊首次參賽即獲得Mapillary街景檢測單項世界第一。
此次人臉檢測技術再破世界紀錄,也充分體現了滴滴在計算機視覺領域強大技術實力,滴滴將持續進行更多探索,不斷優化出行交通感知理解、智能交互等技術,用先進的AI技術提升用戶體驗、助力行業轉型升級,進而構建智能出行新生態。
引用:
[1]WIDER FACE:http://shuoyang1213.me/WIDERFACE/
[2]DFS演算法:Learning Better Features for Face Detection with Feature Fusion and Segmentation Supervision https://arxiv.org/abs/1811.08557#
※鏡面炫彩美背!榮耀暢玩8C幻影藍上手
※明天見 魅族16s新機前瞻:除了無劉海設計還有這些亮點
TAG:快科技 |