LPIRC,不思議-2018年CVPR行記
LPIRC,不思議--2018年CVPR行記
傅博 (普渡大學二年級PhD) I 文
張懷政 I 技術審稿
多年以後,面對一個機器統治人類的世界,傅博將會想起曾經參與過2018年的CVPR,並且作為工作人員之一參加了LowPower Image Recognition Challenge (LPIRC)。那曾是人類對於移動人工智慧的一次深遠的探索。簡單地講,LPIRC是一項基於嵌入式設備的圖像處理比賽,其比賽形式類似於ImageNet的ImageNetLarge Scale Visual Recognition Challenge (LSVRC),並在此基礎上新增了能耗的因素。隨著深度學習演算法的不斷發展,其在移動端的應用越發地廣泛。谷歌於2017年底推出了TensorFlow在移動設備上的輕量級解決方案TensorflowLite,以方便開發者在移動設備上部署人工智慧。能耗作為一個移動處理的一個重點關注點,居然沒有在LSVRC以及相關的其他challenge中得到體現,現有的challenge也缺少對於移動設備的支持,LPIRC應此誕生。從2015年出生至今,LPIRC已經走過了他前4個年頭。
總體來說,本次的LPIRC分為3個track。track 1 為image classification(圖像分類),track 2和track 3是object detection(基於bounding box的目標檢測)。track 1和track 2是在線競賽,用戶通過比賽網站註冊並且在6月15號以前提交最終的model。track 3是onsite challenge,所有的跑分都在6月14號那天產生,那些帶有metadata的result文件將會永遠記錄下會場中的這個太陽曝晒的上午,和這個太陽曝晒的下午。
Track 1是今年LPIRC新增加的嬰兒,是和谷歌的mobile vision team合作進行image classification。這個track要求參賽者首先用Tensorflow開發detection model,然後利用谷歌的開源轉化工具toco將Tensorflow的model轉換成可以在手機上運行的Tensorflow Lite model (.lite)。用戶只需上交.lite模型,谷歌就會實時在Pixel 2手機上測試這些模型並將測試分數同步在比賽的網站上。谷歌的OVIC(On-Device Visual Intelligence Challenge)評測工具在大賽中粉墨登場。第一場track只進行準確性和運行時間的評測,而暫時放棄對能耗的評測。嗯,好事總是要多磨嘛。
圖 1. LPIRC實況。
Track 2作為LPIRC的傳統競技項目,自然是各路豪傑必爭之地。Track 2今年仍然與杜克大學陳教授的實驗室合作,其主要比賽內容是基於caffe的object detection。參賽者需要在參賽網站上提交基於caffe的model,然後由杜克大學實驗室通過power meter和測試程序進行準確性、時間和能耗的檢測。這個track根據bounding box的位置與標註數據的gound truth進行對比計算出mAP (mean average precision),然後將mAP與能耗一起計算出最後分數。
Track 3與track 2內容基本相同,不過需要現場跑分。參賽者可以攜帶任何設備進行評測跑分。這就意味著參賽者需要賽前對各設備的性能情況有充分的了解和比較。當天一共有7個model上交(5個來自韓國,韓國對CV還是很重視的)。雖然儘可能考慮到了當天可能面臨的各種情況,為了預防網路擁堵,我們甚至自己帶了路由器,但是當天還是出現不少意外情況。大部分是參賽者程序問題造成,例如參賽者的detection結果為負數,classification結果是亂碼等等。來自同一個實驗室的4個韓國哥們兒的4個提交的結果集體崩盤,幸好團結的韓國人花了好幾個小時一起把問題基本上解決,如此緊張刺激的時刻一定會留在他們多年後的那本自傳中。最終,7組數據竟然跑到下午5點才結束。還有一個很有趣的現象,有幾組隊伍都是track 2獲得不錯成績的隊伍繼續追夢track 3。他們告訴我,track 3給了他們更多的自由,用自己喜歡的框架搭建模型,並且用適合自己模型的設備進行測評。
圖 2. Track 3在進行測試中。
這個歐巴最後同時獲得track 2和track 3的第一名。
圖 3. 谷歌頒發track 1的第一名。
今年track 1一共收到來自20多支隊伍的超過100次submission。
作為CVPR的panel之一,當然也少不了邀請來自業界的嘉賓進行報告。本次邀請到Facebook的Fei Sun以及谷歌的Andrew和Bochen(也是我現在實習的host),他們分別對FB和狗家的新型深度學習評測工具以及對未來mobile vision的發展趨勢進行了研究和討論。三位嘉賓參與了隨後的座談會,Andrew大神侃侃而談,「單槍匹馬」應對大家輪番的問題轟炸。我當時就想,嗯美國人是牛。
LPIRC結束了,CVPR也隨之完美謝幕。我們了解,在人工智慧指數發展的今天,那些現在的state-of-the-art也許都會很快成為曾經的historical milestone,但是,我們自己會記得,我們曾經改變過世界。
本文版權歸作者所有。
新加坡南洋理工CAP組
※Train the Trainer:利用強化學習優化基於模型的強化學習演算法
※基於DRL的數據中心任務調度與製冷管理的聯合優化
TAG:南洋理工CAP組 |