西交出身，辛書冕獲CVPR 2019最佳論文，李飛飛團隊獲經典論文獎

科技 06-20

作者 | 夕顏

出品 | AI科技大本營（ID:rgznai100）

6 月 18 日上午，CVPR 2019 會議開幕式暨頒獎儀式在美國洛杉磯舉行，經過 CVPR 2019 專門的最佳論文獎評選委員會（Best Paper Award Committee）評審，評委們從50 篇最佳論文候選名單中評選出 4 篇獲獎論文，分別是 2 篇最佳論文榮譽提名、1 篇最佳學生論文和 1 篇最佳論文。

結果顯示，華人幾乎包攬了最佳論文、最佳學生論文和最具影響力論文獎，分別由來自CMU的辛書冕等人、加州大學聖巴巴拉分校的王鑫等人和李飛飛團隊等人摘得！

華人包攬三大獎項第一作者

此次 CVPR 獲獎論文中有三大獎項的第一作者均有華人在列，包括最佳論文、最佳學生論文和最具影響力論文獎，辛書冕、王鑫、李飛飛等眾多華人的名字出現在獲獎者名單中讓人欣喜又印象深刻。

▌最佳論文：非視線內的物體形狀重建

題目：A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction

非視線形狀重建的費馬路徑理論

作者：辛書冕, Sotiris Nousias, Kiriakos N. Kutulakos, Aswin C. Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas

我們在這篇論文的第一作者辛書冕的個人主頁上發現，原來這是一位卡內基梅隆大學機器人研究所的二年級的博士生，研究興趣主要在於計算機視覺和計算攝影領域，師從 Srinivasa Narasimhan 和 Ioannis Gkioulekas 教授。2016年12月，辛書冕在CMU獲得電氣和計算機工程碩士學位，在去美國之前獲得了西安交通大學電氣工程學士學位。

作者機構：卡內基梅隆大學、多倫多大學、倫敦大學學院

論文地址：

https://www.ri.cmu.edu/publications/a-theory-of-fermat-paths-for-non-line-of-sight-shape-reconstruction/

摘要：

我們提出了一個新的理論，即在一個已知的可見場景和一個不在瞬態相機視線範圍內的未知物體之間的費馬路徑（fermat path）。這些光路或者遵守鏡面反射，或者被物體的邊界反射，從而編碼隱藏物體的形狀。

（註：費馬原理（Fermat"s principle）最早由法國科學家皮埃爾·德·費馬在1662年提出：光傳播的路徑是光程取極值的路徑。這個極值可能是最大值、最小值，甚至是函數的拐點。最初提出時，又名「最短時間原理」：光線傳播的路徑是需時最少的路徑。）

我們證明費馬路徑對應於瞬態測量中的不連續性。基於此，我們推導出一種新的約束，它將這些不連續處的路徑長度的空間導數與表面法線相關聯。

基於這一理論，我們提出了一種名為Fermat Flow的演算法來估計非視距物體的形狀。我們的方法第一次實現複雜對象的精確形狀恢復，範圍從隱藏在拐角處以及隱藏在漫射器後面的漫反射到鏡面反射。

最後，我們的方法與用於瞬態成像的特定技術無關。因此，我們展示了使用SPAD和超快激光從皮秒級瞬態恢復的毫米級形狀，以及使用干涉測量法從飛秒級瞬態微米級重建。我們相信，這項工作是非視距成像技術的重大進步。

獲獎理由：這篇論文作出重大進步的問題是非視線內的物體形狀重建，換句話說就是能看到牆角後面的東西。這篇論文的理論部分非常優美，而且同樣非常給人帶來激勵。它把計算機視覺所能解決的問題的邊界繼續向前推進了一步。

▌最佳學生論文：有效地提高強化學習的表現

這篇論文是 UC Santa Barbara 大學（加州大學聖巴巴拉分校）與微軟研究院、Duke 大學合作完成，第一作者系 UC Santa Barbara 大學的王鑫。

據 UC Santa Barbara 計算機科學系助理教授王威廉在其個人微博上發表的喜訊，這篇論文的一作是其組內的成員，獲得了 3 個 Strong Accept，在 5165 篇投稿文章中審稿得分排名第一，並且這篇論文已經確定將在 6 月的 CVPR 會議上進行報告。

這篇論文解決的任務 vision-language navigation（VLN），針對跨模態的基標對準（cross-modal grounding）、不適定反饋（ill-posed feedback）這兩個難點，論文提出了一種全新的強化型跨模態匹配（RCM）方法，用強化學習方法將局部和全局的場景聯繫起來，針對第三個難點泛化能力問題提出了一種自監督模仿學習（Self-supervised Imitation Learning, SIL），其目的是讓智能體能夠自主的探索未知的環境。

題目：Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

面向語言視覺導航（VLN）的強化交叉模型匹配和半監督模仿學習

作者：王鑫，Qiuyuan Huang，AsliCelikyilmaz，Jianfeng Gao，Dinghan Shen，Yuan-Fang Wang，王威廉，Lei Zhang

作者機構：王鑫，Yuan-FangWang，William Yang Wang 加州大學聖芭芭拉分校

Qiuyuan Huang，Asli Celikyilmaz，Jianfeng Gao，Lei Zhang 微軟研究院

Dinghan Shen 杜克大學

摘要：

視覺語言導航（VLN）是對真實智能體在真實 3D 環境內執行自然語言指令的任務。本文研究了如何解決這項任務的三個關鍵挑戰：跨模態基礎、不適定反饋和泛化問題。

首先，我們提出了一種基於強化學習的新的強化交叉模型匹配（RCM）方法。我們將匹配的批評內容作為內在獎勵，以促進指令和智能體運動軌跡之間的全局性匹配，並利用推理導航器在本地視覺場景中執行跨模態 grounding。對 VLN 基準數據集的評估表明，我們的 RCM 模型在 SPL 上顯著優於以前的方法，性能提升 10％，並達到了最先進的性能。

為了提高學習政策的可泛化性，文章進一步引入了自我監督模仿學習（SIL）方法，通過模仿自己過去的高質量決策來探索未見過的環境。結果表明，SIL 方法可以近似地獲得更好、更有效的策略，極大地降低了已見過和未見過的環境之間的成功率上的性能差距（由 30.7％降低至 11.7％）。

亮點：據加州大學聖芭芭拉分校計算機科學系助理教授William Yang Wang在微博的介紹，這篇文章的亮點在於該論文提出的自監督獎勵函數很大程度上影響了有效獎勵的密度，從而有效地提高了強化學習的表現。另外，自監督模仿學習也能很好地提高視覺語言導航系統的泛化能力。

▌經典論文獎：李飛飛團隊計算機視覺奠基之作——ImageNet

Longuet-Higgins 獎是 IEEE 計算機協會模式分析與機器智能（PAMI）技術委員會在每年的 CVPR 頒發的「計算機視覺基礎貢獻獎」，表彰十年前對計算機視覺研究產生了重大影響的 CVPR 論文。該獎項以理論化學家和認知科學家 H. Christopher Longuet-Higgins 命名。

今年的 Longuet-Higgins 獎由 Jia Deng、Wei Dong、Richard Socher、李佳、Kai Li 和李飛飛於 2009 年發表在 CVPR 大會的論文《ImageNet: A Large-Scale Hierarchical Image Database》摘得。

ImageNet 在計算機視覺領域大名鼎鼎，推動了計算機視覺領域的賽事 ImageNet 挑戰賽成為領域標杆，可謂促進了計算機視覺領域的突破性進展。這篇論文發表於 2009 年 CVPR，目前引用量高達 11508 次，獲獎實至名歸。

▌最佳論文榮譽提名

此次獲得榮譽論文提名的有兩篇，分別是：

1. A Style-Based Generator Architecture for Generative Adversarial Networks

作者：Tero Karras、Samuli Laine、Timo Aila，來自英偉達

論文鏈接：https://arxiv.org/abs/1812.04948

2. Learning the Depths of Moving People by Watching Frozen People

作者：Zhengqi Li、Tali Dekel、Forrester Cole、Richard Tucker、Ce Liu、Bill Freeman、Noah Snavely，來自Google Research

論文鏈接：https://arxiv.org/abs/1904.11111

▌計算機先驅獎

最後，大會還頒發了計算機先驅獎（Computer Pioneer Award），獲獎的是加州大學伯克利分校電氣工程和計算機科學專業、生物工程專業教授 Jitendra Malik。他的主要研究領域是計算機視覺，特別是在人類視覺、計算機圖形學和生物圖像分析方面有很多突出成果，一些知名的理論和演算法就出自 Malik 教授和他領導團隊的研究，包括各向異性擴散（anisotropic diffusion）、歸一化分割（normalzied cut）、高動態範圍成像（high dynamic range imaging）等。

計算機先驅獎於 1981 年由 IEEE 計算機協會設立，用於表彰至少在十五年以前對計算機領域發展做出突出貢獻的個人。

▌萬人參加，中國影響力顯露

據官方統計，註冊的參會者數量也是達到了空前的 9227 人，來自全球世界各地。其中來自美國的參會者仍然最多，達 4743 人，有 1044 人來自中國大陸。

據程序主席之一的 UIUC 教授 Derek Hoiem 介紹道，CVPR 2019共收到了 5165 篇有效提交論文，比去年 CVPR 2018 增加了 56%，增速提高了 26%。有趣的是，這些提交的論文大多數來自亞洲，且有39%的論文來自中國。

據官網統計，今年CVPR一共收到創紀錄的5165篇有效投稿，比去年的3309篇多出近2000篇。在 5165 篇投稿中，共有 1294 篇被接收，接收論文數量也首次超過了一千篇，接收率達到了接近 25.5%。

值得一提的是，今年的 CVPR 特意設立了 Ethic Chair 倫理主席和監察員，旨在維護並改善會議期間的氣氛、減少歧視以及其它各種不良行為的發生。但是由於白宮的政策，許多希望參會的學者被拒簽，註冊申請也未獲通過，CVPR 2019 組委會也為此專門發送了郵件表明學術自由的立場，並表示明年將考慮換一家不受影響的供應商。

作為計算機視覺的頂級會議，CVPR 2019 盛況依然，中國學者斬獲頗豐也代表了中國學術影響力的不斷提高，計算機視覺還是研究的一大熱門領域，但同時我們也注意到，CVPR 2019 的論文接收率仍比去年的 29% 有所下降，可以看出，近年來人工智慧頂級會議的錄取困難程度在不斷提升。期待來年中國學者在頂級賽事上繼續高歌前進！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

※GitHub五萬星登頂，程序員命令行最全技巧寶典！
※推薦系統遇上深度學習，9篇阿里推薦論文匯總！

TAG:AI科技大本營 |