優必選悉尼AI研究院AAAI 2018頂會論文一覽
AI 科技評論按:第 32 屆人工智慧頂級會議 AAAI 2018 在美國新奧爾良召開。在今年的 AAAI 上,優必選悉尼 AI 研究院共有 5 篇論文入選,其中 3 篇 oral,2 篇 poster。
在 AI 科技評論推出的資料庫項目「AI 影響因子」中,優必選悉尼 AI 研究院已經憑藉 4 篇 CVPR 錄用論文上榜「AI 影響因子論文類目活躍企業」。優必選悉尼 AI 研究院也即將在五月份於 AI 慕課學院上做論文解讀的直播分享,敬請期待。
論文 1:Domain Generalization via Conditional Invariant Representation
為了將從源域的數據里學習到的模型泛化到將來的某個目標域,我們的方法希望學習到域不變的特徵。以前的域自適應方法都是通過匹配特徵的邊緣分布 P(X) 來學習域不變特徵,但是這種方法假設 P(Y|X) 在不同的域穩定不變,現實情況很難保證。我們提出通過匹配條件概率 P(X|Y) 並同時衡量 P(Y) 的變化來保證不同域之間的聯合分布 P(X,Y) 相同。條件域不變特徵通過兩個損失函數進行學習,一個衡量以類為條件的分布差異,一個衡量以類別歸一化的邊緣概率分布的差異,從而達到匹配聯合分布的效果。如果目標域的 P(Y) 變化不大,那麼我們可以保證得到很好的匹配目標域的特徵。
論文 2:Adversarial Learning of Portable Student Networks
學習具有較少參數的深度神經網路的方法是迫切需要的,因為重型神經網路的龐大的存儲和計算需求在很大程度上阻止了它們在移動設備上的廣泛使用。與直接去除權值或卷積核以獲得比較大的壓縮比和加速比的演算法相比,使用教師網路-學生網路學習框架的模式來訓練輕型網路是一種更靈活的方法。然而,在實際應用中,我們很難確定利用哪一種度量方式來從教師網路中選擇有用的信息。為了克服這一挑戰,我們提出利用生成對抗網路來學習輕型的學生神經網路,具體地,生成器網路就是一個具有非常少權值參數的學生神經網路,判別器網路被當作一個助教,用來區分學生神經網路和教師神經網路所生成的特徵。通過同時地優化生成器網路和判別器網路,本文生成的學生神經網路可以對輸入數據生成具有跟教師神經網路特徵具有同樣分布的特徵。
論文 3: Reinforced Multi-label Image Classification by Exploring Curriculum
人和動物學習經過組織的知識比學習雜亂的知識更為高效。基於課程學習的機制,我們提出了一種強化多標籤分類的方法來模擬人類從易到難預測標籤的過程。這種方法讓一個強化學習的智能體根據圖像的特徵和已預測的標籤有順序地進行標籤預測。進而,它通過尋求一種使累計獎賞達到最大的方法來獲得最優策略,從而使得多標籤圖像分類的準確性最高。我們在 PASCAL VOC2007 和 PASCAL VOC2012 數據集上的實驗表明了,在真實的多標籤任務中,這種強化多標籤圖像分類方法的必要性和有效性。
論文 4: Learning with Single-Teacher Multi-Student
本文研究了如何通過一個單一的複雜通用模型來學習一系列的輕量專用模型,即單老師多學生 (Single-Teacher Multi-Student) 問題。以經典的多分類和二分類為例,本文圍繞著如何利用一個預訓練的多分類模型來衍生出多個二分類模型,其中每個二分類模型對應不同的類別。在實際場景中,許多問題可以被看做這一範疇;例如,基於一個通用的人臉識別系統對於特定的嫌犯進行快速準確地判斷。然而,直接使用多分類模型進行二分類操作的推斷效率不高,從頭訓練一個二分類器的分類表現往往不好。本文通過將多分類器看做老師,將目標的二分類器看做學生,提出了一種門化支持向量機 (gated SVM) 模型。此模型中,每一個二分類器可以結合多分類器的推斷結果給出自己的預測;此外,每個學生可以獲得由老師模型給出的樣本複雜度度量,使得訓練過程更加自適應化。在實際實驗中,所提模型取得了不錯的效果。
論文 5: Sequence-to-Sequence Learning via Shared Latent Representation
受人腦可以從不同的模態學習和表達同一抽象概念的啟發,本文提出了一個通用的星狀框架實現序列到序列的學習。該模型中將不同模態的內容(外圍節點)編碼到共享隱表徵(shared latent representation,SLR),即中央節點中。SLR 的模態不變屬性可以被視為中間向量的高級正則化,強制它不僅捕獲每個單個模態的隱式表示(如自動編碼器),而且還可以像映射模型一樣進行轉換。因此,我們可以從單個或多個模態學習 SLR,並且生成相同的(例如句子到句子)或不同的(視頻到句子)的模態信息。星型結構將輸入與輸出分離,為各種序列學習應用提供了一個通用且靈活的框架。此外,SLR 模型是內容相關(content-specific)的,這意味著它只需要對數據集進行一次訓練,就可以用於不同的任務。
對了,我們招人了,了解一下?
CCF-GAIR(CCF 全球人工智慧與機器人峰會)
將在 6 月底再次席捲鵬城
連續 3 天 11 場 分享盛宴
6.29 - 7.1,我們準時相約!
※全網獨家!2018 MIT 6.S094 中文譯版「深度學習和自動駕駛課」
※谷歌開源獵星代碼,AI時代的天文愛好者們該換裝備了!
TAG:AI科技評論 |