國內首次零樣本學習演算法大賽開啟報名,零樣本數據集免費下載
去年,由創新工場、搜狗、頭條聯合主辦的 AI Challenger(簡稱 AIC)全球 AI 挑戰賽吸引了來自 65 個國家 8892 支團隊參賽,經過激烈的角逐,最終勝出的團隊共同瓜分了大賽提供的百萬獎金。
2018,AIC 全新賽季開啟預熱。3 月 22 日起,零樣本學習(zero-shot learning)競賽正式在線開啟比賽。
這次的零樣本學習競賽同樣發布大規模圖像屬性數據集,包含 78017 張圖片、230 個類別、359 種屬性。與目前主流的用於 zero-shot learning 的數據集相比,圖片量更大、屬性更豐富、類別與 ImageNet 重合度更低。
零樣本學習(zero-shot learning)
什麼是零樣本學習?簡單來說就是識別從未見過的數據類別,即訓練的分類器不僅僅能夠識別出訓練集中已有的數據類別,還可以對於來自未見過的類別的數據進行區分。例如識別一張貓的圖片,但在訓練時沒有訓練到貓的圖片和對應貓的標籤。那麼就可以通過比較這張貓的圖片和訓練過程中的哪些圖片相近,進而找到相近圖片的標籤,再通過這些相近標籤去找到貓的標籤。本質上,零樣本學習屬於遷移學習的一種。
零樣本學習的意義也顯而易見:在傳統圖像識別任務中,訓練階段和測試階段的類別是相同的,但每次為了識別新類別的樣本需要在訓練集中加入這種類別的數據。一些類別的樣本收集代價大,即使收集到足夠的訓練樣本,也需要對整個模型進行重新訓練。這都會加大識別系統的成本,零樣本學習方法便能很好的解決這個問題。
零樣本學習研究現狀
早期的零樣本學習研究可以追溯到 2008 年。那時,Larochelle 等人針對字元分類問題提出了零樣本學習(zero shot learning)方法,並且識別準確率達到了 60%。
2009 年 Lampert 等人提出了 Animals with Attributes 數據集和經典的基於屬性學習的演算法,才算真正打開零樣本學習的關注度。
2013 年,發表在 NIPS 上的論文《DeViSE: A Deep Visual-Semantic Embedding Model》,解決了如何將已有的圖像分類模型應用到訓練中未涉及到的圖像分類中。
2014 年,在 ICLR 2014 上的發表的《Zero-Shot Learning by Convex Combination of Semantic Embeddings》繼承了前人研究方法中的主要思想(CNN+word2vec),但使用了更簡單的方法,從而保留了整個 CNN 結構,且不需要 linear transformation。
之後,發表在 ICCV 2015 上的《Objects2action: Classifying and localizing actions without any video example》將零樣本學習研究又向前推動了一步。
如果讀了上面提到的三篇論文,大概會對零樣本學習的研究方法有所了解。但最經典的零樣本學習方法是 Lampert 發表在 CVPR 2009 上的一篇論文《Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer 》提出的直接屬性預測模型 (DAP)。
模型中屬性訓練是在傳統特徵提取的基礎上的進行的,首先使用顏色直方圖、局部自相似直方圖、SIFT 和 PHOG 等 6 種方法來提取樣本圖像的底層特徵,這幾種特徵包含了圖像的顏色、形狀和紋理等方面,所以通過這種特徵提取方法得到的特徵可以良好的表達圖像中的信息。這幾種圖像特徵不僅適用與線性分類器,而且在非線性分類器中也能達到良好的表現。在 DAP 方法中,通過上述的特徵提取方法得到樣本的圖像特徵後,將特徵用於屬性分類器的訓練,然後將訓練得出的模型用於屬性的預測,最後採用貝葉斯方法推算測試樣本的類別。近年來深度特徵的使用大幅提高了零樣本識別的準確率。
零樣本學習潛在應用場景
零樣本學習是希望藉助輔助知識(如屬性、詞向量、文本描述等)學習從未見過的新概念。因此,在一些場景下,如細粒度物體識別、任意語言之間的翻譯等,難以獲得足夠的有標註的數據來訓練識別或預測模型可以嘗試使用零樣本學習來解決。
物體識別
例如,模型在「馬」、「牛」等類別上訓練過,因此模型能夠準確地識別「馬」、「牛」的圖片。當模型遇到「象」這個新類別,由於從未見過,模型無法作出判斷。傳統解決方案是收集大量「象」的圖片,與原數據集一起重新訓練。這種解決方案的代價高、速度慢。然而,人類能夠從描述性知識中快速學習一個新概念。例如,一個兒童即使沒有見過「象」,當提供他文本描述「象是一種的大型食草類動物,有長鼻和長牙」。兒童能夠根據描述快速學會「象」這一新類別,並能在第一次見到「象」時識別出來。零樣本學習與之類似,在沒有任何訓練樣本的情況下,藉助輔助知識(如屬性、詞向量、文本描述等)學習一些從未見過的新概念(類別)。
語言翻譯
比如說要進行三種語言之間的翻譯,按照傳統的方法需要分別訓練六個網路,在日語和韓語之間沒有那麼多樣本的情況下,訓練英語特徵空間日語,韓語特徵空間英語這兩個網路,那麼就可以自動學會韓語特徵空間日語這個翻譯過程。
圖像合成
近年來,對抗網路 GAN 被用於圖像合成,取得了以假亂真的效果。但傳統圖像合成僅能合成見過的類別的圖像。零樣本圖像合成希望模型能夠合成從未見過的類別的圖像。目前已有一些演算法通過條件 GAN 網路實現了零樣本圖像合成。
圖像哈希
傳統圖像哈希演算法利用一些訓練樣本來學習針對某些類別的哈希演算法。但這些學習到的哈希演算法無法用於新類別。零樣本圖像哈希,希望在已知類別上學到哈希演算法能夠運用到新的未知類別上。目前,一些基於屬性的零樣本哈希演算法已經被提出。
零樣本學習競賽
最後,歡迎對零樣本學習有研究的同學們來參加此次比賽。
目前 AI Challenger 官網已開通報名參賽通道,報名截止日期在 4 月 23 日。感興趣的同學一定要計劃時間,不要錯過這次報名!
比賽所用的數據集也已開放下載。
※ArXiv 中最受歡迎的開源框架大起底,第一名當然是……
※北航張歡:如何運用深度學習進行位姿測量?
TAG:AI研習社 |