全球最大地標識別數據集問世:包含200萬張圖片和3萬處地標
安妮 編譯自 Google Research Blog
量子位 出品 | 公眾號 QbitAI
今天,谷歌推出了目前世界上最大的人造和自然地標識別數據集Google-Landmarks。數據集中包含200萬張圖片,描述了3萬處全球獨特地標,量級是普通的數據集的30倍。
數據集中地標的位置分布
兩場競賽
和這個數據集一同推出的,還有兩場相關的數據競賽:地標識別(Landmark Recognition)挑戰和地標檢索(Landmark Retrieval)挑戰。谷歌在博客中表示,這將成為Kaggle競賽的賽題,也設有相應的獎金。
這場競賽的後續消息,還將出現在今年6月份的CVPR 2018會議的Landmarks workshop中。
谷歌路標識別挑戰賽(內含數據集下載):
https://www.kaggle.com/c/landmark-recognition-challenge
谷歌路標檢索挑戰賽(內含數據集下載):
https://www.kaggle.com/c/landmark-retrieval-challenge
地標識別和其他問題比較大的區別在於,即使在一個大型標註過的數據集,對一個不太知名的地標也可能訓練得不夠。
此外,由於地標建築不會移動並且內部的變化非常小,因此,圖像的拍攝條件,如遮擋、不同視角、天氣和光線等因素決定了地標圖像的變化。但其他的普通數據集(比如萌犬數據集),往往變化多樣。
這兩個Kaggle挑戰提供了標註數據,幫助研究人員解決這些問題。路別識別競賽是在具有挑戰性的測試圖像數據集中,讓參賽者構建識別正確地標的模型。而在路標檢索挑戰賽中,參與者需要檢索包含相同地標的圖像。
數據集中部分地標建築
開源DELF
講到這裡還沒完。為了刺激這個領域的研究,谷歌研究人員還開源了專註本地特徵的描述符Deep Local Features(DELF)。關於DELF的論文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相於2016年,一個月前又進行了一次修改。
論文地址:
https://arxiv.org/abs/1612.06321
DELF開源代碼和數據集地址:
https://github.com/tensorflow/models/tree/master/research/delf
最後,附谷歌博客介紹地址:
https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html
—完—
加入社群
量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微信號qbitbot5,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※國內學者新研究:中醫AI登場,自動開出藥方
※第四範式完成B+輪融資,三大國有銀行入股
TAG:量子位 |