當前位置:
首頁 > 科技 > 全球最大地標識別數據集問世:包含200萬張圖片和3萬處地標

全球最大地標識別數據集問世:包含200萬張圖片和3萬處地標

安妮 編譯自 Google Research Blog

量子位 出品 | 公眾號 QbitAI

今天,谷歌推出了目前世界上最大的人造和自然地標識別數據集Google-Landmarks。數據集中包含200萬張圖片,描述了3萬處全球獨特地標,量級是普通的數據集的30倍。

數據集中地標的位置分布

兩場競賽

和這個數據集一同推出的,還有兩場相關的數據競賽:地標識別(Landmark Recognition)挑戰和地標檢索(Landmark Retrieval)挑戰。谷歌在博客中表示,這將成為Kaggle競賽的賽題,也設有相應的獎金。

這場競賽的後續消息,還將出現在今年6月份的CVPR 2018會議的Landmarks workshop中。

谷歌路標識別挑戰賽(內含數據集下載):

https://www.kaggle.com/c/landmark-recognition-challenge

谷歌路標檢索挑戰賽(內含數據集下載):

https://www.kaggle.com/c/landmark-retrieval-challenge

地標識別和其他問題比較大的區別在於,即使在一個大型標註過的數據集,對一個不太知名的地標也可能訓練得不夠。

此外,由於地標建築不會移動並且內部的變化非常小,因此,圖像的拍攝條件,如遮擋、不同視角、天氣和光線等因素決定了地標圖像的變化。但其他的普通數據集(比如萌犬數據集),往往變化多樣。

這兩個Kaggle挑戰提供了標註數據,幫助研究人員解決這些問題。路別識別競賽是在具有挑戰性的測試圖像數據集中,讓參賽者構建識別正確地標的模型。而在路標檢索挑戰賽中,參與者需要檢索包含相同地標的圖像。

數據集中部分地標建築

開源DELF

講到這裡還沒完。為了刺激這個領域的研究,谷歌研究人員還開源了專註本地特徵的描述符Deep Local Features(DELF)。關於DELF的論文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相於2016年,一個月前又進行了一次修改。

論文地址:

https://arxiv.org/abs/1612.06321

DELF開源代碼和數據集地址:

https://github.com/tensorflow/models/tree/master/research/delf

最後,附谷歌博客介紹地址:

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html

加入社群

量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進群請加小助手微信號qbitbot5,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

國內學者新研究:中醫AI登場,自動開出藥方
第四範式完成B+輪融資,三大國有銀行入股

TAG:量子位 |