谷歌推出YouTube-8M Segments時間定位數據集
Google擴展現有的YouTube-8M數據集,發布時間定位子數據集YouTube-8M Segments,YouTube-8M Segments擁有人工驗證過的標記,還加入了時間定位,標記出視頻中實體出現的時間,如此讓YouTube-8M是分類數據集,同時也成為時間定位數據集。
YouTube-8M數據集是一個大型標籤視頻數據集,由數百萬個YouTube視頻組成,加入了由計算機自動產生的高品質標籤,涵蓋了高達3,800個視覺實體,這個數據集的特色是,其包括的數十億個影格以及聲音片段,可以存儲在單一個磁碟中,而這能用單個GPU,一天內就可以完成基準模型訓練,但由於數據集的規模以及多樣性內容,也可以讓用戶進行更深入複雜的圖片與聲音模型。
Google提到,雖然之前的YouTube-8M數據集為視頻分類應用,提供了有用的訓練數據,但是包含的只有機器產生的標籤,而且也缺乏精細的時間定位數據,這在某種程度限制了數據集的應用範圍。
而為了加速時間概念定位的研究,Google新發布了YouTube-8M Segments數據集,這是一個YouTube-8M的子數據集,內容為YouTube-8M中視頻的5秒片段,由人工驗證實體出現在片段與否。Google並非詳盡地標記視頻中的所有片段,而是另外創建YouTube-8M片段擴展,Google為每個隨選的YouTube-8M視頻,平均標上5個標籤,YouTube-8M Segments數據集總共有237,000個片段,涵蓋一千種類別。
也就是說YouTube-8M Segments數據集的補充,使得YouTube-8M數據集現在除了是一個大規模分類數據集,也是一個時間定位數據集。
※Firefox本周再傳零時差攻擊漏洞,可能鎖定加密貨幣用戶
※Bitdefender與警方聯手發布勒索軟體最新版解密工具
TAG:十輪網 |