當前位置:
首頁 > 新聞 > 谷歌發布Quick Draw:5千萬張矢量圖,345個類別

谷歌發布Quick Draw:5千萬張矢量圖,345個類別

選自Github

機器之心編譯

參與:吳攀、李澤南


還記得谷歌上個月推出的 AutoDraw 嗎?這是一個能把你的隨手塗鴉變成繪畫的人工智慧技術工具。谷歌也曾發布論文和博客介紹了其背後的技術,參見機器之心文章《谷歌官方揭秘 AutoDraw 人工智慧繪畫工具原理:讓機器學會理解藝術》。實際上,AutoDraw 所用的技術基於谷歌先前的塗鴉實驗「Quick, Draw!」。近日,谷歌發布了該項目背後的數據集,其中包含 5000 萬張矢量畫。機器之心對該項目的介紹文檔進行了編譯介紹。

谷歌發布Quick Draw:5千萬張矢量圖,345個類別

  • 數據集地址:https://github.com/googlecreativelab/quickdraw-dataset

  • 數據集官網:https://quickdraw.withgoogle.com/data

  • Quick, Draw! 在線體驗:https://quickdraw.withgoogle.com

  • AutoDraw 在線體驗:https://www.autodraw.com

  • 相關論文:https://arxiv.org/abs/1704.03477

Quick Draw 數據集是一個包含 5000 萬張圖畫的集合,分成了 345 個類別,這些圖畫都來自於 Quick, Draw! 遊戲的玩家。這些畫都是加了時間戳的矢量圖,並帶有一些元數據標註,包括玩家被要求繪畫的內容和玩家所在的國家。你可以在數據集官網瀏覽被識別出的繪畫。

我們在這裡將這個數據集共享給開發者、研究者和藝術家,以供探索、研究和學習。如果你使用這個數據集創造出了什麼東西,請發郵件告知我們:quickdraw-support@google.com 或提交到 A.I. Experiments:https://aiexperiments.withgoogle.com/submit

請注意,儘管這個繪畫集合中每一張都被審核過,但其中可能仍有不當內容。

原始的審核過的數據集

原始數據在 ndjson 文件中,並按類別進行了分割,按照如下格式:

谷歌發布Quick Draw:5千萬張矢量圖,345個類別

每一張包含一副繪畫,下面給出了一個例子:


{

"key_id":"5891796615823360",

"word":"nose",

"countrycode":"AE",

"timestamp":"2017-03-01 20:41:36.70725 UTC",

"recognized":true,

"drawing":[[[129,128,129,129,130,130,131,132,132,133,133,133,133,...]]]

}

繪畫數組的格式如下:


[

[ // First stroke

[x0, x1, x2, x3, ...],

[y0, y1, y2, y3, ...],

[t0, t1, t2, t3, ...]

],

[ // Second stroke

[x0, x1, x2, x3, ...],

[y0, y1, y2, y3, ...],

[t0, t1, t2, t3, ...]

],

... // Additional strokes

]

其中 x 和 y 是像素坐標,t 是自第一個點開始後的時間,單位:毫秒。x 和 y 是實數值,而 t 是整型值。因為用於顯示和輸入的設備各不相同,原始繪畫的邊框大小和點的數量可能有非常大的差異。

預處理後的數據集

我們已經對該數據集進行了預處理,並且將其分成了不同的文件和格式,以便人們能更快更輕鬆地下載和使用。

簡化圖文件(.ndjson)

我們對這些矢量圖進行了簡化,移除了時間信息,並且對數據進行了定位和縮放處理,得到了大小 256×256 的圖像。該數據以 ndjson 的格式導出,帶有與原始格式一樣的元數據。簡化過程如下:

1. 將繪畫對齊到左上角,最小值為 0;

2. 均勻縮放繪畫,最大值為 255;

3. 以 1 像素的間隔重採樣所有的筆畫;

4. 使用 Ramer–Douglas–Peucker 演算法簡化所有的筆畫,設置其 ε 值為 2.0

二進位文件(.bin)

我們也提供了簡化後的繪畫和元數據的定製二進位格式,可用於高效的壓縮和載入。examples/binary_file_parser.py 給出了如何用 Python 載入該文件的示例。

Numpy 點陣圖(.npy)

所有簡化過的繪畫也都被轉換成了 28×28 的灰度點陣圖,保存為 numpy 的 .npy 格式。該文件可以通過 np.load() 函數載入。這些圖像是從簡化過的數據中生成的,但對齊的是繪畫邊框的中心,而非左上角。

獲取數據

該數據集在谷歌雲存儲服務中,在 ndjson 文件中分類存儲。請參閱 Cloud Console 中的文件列表,你也可以使用其他方法使用它(參閱:https://cloud.google.com/storage/docs/access-public-data)。

數據集分類

  • Raw files (.ndjson)

  • Simplified drawings files (.ndjson)

  • Binary files (.bin)

  • Numpy bitmap files (.npy)

Sketch-RNN QuickDraw 數據集

這些數據也被用於訓練 Sketch-RNN 模型。該模型開源的 TensorFlow 應用將在 Magenta Project 上近期推出。了解該模型可參閱文章《谷歌官方揭秘 AutoDraw 人工智慧繪畫工具原理:讓機器學會理解藝術》。數據存儲在壓縮文件.npz 中,這種格式適合輸入進循環神經網路中。在這一數據集中 75000 個用例(70000 用於訓練、2500 個用於驗證、2500 個用於測試)在每個類別里隨機選擇,使用值為 2.0 的 epsilon 參數經過 Ramer–Douglas–Peucker 演算法線簡化處理。

許可證

這些數據由谷歌提供,使用 Creative Commons Attribution 4.0 International 許可證。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

機器之心深度研學社每周乾貨:2017年第20周
小米電視4正式發布,推出人工智慧開放平台
識別惡性腫瘤、篩查視網膜病變,谷歌正在用機器學習改變醫療
阿里巴巴「NASA計劃」新進展:刷新視覺計算世界紀錄

TAG:機器之心 |

您可能感興趣

國外專業Logo設計神器:預設有540個模板,2000個矢量圖形
VecSense智能聲矢量感測器亮相CITE 2018,並榮獲大會「金獎」
高級矢量圖設計Vectornator即將登上Mac
VecSense智能聲矢量感測器亮相CITE 2018,並榮獲大會「創新金獎」
矢量圖設計應用 Vectornator Pro
矢量版殲-20B或將在明年列裝,美:F-22的死敵!
UI設計 120套小可愛多肉 辦公用品icon矢量素材
殲-20有無使用矢量發動機?英專家:仍未達到F-22和F-35的水平
矢量插畫| umenamerou 作品欣賞
殲-20改用矢量發動機?性能較F-22、F-35、蘇-57戰鬥機又如何?
基於CATDrawing的矢量PDF筆記方案
中國矢量發動機WS19和美國惠普F135,差的不只一個落葉飄
矢量圖設計應用Vectornator Pro完全免費
矢量插畫 umenamerou 作品欣賞
F-22A引以為傲機動神話終結,F-35A缺矢量或成典範
矢量版殲10B極低速通場,莫羨慕蘇35的117S,它已落伍!
殲-20、矢量版殲-10B到齊,珠海航展殲-31是否再缺席?
殲20又要火了,中國很快推出帶有超材料+ WS-15推力矢量的殲-20B
矢量版殲10B秀極低速通場,莫再羨慕蘇35的117S,它已落伍!
Illustrator繪製矢量風格的城市落日場景