谷歌發布Quick Draw:5千萬張矢量圖,345個類別
選自Github
機器之心編譯
參與:吳攀、李澤南
還記得谷歌上個月推出的 AutoDraw 嗎?這是一個能把你的隨手塗鴉變成繪畫的人工智慧技術工具。谷歌也曾發布論文和博客介紹了其背後的技術,參見機器之心文章《谷歌官方揭秘 AutoDraw 人工智慧繪畫工具原理:讓機器學會理解藝術》。實際上,AutoDraw 所用的技術基於谷歌先前的塗鴉實驗「Quick, Draw!」。近日,谷歌發布了該項目背後的數據集,其中包含 5000 萬張矢量畫。機器之心對該項目的介紹文檔進行了編譯介紹。
數據集地址:https://github.com/googlecreativelab/quickdraw-dataset
數據集官網:https://quickdraw.withgoogle.com/data
Quick, Draw! 在線體驗:https://quickdraw.withgoogle.com
AutoDraw 在線體驗:https://www.autodraw.com
相關論文:https://arxiv.org/abs/1704.03477
Quick Draw 數據集是一個包含 5000 萬張圖畫的集合,分成了 345 個類別,這些圖畫都來自於 Quick, Draw! 遊戲的玩家。這些畫都是加了時間戳的矢量圖,並帶有一些元數據標註,包括玩家被要求繪畫的內容和玩家所在的國家。你可以在數據集官網瀏覽被識別出的繪畫。
我們在這裡將這個數據集共享給開發者、研究者和藝術家,以供探索、研究和學習。如果你使用這個數據集創造出了什麼東西,請發郵件告知我們:quickdraw-support@google.com 或提交到 A.I. Experiments:https://aiexperiments.withgoogle.com/submit
請注意,儘管這個繪畫集合中每一張都被審核過,但其中可能仍有不當內容。
原始的審核過的數據集
原始數據在 ndjson 文件中,並按類別進行了分割,按照如下格式:
每一張包含一副繪畫,下面給出了一個例子:
{
"key_id":"5891796615823360",
"word":"nose",
"countrycode":"AE",
"timestamp":"2017-03-01 20:41:36.70725 UTC",
"recognized":true,
"drawing":[[[129,128,129,129,130,130,131,132,132,133,133,133,133,...]]]
}
繪畫數組的格式如下:
[
[ // First stroke
[x0, x1, x2, x3, ...],
[y0, y1, y2, y3, ...],
[t0, t1, t2, t3, ...]
],
[ // Second stroke
[x0, x1, x2, x3, ...],
[y0, y1, y2, y3, ...],
[t0, t1, t2, t3, ...]
],
... // Additional strokes
]
其中 x 和 y 是像素坐標,t 是自第一個點開始後的時間,單位:毫秒。x 和 y 是實數值,而 t 是整型值。因為用於顯示和輸入的設備各不相同,原始繪畫的邊框大小和點的數量可能有非常大的差異。
預處理後的數據集
我們已經對該數據集進行了預處理,並且將其分成了不同的文件和格式,以便人們能更快更輕鬆地下載和使用。
簡化圖文件(.ndjson)
我們對這些矢量圖進行了簡化,移除了時間信息,並且對數據進行了定位和縮放處理,得到了大小 256×256 的圖像。該數據以 ndjson 的格式導出,帶有與原始格式一樣的元數據。簡化過程如下:
1. 將繪畫對齊到左上角,最小值為 0;
2. 均勻縮放繪畫,最大值為 255;
3. 以 1 像素的間隔重採樣所有的筆畫;
4. 使用 Ramer–Douglas–Peucker 演算法簡化所有的筆畫,設置其 ε 值為 2.0
二進位文件(.bin)
我們也提供了簡化後的繪畫和元數據的定製二進位格式,可用於高效的壓縮和載入。examples/binary_file_parser.py 給出了如何用 Python 載入該文件的示例。
Numpy 點陣圖(.npy)
所有簡化過的繪畫也都被轉換成了 28×28 的灰度點陣圖,保存為 numpy 的 .npy 格式。該文件可以通過 np.load() 函數載入。這些圖像是從簡化過的數據中生成的,但對齊的是繪畫邊框的中心,而非左上角。
獲取數據
該數據集在谷歌雲存儲服務中,在 ndjson 文件中分類存儲。請參閱 Cloud Console 中的文件列表,你也可以使用其他方法使用它(參閱:https://cloud.google.com/storage/docs/access-public-data)。
數據集分類
Raw files (.ndjson)
Simplified drawings files (.ndjson)
Binary files (.bin)
Numpy bitmap files (.npy)
Sketch-RNN QuickDraw 數據集
這些數據也被用於訓練 Sketch-RNN 模型。該模型開源的 TensorFlow 應用將在 Magenta Project 上近期推出。了解該模型可參閱文章《谷歌官方揭秘 AutoDraw 人工智慧繪畫工具原理:讓機器學會理解藝術》。數據存儲在壓縮文件.npz 中,這種格式適合輸入進循環神經網路中。在這一數據集中 75000 個用例(70000 用於訓練、2500 個用於驗證、2500 個用於測試)在每個類別里隨機選擇,使用值為 2.0 的 epsilon 參數經過 Ramer–Douglas–Peucker 演算法線簡化處理。
許可證
這些數據由谷歌提供,使用 Creative Commons Attribution 4.0 International 許可證。
※機器之心深度研學社每周乾貨:2017年第20周
※小米電視4正式發布,推出人工智慧開放平台
※識別惡性腫瘤、篩查視網膜病變,谷歌正在用機器學習改變醫療
※阿里巴巴「NASA計劃」新進展:刷新視覺計算世界紀錄
TAG:機器之心 |
※國外專業Logo設計神器:預設有540個模板,2000個矢量圖形
※VecSense智能聲矢量感測器亮相CITE 2018,並榮獲大會「金獎」
※高級矢量圖設計Vectornator即將登上Mac
※VecSense智能聲矢量感測器亮相CITE 2018,並榮獲大會「創新金獎」
※矢量圖設計應用 Vectornator Pro
※矢量版殲-20B或將在明年列裝,美:F-22的死敵!
※UI設計 120套小可愛多肉 辦公用品icon矢量素材
※殲-20有無使用矢量發動機?英專家:仍未達到F-22和F-35的水平
※矢量插畫| umenamerou 作品欣賞
※殲-20改用矢量發動機?性能較F-22、F-35、蘇-57戰鬥機又如何?
※基於CATDrawing的矢量PDF筆記方案
※中國矢量發動機WS19和美國惠普F135,差的不只一個落葉飄
※矢量圖設計應用Vectornator Pro完全免費
※矢量插畫 umenamerou 作品欣賞
※F-22A引以為傲機動神話終結,F-35A缺矢量或成典範
※矢量版殲10B極低速通場,莫羨慕蘇35的117S,它已落伍!
※殲-20、矢量版殲-10B到齊,珠海航展殲-31是否再缺席?
※殲20又要火了,中國很快推出帶有超材料+ WS-15推力矢量的殲-20B
※矢量版殲10B秀極低速通場,莫再羨慕蘇35的117S,它已落伍!
※Illustrator繪製矢量風格的城市落日場景