當前位置:
首頁 > 最新 > 最全面超大規模數據集下載鏈接匯總

最全面超大規模數據集下載鏈接匯總

歡迎分享到朋友圈讓更多的人受益

大數據

大數據

1. https://delicious.com/pskomoroch/dataset

3. http://konect.uni-koblenz.de/

搜狗實驗室

http://www.sogou.com/labs/resources.html?v=1

氣象數據集

https://www.ncdc.noaa.gov/data-access/quick-links

氣候監測數據集

http://cdiac.ornl.gov/ftp/ndp026b

機器學習

亞馬遜網路服務數據

航空公司數據 (2009 年 ASA 挑戰)

http://stat-computing.org/dataexpo/2009/the-data.html

澳大利亞天氣

http://www.bom.gov.au/climate/dwo/

因果關係工作台

Kaggle 競爭數據

https://www.kaggle.com/datasets

KDNuggets 競爭網站

www.kdnuggets.com/datasets/

機器學習的數據集存儲庫

http://mldata.org/

醫療保險數據文件

微軟研究院

http://research.microsoft.com/apps/dp/dl/downloads.aspx

百萬歌曲數據集

歌曲數據集

http://labrosa.ee.columbia.edu/millionsong/pages/additional-datasets

RDataMining.com R 和數據挖掘電子書數據

革命分析集合

http://www.revolutionanalytics.com/subscriptions/datasets/

社交網路

http://www.cs.cmu.edu//ancestry.com/ ~ jelsas / 數據

UCI 機器學習庫

http://archive.ics.uci.edu/ml/

535 億點擊

1.http://cnets.indiana.edu/groups/nan/webtraffic/click-dataset

2.http://archive.ics.uci.edu/ml/

3.http://www.ics.uci.edu/~mlearn//MLRepository.htm

機器學習樣本資料庫

2.http://www.ics.uci.edu/~mlearn/MLRepository.html

關於基金的數據挖掘的網站

數據生成器的鏈接

http://www.cse.cuhk.edu.hk/~kdd/data_collection.html

癌症基因

http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi

金融數據

http://lisp.vse.cz/pkdd99/Challenge/chall.htm

網路

斯坦福大學大型網路數據收集

http://snap.stanford.edu/data/

微軟匿名網路數據

http://kdd.ics.uci.edu/databases/msweb/msweb.html

MSNBC 匿名網路數據

http://kdd.ics.uci.edu/databases/msnbc/msnbc.html

SyskillWebert Web 數據

http://kdd.ics.uci.edu/databases/SyskillWebert/SyskillWebert.html

圖像

ImageNet (包含 1400 萬的圖像)

http://www.image-net.org/

Tiny Images Dataset (包含 8000 萬的 32x32 圖像)

http://horatio.cs.nyu.edu/mit/tiny/data/index.html

MirFlickr1M (包含 100 萬的圖像)

http://press.liacs.nl/mirflickr/

CoPhIR (包含 1 億 600 萬的圖像 )

SBU captioned photo dataset (包含 100 萬的圖像)

http://dsl1.cewit.stonybrook.edu/~vicente/sbucaptions/

Large-Scale Image Annotation using Visual Synset(ICCV 2011) (包含 2 億圖像 )

http://cpl.cc.gatech.edu/projects/VisualSynset/

NUS-WIDE(包含 27 萬的圖像)

http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm

SUN dataset (包含 13 萬的圖像)

http://people.csail.mit.edu/jxiao/SUN/

MSRA-MM (包含 100 萬的圖像,23000 視頻 )

http://research.microsoft.com/enus/projects/msrammdata/

TRECVID

卡耐基 - 梅隆的臉圖片

http://kdd.ics.uci.edu/databases/faces/faces.html

金星上的火山

http://kdd.ics.uci.edu/databases/volcanoes/volcanoes.html

雅虎發布超大 Flickr 數據集 1 億的圖片 + 視頻

100 多個有趣的數據集

http://www.csdn.net/article/2014-06-06/2820111-100-Interesting-Data-Sets-for-Statistics

圖像處理相關個人主頁、研究組及公開數據集網址

Public Domain Collections

Data360

Datamob.org

http://datamob.org/datasets

Factual

http://www.factual.com/topics/browse

Freebase

Google

http://www.google.com/publicdata/directory

numbray

http://numbrary.com/

Quora

https://www.quora.com/Data/Where-can-I-find-large-datasets-open-to-the-public

RS Collection 100+

http://rs.io/2014/05/29/list-of-data-sets.html

Sample R data sets

http://stat.ethz.ch/R-manual/R-patched/library/datasets/html/00Index.html

SourceForge 研究數據

http://www.nd.edu/ oss / 數據 / 研究司

StatSci.org

UFO 報告

維基解密 911 尋呼機截取

http://911.wikileaks.org/files/index.html

Stats4Stem.org:R 數據集

《華盛頓郵報》名單

http://www.washingtonpost.com/wp-srv/metro/data/datapost.html

科學

農業實驗

http://www.insider.org/packages/cran/agridat/docs/agridat

氣候數據

http://www.cru.uea.ac.uk/cru/data/temperature/#datter

and ftp://ftp.cmdl.noaa.gov/

Gene Expression Omnibus

http://www.ncbi.nlm.nih.gov/geo/

Geo Spatial Data

http://geodacenter.asu.edu/datalist/

Human Microbiome Project

http://www.hmpdacc.org/reference_genomes/reference_genomes.php

MIT Cancer Genomics Data

http://www.broadinstitute.org/cgibin/cancer/datasets.cgi

NASA

http://nssdc.gsfc.nasa.gov/nssdc/obtaining_data.html

NIH Microarray data

ftp://ftp.ncbi.nih.gov/pub/geo/DATA/supplementary/series/GSE6532/(R)

Protein structure

http://www.infobiotic.net/PSPbenchmarks/

Public Gene Data

斯坦福大學的微陣列數據

社會科學

綜合社會調查

http://www3.norc.org/GSS + 網站 /

ICPSR

http://www.icpsr.umich.edu/icpsrweb/ICPSR/access/index.jsp

皮尤研究

http://www.pewinternet.org/datasets/pages/2/

加州大學洛杉磯分校的社會科學檔案

UPJOHN 本月

http://www.upjohn.org/erdc/erdc.html

時間序列

時間序列資料庫

http://robjhyndman.com/TSDL/

澳大利亞手語數據

http://kdd.ics.uci.edu/databases/auslan/auslan.html

高質量的澳大利亞手語數據

http://kdd.ics.uci.edu/databases/auslan2/auslan.html

腦電圖數據

http://kdd.ics.uci.edu/databases/eeg/eeg.html

日本的母音

http://kdd.ics.uci.edu/databases/JapaneseVowels/JapaneseVowels.html

Pioneer-1 移動機器人數據

http://kdd.ics.uci.edu/databases/pioneer/pioneer.html

偽周期合成時間序列

http://kdd.ics.uci.edu/databases/synthetic/synthetic.html

合成控制圖時間序列

http://kdd.ics.uci.edu/databases/synthetic_control/synthetic_control.html

大學

卡內基梅隆大學安然電子郵件

http://www.cs.cmu.edu/~ 安然 /

卡內基梅隆大學 StatLab

http://lib.stat.cmu.edu/datasets/

龍骨存儲庫

http://sci2s.ugr.es/keel/datasets.php

卡內基梅隆大學 JASA 數據歸檔

http://lib.stat.cmu.edu/jasadata/

俄亥俄州立大學財務數據

http://fisher.osu.edu/fin/osudata.htm

加州大學伯克利分校

加州大學洛杉磯分校

加州大學河濱分校時間序列

http://www.cs.ucr.edu/ / time_series_data /

多倫多大學

http://www.cs.toronto.edu / 深入 / 數據 / datasets.html

UCI 知識發現 (KDD) 歸檔

信息和計算機科學

加州大學歐文分校

https://uci.edu/

互聯網相關數據集

Dataset for "Statistics and SocialNetwork of YouTube Videos"

http://netsg.cs.sfu.ca/youtubedata/

1998 World Cup Web Site Access Logs

//ita.ee.lbl.gov/html/contrib/WorldCup.html

(從 1998/04/26 到 1998/07/26 的 92 天中,發生了 1,352,804,107 次請求)

Page view statistics for Wikimedia projects

http://dammit.lt/wikistats/

AOL Search Query Logs - RP

http://www.researchpipeline.com/mediawiki/index.php?title=AOL_Search_Query_Logs

livedoor gourmet

離散序列數據

UNIX 用戶數據

http://kdd.ics.uci.edu/databases/UNIX_user_data/UNIX_user_data.html

主菜芝加哥推薦數據

http://kdd.ics.uci.edu/databases/entree/entree.html

多元數據

人口收入調查資料庫

http://kdd.ics.uci.edu/databases/census-income/census-income.html

線圈數據

http://kdd.ics.uci.edu/databases/coil/coil.html

Corel 圖像特徵

http://kdd.ics.uci.edu/databases/CorelFeatures/CorelFeatures.html

森林 CoverType

http://kdd.ics.uci.edu/databases/covertype/covertype.html

保險公司基準 (2000 卷)

http://kdd.ics.uci.edu/databases/tic/tic.html

互聯網使用數據

http://kdd.ics.uci.edu/databases/internet_usage/internet_usage.html

IPUMS 人口普查數據

http://kdd.ics.uci.edu/databases/ipums/ipums.html

KDD CUP 1998 數據

http://kdd.ics.uci.edu/databases/kddcup98/kddcup98.html

KDD CUP 1999 數據

http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html

1990 年美國人口普查數據

http://kdd.ics.uci.edu/databases/census1990/USCensus1990.html

關係數據

大腸桿菌基因

http://kdd.ics.uci.edu/databases/ecoli/ecoli.html

結核分枝桿菌基因

http://kdd.ics.uci.edu/databases/tb/tb.html

電影

http://kdd.ics.uci.edu/databases/movies/movies.html

MovieLens 數據集

http://datahub.io/dataset/movielens

厄爾尼諾現象的數據

http://kdd.ics.uci.edu/databases/el_nino/el_nino.html

文本

20 新聞組數據

http://kdd.ics.uci.edu/databases/20newsgroups/20newsgroups.html

路透社 - 21578 文本分類收集

http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html

路透轉錄子集

http://kdd.ics.uci.edu/databases/reuters_transcribed/reuters_transcribed.html

摘要 1990- 2003 年 NSF 研究獎項

http://kdd.ics.uci.edu/databases/nsfabs/nsfawards.html

其他

http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

http://www.w3.org/TR/WD-logfile-960221.html

http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog

http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/

http://www.web-caching.com/traces-logs.html

http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf

http://www.cs.cornell.edu/projects/kddcup/index.html

歡迎分享到朋友圈讓更多的人受益

參考:

關注 AI 研習社(okweiwu),回復1領取

【超過 1000G 神經網路 / AI / 大數據,教程,論文】

怎麼在知乎 「看山杯」 中拿冠軍?


點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 唯物 的精彩文章:

北大信息工程博士孫嘉睿:針對任意解析度的圖像補全技術
AI研習社幫你找了28個職位
教你如何利用演算法原理,讓TA對你一見鍾情

哇!原來你看到的小視頻都出自他們之手

TAG:唯物 |