MapD開源GPU驅動的資料庫:能夠在一台多GPU伺服器上針對數十億個記錄執行亞秒級查詢
自五年多以前在麻省理工學院(MIT)上資料庫課程的同時開始開發MapD以來,我就一直夢想著讓這個項目成為開源項目。因而,我們的公司今天宣布開源MapD Core資料庫(https://www.mapd.com/products/core)及相關的可視化庫,並立即生效,我感到非常高興。
代碼採用Apache 2.0許可證,現放在Github上(https://github.com/mapd)。它擁有你安裝一套功能齊全的MapD Core資料庫所需要的一切,能夠在一台多GPU伺服器上針對數十億個記錄執行亞秒級查詢。我們的所有核心技術包含在今天發布的開源產品中,包括我們的分層緩存系統和低級虛擬機(LLVM)查詢編譯引擎。
點擊播放 GIF/1772K
航班數據集:在時間軸上刷新氣泡圖和行圖
我們這麼做首先是出於我們堅信開源軟體具有強大的變革力量。無論是在Hadoop生態系統,還是在深度學習生態系統,開源都在帶來巨大的創新,這是專有軟體根本所無法企及的。
我本人一直期盼著這天早日到來。我的目標始終是讓MapD向全世界開放,但是一開始我猶豫這麼做,當時渴望代碼庫成熟起來。後來構建產品、擴大公司規模帶來了一系列不同的優先事項。
然而,我在最初與恩頤投資公司(NEA)的格雷格·帕帕多普羅斯(Greg Papadopoulos)和弗里斯特·巴斯克特(Forest Baskett)見過幾次面後,清楚地認識到:我們同樣堅信開源具有顛覆現狀的潛力,尤其是在數據分析領域。在我們最近融資2500萬美元的B輪融資活動中,恩頤投資是領投方。我們特別指出,雖然GPU加速的機器學習在蠶食這個世界,但是在GPU上運行的分析堆棧卻存在很大的缺口。幾乎整個GPU機器學習和深度學習堆棧是開源,但是沒有一個開源數據處理引擎與之相輔相成。這就是我們決意要填補的缺口。
點擊播放 GIF/1866K
Tweets數據集:刷新時間軸,並在顯示行信息的Pointmap數據點上懸停
成為開源讓我們得以與這個生態系統的其他成員整合起來,如果我們作為一種封閉系統,那是根本不可能實現的。因此,在宣布開源的同時,我們今天還激動地宣布與Continuum Analytics和H2O.ai一起成立GPU開放分析項目(GOAI)組織。我們共同宣布了第一個項目:GPU數據框(GDF)。數據框讓用戶得以在GPU進程之間高效地交換數據,沒有拷貝數據或將數據轉移到CPU帶來的那種開銷。我們希望,這個項目為在GPU上搞一條開放的端到端管道邁出堅實的一步。
我們在次日開源了下列產品:
MapD Core開源資料庫――提供了採用Apache 2許可證的MapD Core資料庫的源代碼。代碼提供了多GPU加速SQL查詢所需要的一切。詳見https://github.com/mapd/mapd-core。
MapD可視化庫--MapD提供開源Javascript庫,讓用戶可以構建自定義的、基於Web的可視化應用程序,MapD Core 資料庫支持這類應用程序。庫含有生成圖表、交叉過濾數據以及管理MapD Core資料庫連接的功能。圖表和交叉過濾這兩套庫基於廣受歡迎的DC.js Dimensional Charting項目。詳見https://github.com/mapd/mapd-charting。
我們同時發布了MapD Analytics Platform企業版,這個版本包含MapD Core資料庫、MapD Core GPU渲染引擎以及MapD Immerse可視化分析客戶軟體。它還包含開源版所沒有的分布式橫向擴展、高可用性(HA)、LDAP和ODBC等功能。我們的路線圖包括額外的功能(尤其是安全方面的功能),將來會添加到企業版中。
我們還提供了供人下載的社區版二進位代碼(https://www.mapd.com/products/downloads),包含MapD Core資料庫、我們的GPU渲染引擎以及採用非商業學術許可證的MapD Immerse可視化分析客戶軟體。
前方的道路以及努力打造社區讓我們極其激動和興奮。我們設立了一個社區論壇(https://community.mapd.com/),這是我們邁出的第一步――我們想要聽到大家的想法、評論和問題,無論是技術方面的還是其他方面的。
期待共同構建非常出色的產品。
※樂視雲拖欠和記電訊網路服務費,去年曾宣稱融資10億元
※逆天了!人工智慧可察覺出挖苦和諷刺
※今日Google、Facebook、Twitter、Youtube等均出現故障
※深度學習重大突破:具有學習能力的深度學習軟體,不需要在雲端運行的伺服器
※Facebook、亞馬遜等巨頭是如何建造自己的資料庫的?
TAG:雲頭條 |
※AMD移動端再次發力:移動標壓APU現身AOTS DX12資料庫
※在MSSQL中,若希望用戶USER1具有資料庫伺服器上的全部許可權,則應將USER1加入到下列哪個角色
※Nvidia GeForce GTX 1180 顯卡出現在在線 GPU 資料庫中
※10個頂級Mongodb GUI工具,以圖形方式管理資料庫
※從Dell EMC vs.HPE的HCI資料中看到華為首次進入IDC全球TOP5……
※TCGA資料庫mRNA&lncRNA數據提取
※Sketchfab推出便於3D、VR和AR軟體訪問3D模型資料庫的下載API
※混合雲利器:VMware 上可運行 AWS RDS 資料庫
※TCGA、GEO及SEER資料庫挖掘與應用學習會
※AMD第二代EPYC處理器現身SiSoftware資料庫,並直接拿下第一
※PowerBI從SCCM資料庫中分析數據和KPI展現
※帶你走近TiDB:一款開源NewSQL資料庫
※AMD Vega 20顯卡現身Linux驅動資料庫
※SAP S/4 HANA Cloud資料庫加強AI能力
※專訪百勝軟體CTO:30萬家門店,從MySQL到阿里雲POLARDB雲原生資料庫
※HTML5 Web SQL 資料庫
※GPU資料庫公司Zilliz完成1000萬美元A1輪融資,加速GPU資料庫商業化進程
※SAS-你還在手動配置ODBC連接資料庫嗎
※AWS開源可跨關係型與NoSQL資料庫查詢語言PartiQL
※微軟雲計算PostgreSQL資料庫支持GraphQL