當前位置:
首頁 > 科技 > GPU資料庫崛起

GPU資料庫崛起

作者簡介:Ami Gal是Sqream公司的首席執行官兼聯合創始人。

最近出現了從CPU向GPU轉變這個顯著的趨勢,這主要歸因於GPU給廣告技術、金融、電信、零售或安全/IT等行業帶來了獨特的好處。我們剖析了GPU資料庫在何處大放異彩。

你也許還沒有意識到,但是今年我們設計和使用計算資源的方式方面出現了重大的革命。有什麼變化?許多企業和雲提供商開始從傳統的中央處理單元(CPU)處理轉向使用圖形處理單元(GPU)。GPU資料庫是這個趨勢的最新動向,它們有望全面改變資料庫的運行方式。

下面介紹了GPU資料庫如何改變行業的遊戲規則及其最佳應用領域:

GPU資料庫的若干優點

針對大量數據執行重複性操作時,GPU資料庫相比常規的CPU資料庫有了顯著改進。這是由於GPU在每塊卡上可能有數千個核心和高帶寬內存。

GPU具有許多獨特的優點:

更快速的創新。GPU仍然遵循阿姆達爾定律(Amdahl』s law),效率提升通常是CPU速度提升的兩倍,而且發布周期短得多。

與CPU相比,GPU在處理同樣的工作負載時通常快10倍至100倍。

GPU尺寸小得多(大小只有CPU的1/6.5至1/20)。僅僅16台GPU加速的伺服器擁有與1000個CPU集群一樣強大的執行能力。

具有實時可視化和處理數據的能力。由於數據駐留在強大的圖形渲染引擎上,結果以極快的速度顯示!

數據獲取速度非常快。

近實時數據探索――實時數據探索和飛快的獲取速度通常意味著,數據科學家和機器學習演算法確實從使用GPU中獲益良多。

GPU資料庫在何處大放異彩?

就在一兩年前,資料庫行業的許多人士對GPU資料庫還不屑一顧,認為只是一陣風,可能只適用於小眾領域,與內存資料庫配合使用。他們表示,未來仍是傳統資料庫的天下。

然而,一些積極創新的公司不這麼認為。很快,使用GPU資料庫的現象大大普及開來,安裝於所有的垂直行業領域,包括金融、電信,甚至一向很晚採用新技術的政府部門。原因何在?簡而言之,GPU資料庫用於分析數據時大放異彩,投入僅為傳統資料庫的一小部分。

對於從來就不是為關係數據分析設計的Hadoop來說,GPU資料庫堪稱完美的補充。只要看看正在使用一批GPU伺服器的美國郵政總局,就可以了解其優勢。美國郵政總局管理遍布20萬條投遞路線的1.54億個地址,分析每個郵遞員的位置數據。所以,可想而知美國郵政總局有一個龐大的資料庫。

有了這些數據,美國郵政總局可以估計投遞時間,實時通知主管,並且優化臨時路線。得益於GPU資料庫,郵政總局可以迅速處理這些複雜的查詢,所用時間與載入網頁的時間相當。這給人留下了很深刻的印象。

GPU資料庫給廣告技術、金融、電信、零售、安全/ IT甚至能源行業帶來了大好的機會。它們在國防情報機構中也得到了廣泛的使用。

GPU加速的工作原理

誰得益於GPU資料庫?

雖然公司各部門從更快的查詢、更快的數據獲取和更低的IT成本中獲得的好處似乎不值一提,但從GPU資料庫獲得最大好處的其實是數據科學家。

快速的數據獲取和查詢意味著,數據科學工作的典型周期從幾天縮短到區區幾小時。其他工作負載可能會從幾小時縮短到幾分鐘,甚至幾秒鐘。為這些關鍵業務型數據科學和機器學習工作負載縮短這些周期,將使數據科學家由平常的「二等」資料庫用戶成為GPU資料庫的主要受益者。

GPU資料庫項目如何實施?

大多數GPU資料庫在雲端運行,適用於從IBM Bluemix到亞馬遜AWS的各種環境。然而,本地資料庫和混合架構也可以使用。一旦資料庫搭建完畢,可以使用基於行業標準的驅動程序,使用標準SQL來查詢數據,這些驅動程序包括:

JDBC和ODBC

Python、Jupyter和sklearn 等

R及其他機器學習庫

之後,擴大規模通常就跟為設備添加另一個GPU一樣簡單。由於每個GPU具有強大的計算能力,添加新的設備不太常見。實際上,藉助一些GPU資料庫,就可以在標準的2U伺服器中存儲和查詢多達100TB的原始數據。

對大多數GPU資料庫來說,整個搭建過程通常異常簡單,只需要極少的數據建模工作,不需要新的/昂貴的開發和使用技能。大多數GPU資料庫常常還與現有的生態系統兼容。它們可與你現有的數據源、數據採集工具,甚至商業智能(BI)、報告、分析和可視化工具協同運行。

結束語

鑒於現在數據量每兩年翻一番,預計今年年底存儲系統所容納的數據大約多達17.6萬億GB。但是大數據的用途完全取決於分析速度。藉助快速分析,你的數據才會以無法想像的方式為貴企業增添價值。

如果貴企業依賴傳統資料庫,可能已經在考慮適合自己的那種GPU資料庫。畢竟,貴企業系統面臨的要求只會越來越高。


點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

北京一軟體工程師離職後刪僱主網站源代碼被判刑五年

TAG:雲頭條 |

您可能感興趣

ACCESS資料庫
GPU資料庫公司Zilliz完成1000萬美元A1輪融資,加速GPU資料庫商業化進程
TCGA、GEO及SEER資料庫挖掘與應用學習會
MySQL資料庫
POLARDB:「比快再快點」的雲原生資料庫
ICDE:POLARDB定義雲原生資料庫
TCGA資料庫mRNA&lncRNA數據提取
LOGO 最新設計資料集
混合雲利器:VMware 上可運行 AWS RDS 資料庫
資料庫實現ArcGIS相交、融合功能
辦公資料隨身帶,東芝CANVIO PREMIUM升級版帶你飛
SAS-你還在手動配置ODBC連接資料庫嗎
SQLite 創建資料庫
PowerBI從SCCM資料庫中分析數據和KPI展現
Perl 資料庫連接
HTML5 Web SQL 資料庫
UCI機器學習資料庫的Python API介紹
阿里雲POLARDB資料庫為啥全線標配Intel「傲騰」?
CFPS和CHARLS資料庫分析技巧大指南
AWS擁抱混合雲,RDS雲計算關聯式資料庫支持VMware