當前位置:
首頁 > 知識 > HBase全網最佳學習資料匯總

HBase全網最佳學習資料匯總

前言

HBase這幾年在國內使用的越來越廣泛,在一定規模的企業中幾乎是必備存儲引擎,互聯網企業阿里巴巴、京東、小米都有數千台的HBase集群,中國電信的話單、中國人壽的保單都是存儲在HBase中。注意大公司有數十個數百個HBase集群,此點跟Hadoop集群很不相同。另外,數據需求,很多公司是mysql+hbase+hadoop(spark),滿足關係型資料庫需求,滿足大規模結構化存儲需求,滿足複雜分析的需求。如此流行的原因來源於很多方面,如:

  • 開源繁榮的生態:1. 任何公司倒閉了,開源的HBase還在 2.幾乎每家公司都可以去下載源碼,改進她,再反饋給社區,就如阿里已經反饋了數百個patch了。加入的人越多,引擎就越好

  • 跟HADOOP深度結合:本就同根同源,在數據存儲在HBase後,如果想複雜分析,則非常方便

  • 高擴展、高容量、高性能、低成本、低延遲、稀疏寬表、動態列、TTL、多版本等最為關鍵,起源google論文,發揚社區及廣大互聯網公司,設計之初就是為存儲互聯網,後經過多年的改進升級,如今已經是結構化存儲的事實標準

以下資料會一直更新中......請大家關注!

書籍

最好買紙質書籍,集中時間看下

  • HBase權威指南(HBase: The Definitive Guide):理論多一些

  • HBase實戰:實踐多一些

總結性

  • HBase2.0: HBase2.0 :預計今年會發布,hbase2.0是革命性的版本

  • HBase Phoenix:Apache Phoenix與HBase:HBase之上SQL的過去,現在和未來

  • 社區hbase博客:https://blogs.apache.org/hbase/

方法論

  • HBase使用場景和成功案例 存儲互聯網的初心不變

  • 一種基於物聯網大數據的設備信息採集系統及方法:怎麼使用HBase、sparkStreaming、redis處理物聯網大數據

各大公司的實踐

基本圍繞在用戶畫像、安全風控、訂單存儲、交通軌跡、物理網、監控、大數據中間存儲、搜索、推薦等方面:

  • 阿里巴巴-大數據時代的結構化存儲HBase在阿里的應用實踐:講述在阿里巴巴集團的實踐,HBase在阿里集團已經10000台左右,主要在訂單、監控、風控、消息、大數據計算等領域使用

  • 阿里巴巴搜索-Hbase在阿里巴巴搜索中的完美應用實踐:講述在搜索場景下hbase的應用及相關的改進

  • 滴滴-HBase在滴滴出行的應用場景和最佳實踐:統計結果、報表類數據、原始事實類數據、中間結果數據、線上系統的備份數據的一些應用

  • HBase在京東的實踐 :跟阿里一樣,京東各個業務線使用了HBase,如:風控、訂單、商品評價等

  • 中國人壽基於HBase的企業級大數據平台:使用一個大跨表存儲所有的保單,HBase寬表的實踐

  • HBase在Hulu的使用和實踐:用戶畫像、訂單存儲系統、日誌存儲系統的使用

  • Apache HBase at Netease:在報表、監控、日誌類業務、消息類業務、推薦類業務、風控類業務有所使用,另外講述了一些優化的點。

  • 10 Million Smart Meter Data with Apache HBase:講述Hitachi為什麼選擇hbase及在HBase方面的應用

  • G7:如何用雲計算鏈接30萬車輛--EMR&Hbase 在物聯網領域的實踐及解決方案 講述了怎麼使用spark及hbase來滿足物聯網的需求

HBase資料庫

  • HBase:https://pan.baidu.com/s/1jILzgns

  • 知乎HBase討論:https://www.zhihu.com/topic/19600820/hot

結尾

這些資料是筆者整理,以供有大規模結構化需求的用戶及HBase愛好者學習交流,以使用HBase更好的解決實際的問題。

文中有很多加鏈的內容,請點此查看所有鏈接:https://yq.aliyun.com/articles/169085

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲棲社區 的精彩文章:

循環遞歸RNN,序列建模套路深(深度學習入門系列之十三)
關於機器學習演算法 你需要了解的東西
十年磨一劍,阿里巴巴企業級數據管理平台:iDB
阿里雲發布ECS企業級產品家族,涵蓋173個應用場景

TAG:雲棲社區 |

您可能感興趣

Python學習資料匯總(上)
Python學習資料大全「視頻+文檔」
資料 Python學習材料
Ian Goodfellow:生成對抗網路 GAN 就是強化學習(超全資料)
Ian Goodfellow:生成對抗網路 GAN 就是強化學習 超全資料
醫學SCI之美國生物科學資料庫BIOSIS Previews
UCI機器學習資料庫的Python API介紹
Oracle 資料庫最佳實踐
華為全球發布AI-Native資料庫GaussDB
華為面向全球發布AI-Native資料庫GaussDB
遊戲資料庫TcaplusDB
乾貨分享⑧|台灣團輔資料:Learning to learn——學習如何學習
PHP學習資料推薦
DBA之Oracle資料庫的備份恢復
雲資料庫TencentDBforCTSDB
一周 Github Trending 熱門項目,最全中華古詩詞資料庫
資料庫學習計劃——learning plan
Mariadb學習總結(二):資料庫及表管理
MongoDB 創建資料庫
純分享兩個學習資料:OpenCV-Python-機器學習-Qt相關