百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用
從 2013 年開始,百度網頁搜索部先後開源了 sofa-pbrpc,Tera 和 MIP 等精品技術。Tera 是百度網頁搜索部開源的大型分布式表格系統,其數十 PB 量級的數據存儲和百萬 QPS 的實時數據訪問能力,支撐著百度搜索引擎的鏈接存儲、實時索引篩選、實時用戶行為分析等多個核心系統。
在 GitHub 社區里,Tera 佔據超過 1.3k 的 star,是百度開源項目中最受歡迎的項目之一。本次百度技術沙龍,將為大家深入介紹 Tera 的架構設計與實踐,以及 Tera 在百度搜索引擎中的應用。
活動時間:2017 年 5 月 20 日 14:00~17:00
活動地點:海淀區中關村創業大街 48 號 車庫咖啡二層
活動日程:
開場演講:百度開源最新狀況
講師介紹:
譚中意, 工程效率部資深工程師,架構師顧問團成員,百度工作 6 年多,目前負責平台化相關的技術工作。曾在多個開源社區工作過,對開源社區有較多經驗。
主題一:Tera 大型分布式表格系統的架構設計與實踐
講師介紹:
鄭然,百度網頁搜索部資深工程師。2009 年加入百度網頁搜索部,在網頁搜索部工作的 7 年時間裡,一直從事百度搜索引擎的架構研發工作,先後負責過百度搜索引擎的大規模索引構建工作,大數據離線平台架構工作,微服務架構以及大規模在線服務治理等工作。目前主要做 Tera 分布式存儲系統的研發工作。
演講概要:
Tera 是一個高性能、可伸縮的結構化數據存儲系統,被設計用來管理搜索引擎萬億量級的超鏈與網頁信息。為實現數據的實時分析與高效訪問,百度使用按行鍵、列名和時間戳全局排序的三維數據模型組織數據,使用多級 Cache 系統,充分利用新一代伺服器硬體大內存、SSD 盤和萬兆網卡的性能優勢,做到模型靈活的同時,實現了高吞吐與水平擴展。鄭然在演講過程中會詳細介紹 Tera 的架構設計,包括數據模型,整體架構,高可用技術和性能優化等內容。
主題二、Tera 在百度搜索引擎中的應用
講師介紹:
齊志宏,現任百度網頁搜索基礎架構 & 調研架構團隊技術經理。曾供職騰訊,2012 年加入百度網頁搜索,從事搜索架構相關的技術管理工作,目前主要負責百度海量數據存儲系統相關工作。
演講概要:
演講重點介紹 Tera 作為核心技術,是如何支撐百度鏈接存儲,實時索引篩選以及實時用戶行為分析等多個重要系統的。
※數字產業時代,和Visa來一場支付服務的頭腦風暴
※技術漫談:為何KPI毀了索尼,而OKR卻成就了谷歌?
※甲骨文副總裁:一位 25年IT 老兵的觀雲心得
TAG:InfoQ |
※谷歌開源TensorNetwork資料庫,加快運算速度百倍!
※微軟收購開源資料庫廠商Citus Data,雲資料庫服務能力再填新砝碼
※微軟收購開源創企 Citus Data,加強資料庫業務
※開源Android或將收費
※抄襲谷歌?紅芯瀏覽器再度回應:基於Chromium開源項目
※開源應用伺服器WildFly 12:首次發布新季度交付模式
※VMware收購開源應用庫Bitnami擴大多雲戰略
※用於運行和訓練深度神經網路的開源 C+庫——nGraph
※Darkon:可更好理解深度學習模型的開源工具包
※DeepHash-深度學習哈希開源庫
※開源資料庫中間件:Kingshard
※Pulumi開源基礎架構,能簡化AWS應用程序部署工作
※開源項目精選:機器學習開源框架 TensorFlow
※Midori:輕量級開源 Web 瀏覽器
※英特爾宣布投資SiFive,攜手開源架構挑戰Arm?
※微軟收購開源創企CitusData 欲爭奪雲計算市場業務
※微軟自證開源決心:GitHub 私有庫免費無限開放!
※RollViewPager圖片輪播效果開源框架的使用
※Joplin:開源加密筆記及待辦事項應用
※開始使用 Joplin 吧,一款開源筆記應用