當前位置:
首頁 > 科技 > 百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用

百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用

從 2013 年開始,百度網頁搜索部先後開源了 sofa-pbrpc,Tera 和 MIP 等精品技術。Tera 是百度網頁搜索部開源的大型分布式表格系統,其數十 PB 量級的數據存儲和百萬 QPS 的實時數據訪問能力,支撐著百度搜索引擎的鏈接存儲、實時索引篩選、實時用戶行為分析等多個核心系統。


在 GitHub 社區里,Tera 佔據超過 1.3k 的 star,是百度開源項目中最受歡迎的項目之一。本次百度技術沙龍,將為大家深入介紹 Tera 的架構設計與實踐,以及 Tera 在百度搜索引擎中的應用。


活動時間:2017 年 5 月 20 日 14:00~17:00

活動地點:海淀區中關村創業大街 48 號 車庫咖啡二層


活動日程:

百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用


開場演講:百度開源最新狀況


講師介紹:

百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用



譚中意, 工程效率部資深工程師,架構師顧問團成員,百度工作 6 年多,目前負責平台化相關的技術工作。曾在多個開源社區工作過,對開源社區有較多經驗。

主題一:Tera 大型分布式表格系統的架構設計與實踐


講師介紹:

百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用



鄭然,百度網頁搜索部資深工程師。2009 年加入百度網頁搜索部,在網頁搜索部工作的 7 年時間裡,一直從事百度搜索引擎的架構研發工作,先後負責過百度搜索引擎的大規模索引構建工作,大數據離線平台架構工作,微服務架構以及大規模在線服務治理等工作。目前主要做 Tera 分布式存儲系統的研發工作。

演講概要:


Tera 是一個高性能、可伸縮的結構化數據存儲系統,被設計用來管理搜索引擎萬億量級的超鏈與網頁信息。為實現數據的實時分析與高效訪問,百度使用按行鍵、列名和時間戳全局排序的三維數據模型組織數據,使用多級 Cache 系統,充分利用新一代伺服器硬體大內存、SSD 盤和萬兆網卡的性能優勢,做到模型靈活的同時,實現了高吞吐與水平擴展。鄭然在演講過程中會詳細介紹 Tera 的架構設計,包括數據模型,整體架構,高可用技術和性能優化等內容。


主題二、Tera 在百度搜索引擎中的應用


講師介紹:

百度沙龍免費招募:深度解讀開源資料庫Tera架構與應用



齊志宏,現任百度網頁搜索基礎架構 & 調研架構團隊技術經理。曾供職騰訊,2012 年加入百度網頁搜索,從事搜索架構相關的技術管理工作,目前主要負責百度海量數據存儲系統相關工作。


演講概要:


演講重點介紹 Tera 作為核心技術,是如何支撐百度鏈接存儲,實時索引篩選以及實時用戶行為分析等多個重要系統的。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 InfoQ 的精彩文章:

數字產業時代,和Visa來一場支付服務的頭腦風暴
技術漫談:為何KPI毀了索尼,而OKR卻成就了谷歌?
甲骨文副總裁:一位 25年IT 老兵的觀雲心得

TAG:InfoQ |

您可能感興趣

谷歌開源TensorNetwork資料庫,加快運算速度百倍!
微軟收購開源資料庫廠商Citus Data,雲資料庫服務能力再填新砝碼
微軟收購開源創企 Citus Data,加強資料庫業務
開源Android或將收費
抄襲谷歌?紅芯瀏覽器再度回應:基於Chromium開源項目
開源應用伺服器WildFly 12:首次發布新季度交付模式
VMware收購開源應用庫Bitnami擴大多雲戰略
用於運行和訓練深度神經網路的開源 C+庫——nGraph
Darkon:可更好理解深度學習模型的開源工具包
DeepHash-深度學習哈希開源庫
開源資料庫中間件:Kingshard
Pulumi開源基礎架構,能簡化AWS應用程序部署工作
開源項目精選:機器學習開源框架 TensorFlow
Midori:輕量級開源 Web 瀏覽器
英特爾宣布投資SiFive,攜手開源架構挑戰Arm?
微軟收購開源創企CitusData 欲爭奪雲計算市場業務
微軟自證開源決心:GitHub 私有庫免費無限開放!
RollViewPager圖片輪播效果開源框架的使用
Joplin:開源加密筆記及待辦事項應用
開始使用 Joplin 吧,一款開源筆記應用