當前位置:
首頁 > 最新 > Apache新成員:LinkedIn分散式數據集成框架Gobblin

Apache新成員:LinkedIn分散式數據集成框架Gobblin

作者|Abhishek Tiwari

譯者|核子可樂

編輯|Emily

AI 前線導讀:LinkedIn 又向 Apache 基金會貢獻了一個新的開源項目:Apache Gobblin!

更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)

下文轉載翻譯自 LinkedIn Engineering 博客:

Gobblin 是一套分散式數據集成框架,旨在簡化大數據集成工作當中的各類常見任務,具體包括數據流與批量生態系統的提取、複製、組織與生命周期管理。

Gobblin 的發展速度非常驚人。自 2014 年 12 月問世以來,Gobblin 一直在開源世界當中快速消化海量大數據資源。目前,其已經由原本主要立足 Hadoop 之上以 mapreduce 模式運行的離線數據接收框架,逐步轉化為一套全面而強大的生態系統,且功能涵蓋執行環境、數據速度、規模化、連接器以及其它生態系統增強領域中的不同維度。

LinkedIn 擁有豐富的開源項目貢獻歷史,並已經成為 Apache 軟體基金會(旗下擁有 Kafka、Samza 以及 Helix 等多個項目)中的重要成員。延續這一趨勢,我們相信 Gobblin 已經準備好加入 Apache 項目家族的行列。因此,我建議 Gobblin 轉型為 Apache 孵化器項目。令人振奮的是,我們的提案得到了孵化器項目委員會(簡稱 PMC)的一致認可,並於 2017 年 2 月開始了我們的孵化項目轉型旅程。自此以來,我們完成了必要的內部轉型流程並貢獻了相關代碼,並正式開始 Apache 旗下的發展道路。

為何選擇 Apache?

Apache 軟體基金會(簡稱 ASF)為目前全球最具影響力的開源機構之一。Apache 項目支持著超過 2 億個網站(占互聯網網站總數的一半),並成為世界上眾多最具價值企業的(技術)支柱。Gobblin 已經陸續得到 LinkedIn、蘋果、Paypal 等企業以及 CERN、Sandia 國家實驗室等研究機構的廣泛採用,我們相信其作為 Apache 項目將繼續維持穩定的運作與持久能力,並允許不斷發展的技術社區在「Apache 道路」上繼續為其添磚加瓦。

Gobblin 未來展望

自我們發布上一篇博文以來,Gobblin 在內部與外部社區貢獻的共同推動下迎來了一系列重大變化。下面,我們將概述這一階段中 Gobblin 中出現的令人興奮的增強功能:

展望未來,我們將致力於繼續推動 Gobblin 項目的快速發展,同時幫助社區持續發展並適應「Apache 道路」。

自去年年初加入 Apache 孵化器計劃以來,我們已經在這方面迎來良好的進展勢頭。Apache Gobblin 社區成員在 Gobblin 生態系統當中提出、建立並啟動了一系列關鍵性發展成果,具體包括:

我們還進一步邀請大家體驗 Gobblin 並為該項目的 Apache 發展之旅貢獻力量。

感興趣的讀者可以通過多種方式加入 Apache Gobblin 社區,包括貢獻新功能、進行技術佈道,或者幫助社區更新說明文檔。請點擊此處加入 Gobblin 的用戶或開發者郵件列表。也可以點擊此處訪問 Gitter 頻道。

https://engineering.linkedin.com/blog/2018/01/gobblin-enters-apache-incubation

今日薦文


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI漫遊 的精彩文章:

CNN對抗補丁之謎

TAG:AI漫遊 |