當前位置:
首頁 > 科技 > Hadoop 之父 Doug Cutting:Hadoop 天然契合 AI 發展需求

Hadoop 之父 Doug Cutting:Hadoop 天然契合 AI 發展需求

Hadoop 之父 Doug Cutting:Hadoop 天然契合 AI 發展需求

據了解,大數據開源框架 Hadoop 之父 Doug Cutting 十年前創建 Hadoop 架構的時候,僅僅只是為了使得網路搜索更快更完整。但由於其創造性地實現了多運算設備的分散式計算,不僅運算性能得以大幅度提升,更使得系統的成本得以大幅度降低,並適應當今大數據乃至人工智慧時代下的海量數據技術需求,該技術也逐漸被各行各業所採用。比如,它幫助 Facebook 分析其每月超過 16 億的用戶流量,幫助 Visa 發現了數十億美元的金融欺詐等。

由於 Hadoop 深受客戶歡迎,許多公司都推出了各自版本的 Hadoop,也有一些公司則圍繞 Hadoop 開發產品。在 Hadoop 生態系統中,規模最大、知名度最高的公司則是 Cloudera,甚至連 Hadoop 之父 Doug Cutting 本人也加入了這家公司擔任首席架構師職務。近日,我們對他進行了採訪。

Hadoop+人工智慧,大有可為

「因為 AI 本身就是一種大數據的應用。特別是在對於 AI 的系統進行訓練的時候,使用的數據越多,AI 系統就越先進。」因此,Doug Cutting 認為 Hadoop 和 AI 之間是非常適合、非常匹配的一項技術。

雖然深度學習隨著大數據的紅利消耗殆盡,其天花板日益迫近(深度學習的局限性尤其體現在依賴大規模標註數據和難以有效利用先驗知識等方面),以至於很多人開始認為知識圖譜將成為人工智慧發展的關鍵。比如 Google 為了讓人們網路搜索更加完整,早在 2012 年便已經推出了知識圖譜項目,並且越來越受行業認可。

對此,Doug Cutting 堅持認為,在推動人工智慧的過程中,知識圖譜的方法沒有統計學方法(即深度學習)那麼成功。「人工智慧在當今取得的成功,主要依靠的是統計學的方法,也就是基於巨量數據的各種模型的訓練,而不是通過知識工程的方式。知識工程在八十年代就已經非常流行了,在我還當學生的時候知識工程就很流行。」

雖然 Doug Cutting 並不認為知識圖譜的方式永遠不會成功,但他也強調「目前的現狀當中(知識圖譜)的確不如統計學的方法更加有效」。


開源能使生態更加繁榮和兼容

據了解,得益於技術的開源性,Hadoop 並不是某一個單獨的技術,而是基於多種技術組成的系列家族,整個技術系列是在不斷發展和演進之中,按照 Doug Cutting 的說法那就是:「圍繞著 Hadoop 現在已經形成了非常強大的生態系統,Hadoop 整體生態系統的演進和發展並不受制於其中的任何一種組成的技術。」這就意味著生態更加兼容。

比如,Hadoop 雖然最初只是針對搜索引擎而開發的,在如今 AI 與 IoT 物聯網領域也已經出來了各種各樣的更具針對性的性能也更佳好的開源軟體,這些新的開源軟體是否會取代 Hadoop?Doug Cutting 的答案是不會!「因為在開源的世界當中,競爭的邏輯是不一樣的,沒有哪個公司是擁有開源的技術。每當開源的技術有了新的發明或進展,開源群體的每一分子都會受益於其中。比方說如果在有一些領域會出現新的技術,在某些方面會優於 Hadoop,那 Cloudera 也會毫無疑問去採納這樣的技術放到我們的解決方案當中去交付給客戶。」Doug Cutting 如此表示。

這裡最明顯的一個例子便是加州大學伯克利分校 AMP 實驗室所開發的 Spark,Spark 是一種與 Hadoop 相似的開源集群計算環境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負載方面表現得更加優越,尤其是 2014 年 10 月他們完成了 Peta sort 的實驗,這標誌著 Spark 越來越接近替代 Hadoop MapReduce 了。儘管創建 Spark 是為了支持分散式數據集上的迭代作業,但是實際上它是對 Hadoop 的補充,可以在 Hadoop 文件系統中並行運行。實際上 Cloudera 也已經將 Spark 納入到了他們的服務之中了。

Doug Cutting 強調,「新的技術的湧現,能夠使得開源的整個生態系統進一步得到發展和改進,這對於整個開源的生態系統來說是一件好事。」

另外 Doug Cutting 還表示,他們也在構建更多基於 Spark 機器學習的工具,與之相關的有一個項目叫 Apache Spot,它是一個網路安全的能力,幫助的客戶保護他們的網路安全,免遭黑客的攻擊,「這是我們在 Hadoop 和 Spark 基礎上進一步的推進。」Doug Cutting 表示。


開源軟體另一巨大優勢就是低成本

Doug Cutting 認為對於企業而言,成本永遠都是他們不能不考慮的事情,而開源則在成本上有著天然的優勢。「首先我們的軟體是開源的,而且我們所有解決方案能夠使用普通的商用硬體,所以和上一代相比成本有大幅度降低。而且我們認為今天這種低成本的架構是可以去運行很多其他的應用,只不過有很多其他的應用暫時還沒有用上低成本的架構,還有進一步降低成本的潛力。」

Doug Cutting 發現目前除了在雲環境下,亞馬遜、微軟和谷歌的雲平台之上會有一些用戶,他們的大數據應用使用的是專有的商用軟體服務。「但是我認為假以時日,這些客戶會再次認識到在雲中使用開源的大數據解決方案,具備成本更低、質量更高的優勢,因為使用開源的解決方案使客戶可以在不同的雲環境之間自由遷移。」Doug Cutting 如此表示:「迄今為止,這些在大數據領域的商業或者專有軟體給 Cloudera 帶來的威脅,我認為並不是一個嚴重的威脅。」

雲模式將越來越高,但不可能達到 90%

目前在 Hadoop 的部署方面,業內已經越來越傾向於雲模式了,Doug Cutting 也認為雲計算、雲模式使得客戶在使用 Hadoop 的方式上具有了更大的靈活性,「如果他們把 Hadoop 用本地安裝運行的形式來使用的話,他們往往是建一個單個很大的集群來支持各種不同的應用,並且擁有一個統一的數據拷貝。如果在雲環境當中來運行 Hadoop,他們的數據會在亞馬遜存儲之類的系統當中,雲環境供應商已經幫助他們管理了數據的拷貝。與此同時,在雲環境當中使用 Hadoop,在這樣的使用場景中,客戶可以針對不同的應用創建應用不同的集群,而這樣的集群開關或者是規模的伸縮,都可以按需進行,這樣對於客戶來說,他們對於應用有了更好控制的同時也增加了靈活性。」

另外,「由於有雲計算使得一個公司當中非 IT 部門,例如運營、製造、市場營銷部門都能夠自行採購一些服務並且加以運行,他們的控制能力和靈活性都大大增加了。」Doug Cutting 認為雲計算也是促進了 IT 和數據由過去那種集中化的模式向分散化、自助化轉變的進程。

而 Cloudera 大概在 3 年之前順應趨勢推出了相關的雲服務,「就 Cloudera 而言,我們目前的業務以雲模式做的佔到了 15%到 20%,這肯定會增長。我預計將來會達到 40%到 60%,但是不會到 90%。」Doug Cutting 認為雲端部署與閑暇實體部署在未來若干年當中會長期共存下去。

「比方說對於一些數據量非常之大,而且本身企業的處理資源很強的客戶來說,很多的工作負載特別是像需要全天候永續運行的工作負載是放在本地的物理機上運行,經濟實用性更強,擴展性也更強。另外對於其他一些類型的工作負載,包括對於一些剛剛起步的企業來說,可能放在雲環境當中運行更加合適。還有一些工作負載或者是數據的處理,由於受制於法律上的要求,規定必須要放在本地的物理機當中來運行的。」Doug Cutting 建議。

本文 Hadoop 之父 Doug Cutting:Hadoop 天然契合 AI 發展需求來自動點科技.

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

特朗普說,蘋果承諾將在美國建 3 座工廠以促進就業
雲犀直播獲賽富(亞洲)兩千萬 pre-A 輪投資
終於,Adobe 將在 2020 年完全終止對 Flash 的支持
Google 的 SOS 警報功能在災難來臨時能救你一命
滴滴系三名高管進駐 ofo,後者正尋求軟銀戰略投資

TAG:動點科技 |

您可能感興趣

為刺激VR/AR領域發展 Digital Catapult再次啟動Augmentor項目
澳大利亞的船舶製造業繁榮發展Australian Ships for China and the World?
多元化發展?Husqvarna Svartpilen 701 flat tracker測試捕獲
亂侃:RT-Thread、Alios Things、Huawei LiteOS誰家強?國產RTOS迎發展新機遇
泰斗Michael Jordan Diss李開復,AI產業發展沒你想的那麼好
ToryBurc創始人的獨特Fashion發展歷程
帶你了解comme des garcons的發展史
Windows從入門到放棄-Windows的發展
前有iPhone7後有iPhoneX,iPhone8該如何發展?
郭明基:2018年MacBook系列產品比iPhone、iPad發展得更好
NetSpeed與Esperanto合作推動人工智慧系統級晶元的發展
2018年Automechanika Ho Chi Minh City盛大開幕,為發展蓬勃的越南汽車服務業注入新動力
不要誇大人工智慧,AI泰斗Michael Jordan Diss李開復,AI產業發展沒你想的那麼好
Aus評級表明ZombiU來到Xbox Kerbal太空計劃飛速發展到PS4
HK Audio 新一代Lucas Nano立體聲PA系統向輕重量發展
蘋果或引入Ripple技術,以支持Apple Pay發展
遊戲發展史——Play Station的「逆襲」
神評論|理性評價Twice、BLACKPINK、GFriend未來的可能性及發展路線?網友:喜歡black pink
Ripple聯合創始人Chris Larsen:稱現在是區塊鏈發展的最好時代
華為與Intel、Microsoft、視博雲等攜手合作,推進Cloud VR產業繁榮發展