Gartner 2019年十大數據和分析技術趨勢
處於數據和分析位置的領導人必須審視這些趨勢對業務帶來的潛在影響,並相應調整業務模式和運營,否則就有可能失去競爭優勢。
增強型數據分析,增強型數據管理,持續型智能,可解釋的 AI,數據結構,NLP/對話式分析,商業 AI 和 ML,區塊鏈和持久性內存伺服器共同構成了 Gartner 2019 年十大「數據和分析技術趨勢」。
最近兩天里,2 月 18 日-19 日,在悉尼舉行的 Gartner 數據與分析峰會上,增強型數據分析和可解釋的人工智慧成為焦點。
知名調研機構 Gartner 稱,增強型數據分析、持續型智能和可解釋的人工智慧(AI)是數據和分析技術的主要趨勢之一,並在未來三到五年內具有顯著的顛覆性潛力。
Gartner 副總裁兼傑出分析師 Donald Feinberg 認為,數字化顛覆帶來的挑戰——數據太多——也創造了前所未有的機遇。大量數據和由雲實現的日益強大的處理能力意味著現在可以大規模地訓練和執行必要的演算法,以最終兌現出 AI 的全部潛力。
Donald 表示,「任何企業的持續生存都將取決於靈活的,以數據為中心的架構,以響應不斷變化的速度。」
他還談道,「數字化業務需要大量複雜且分散式的數據、迅速行動以及持續型智能,這意味著僵化且集中式的架構和工具分崩離析。」
Gartner 研究副總裁 Rita Sallam,數據和分析領導者必須審視這些趨勢對業務帶來的潛在影響,並相應調整業務模式和運營,否則就有可能失去競爭優勢。
「數據和分析的形勢不斷發展,從支持內部決策到持續型智能,信息產品和任命首席數據官,」Rita 說道,「深入了解它們對於推動這種不斷變化的技術趨勢,並根據業務價值對它們進行優先排序至關重要。」
Gartner 建議數據和分析領導者與高級業務負責人討論他們的關鍵業務優先順序,並探索以下主要趨勢如何實現這些優先順序。
趨勢 1:增強型數據分析(Augmented Analytics)
作為數據分析的高級增強階段,增強分析能為分析計劃帶來更多自動化動能以及創新洞察力。因為在正式進入數據分析之前,都需要對數據進行抽取、清洗、融合等準備工作,以提高數據分析的效率和準確性,更利於決策。而增強分析則能夠幫助普通用戶在沒有數據科學專家或IT人員協助的情況下,訪問有效數據,並對理論和假設情況展開測試與驗證。
增強型數據分析側重於增強智能的特定領域,利用機器學習(machine learning)轉變分析內容的開發、使用與共享方式。
目前國內正在加強這一技術突破的包括幾大數據計算廠商,如阿里雲、百度雲、華為雲等,通過對百萬數據的計算與匯聚,實現對現實算力的優化,以在未來如智慧大腦領域實現更多突破。
Gartner預測,到 2020 年,增強分析將成為分析和商業智能解決方案的主要賣點,相關業務負責人應該在平台功能趨於成熟時率先採用增強型分析。
機器學習和人工智慧、增強型分析將為數據和分析市場帶來顛覆,因為它將徹底改變開發、消費和共享分析內容的方式,可使數據準備、洞察力獲取和洞察力可視化這個過程實現自動化,在許多情況下無需專業的數據科學家。
趨勢 2:增強型數據管理(Augmented data Management)
增強型數據管理利用機器學習功能和 AI 引擎來製作數據管理類別,包括數據質量、元數據管理、主數據管理、數據集成以及資料庫管理系統(DBMS)自我配置和自我調整。
增強型數據管理將元數據由僅用於審計、沿襲和報告變成支持動態系統。元數據正在從被動變為主動,並且正在成為所有 AI / ML 的主要驅動因素。
它可以自動執行許多手動任務,為技術水平較低的用戶提供使用數據的機會。它還有助於高技能的技術資源專註於更多的增值任務。
趨勢 3:持續型智能(Continuous Intelligence)
持續性數據不僅僅是一種實時數據的新方式;相反,它是一種設計模式,其中實時分析與業務運營相結合,處理當前和歷史數據以規定響應事件的行動。
它提供決策自動化或決策支持。持續型智能利用多種技術,比如增強型分析、事件流處理、優化、業務規則管理和機器學習。
「持續型智能代表了數據和分析團隊工作的重大變化,」Gartner 研究副總裁麗 Sallam 人文,「分析和 BI(商業智能)團隊在 2019 年幫助企業做出更明智的實時決策,這是一個巨大的挑戰 - 也是一個巨大的機會。它可以被看作是運營商業智能的終極目標。」
到 2022 年,超過一半的重要新業務系統將採用持續性智能,使用實時上下文數據來改善決策。
趨勢 4:可解釋的 AI(Explainable AI)
人工智慧模型越來越多地用於增強和取代人類決策。但 AI 解決方案如何解釋為什麼他們得出某些結論?
大多數這些先進的 AI 模型都是複雜的黑盒子,無法解釋他們為何達到特定的推薦或決定。
這是可解釋的人工智慧的用武之地。
比如說,數據科學和機器學習平台中的可解釋型AI可自動生成模型的解釋,用自然語言從準確性、屬性、模型統計和特徵等方面解釋模型。
趨勢 5:圖形分析(Graph)
圖形分析是一組分析技術,可幫助企業探索交易,流程和員工等實體之間的關係。
到 2022 年,圖形處理和圖形資料庫管理系統的應用將以每年 100%的速度增長。
根據 Gartner 的說法,圖形數據存儲可以跨數據孤島有效地建模,探索和查詢數據,但是對專業技能的需求限制了它們的採用。
由於需要在複雜數據中提出複雜問題,圖形分析將在未來幾年內增長,這在使用 SQL 查詢時並不總是切實可行或甚至可能。
趨勢 6:數據結構(Data Fabric)
數據結構都是關於單一且一致的數據管理框架。它著眼於在分散式數據環境中實現無摩擦訪問和數據共享,而不是孤立存儲。
到 2022 年,定製數據結構配置將主要用作靜態基礎架構,迫使組織進入新一波的成本控制浪潮,以完全重新設計更動態的數據網格方法。
趨勢 7:NLP /會話分析(NLP/Conversational Analytics)
到 2020 年,50%的分析查詢將通過搜索、自然語言處理(NLP)或語音生成,或者將自動生成。
分析複雜的數據組合併使組織中的每個人都可以訪問分析的需求將推動更廣泛的採用,使分析工具將如同搜索界面或與虛擬助手的對話一樣簡單。
根據另一項單獨研究,NLP 用例非常龐大,預計到 2020 年 NLP 市場價值將達到 134 億美元。
趨勢 8:商用的人工智慧和機器學習(Commercial AI and ML)
到 2022 年,75%利用 ML 和 AI 技術的新終端用戶解決方案將採用商業解決方案,而非開源平台的方式構建。
商業供應商已經在開源生態系統中創建了連接器,它們為組織提供了擴展 AI 和所需的功能,例如項目和模型管理、透明度、復用、數據沿襲、平台凝聚力以及開源技術所缺乏的集成。
趨勢 9:區塊鏈(Blockchain)
企業可以使用區塊鏈來解決數據管理問題嗎?
數據管理對 CTO 來說是一個持續不斷的挑戰,但 Bluzelle 首席執行官 Pavel Bains 認為區塊鏈技術可以提供解決方案。
區塊鏈和分散式賬本技術的核心價值主張是在不受信任的參與者網路中提供去中心化的信任。區塊鏈對於數據分析的潛在影響很大,尤其是對利用參與者關係和交互的那些企業的影響。
然而,在四到五個主要區塊鏈技術成為主導之前,還需要幾年時間。
但是,區塊鏈是數據源,而不是資料庫,不會取代現有的數據管理技術。
趨勢 10:持久性內存伺服器(Persistent Memory Servers)
持久存儲器技術旨在降低採用內存計算(IMC)的架構的成本和複雜性。持久性內存代表 DRAM 和 NAND 快閃記憶體之間的新內存層,可為高性能工作負載提供經濟高效的大容量內存。
「數據量正在激增,實時將數據轉化為價值的緊迫性正以同樣快的速度增長,」Donald 表示,「新的伺服器工作負載不僅要求更快的 CPU 性能,還要求大容量內存和更快的存儲系統。」
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
TAG:機器之能 |