當前位置:
首頁 > 最新 > Gartner預測:90%的數據湖將毫無用處

Gartner預測:90%的數據湖將毫無用處

Gartner此前曾預計,到2018年,90%的數據湖將毫無用處,因為它們充滿了原始數據,很少有人會使用這些技術。

在當前的技術領域,沒有什麼能像人工智慧(AI)那樣引起人們的好奇和興奮。而AI的潛在優勢,也剛剛開始在企業內顯現出來。

然而,企業中人工智慧的增長受到了阻礙,因為數據科學家通常無法獲得建立有效人工智慧模型所需的相關數據。這些數據專家經常被迫僅依賴於一些已知的來源,如現有的數據倉庫,而並不能利用他們所需的所有實時的真實數據。此外,許多公司很難有效且經濟地確定大量數據的業務環境和質量。鑒於這些困難,很容易理解AI在加速和應用過程中的一些歷史障礙。

數據對AI有價值,用戶才能自信而安全地使用它來訓練AI模型。實現這一目標的唯一方法是以「智能數據」為基礎。

多年來,我們已經超越了數據的收集和聚合,以驅動特定的業務應用程序(數據1.0),組織已經能夠創建定義明確的流程,允許任何人訪問數據,但這還遠遠不夠,我們現已達到了需要智能數據才能真正為企業範圍的轉型提供動力的數據(數據3.0)。

例如,考慮一家公司將嘗試重新定義其與客戶群的傳統關係所面臨的挑戰,引導這種顛覆性變革需要來自眾多數據源,諸如資料庫,數據倉庫,應用程序,大數據系統,物聯網,社交媒體等的輸入,各種數據類型,諸如結構化,半結構化和非結構化,以及各種位置,諸如本地,雲,混合和大數據等因素。

如今,數據湖正在成為信息變革時代所需大量不同數據的首選存儲庫。但沒有智能數據,這些湖泊價值不大。 Gartner此前曾預計,到2018年,90%的數據湖將毫無用處,因為它們充滿了原始數據,很少有人會使用這些技術。

相比之下,通過智能數據,數據科學家可以進行類似Google的搜索,並立即發現相關數據的所有潛在來源。智能數據可以節省大量寶貴的時間,數據科學家可能不得不花費時間來收集、組裝和改進模型所需的數據。

那麼如何確保數據真正智能化?通過構建端到端數據管理平台,該數據管理平台本身使用機器學習和AI功能,由廣泛的元數據驅動,以提高平台的整體生產力。元數據是釋放數據價值的關鍵。

如果用戶希望提供全面,相關且準確的數據來實施人工智慧技術,那麼就需要查看四種不同的元數據類別:

1.技術元數據 - 包括資料庫表和列信息以及有關數據質量的統計信息。

2.業務元數據 - 定義數據的業務上下文以及它參與的業務流程。

3.操作元數據 - 有關軟體系統和流程執行的信息。

4.使用元數據 - 有關用戶活動的信息,包括訪問的數據集,評級和評論。

應用於此元數據集合的AI和機器學習不僅有助於識別和推薦正確的數據,該數據也可以自動處理——無需人工干預,使其適用於企業AI項目。

數字化轉型,正在迫使組織以不同的方式審視數據,這是成為「獵物或捕食者」的問題。如今,有實時可用的數據和工具訪問,可以實現快速分析,將促進了人工智慧和機器學習,並允許過渡到數據優先的方法。由於數字化、數據爆炸以及人工智慧對企業的變革影響,人工智慧帶來的信息技術變革正在蓬勃發展。

顯然,越來越多的數據輸入可能影響人工智慧應用程序的決策,因此組織需要對相關且有影響力的內容進行分類整理。然而,在您的組織採用人工驅動的數據管理方法之前,請考慮以下問題:

您希望從AI中獲得什麼?


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國IDC圈 的精彩文章:

青雲QingCloud發布SD-WAN服務 背後憋了什麼大招?

TAG:中國IDC圈 |