Wikibon:2018大數據和機器學習的預測
本文節選譯自wikibon文章
有關大數據的一切——技術、產品、市場、應用、以及期望——正在被重新定義。2018年將是大數據完全嵌入商業版圖的一年。
大數據的科學實踐的階段已經過去。經歷了痛苦的嘗試和失敗,企業已經從大數據實踐中積累了必要的經驗,並將其轉化為商業價值。雖然水平方法依然重要(如數據湖和定製分析管道),但是通過API和應用程序訪問,這類更加易於開發的在線業務使大數據技術的價值劇增。
大數據將會成為所有數據業務的推動者,並成為其重要的特徵——這是我們關於大數據的首要預測。
獲取新的數據源
數據業務通過差異化利用數據來增加和保留客戶。這意味著除了網路和移動應用之外,企業必須從有新的數據源,如從物聯網和其相關的技術設施獲取數據。這類的新型數據與傳統方式獲取的數據完全不同。
流數據將成為批處理和請求/響應的主流。流數據大多來自感測器,或是源自網路和移動端的交互。數據不再來自最終用戶的表單輸入。除此之外,大部分數據的持續流動,需要與用戶的輸入過程或周期性批處理過程互不影響。
從數據中創造新的價值
企業獲得新型數據,就需要從這些數據中挖掘價值。商用軟體成為供應商與客戶聯合開發的起點。
機器學習的重點將從工具轉變為開發者準備的API。以技術為中心的公司擁有很強的的數據科學能力。大多數企業將認識到,構建定製的機器學習模式已超出了他們的能力範圍。相反,這些企業將專註於建立基於API的應用程序,以預先培訓的技術供應商提供的模型。
受限於進入市場要求,開源業務模型差異化變小。支持軟體工具和平台價值鏈的商業模式仍未得到證實。這個領域還沒誕生像Red Hat這樣成功的開源廠商。企業軟體還需要將高額成本投入銷售團隊建設來推動大範圍部署。開源已經降低了定價,但是很少有新興廠商有足夠大的產品線來支持直銷。
基於數據的制定
代理系統使用機器學習自動運行或決策,以驅動新的業務結果。從效率角度考慮,代理系統建立在遺留系統的記錄上。然而,構建和銷售新的應用程序將與傳統的應用程序有很大的不同。支持他們的基礎設備也截然不同。
封裝的企業不再完全封裝。在研發方面,代理系統更像是供應商和客戶之間的半定製聯合開發。在市場方面,供應商將越來越多地與客戶一起銷售應用程序。這種合作將結合這些高度專業化解決方案的技術和領域專門知識。
機器學習可以使新一代itops和APM對SLA永遠支持。除了代理系統之外,網路和移動應用也不能再以來傳統的勞動密集型管理流程。僅這兩項要求將驅動IT操作和應用程序性能管理納入機器學習。這種管理基礎設施將成為機器學習的第一個橫嚮應用。
Wikibon的2018年大數據預測:
一、在2018年,超過五成技術領先的消費科技公司會選擇流式數據板作為他們應用的單一真實源。流數據將加入批處理和請求/響應編程成為第三種主流編程模型。
二、機器學習的熱潮甚至將超過大數據,在2018年非技術的領先公司將因機器學習的業務壁壘陷入困境。這些企業會意識到,數據科學人才的稀缺會導致他們不能從零構建自身的機器學習應用。相反,他們會從自建模型轉向從開發者準備好的介面使用公有雲供應商預先訓練好的模型。
三、2018年,開源軟體供應廠商將以併購和整合的形式開始合併。
四、50年來,應用開發商銷售給客戶的軟體包之間並沒有太大差異。2018年,應用開發商將意識到這些約定不再有效。促進銷售效率的最直接方式是將高額成本投入銷售團隊的建設。在2018年,以往供應商們的這些認知將不再有效。
五、2018將是IT運營和APM成為機器學習首次大規模廣泛應用的年份。
Action Item
代理系統將為新的業務開闢道路,甚至為主流企業提供新的商業模式。但這些企業需要真實評估他們的數據能力。幾乎沒有企業可以自己構建新的應用程序。他們需要技術供應商作為他們的合作夥伴。主流企業必須謹慎地對待開源工具和未經證實的平台供應商。最後,主流企業和技術供應商都必須部署基於機器學習的ITOps和APM基礎架構,以支持永不停機的響應式應用程序。
關於 Wikibon
About Wikibon
Wikibon是一個技術和業務系統領域從業者、技術人員和顧問活躍的全球社區,致力於通過開源免費知識的分享改善技術和業務系統。它是第一個也是最大的技術研究和諮詢組織。
※聊聊機器學習中的那些樹
※機器學習——神經網路代價函數、反向傳播、梯度檢驗、隨機初始化
TAG:機器學習 |