當前位置:
首頁 > 最新 > 以AI賦能數據分析,一站式數據分析平台仍是國內主流打法

以AI賦能數據分析,一站式數據分析平台仍是國內主流打法

近日,愛分析在京舉辦了2018·中國大數據高峰論壇。針對數據分析平台這一大數據行業重要細分領域,愛分析邀請了九章雲極創始人方磊、觀遠數據創始人蘇春園和日誌易創始人陳軍三位創始人進行圓桌討論。

會上,三位創始人就分析平台的智能化趨勢,分析平台應該選擇通用性還是垂直性發展路線,分析平台如何突破工具軟體天花板以及中國廠商是否應該效仿Splunk等國外廠商發展路徑等問題展開討論。

現將圓桌論壇的實錄分享。

圓桌論壇實錄

愛分析:開始討論前,還請三位先簡單介紹下各自的公司。

方磊:在國內來看,九章雲極其實是一家非常早就定位數據科學平台的廠商。

通過提供軟體產品,為大客戶建立訓練模型。數據分析在過去幾年經歷了很大的變化,從以前的可視化更多地往模型轉變,這也是數據科學平台的定位和價值所在,就是讓我們的企業可以更容易的像使用EXCEL一樣構建模型,使用模型。

陳軍:日誌易是對IT系統的日誌和指標數據進行實時採集、分析、可視化的產品。主要是用在IT的運維監控,運維分析,業務分析,還有安全審計等方面。

那現在也切入智能運維領域,幫助大型企業打造智能日誌中心,把機器學習等AI技術用在日誌、指標數據等機器數據上,從而對其進行智能分析。

蘇春園:觀遠數據是做新一代的BI,專註於BI和AI的結合,做企業經營的數據分析和決策。

過去的BI就是強調的看數據,更多傾向於可視化,但是我們更多的強調看數據,到最後更智能的決策,有一個完整的路徑,從BI到AI整體的規劃。目前布局的行業是零售、金融、互聯網等行業。

數據分析平台智能化是趨勢,但人在決策中作用依然重要

蘇春園:上個月的今天,我們觀遠數據在上海做了2018年產品發布會,分享了我們從智能化這個方向上對市場的解讀。

因為我們在BI領域,剛才也提到我們看的方向是BI和AI怎麼結合,但是這兩者的結合需要一個路徑,為此我們提出了「5A」的理念。

做數據分析,第一步要解決的問題是「敏捷化(Agile)」,就是能基於企業已有的大量數據資產快速形成指標體系。

第二步就是場景化(Accurate)。比如零售行業,便利店是我們切的一個場景。單點分析應該怎麼分析,它可能慢慢的就不僅是敏捷工具的概念,更進一步是一個場景化。我們提供的思路就是給他一系列的場景分析的模版,可以套用這個行業最好的分析實踐。

第三步是自動化(Automated)。有了前兩步的工作後,我們希望實現自動化。比如數據的自動關聯、自動告警等等。

第四個就是行動化(Actionable),指根據現有信息對未來擬採取措施給出建議和指導,最後輔助業務人員作出可行動的決策。

最後一步就是演算法和業務的深度融入,我們稱之為增強化(Augmented),意為增強的應用。比如智能訂貨,或者是更精準的預測和路線的規劃。

所以大體上我們覺得智能化的趨勢是毫無疑問的,如何實現智能化值得我們做更深入的探討。

陳軍:數據分析必然要智能化的,所以對於日誌這種機器數據來講,我們現在做的智能化主要是智能運維(AIOps)。在AIOps方面,也是前年剛剛提出來的,概念就是把機器學習、人工智慧用在運維領域,大大提升運維的效率。今年工信部下的一個組織在組織業界編寫智能運維技術白皮書,BAT、360、華為等都有參與,日誌易也是成員單位,負責編寫其中的一部分章節。

智能運維在日誌領域落地的主要有兩點。

一個是故障的自動發現。因為以前發生故障的時候運維工程師根據經驗發現故障,現在可以通過機器學習和歷史數據來進行自動的發現。

還有一個是故障的根因檢測分析。我們發現有一些客戶出了IT故障之後幾周才能到根源,因此,我們希望用人工智慧的方式分析海量的數據,把這個故障找出來。比如說,1億條日誌裡面可能跟這個錯誤根因相關的也就十條,千萬分之一的概率把根因找出來,猶如大海撈針。如果靠人工的話十分困難,以前可能用一些統計學的方法來做,我們前兩年開始用機器學習的演算法來做,從去年開始用一些神經網路、深度學習方式來做。

方磊:現在我們技術上最大的突破是在感知上有一個突破。在認知上,所謂的真正的intelligence最核心的突破是非常少的。

在我來看,作為一個分析層面的工具廠商,我認為我們今天面對的分析有很大的變革。我認為分析層面面臨著三個維度的變化。

第一,從單機變成分散式,這是得力於Hadoop、Spark等開源框架的進步。

第二,是在分析上面臨著從離線處理到實時處理的變革。比如流處理技術的出現等等。

第三,大量的可視化的,所謂BI的工作,開始轉向基於模型的預測性分析。

比如,我們主要是在金融特別是銀行業開拓客戶。銀行客戶所使用的工具,在這三個緯度上的提升,體現在有的時候不是一定要做預測,而是把財務計算指標變得更快一些,這也會是分析過程中的巨大變化,比如對流動指標的監控、實時告警、監管報送等。

也就是說,這三個維度的變化給很多的企業帶來很多的變化。我覺得是這些基本面的變化帶來了工具的提升,也讓我們往最終的AI指導決策方向邁進。

愛分析:未來AI能在多大程度上替代人做決策?還是說仍會如目前一般,由AI提供輔助,人做最終的決策?

方磊:這個問題最簡單的就是根據不同場景給出不同的方案。

另一方面,是否由AI替代人決策,除了技術上的實現,還有後果的問題。後果的問題包括倫理的問題、法律的問題。很顯然,如果一個決策產生了很大的傷害,這個決策是由人作出的,那麼還有有法律兜底,但如果是AI作出的決策就會產生法律作用對象的判定問題。所以這裡面很複雜。

我個人覺得在很多純數字化的場景裡面,其實自動決策已經成為現實,比如實時的廣告投放就是其中一種,而且我們每天被它騷擾。

在一個純虛擬化的,自動扭轉的過程當中,我認為決策是比較容易實現的。一旦跟現實世界有很多交集的時候,它帶來的不只是跟現實交互的問題,還有法律、倫理的都會湧現出來。

蘇春園:最近我和一位零售行業的CEO交流的時候,收穫的一個觀點還是蠻有意思的。以零售行業為例,零售行業的本質是什麼?本質一定是希望我們去消費,得到有溫度的服務等。不應該讓零售企業的門店的業務人員花時間去看數據,去思考銷售怎麼樣,然後做什麼決定。

所以就智能分析決策這個方向,我們提出一個概念:未來智能分析決策的方向就是讓工具代替人去做決策,並給出可執行的方案。這是未來的方向。

但是我們現在看到的人工智慧,只見人工,不見智能。原因還是行業整體的數據的根基、管理流程規範性比較差,當下還是應該先將數據處理等基礎能力做紮實,然後再去考慮實現AI的路徑問題。那麼在至少未來三至五年間,一定還是人機交互,工具給出的更多還是行動建議,由人去做決策。

通用平台有存在空間,但從行業入手或能更快成長

方磊:我認為一定是有通用平台存在的空間的。事實上在美國現在已經能看到這種趨勢。比如我們已經承認Tensorflow,甚至GPU等是通用的東西,而國內在底層還沒達到這樣的深度或積累程度,所以會討論橫和縱的問題。

至於對於一個企業來說,你選擇縱的策略,還是橫的策略,是值得思考的。在今天中國的市場上,我認為縱的策略更快。當然具體你要選快的還是慢的路徑,這取決於每一個企業自身的決策。

陳軍:其實關於縱向還是橫向發展的問題,一個取決於產品的特點,還要考慮所處行業的特點,以及企業目前所處的狀態。

做一個通用的產品的話,肯定是天花板會更高,市場更大,但是要落地,可能就不容易。

剛開始的時候,還需要做行業積累,做縱深垂直,然後落地,推廣開來。其實不少好的技術都是走這個路徑,在某些垂直領域落地後,再推廣到其他行業。

你看整個IT行業的歷史,一項新的IT產品出現後,基本上最早的客戶都是在銀行和運營商。這兩個行業對IT的要求最高,也是最有付費意願的,IT產品能在這兩個行業站穩,就是證明了有價值,就可以推廣到其他的行業裡面。從日誌易產品來講,目前服務的行業有十多個,只要IT足夠複雜的,IT運營精細化程度足夠高的企業,都需要分析日誌。但我們也有一些重點行業,像金融、運營商,這兩個行業本身也夠大,可以去做垂直、去積累。

另外,我覺得在某一些縱深行業裡面,能抽象出一些跨行業的共性,這些共性是可以做的。那麼下一步就是平台化、生態系統的打造,但這個過程可能需要很久,甚至幾十年的時間。

蘇春園:我的看法是真正能夠扎入到行業,扎入到場景,再後面就是在這個行業裡面通用化,然後再跨行業複製。

比如觀遠數據目前布局零售行業。我們會在零售行業某些應用的基礎上,盡量提煉共性,發現客戶的剛需,比如門店或單品的管理等,這都是在行業市場通用的場景,然後再嘗試在整個行業推廣。從國外發展來看,諸如Salesforce等廠商也都是這樣的邏輯。

打磨產品是核心,要在解決方案和產品中找到平衡點,

陳軍:前提還是要將產品先做好,如果產品沒有做好,很難做解決方案,交付成本會非常高。廠商要在產品和解決方案中間找到一個平衡點,不可偏廢。

很多2B的廠商,很容易變為純做項目的企業。客戶需要解決某個問題,就做對應的項目。這樣能夠生存下來,但是毛利會非常低,也不可擴張,很難高速增長。而做產品則很容易複製,高增長,但是也會有不能完美滿足客戶需求的問題,所以需要在中間找到平衡點。

做產品的目的和做解決方案並不矛盾,做產品的目的是要降低交付成本,每一次去交付時可重複使用的比較多,能夠降低邊際成本。就像日誌易,我們給客戶賣的也不是一個日誌工具,而是一個智能日誌中心,在日誌中心可以把企業所有業務日誌、運維日誌的價值挖掘出來,並且不僅僅是日誌,還包括一些指標數據,還有一些其他的非結構化數據,一站解決,所以我們最終交付的也是一個solution,一個智能日誌中心的solution。

方磊:我特別贊同陳總的一個觀點,就是產品是最核心的抓手。

很多時候解決方案體現的是人的價值,而不是產品的價值。如果向客戶賣的是產品,應該是產品的價值。

從這個角度來看,我認為確實國內工具廠商到現在賣得都不太好。但是這有一個前提,我們的客戶不是不肯付錢給供應商,而是不肯付錢給國內的工具廠商。像SAS之類的國外工具廠商在中國的銷售情況就很好。

為什麼我們自己的BI工具或分析工具很難有這個成績?我覺得原因就是產品價值水平比較低。所以為了提升業績,可能就要加入一些別的能力,來讓客戶為此買單,表現出來的結果可能就是解決方案的交付。

所以我覺得這一代的創業公司,這一代的軟體服務廠商,如果能夠在產品上實現所承諾的價值或功能,還是有很大的提升空間的。

蘇春園:我很認同方總的觀點。在銀行業,客戶不是不付錢給工具軟體,而是不付錢給國內的工具軟體。

在BI領域,Gartner發布的魔力象限圖,過去十幾年從未有過BI廠商入選。BI在中國也並不是一個新市場,為什麼不能入選?這是值得大家深思和討論的。

不管是工具,還是解決方案,最後對企業來說就是體現為價值。以Tableau為例,它能在10多年內崛起,正是因為抓住了self-service這個痛點。美國的企業客戶,很有工具精神。Self-service契合了這一點。

所以從我們的這個角度來說,我覺得最重要的還是價值,這個價值需要基於國內客戶的使用習慣等特性。

中美髮展有差異,國內一站式平台仍將佔據主流

蘇春園:美國同行的發展確實非常值得借鑒。還是以BI領域為例,國外客戶在使用BI工具時,可能會同時採用幾家廠商的產品,因為各家的產品主打的特點有所不同,這也導致行業整體比較分散。

但是國內市場與此不太相同,國內客戶更希望廠商交付的是一個一站式的解決方案,進而能夠快速的開始數據分析的構建、探索等等。

這是國內外的不同之處。

另外,國內比美國更強調敏捷BI的概念,因為國內的業務變化實在太快,很多業務指標都在快速變化。而美國BI廠商,他們的產品戰略通常是全球化的。因此不太可能為了中國的某個場景去改變整體產品迭代方向。這也是從本土需求衍生出來的產品端的巨大差別。

陳軍:在日誌分析領域,國內廠商和國外如Splunk等廠商的發展路徑也會有所不同。這點可以從兩個維度去闡明。首先,從客戶層面來講,美國的IT比較發達的,工程師的動手能力比較強。

比如說像IT產品在美國銷售,客戶要做POC,要證明這個產品能解決問題。基本上是客戶做,廠商不會做,如果廠商做是要收費的。國內是不太可能的,我們在國內銷售都是要由廠商做POC。

所以在國內做2B業務其實非常苦,可以說是又臟又累又苦,因為不僅要做好產品,也要做好服務,需要投入很多服務資源。例如,日誌易服務的一些大客戶,需要幫助企業接入幾千台設備、上萬個系統的日誌,而且日誌格式千變萬化、日誌內容參差不齊,需要與客戶內部各個部門協調,投入非常多的服務資源,才能服務好客戶。所以,這就導致產品形態不太一樣。

其次,從公司的業態來講也不太一樣。看美國的話,每一個細分領域都很多公司,廠商通常是在某個單點的創新上做得非常好,因為美國公司往往面對全球市場,單點突破有助於其快速鋪開業務,而國內廠商主抓的還是中國市場。這也導致了國內2B、2C企業經常會為了發展跨入彼此的領域,而美國企業則不是如此。即使在2B市場,併購也非常的活躍。很多創業公司成立的目的就是為了解決一個痛點然後被巨頭收購,也就是所謂的「Build to sell」,而非通常認為的「Build to last」。中國在這方面還只是初現端倪。

方磊:兩位對於這個議題的認識都很深刻。我想補充一點,我們對問題有一個結構性的認識。我認為中美最大的差別就是,美國在行業發展之初培養了一批CIO/CDO。這批人的思維就很容易接受「Build to sell」。當新出來的創業公司突破了某個點,他們能夠接受將其收購,並用自身的IT能力將其集成到自己的產品里。

我認為中國沒有這批人,國內同行更多的是要做服務,很難說大規模的採購單點型的創業公司,對每一個單點的價值認知是不一樣的。

現在這些也在變化,國內同行對於自我能力的提升的訴求,自我認知定位的覺醒,對我們的採購方式會帶來巨大顛覆。我相信未來我們會更多由一站式往美國的產品採購方式轉變。這會給工具廠商帶來更多機會。

另外,我覺得這一代2B的廠商是有機會出海的。在座的各位可以看,三、五年以後,一定會看到很多中國2B企業出海的新聞。2B領域的雲化趨勢是一個很好的機會,隨著AWS、Azure的壯大普及,全球2B市場的標準開始統一,今天你賣給一個2B的客戶,雖然還有很多商務環節,但是實際上這個路已經比以前平坦很多了。這也是中國2B廠商出海的機遇。

愛分析:對於國內日誌分析領域,包括ITOA、UEBA、SIEM等細分市場,您判斷其市場規模在什麼量級?

陳軍:可以參考日誌領域國外的標杆企業Splunk。Splunk於2012年上市,當時收入是1.2億美元,去年的收入是12億,每年百分之幾十的增長。

其實Splunk只是國外日誌分析領域中最大的一家,後面還有很多的競爭對手。我記得,2014年的時候我看過Splunk大概有40多個競爭對手,後來微軟、Oracle也開始做了類似的東西。我估計它的市場份額可能也就30%多,不超過50%這樣的。

其實像日誌以及物聯網設備產生的帶有時間戳的數據都是時間序列數據,也就是機器數據的一種。目前Splunk在物聯網的數據服務的收入還不到10%。

中國的IT支出是全球的10%左右,一家國內公司只面向中國市場,對比面向全球市場的Splunk去年的12億美元收入,做到其目前收入的10%的營收還是可能的。

愛分析:您幾位更看好一站式的分析平台,還是場景化、模塊化的工具?

方磊:這個問題我覺得是個人喜好,即使在美國也是共存的。像DOMO就是比較典型的一站式的平台,發展的也很好。當然DOMO現在也碰到一些問題,在美國每個點的人員的能力比較強,提供一站式產品容易被人攻擊。

比如,可能出來一個小公司,會就某一個環節單點突破,導致客戶流失。相應地,單點突破型的公司因在在單點上的持續投入會非常大,容易形成一個自然的壁壘。

回到國內,我覺得未來三到五年,一站式還是一個趨勢。有能力養一個自己的團隊的客戶還是比較少的。

陳軍:我認同方總的觀點。短期內還是一站式的解決方案,但是長期隨著客戶的技術能力的提升,肯定是找每一個類別裡面最優秀的產品。

蘇春園:企業級市場從國內到國外,還是蠻理性的市場。在不同的階段有不同的需求,很多新的東西一開始是一站式,之後客戶肯定趨向於找細分領域做到最極致的產品。

愛分析:數據分析平台市場未來三五年內還是主流,行業發展會否趨於集中?這個拐點會是何時?

方磊:任何行業肯定都有整合。從整個分析工具軟體來看有四類廠商。

第一類是圍繞資料庫展開的,如數據倉庫,有ETL,有OLAP等各類型廠商。

第二類是BI,BI可再分為兩類,一類是Enterprise BI,以Microstrategy為代表。一類是興起的,叫Agile BI,以Tableau為代表。第三類是Data Science Platform,就是九章雲極所處領域,這在美國也是一個非常新興的領域,沒有體量很大的公司。第四類就是數據治理。

從分析軟體層面,基本上分為這四類。國內也有很多的廠商,這個數量比美國少很多。我們還處在行業發展早期,整合的時間窗口還是很長的。我認為接下來兩三年之內都不會產生非常嚴重的整合。這是我的一個判斷。

陳軍:整合是必然的。一部分沒有創造什麼價值的企業肯定要被淘汰的,而有一些有價值,但是遇到了瓶頸的企業就會面臨整合。整合的形式可能有體量對等的企業合併,也可能被更大的公司收購等。也可能有極少數非常優秀的企業,能夠做到年收入幾億還能夠繼續高速增長的,那可能就獨立上市。

蘇春園:遠期來看,毫無疑問會有整合。短期來看,任何一個玩家只要能做好某個點,某個場景,就有生存的機會。我與很多CIO做過交流,發現現在企業給分析工具的預算是很充足的。因此在未來相當長的時間裡,創業公司專註某個點打造核心競爭力,就有存活和進一步發展的機會。至於商業模式上如何繼續延展,和上下游協同,就是另一個話題了。

愛分析熱文


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛分析 的精彩文章:

按訂閱收費,Alarm.com如何挑戰百億美元的智能家居服務商?
從11億到440億美金市值,美國財稅軟體巨頭Intuit的登頂之路

TAG:愛分析 |