當前位置:
首頁 > 最新 > 布局金融業,九章雲極以數據科學平台切入百億級市場

布局金融業,九章雲極以數據科學平台切入百億級市場

通過五年的業務積累,九章雲極已成為國內領先的數據科學平台提供商。相比於國外廠商的同類產品,九章雲極有高性價比、豐富案例等優勢。基於對市場空間和行業發展速度的判斷,2018年,九章雲極將加速拓展銀行客戶。而其所面臨的挑戰則是獲取標杆客戶的能力及不斷完善產品化程度。

指導 |李喆

調研 | 李喆 王琦 倪賢豪

撰寫 |倪賢豪

創立於2013年的九章雲極是國內最早最領先的數據科學平台提供商。

創始人方磊,曾是微軟雲計算平台(Windows Azure)及Bing團隊核心成員,負責Azure的數據中心監控系統的開發,並在海量異構數據的採集和實時分析上有自己的獨特見解。

截至目前,九章雲極公司已超過120人,並在上海、山東、西雅圖都設有分公司,其中研人員佔60%,並擁有一隻超過10人的數據科學家團隊,多數技術團隊成員擁有服務世界500強企業的開發和諮詢服務經歷。

2018年,九章雲極將重點開拓銀行業客戶。

從數據預處理到模型構建與訓練,九章雲極打造數據科學平台

九章雲極的大數據平台產品為「DataCanvas」。通過該平台,九章雲極幫助客戶做數據預處理(DEP),數據的分析和模型構建(APS),為模型的運行提供實時計算的環境(RT),並幫助模型實現生產化,最終落到應用場景中去。

DEP數據管理平台,提供數據集成、數據建模、數據質量探查以及數據下發等能力,幫助企業轉換原始數據並管理轉換後的數據,從而提供高質量、高價值數據。

APS是面向數據科學團隊的一站式數據分析平台,集數據準備、演算法實現、機器學習和模型開發於一體,能夠幫助企業快速構建數據分析應用。其功能模塊可分為三大類:

第一,業務分析模板,支持自定義拖拽模塊構建大數據分析流程。

第二,數據處理模塊,構成常用數據和特徵處理模塊。

第三,機器學習模塊,提供機器學習演算法模型和行業典型模型。

RT,通常情況下指實時計算,而在DataCanvas平台下,RT本質上是一個運行模型的環境,同時也為最終模型的生產化提供幫助。針對各類場景的模型通過APS完成構建,需要在一個實時計算的環境下運行。九章雲極通過「流處理引擎+內存資料庫+模型載入管理」的方式,為模型的正常運行提供了理想環境,使分析結果能在實際業務中得到運用。

當前,DataCanvas平台在銀行業的適用場景主要為營銷、運營、風控等三大方向。營銷上,適用場景主要是理財推薦等。運營則更多在網點運營上,如現金儲備優化(ATM加鈔等)。風控上,銀行通常自有一套風控模型,DataCanvas能幫助客戶將這套模型落實到實時計算的環境中去,達到實時監控等效果。具體的應用場景有ATM取現監控、小貸風險控制等。

產品化程度還有提升空間

如上所述,DataCanvas作為數據科學平台,已基本實現協助客戶完成模型構建和訓練的目的。而在後續的產品迭代中,產品化的提高會是發展方向之一。

目前DataCanvas平台在模型構建方面已達到高度產品化(APS),但在前端的數據清洗、轉換和載入(DEP)和後端的分析結果產品化(RT)上相對產品化程度較低。

由於各類銀行客戶的信息化建設進度不同,導致數據清洗、轉換和載入的產品化率較低,所以九章雲極在對接客戶業務系統時,需在ETL等方面有更多交互。

分析結果產品化部分的產品化率較低,則是因為模型在實時計算環境下完成訓練、評估後,如何在實時計算環境下,將分析結果(模型)運用在實際業務中,這部分所需的工作量是比較重的。

兩者相較,分析結果產品化的產品化提升難度相對較低,因為業務系統總體來說,是一個有著特定步驟或處理辦法的流程,訓練模型得出更匹配客戶需求的參數,更多的是通過輸入盡量多的高質量訓練數據來達到。隨著九章雲極對客戶業務的理解不斷加深,這部分的產品化程度會不斷提高。

而在數據清洗、轉換和載入方面,實現高度產品化或自動化,還是有著較大難度,目前更多還是通過建數據集市或者數據湖的方式提供可供分析人員使用的高質量數據。

著重布局金融領域,加強標杆客戶獲取是未來方向

在客群定位上,九章雲極傾向於大客戶。在重點布局的金融領域,其對大客戶的定義主要是國有大型商業銀行、股份制銀行、城商行、大型保險證券公司等客戶,至於農商行、農村信用社等則屬於長尾客戶之列。

由於九章雲極所提供的DataCanvas數據科學平台,,主要是在數采、模型構建和實時計算環境下的運行為客戶提供幫助。因此,客戶需要具備數據分析能力,只需要不到10人的數據分析團隊便可確保對於DataCanvas的高效運用。而目前定位的銀行業大客戶,通常都具備此等規模的團隊。

從市場切入點來看,考慮到九章雲極主要輸出的是分析結果及其運用,與之相對的是BI和分析軟體市場。根據Gartner的預測,2017年全球BI和分析軟體市場規模將達到183億美元,預計到2020年,該數字將達到228億美元。作為BI領域全球增速最快的國家之一,中國市場2017年的規模保守估計可達到20.1億美元左右,摺合人民幣接近130億元。

細數九章雲極現有客戶,銀行客戶已佔九章雲極總客戶數的70%,其中多數為城商行。股份制銀行或更大體量的銀行獲取還略有不足。未來能否在目標領域佔據更多的份額,還取決於其如何增強在銀行業的標杆客戶獲取能力。

技術和客群較有優勢

技術:創始團隊曾任職於Microsoft等公司,負責Azure、Bing等項目,有著豐富的分散式系統搭建及數據分析經驗。

產品:所提供數據科學平台產品覆蓋數據預處理與存儲、實時處理與批處理、數據分析等。

產品化率還有提升空間,目前在數據預處理、訓練模型獲得匹配業務流程的參數等方面還需較多的數據分析人員介入。

客群:定位客群為金融領域,例如股份制銀行、城商行、農商行、大型保險證券公司等。所服務市場規模在百億級以上,客單價在百萬級,未來成長性較好。

獲客:已有10多人的銷售團隊,均有多年IT行業從業經驗。目前已有客戶主要為部分股份制銀行和城市商業銀行,2018年重點加強標杆客戶的獲取能力

場景:銀行業場景可分為營銷、運營、風控等三大領域,如理財推薦、小貸風險控制等。九章雲極對於場景的理解主要作用在使得模型與實際業務很好匹配。即完成模型訓練並使其參數匹配實際業務的需要。現階段還需要投入較多時間和分析人員達成這一目的。場景理解能力還需繼續增強。

近期,愛分析專訪了九章雲極創始人方磊,現將部分內容分享如下。

布局金融業,以數據科學平台服務客戶

愛分析:除了產品功能外,DataCanvas作為企業級產品還需具備什麼條件?

方磊:產品的安全性和可靠性不可或缺,這是基本條件。但我認為最重要的還是配合客戶的模式,與客戶進行深度的合作,提高服務水平。

愛分析:DataCanvas的應用場景有哪些?

方磊:必須是規模比較大的客戶,而且要具有10人以上的數據分析團隊。比如智慧網點的應用,可以分析ATM的使用率,或者VTM自主開卡機的使用率等場景。根據客戶需求不同,提供平台或者具體應用。

很多時候,我們在建模方法上可能更擅長,但在業務上絕對是客戶比我們掌握的更多。

愛分析:目前產品應用的行業主要有哪些?

方磊:之前我們涉足過比較多的行業,現在主要集中在金融,2018年集中在銀行領域,目標是規模比較大的銀行。

愛分析:相比於同類競品,DataCanvas的優勢是什麼?

方磊:主要是實時性和建模。RT是一個流處理引擎+內存資料庫+模型載入管理的方式,這部分也是很難的。還有就是從用戶習慣切入來說,用戶在APS產品的使用中,會形成一定的用戶依賴。RT也是我們的一個壁壘。

愛分析:ETL在DataCanvas中佔據了多少工作量?

方磊:雖然很多大數據公司看不上ETL,但實際上ETL可以佔據80%的工作量。比如,銀行系統要調用某客戶的銀行流水,但實際上他的多個賬戶並不在一個資料庫,有儲蓄卡、信用卡、外匯、手機銀行等等賬戶,且在資料庫中的ID是不一樣的,要做匹配工作量還是很大的。

愛分析:DataCanvas能否處理日誌等半結構化數據?

方磊:目前我們給銀行做的分析平台,就有日誌處理的模塊。日誌數據大量來自於系統運維數據。還有部分日誌數據是跟業務相關的。

愛分析:與銀行客戶合作的過程是怎樣的?

方磊:比較淺的合作一般是銀行來做測試,與原來的資料庫分析軟體進行對比,然後銀行來選擇。關係比較好的合作夥伴,我們會根據他們的具體需求,與客戶人員進行合作,將應用模塊進行固化。

愛分析:未來有無考慮向集成商轉型?

方磊:集成商是需要很大的人力投入的,需要在客戶現場進行維護,這主要還是業務模式的區別,我們一般會選擇和客戶比較熟悉的集成商進行合作,目前來說,我們並不適合這種模式。

企業面臨數據化變革,數據服務大有可為

愛分析:您對於數據服務的發展怎麼看?

方磊:傳統上認為,數據服務是一個金字塔結構,底層是Database,中間層的產品包括SAS和IBM的SPSS等數據分析類產品,第三層則是應用層。

現在看來,這一結構正在受到侵蝕,逐漸由金字塔結構往紡錘形結構轉變。底層的數據類型和上層的應用都呈現碎片化的趨勢,而中間分析層變得更厚。

中間分析層開始由原本SAS、SPSS等單機版程序轉向分散式計算,並且由報表等較簡單需求往模型構建,進而與業務結合的方向轉化。還有就是在線分析的運用越發普遍。

總的來說,以前我們認為數據是交易的產物。但現在我們更認同交易產生數據,數據提煉模型,進而反過來影響交易的閉環。

愛分析:對於BI等產品的需求,會否被其他數據服務的形式取代?

方磊:對BI的需求還會存在,但實施形式會有兩類變化趨勢。一類是建立數據倉庫,按照主題將報表分類;一類是直接ETL,建立報表集市。

愛分析:數據服務各環節技術的滲透率如何?

方磊:像Hadoop這樣的底層應用,在頭部客戶中幾乎達到了80%以上,分析層次的應用基本上處於剛起步的階段,不到10%,真正應用在業務當中可能更少。

愛分析:數據服務領域有無可能出現Oracle和SAP等量級的企業?

方磊:這個要看時代背景,Oracle和SAP正趕上很多企業的信息化建設,抓到了發展機遇。現在的企業正面臨數據化的變革,肯定會出現一批數據分析服務的公司,也肯定會有公司最終走出來。

愛分析:潛在競爭對手方面,BAT等大型互聯網公司會否跟銀行做排他性合作?

方磊:BAT做的更多的是數據層面的合作,在數據分析層面提供的幫助很少。一般這種大型互聯網公司的數據分析系統跟自身的業務綁定的比較緊,目的是讓數據分析幫助實現自身的收入,無法做成服務客戶的產品,而我們的產品與客戶的業務綁定比較緊。

愛分析:數據服務領域,客戶招標有什麼樣的形式?

方磊:這要看客戶的運作模式,項目有以軟體為主,也有以硬體為主的,也有直接招標分析平台的。

招投標過程中,我們看到的大部分都是傳統集成商,並看不到最終的廠商。很多客戶為了安全,基本上都是和集成商對接。

愛分析熱文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛分析 的精彩文章:

強監管環境下,美國現金貸平台的出路何在
定位大數據分析平台,Kyligence憑開源優勢謀全球業務擴張

TAG:愛分析 |