Talking Data做的高附加值數據買賣究竟是什麼?
「對於創業者來說,你每年都得升個級,如果一次升級被卡住了,你的公司就卡住了。」
撰文 | 高靜宜
伴隨著互聯網時代而來的,是鋪天蓋地的數據。風口之上,行業內的大數據公司不斷沉淪起伏,都想殺出一條血路。
創業七年時間,在國內大數據公司 TalkingData CEO 崔曉波的眼中,領域內的廝殺已經異常殘酷。「這已經不是小公司的遊戲了,而是一場大公司間的絞殺,甚至是一種贏者通吃的局面。」
而在這樣的大環境之下,TalkingData 發展迅猛,不僅服務於 12 萬款移動應用與 10 萬多應用開發者,還深入多個垂直行業,並且邁過了 C 輪融資,估值接近 60 億元,步入行業獨角獸行列。
「其實我們從創業至今也並沒有在某一個時刻把落點看清楚,而是不斷往前去嘗試而已。」
初探行業壁壘
從最初的學生生涯到之後的外企經歷,再到 2011 年創立 TalkingData,你在不同階段對「數據」一詞的認知產生了怎樣的變化?
這是一個角度特別的好問題,這裡面有一個規律是「越早越接近本質」。
舉例來說,我在 1993 年進入南開大學學習信息管理,是與計算機相關的專業。其實在那個時候,計算機電腦處於早期發展階段,並沒有數據這個概念,讓我們有機會見證奇蹟。
以往,人們做記錄是把文字內容寫在紙上或者筆記本里,信息分享要通過抄寫。後來出現了 Word 這類自處理軟體,分享只需拷貝文件就行了。現在看來這是一件特別平常的事,但在當時卻是一個跨時代的轉變。所以我認為最早跟數據相關的概念首先是存儲,存儲的東西是什麼?是文件。
那為什麼說越早越接近事物的本質呢?
念書的時候我們開始研究計算機的操作系統,眼中看到的不是文件,而是二進位。人們可能很難理解數據存儲是什麼,因為數據就是這樣一個抽象的表達形式。
我畢業參加工作之後,一個最重要的變化就是出現了資料庫,也真正有了數據的概念。那時候存在資料庫里的東西才叫數據。最早的資料庫都是關係型資料庫,這是一個偉大的發明。關係型資料庫是數據發展的第二個階段。
在這之後,人們發現單純把數據存儲下來是不夠的。所以第三個階段就是 BI(商業智能),從數據角度來說的另一個表述形式就是數據倉庫。數據倉庫並不只是存取數據,更關心的是數據對商業的價值。因此那時針對數據倉庫出現了數據挖掘技術。
到了互聯網時代,「數據」的概念又進化了,出現了「大數據」的概念,只有互聯網的數據,不管是在維度、體量還是價值上才稱得上是大數據。無論是從親歷者還是觀察者角度出發,這個領域的發展歷程可以總結為四個階段:文件、資料庫、數據倉庫、大數據。
身處數據概念發展變遷的過程中,是什麼契機促使你決定創業建立 TalkingData 這樣一家公司?
我在以前的工作經歷中做了許多數據分析和數據挖掘的相關工作。我慢慢意識到,從業務角度出發,傳統的資料庫公司遇到了很多瓶頸。
那時做的資料庫叫集群系統,但即使是當時世界上最大的一個集群節點,在支持到幾億用戶的時候,就已經到上限,不可能再突破了。可以發現,當數據量劇增,傳統的資料庫和數據倉庫技術便很難支撐了。
所以從技術的發展來看,我們認為必然會有一波新的技術浪潮湧現,取代這種集中化的數據管理技術。在這之後,開源社區出現了 Hadoop 這樣的分散式文件存儲基礎架構,它們的核心思想不再是把數據集中進行處理,而是用無數分散式的小單元分開去存儲、計算數據。
再就是從數據源的角度去看問題。企業數據的類型都是靜態的,並且類型非常有限。而在互聯網時代,大量全新的數據類型不斷出現,包括用戶的點擊、瀏覽歷史、購買記錄等行為數據。這些行為數據帶來潛在的商業價值,需要用新的技術挖掘這些新的行為數據。這是一個很大的趨勢。
而之後的移動互聯網對於我們來說才是一個巨大的機會。
智能手機是一個可以隨身攜帶的設備,人類歷史上第一次出現了一種類似於人體器官、走到哪跟到哪的設備,這種設備可以時時刻刻忠實地記錄人們的線上行為以及線下位置等。我們意識到,移動互聯網的時代會讓數據的體量、維度、價值呈指數級爆發,這就是我們創立 TalkingData 的最大契機。
在看到智能手機將成為未來數據發展的關鍵點之後,你做了什麼事情?
2009 年,我加入了一家做手機應用的創業公司。在那段時間中,我們注意到手機的功能在不斷變化,而且迭代速度特別快。從一開始只有打電話、發簡訊這樣的功能,到後來各色應用的出現,覆蓋衣食住行,涉及的數據也越來越多。
與此同時,隨著海量的 APP 誕生,開發者這個群體開始出現。開發者需要資料庫,但由於他們一般都是創業公司或者小團隊,可能沒有能力開發成熟的數據平台,就需要找到第三方來提供這方面的服務,這也是我們的機會。
那麼在決定創業之後,TalkingData 最初鎖定的商業模式是什麼,之後是否經歷過調整?
其實在創業七年的過程中我們一直都是在探索,並沒有在某一個時刻把落點看清楚了,而是不斷往前去嘗試而已。
最早我們給開發者提供 SaaS 服務,開發者可以將數據傳到我們的平台上,之後我們對數據進行各種標準化、清洗以及處理計算,進而形成數據指標,再形成數據報表系統。
但在中國做 SaaS 服務非常難。大企業不願意把數據放在一個移動化平台上面,而是更傾向於自己管理;小微企業願意為 SaaS 服務買單,但小微企業存活率非常低,要不斷的尋找新客戶,獲客成本非常高。
第二個階段,我們做的更多的是 On-Premise 模式,就是為企業客戶提供軟體平台。這種模式的最大弊端在於大客戶的定製化程度高,項目壓力大,也很難盈利。
其實可以發現,這兩種服務模式的最大問題是都沒有核心的壁壘。行業競爭逐漸加劇,盈利不斷降低,那這樣的業務模式就跑不通了。
我們就開始反思,為什麼二十年前這樣的模式曾經可行,現在卻不行了呢?其實一句話就可以說明白:那個時代過去了。
現在軟體已經不是一種稀缺資源,而是進入一個供給充足的時代了。
那核心的東西是什麼?這是一個數據時代,最核心的東西是數據,最稀缺的也是數據。需要的是一個以數據為核心的整合能力。只有基於數據構建能力,同時擁有高質量的軟體系統以及專業的服務團隊,才能贏得客戶,這是我們所選擇的模式。
建立數據中台
反思過後,公司的技術策略和路徑開始走向何處?
2013 年左右,我們開始進入金融領域,客戶包括國有銀行、股份制銀行、券商等。那時我們在垂直行業的擴張進程非常快,除了金融,我們還進入了零售、地產、快銷、航旅等,可以說是勢如破竹。
但業務沖得很快的同時,問題也來了。我們遇到了瓶頸,首先是產能不足、效率不夠高,第二是高附加值的數據服務不太多。我覺得這樣的模式對公司來說競爭力不太穩,容易變成傳統的以人力為核心的公司。
所以經過反思,到 2016 年我們就開始收斂,最大變化就是將原本分散在各個業務單元里的研發和產品人員集中起來,服務我們的「數據中台」。目前,這個團隊的人員占公司整體員工數的近一半。
我們有兩個數據科學團隊,一個是領域數據科學團隊,他們幫助行業客戶構建所謂的演算法模型甚至數據科學工具;另一個則是做數據中台的數據科學團隊,他們注重的是提高數據質量、實現演算法糾偏、提升預測模型準確率等工作。
能否展開講講這個數據中台?
這個數據平台的核心就是起兩個作用。
第一是聚合所有的數據。不僅要對開放的數據源做進一步技術處理,也要與許多數據源合作夥伴展開深度合作。這樣一來,才能打通數據,將數據關聯在一起,並且提供統一的建模環境,進而給上層的模型開發商和數據應用開發商使用。
第二是要提供大量共享的數據服務和工具,例如人群畫像、標籤管理等服務,還有建模、報表等工具。
其實數據中台的概念更多是由「共享」推動而產生的。既然行業對數據、數據服務、數據工具有著同樣的需求,而我們在服務行業客戶時的很多數據、工具、能力也是相通的,那不如就打造一個共享的平台。
數據中台是為上層提供能力的。它上面有兩層,第一層是數據應用,或者說是數據模型,再往上一層叫解決方案。
根據我們的判斷,眼下尚處於大數據變現的早期階段,所以大量客戶比較認可的價值還是屬於數據應用和解決方案。而在未來,隨著大數據領域不斷向前發展,對數據平台、數據服務的認可和相應的營收都會提升。
為了實現這一點,我們會採取哪些措施?
賦能。
我們現在會開放我們的建模環境,把很多聚合好的數據能力開放給上層的數據建模合作夥伴,在更豐富的場景下進行數據挖掘。相比之下,他們更懂業務,也有更多的應用場景,能夠幫我們把底層的數據服務和數據標籤提煉好,然後再開放出去。
升級合作模式
所以在 TalkingData 的眾多數據服務產品線中,想最早打開局面的那盤棋是什麼?
這也是個好問題,很多人也問,到底應該怎麼做。我們公司採用的方式是先做解決方案。
每當我們進入一個領域的時候,第一個 KA(Key Account,關鍵客戶)一般我們都不會考核盈利,而是先找出一些產出標準化數據產品的機會。
國內外有沒有哪些公司在跟我們走一樣的路?
其實大數據領域有很多公司的商業模型都是有點像的,但與我們 TalkingData 不太像。對我們來說,核心壁壘在於數據中台形成業務閉環,並與上層的合作夥伴實現共贏。我們的業務模型是往這方面走的,不是單純的提供服務或者工具。
去年開始,TalkingData 對合作模式了調整,開始傾向於與 KA(關鍵客戶)達成成效合作。可否介紹一下?
我們發現成效合作是一種更為先進的合作形態。如果合作沒有出效果,客戶為什麼持續性投入?
例如我們與一家零售企業合作。他們的訴求比較簡單,公司的線上業務收入比較低,銷售主要靠線下門店。他們與我們合作線上業務,如果能產生成效就與我們按銷售額分成。
其實成效合作對幾個方面的能力有較強要求。
第一是不僅要為客戶提供平台,還要提供運營團隊。一般客戶的運營和數據分析的能力相對一般,我們會派團隊進去幫他們把最基本的運營體系建立起來,包括如何利用數據鎖定目標人群、利用數據策劃活動、利用數據鑒定模型等。然後再在每次活動後看效果,包括獲客成本是否降低、個體收益是否提升,也要看客戶生命周期價值。
另一方面,還要具備自動化流程的能力。剛進入一個領域時,會發現有特別多的環節都需要人來決策,而我們的的演算法和模型團隊會讓固化的模型去替代人做決策,這不僅是人力成本的降低,也是效率的提升。
例如,我們有一個客戶在發起營銷活動時,以前相同的配置只能做 50 個活動,但現在能做 500 個活動,這種效率提升也是一種收益。
鎖定行業領域
目前看來,TalkingData 聚焦的金融、零售、營銷、智慧城市等都是數據流動性強、相對高頻的領域。在你眼中,具備哪些特質的行業應用,可以讓其數據價值和潛力可以最大程度地發揮?這中間經歷了怎樣的取捨與漸進?
其實我們更重視的是數據能不能形成產品和模型。
例如,零售領域中有大量做演算法應用的場景。以選址為例:以前的選址是完全基於人工的選址,但現在基於演算法可以比人更高效、更精準,還可以做預測。此外,還可以通過模型來整合運營、電控、銷售等數據,這樣一個簡單的場景所形成的閉環也非常具備價值。
金融領域也是一樣。反欺詐模型可能很成熟了,但在營銷模型、貸後模型上還有很大的發展空間,這也是形成數據產品的機會。
在政府方面也是如此。我們與統計局、旅遊局合作開發人口模型,後面有很多種數據源,要做很多次模型的校準和比對。一旦模型形成,會發現模型有很多可以開放共享的部分,它會沉澱到我們的數據中台里,在其他應用場景中發揮作用。
總而言之,我們重視的是將利用數據形成的智能沉澱下來。
公司是否對其他領域有所布局?
第一是醫療領域。雖然目前發展相對較慢,但是這是有潛力的領域,我們也做了一些投資。
其次是製造業,我們也在與製造業的頭部企業溝通合作,考慮能否在工業生產線中做出標準化、規模化的產品。
還有,我們很關心如何搭建一條中美之間的橋樑。
中國有非常好的應用,有實際待解決的問題,也有與這些問題相關的數據,但缺乏相關技術和有經驗的數據科學家。而美國有非常好的數據科學人才,有很多行業應用經驗的知識儲備。那麼如何構建平台來溝通二者呢?我們想做一個平台讓全球的科學家幫我們解決問題。
2018 年已經過去一半,對於公司來說,這期間最重要的一個改變或關鍵詞是什麼?
數據產品。
以前我們的數據並沒有形成產品,這半年我們做一件事,就是數據產品化,不管是數據服務還是數據模型,都是往產品方面做。
公司的下一個階段最核心的發展關鍵是什麼?
發展合作夥伴。我們的中台能力已經具備了,也聚合了各種數據源、發布了一些數據應用。希望發展更多的數據合作夥伴,把上層的應用場景做大。
回顧來時之路
那麼回顧 TalkingData 這一路走來,公司經歷過的最大阻礙是什麼?如何解決的?
首先我個人的經歷比較特殊。我在外企工作的 8 年時間裡,是從前端的售前逐步走向了後端的研發,而不是常見的從後端到前端。
從創業者的角度來看,每年都得給自己升個級。其實剛創業的時候,我滿腦子都是技術。技術架構怎麼搭?用哪些開源組件?用哪個框架、資料庫解決問題?……開始的兩年想的就是這些。
但是後來會發現,除了技術之外,產品也很重要。用戶體驗怎樣?市場定位準不準?與競品的競合策略?如何實現差異化?……這些問題開始變得很重要。
再之後,技術、產品差不多了,會發現銷售和市場能力又變得很重要,公司品牌也得提升。
再後來資本能力、政府關係等方面的重要性也體現出來。
總結下來,創業企業每年都得升級,這也是在中國創業和在美國創業的不同之處。如果一次升級被卡住了,這家公司就卡住了。所以有的創業公司規模過不了 100 人,有的過不了 200 人,有的到不了 500 人,隨著規模的上升,管理能力也要上升,這都得學習。
所在你看來,大數據智能分析領域的最大技術門檻在哪裡?在數據行業,業務突破上的核心要素到底是什麼?TalkingData 的競爭力又在哪裡?
布局能力還是很重要的,我們一直在嘗試著比別人看得更遠一點。
很多創業者看得比較近,更多是看半年、一年內的事情。也有很多 toB 的公司把目光更多放在盈利上。這樣么做的問題在哪?短期可能沒問題,但長期來看公司的產品能力和平台能力並沒有得到提升。
TalkingData 的特點在於,第一我們嘗試著平衡短期和中期的目標,這也意味著我們比較自信的。很多公司只看短期是因為想著活過今年就行,所以還想那麼遠幹嘛。而我們是一定能活下去的,所以一定要考慮明年、後年的事情。
這也使得我們在研發上投入非常大。我們認為,未來的核心壁壘在技術、演算法、數據模型上面,所以我們會持續投入在這些方面,把壁壘建立起來。
那麼數據呢?你們提供數據相關的服務,能夠真正沉澱和掌握一些數據嗎?手裡拿到一些數據,對大數據公司來說是不是重要的事?
重要,也不重要。我們觀察到一個很有意思的情況,數據應用、數據模型做的好的都是沒數據的公司,基本都是這樣一個情況。
如果有數據,會過於依賴數據。如果沒有數據,可能會聚合很多數據源做交叉驗證和模型測試,反而讓模型效果更好。
是不是說擁有數據的公司才能把上面的平台、應用做好?回答是一定是,但現在不是。
短期內沒有數據的公司不一定沒有機會。因為他們可以把應用做出來,然後通過業務閉環收集各種數據,再從沒有數據的公司慢慢變成有數據的公司。
而現在擁有數據也不能代表什麼,未來還是要看數據能不能形成閉環,從而流動起來。單方面消耗數據毫無用處,只有把數據加工成數據服務和模型再應用,將應用反饋返回數據和模型,然後再使用經反饋優化後面的數據,這樣才能形成閉環。千錘百鍊之後的數據模型更準確,這也是我們公司的重要壁壘之一。
現在很多人在談數據智能,因為數據是人工智慧的一條生命線。所以人工智慧對於大數據行業意味著什麼?你怎麼看接下來大數據行業的走向?
我認為,大家對人工智慧的理解還處於感性認知階段,常見的智能音箱、自動駕駛等並不是真正的人工智慧。真正的人工智慧,是能夠幫人做決策。
但企業級應用里,人工智慧已經開始做決策了。例如通過模型評分決定店鋪選址、通過模型評分決定貸款發放。這是我們理解的基於數據做智能,但還沒有到 toC 應用的程度。
去年在烏鎮,我也與 DeepMind 創始人 Demis Hassabis 聊過這個問題。可以發現,他們對人工智慧的看法與前兩年相比發生了巨大的變化。之前谷歌認為人工智慧是會改變世界的,但去年我問他,你們的 AI 策略是什麼?他的回答是,這首先是一個 toB 的服務,會更多地把人工智慧能力放在 Google Cloud 上作為服務提供給企業。而短期內 toC 並不會因人工智慧而發生顛覆性的改變,除了下棋。
這與我們的看法是一致的,目前階段,數據智能還是幫助企業做決策,而且要在這件事情上做透。
※場景還是場景,配送服務正變天?AI晶元也要走向終端應用的競爭?
※93.8%全面屏、雙軌升降鏡頭、999歐,內馬爾手中OPPO高游標簽
TAG:機器之能 |