當前位置:
首頁 > 最新 > 服務近2000家客戶,人工智慧掘金熱中,他選擇做賣水人,想把AI做成人人能用的應用

服務近2000家客戶,人工智慧掘金熱中,他選擇做賣水人,想把AI做成人人能用的應用

掘金熱時,挖金人無數,賣水的賺了錢。在AI熱潮中,戴文淵想讓第四範式做那個賣水人。

撰稿:賈 寧

01

想做AI界的甲骨文

第四範式,戴文淵所有的野心就嵌在這個名字里。

範式是科學用語,人類科學研究的發展經歷了四個範式,第四種範式是數據科學,即讓計算機總結規律的數據密集型科學。第四範式的名稱就來源於此。

範式也是計算機專業術語,資料庫通過三大範式來優化數據存儲方式。在資料庫企業解決方案領域,市值1900多億美元的甲骨文,是一座難以攀越的高山。

第四範式創始人兼CEO戴文淵希望做人工智慧時代的甲骨文,為企業及合作夥伴服務產業的公司提供既好用又有壁壘的技術服務

「大部分人想做伺服器,因為壁壘不高,好用歸好用,我可以再做一個和你競爭。但是,好用的甲骨文資料庫沒有人想著再做一個。」戴文淵對新經濟100人說。

第四範式創始人兼CEO 戴文淵

他意識到,企業服務不僅要產品好用、有價值,還得有技術壁壘。「甲骨文作為傳統的企業服務公司,仍然有這樣的收入、這樣的估值。我認為AI的天花板不會比這個低。」按照他的設想,像甲骨文有個資料庫體系一樣,第四範式未來將有個AI體系。

這個體系不是「煙囪式」的創新,按垂直行業劃分,從頭做到尾,提供端到端的解決方案。而是不同要素像積木一樣疊加,成為通用的平台

02

「先知」的進化

第四範式所有產品線圍繞一個名為「第四範式先知」(以下簡稱「先知」)的平台。

「先知」的設計,來源於學習圈理論。學習圈是大衛·庫伯總結了前人經驗之後提出的經驗學習模型,包括具體經驗、反思性觀察、抽象概念化、主動實踐四個環節,體現了學習的完整流程。

學習圈理論

以「先知」平台上的反欺詐為例,如何訓練機器自動識別一筆交易是正常交易,而不是盜刷信用卡呢?

首先輸入很多歷史交易數據,這些交易行為會有反饋,盜刷會有電話投訴,沒有被投訴的交易可以判斷是正常的。這些反饋交給機器學習做反思,反思不是剖開機器大腦做神經元連接,而是運用AutoML技術,把行為數據和反饋數據導入機器,反思出一個模型,自動產生理論總結,知道什麼情況是正常交易,什麼情況是欺詐。最後,把這個模型做成線上系統。新的交易數據過來,機器就會判斷它是否是欺詐。

這就是完整的學習圈過程,其中,反欺詐可以替換成醫療、金融、政府、能源等各行業的應用。

類似紡織業從手工縫製變成了工廠流水線生產,AI的落地演進也會走上社會化分工再提煉的必由之路。

第四範式聯合創始人兼產品負責人胡時偉打了個比方,現在一些公司給客戶提供AI解決方案,相當於裁縫上門給客戶量衣服。在某個行業落地相當於預先做好一些版型,批量生產。

而第四範式想做的,是打造制衣廠生產線,多個版型的衣服都能在這條生產線上生產。

要實現這個目標,第四範式花費了三年時間來摸索路徑,讓「先知」升級換代。

機器學習的核心是模型具備判斷能力,建模技術門檻比較高,一般都由AI專家來做,「先知」1.0就是取代AI專家的建模工具。

在企業落地的時候,第四範式發現只是建模還不夠,數據的來源、生成的模型如何上線都需要解決。於是,「先知」2.0向前向後各增加一環節,前接數據進來,後可生成服務。

從「先知」1.0到2.0,從建模工具到全流程開發平台,由於沒有對功能抽象提煉,導致後來出現問題:作為一個工具,每個部分都要單獨做,項目太多了。

AI在一家企業里的應用,應該是一片森林,而不只是一棵樹。那麼如何批量植樹造林?

到了「先知」3.0,第四範式提出核心系統的概念,把數據和應用之間的關係都連接在這個核心系統上,從獲客到營銷,從風控到留存,從安全到員工體驗,到上下游的供應鏈等各個環節,全部都用一套系統。

「1.0相當於我們造了一個發動機,結果發現發動機開不了,自己還得手動組裝車,2.0相當於我們弄了一個生產車的手工作坊,一輛一輛地造車,3.0相當於弄了一套生產線,可以生產各種不同型號的車,是一個再擴展的過程。」胡時偉對新經濟100人說。

「先知」3.0另一個重要改變是,把開發和運行區隔開了。AI企業做企業服務業務,通常派人去客戶現場做,大家對於AI外包的業務形態有過不少激烈的爭執。

「軟體知識產權的開發和運行沒有分開,缺少一套方法論和語言去定義,什麼叫AI應用。比如手機上的App,下載就可以使用。但是AI現在還做不到下載一個營銷應用就可以直接使用。先知3.0就是要定義一種可下載使用的AI應用,實現行業內的複製。」胡時偉說。

同時,第四範式提供開發工具,讓合作夥伴在各自行業內開發應用。應用開發出來後,通過相關載體,企業拿去安裝即可,不需要派人到每家企業部署實施。

這種方式成為第四範式商業化的重點。

沒有甲骨文之前,企業想用資料庫,就需要自己開發。甲骨文首先推出了商用SQL(結構化查詢語言),後來,大家都做SQL語句,語句最後形成了應用。第四範式認為AI應用的發展,也將類似。

那麼,一個AI應用應該是怎樣的?

「我們利用學習圈理論,通過數據的採集、標註、機器學習和模型上線四個部分,定義一個AI應用。最早企業做信息化都是外包,沒有SAP,沒有eHR,這些軟體後來才出現。各行各業定義出AI應用後,推而廣之,就可以解決現在做AI就是外包的問題。」胡時偉說。

做toB業務,難免會遇到客戶提出各種需求。在AI應用早期,客戶的理解經常會有偏差,有時候客戶提出來的需求需要轉化。

第四範式團隊經常遇到這種情況:客戶說要A,第四範式說你要的是B。客戶馬上說,對對對,我要的是B。

舉例來說,客戶對第四範式提過一個需求,能不能把公司數倉數據導入進來,用數倉數據來建模。實際上,數倉數據是為BI設計的,用BI里的數據做AI,基本都慘不忍睹。因為BI是報表數據,是給人看的,AI的數據是給機器看的。

於是,第四範式給客戶分析投入產出比,用數倉數據不如直接從生產系統上重新採集數據。從生產線拿過來的原始數據,不需要預處理,最適合機器學習。BI的數據經過複雜的聚合,信息量丟失了,機器反而訓練不好。

對企業來說,解決方案的方法論和交互越簡單越好。第四範式的工程和演算法團隊很大一部分精力,是為了減少客戶的操作步驟,為了讓模型更普適,讓應用更廣泛。

當前,第四範式產品按照學習圈理論,構建數據、演算法和生產三大核心,給企業客戶提供包括行為數據、反饋數據、模型訓練和模型應用在內的全流程應用。客戶點擊進去進行簡單操作,就可以得到想要的應用服務。

第四範式先知界面圖

AI能夠發揮作用的關鍵是數據。企業接入「先知」平台之前,如果沒有數據積累,往往有一個收集數據的過程。

「我們認為一千萬條以上的數據很大概率能達到比人好的效果,一千萬條數據意味著機器可以寫一千萬條規則。人最多可能寫幾十到幾百條,如果機器寫的規則數比人寫的規則數多幾個量級時,就能達到一個比較好的效果。」第四範式首席研究科學家陳雨強說。

按照戴文淵的設想,「先知」平台的發展,將從數據輸入變為業務輸入。只需要把企業的業務目標告訴機器,機器就可以從企業數據倉庫中創造出業務價值。

其產品設計的邏輯在於,內部越做越複雜,對外越來越簡單。

03

從競爭走向合作

2015年初,第四範式公司剛成立,戴文淵就想著做銀行。周圍的人覺得他異想天開,銀行不可能和一家剛成立的小公司合作。

戴文淵直接與招商銀行營銷部的一位負責人溝通,介紹互聯網公司的營銷方式,他在百度時是如何做營銷的。當時,百度採用了機器學習的方式,帶來效益8倍的提升。

戴文淵問對方,招行模型如何制定,得到的回答是有專家在寫營銷規則,兩百多條。

戴文淵說,你知道百度有多少條嗎?一千億條。通過機器,我現在能給你做到一千萬條。

銀行需要在持卡群體里找到有分期需求的客戶,通過打電話、發簡訊或者微信推送的方式進行營銷。銀行的營銷渠道資源容量有限,只能從數千萬持卡人中挑出一小部分意願比較強、有較大分期需求的客戶,做出投入產出比更高的選擇。

機器學習可以從幾千萬人里精準找到這類客戶,優先撥打他們的電話。同樣打十萬個電話,有多少客戶響應了電話營銷,這個響應率或者營銷成功率是最終判斷機器學習模型是否有效的核心業務指標之一。

後來,第四範式為招行信用卡中心做了五千萬條營銷規則,上線以後收入提升60%。

有了招商銀行作為標杆案例,第四範式陸續拿下了國內幾家大型信用卡中心,為它們提供精準營銷服務。

之後,第四範式不斷擴張業務,從精準營銷擴散到反欺詐、定價等銀行業務的各個環節,再從銀行擴展到能源、政府、醫療、零售等各個行業,如今客戶近2000家。

企業服務依賴公司交付團隊的規模,第四範式試圖通過合作夥伴模式打破限制。

「交付團隊的規模決定我們業務成長的速度,我們需要一個生態圈幫助我們更快速、更大範圍地落地。靠自身能力擴張市場,邊界總是有的,合作夥伴幫我們彌補了自身能力覆蓋不到的邊界外部分。」 第四範式諮詢合伙人柴亦飛說。

選擇合作夥伴這種模式,也是為了在各行業快速落地的變通。

對創業公司來說,風捲殘雲般「洗劫」某個行業,並不現實。原有供應商在行業內盤根錯節,擁有自己的一方地盤,對於橫插一杠子的新競爭者,他們會製造各種各樣的障礙。

所以,第四範式從競爭轉向合作。「做商業共贏,讓所有公司都覺得跟你合作有飯吃。要幫到別人,不要說比別人強。就算我真的沒辦法幫到你,那我跟你也是兩個不同的東西,咱倆沒競爭關係。」戴文淵如此劃分陣營。

現在第四範式的不少合作夥伴都曾經與其有過競爭。例如,現在有一合作夥伴,曾跟他們競爭過廣發銀行的標。廣發銀行的需求是反欺詐加平台,合作夥伴做的是反欺詐,第四範式是平台,最終第四範式中了標。

後來第四範式拉上對方,形成聯合體,在第四範式平台上開發反欺詐應用,共同完成之後的大單。

這好比掘金熱時候,挖金子的人無數,賣水的商人大賺了一筆。戴文淵想讓第四範式做掘金人背後的賣水人。

但是在賣水之前,第四範式也掘金,以此來告訴其他人,掘金是賺錢的。在通過合作夥伴滲透行業之前,第四範式自己也會做行業標杆案例,推動平台在行業落地。

對手依然存在,戴文淵也有自己的競爭思路,那就是拿下行業所有標杆。

「我們在拿下第一個標杆招行以後,第一件事情不是去擴大收入,而是看行業內還有什麼其他的標杆,比如工商銀行、建設銀行、中國銀行、民生銀行、中信銀行等。」戴文淵說。

戴文淵帶著黑色框鏡,穿著黑色襯衫,透著一股理工科生的氣質。他曾是百度最年輕的高級科學家。和新經濟100人交流當天,因為嗓子不舒適連喝了三四瓶水。他努力說話,聲音不大,有些沙啞。

2005年,還在上海交通大學讀書的戴文淵,和兩位搭檔一起奪取了ACM大學生程序設計競賽世界冠軍。這項賽事由美國計算機協會(ACM)主辦,經過四十多年發展,已經成為全球最具影響力的大學生程序設計競賽。

捧回冠軍的戴文淵來不及高興,他發現,熱門的計算機圖像學已經被同學選完,人工智慧是剩下的為數不多方向之一。他因此結緣香港科技大學計算機系主任楊強——華人界首位AAAI Fellow、唯一執委,IJCAI理事會主席。2015年,戴文淵創業,楊強擔任第四範式首席科學家。

在大三參加ACM比賽之前,戴文淵成績一直不太穩定,每每到了關鍵比賽就發揮不出應有水平。

後來他調整自己的心態,控制自己的情緒,不去想那些對結果沒有幫助的事情,讓自己達到最佳狀態。

「你經歷過最殘酷的競爭,你越是想得到,你越得不到。最高水平的競爭,大家差距是非常微小的,勝負只在一念之間。」

他發現,比賽最重要的事情不是把自己發揮到極致,而是把團隊發揮到極致。以前他們團隊三個人比賽,每個人都把自己那部分做到最好,戴文淵嘗試自己做得弱一點為代價,讓隊友做得更好。結果,團隊強大了很多,也如願收穫了世界冠軍。

由此,戴文淵學會了變通。如果方向清晰,那就一直往那個方向走,用什麼方法都行,不是非要用某個方法才行。

一如第四範式的商業邏輯,無論是自己做,還是經由合作夥伴,只要能夠進入到企業客戶,哪一條路都行。

世界級競賽殘酷,創業更是。

頭圖來源:東方IC


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新經濟100人 的精彩文章:

新零售將誕生20家百億美元公司

TAG:新經濟100人 |