做過120個項目的「老兵」談復星集團的大數據布局 數據科學50人·甄浩
文/胡世龍
如今,我們每個人都在談論「數據科學」,哈佛商業評論雜誌甚至將數據科學家定義為「21世紀最性感的職業」。在這個大數據時代,究竟什麼是數據科學?數據科學領域的科學家、從業者們又究竟是怎樣的一群人?他們在創造著什麼令人著迷的東西?DT君將在2018年走訪50位來自各行各業的頂尖數據科學從業者,希望能讓你們了解這些神奇的人和他們神秘事兒,為你們一窺數據科學的未來與未知。
▍搞大數據不會說段子怎麼能當好首席數據官
2018年2月初,在復星集團舉辦的2018年C2M智能科技峰會上,DT君聽到了兩個大數據的段子。一個是關於國內幾類大數據人群「臉譜」的:
如果在某個大數據相關會議上,有人一上來就提演算法,那八成是學校的人;而如果一上來就提Hadoop、Spark的,一定是開源社區的人;一上來就用三個V、四個V來定義大數據的人,基本上是政府官員或者剛剛接觸大數據的人;而一上來就談到項目的人,多數是工程師或項目經理。
說段子的,是復星集團旗下上海星濟信息科技的首席數據官甄浩。按照甄浩自己的描述,他更像是最後一類大數據人。在他的職業生涯中,各類數據項目一直是他最為熟悉和擅長的。
(圖片說明:甄浩在2018年C2M智能科技峰會現場接受DT財經專訪)
過去15年,甄浩先後服務過民企、國企、外企,做過數據工程師、數據架構師、大數據解決方案顧問、總數據官等。這期間,他主持或參與的數據類項目有近120個,涉足銀行、保險、醫療、互聯網等多個領域。
近些年,甄浩卻尤其專註於健康醫療大數據的運營與產業化開發,並且還擔任國家衛計委委員會和多個項目的專家委員。
2017年12月,甄浩從北京轉戰上海,擔任作為復星集團旗下大數據業務平台的上海星濟信息科技有限公司首席數據官。甄浩眼中,未來,醫療大數據仍是自己最想繼續深耕的領域,復星大數據也會用大數據和AI去賦能各個行業,做智慧醫療、智慧旅遊、智慧商圈等。
與甄浩見面,DT君還收穫了第二個段子。在問及數據科學的定義時,甄如實道來:「很多人會將數據科學定義成一套科學,但像我們做的這類業界的事情,算不算呢?我覺得算。科學家常常做的事情很神秘,結果反而弄得很學術。」
提到這,作為大數據界的段子手的甄浩說了另一個段子:
數據科學其實做的就是兩件事,第一是算命,就是根據歷史的情況來分析現在是什麼情況。測字先生通常會問你要問什麼事情,然後通過數據,掐指一算告訴你出現了什麼情況。第二件事叫做改運,因為已經知道了發生了什麼狀況,下一步就是要趨利避害,讓數據告訴你如何改變命運。
甄特彆強調業務場景的重要性。「很多科學家在實驗室中埋頭做數據分析得到的結論,在業界卻可能是常識,要避免這樣的問題,就應該更加結合業務,做到所謂的』接地氣』。」
▍談數據思維:從項目驅動到運營驅動
甄浩是北京人,本科學的是電子工程,畢業之後,先是進入一家科技公司擔任數據工程師,後來又在長城計算機軟體與系統公司擔任數據架構師。
儘管一開始做的是編程,更多和前端及後台演算法接觸,但和數據打交道多了,甄浩對數據在企業內部的應用和作用也逐漸明晰。在他看來,演算法和各種編程語言是相對多變的,但數據卻是相對穩定,也是和業務最為接近的。
用他的話說,「2005年、2006年的時候,自己就看到了這樣的趨勢,因此也決定做離業務更近一些的東西」。
這樣的想法,在IBM中國得到了實現。2011至2015年間,甄浩任職IBM中國公司大數據解決方案顧問,各種不同類型的數據項目,著實讓自己離業務近了很多。這一時期,他作為項目負責人,給銀行、電信、政府、保險等行業的不同公司提供過大數據解決方案。
在這些案例中,他印象比較深刻的是曾經幫助中國銀行做過呼叫中心的數據項目。
甄浩說:「以往,呼叫中心的話務員接到呼入的電話,要在目錄菜單裡面慢慢找答案,耗時較長。但我們幫他們做了一個搜索引擎,只要輸入關鍵詞就能迅速查到結果,就跟百度一樣。並且新的數據能夠實時更新到庫中,被迅速查詢到。當時,我第一次明顯感覺到分散式計算對整個系統帶來的支撐,能夠同時支撐幾千個話務員進行實時的查詢。」
在IBM的項目經驗算是甄職場的分水嶺。此前,他做的工作多是由項目來推動。但離開IBM後,他在阿里短暫任過數據生態總監,也在國企中電旗下中電數據服務有限公司擔任過首席數據官,再到2017年底進入復星,這一階段則是基於數據運營來驅動。
「在這些企業內部,初期的時候往往也有很多項目,但當數據積累下來、治理好之後,就轉為數據運營。」
在從事數據項目和運營的相關工作之餘,甄浩也在工程專業方向越鑽越深,2010年,他取得中國科學院研究生院的軟體工程碩士學位;目前擔任首席數據官的他,還是天津大學先進位造方向的在讀工程博士。
所學專業的變換,看起來和數據的關聯不大,尤其先進位造方向。但其實不然。甄浩告訴DT君,很多人覺得,搞數據科學的人和搞工程實踐的人水火不容,但在他自己的實踐中,這兩方面並不矛盾,比如,目前他博士期間的研究方向是腦機介面、物聯網相關的先進位造,這和數據的關係很大。
▍談醫療大數據:產業化起步,前景向好
過去幾年,國內醫療行業興起了一場大數據變革。變革的背後有著政府政策層面的強力推動。
2016年10月,國家衛生計生委在北京的一場電視電話會上,宣布福建省、江蘇省及福州、廈門、南京、常州為健康醫療大數據中心的第一批試點省市,2017年12月,試點進一步擴大到了山東、安徽、貴州三省。
甄浩在任中電數據服務有限公司首席數據官期間,曾深度介入國內健康醫療大數據產業,是福州市醫療大數據中心與產業園建設國家試點工程的項目負責人。
甄指出,在醫療大數據領域,幾個不同的主體有著不同的訴求:國家衛生計生委的訴求,是能合法收集醫療大數據;地方政府則希望兼顧經濟發展、招商引資;而醫院本身,也有數據分析應用的需求,比如說跨醫院的轉診或者科研,就有著數據交流、共享的需求。
「健康醫療大數據涉及到國家的生物安全,不太能商業化,有著某種社會公共的屬性」。雖有商業化方面的限制,但在福州項目上,甄浩帶領的團隊基本摸索出了一條路。
先是立法,由政府出台數據的相關管理辦法,明確權責、數據權屬、數據的運營方案等;第二步則是數據的匯聚,在福州,健康醫療大數據中心匯聚了市裡二級以上醫院的全量數據,讓數據能夠實時呈現;第三步是在地方立法的前提下保護數據的安全和隱私。
「從數據安全方面考量,由我們將數據隨意給出去是危險的,因此我們選擇了定向開放,只有遵守數據的安全和隱私規則,並且在產業園區落戶的企業,才可能獲得數據。」
而一旦在合法前提下向部分企業開放了醫療大數據,產生的產業化能量可能是巨大的。比如,製藥企業可以加快新葯研發的效率,對保險業來說,則可以基於臨床的數據,獲得關於某些疾病的發病率、人群方面的信息,在推出新的健康險產品和營銷方面,也有很大的幫助。
在甄浩看來,這基本上是一個良性的循環。「對當地政府來說,能通過引進產業獲得稅收,而稅收又能直接轉化為惠民服務。而從居民個人來說,以往挂號時掛什麼科可能都不太了解,但有了數據的支撐,可以很精準地知道。此外,將來醫院還可能基於大數據,給不同的癥狀的患者提供定製化的服務,這對於患者自身也是有利的。」
▍復星集團的大數據布局
2017年12月,甄浩從中電數據服務有限公司轉到復星集團旗下星濟信息科技有限公司任職首席數據官。從北京到上海,這背後,甄浩的考慮是上海在大數據應用方面的施展空間更大。
在復星,大數據方面的內部整合和新的布局已經展開。目前,整合內部資源,復星推出了「星際大數據」平台,在這個平台,能夠提供各行業的解決方案。
「復星的業務以往更多是以實體為主,比如醫藥、地產、建材等等。星際大數據平台,就是希望能通過大數據、AI(人工智慧)賦能各個行業,為傳統行業帶來轉型升級。」甄浩說。
另一方面,復星提出了C2M(顧客直連工廠,Customer to Manufactory),在這之中,大數據算是最核心的內容。
(圖片說明:復星集團的C2M闡釋)
目前,基於復星自己的實體產業資源,「星際大數據」平台已經有幾個大的業務板塊,比如,智慧商圈、智慧金融、智慧旅遊、智慧健康。
舉例來說,復星已經在智慧商圈方面有所布局,與上海豫園商圈的合作即是一例。
甄浩向DT君介紹,傳統上來說,商圈運營模式最大的問題在於無法量化,因此要做的第一件事情就是「線下業務的線上化」。復星幫助豫園開發了一款商家導航類的App,通過App,可以定位到商家的位置等信息。對商圈運營者來說,這樣就可以收集到一部分用戶的數據,了解到人流量、顧客畫像等信息,這些在以往都是摸不準的。
不過,這種新的模式的最大問題在於,如何才能吸引顧客下載並持續使用App?
對於這一點,甄浩覺得,問題要回到數據的運營。「要吸引更多人來用,就得根據顧客的習慣,以數據為核心,打造一個業務閉環。通過數據的運營,為用戶提供更好的服務。」
除了智慧商圈,智慧健康也是甄浩最希望能取得突破的。他提出了依託於復星醫藥和醫院相關的產業資源,打造以人的健康為核心的智慧大健康業務板塊的想法。
具體做什麼?怎麼做?
「從復星集團來說,健康醫療是很重要的一個業務板塊,在實體業務方面也有深厚的積累。我們就希望能打造一個面向政府、醫院和基層的的健康大數據的產業生態平台,做到惠民,惠企,惠政。」甄浩如此解釋。當然,要完全實現以數據運營為核心的健康醫療產業生態閉環,他也坦承,需要做的工作還有不少。
展望未來的工作和過往的經歷,甄浩尤其覺得,做大數據工作,每個人對數據的準確都應常懷有「敬畏之心」。
他跟DT君舉了這樣的例子:
剛剛入行之初,他參與了澳洲保險集團的一個數據項目。當時,原始的業務系統是英國人做的,因為沒有校驗功能(DT君註:校驗功能能避免很多錯誤,比如,限制數據格式,格式填錯就無法提交),澳洲保險集團在中國的業務操作人員錄入的數據很多都較為粗糙,有不少「臟數據」,直接影響了其後的數據分析。
於是,澳洲保險集團和英國供應商取得了聯繫,希望能對原始業務系統加以改造,加上數據校驗的功能。不過,英國派來的一位工程師對此明確拒絕。
「這位英方工程師表示,確保錄入數據的正確是你們的職責,而不是系統的問題。」對剛入行的甄浩來說,這樣的回答讓他震撼。甄感慨說:「中國人的思維常常是我們在系統設計上就把所有的問題都給預防了,但卻忽略了最細微處的個人對數據的責任。這顯然是數據文化出了問題。」
題圖 | 視覺中國
▍關於數據科學50人
數據科學50人項目是DT財經旗下數據俠計劃重點內容產品,旨在與數據科學領域KOL共同挖掘數據內容的價值。我們從商業數據科學領域選出最具代表性的50位先鋒進行深度專訪,50人由DT財經獨立評審並發布,第一財經數據科技及合作夥伴傾力支持。
▍數據俠門派
甄浩,復星集團上海星濟信息科技有限公司首席數據官。有15年IT行業經驗,10年數據相關領域經驗。先後在民企、國企、外企、互聯網企業中從事數據類相關工作。曾任IBM大數據解決方案顧問、阿里雲數據生態總監、中電數據服務有限公司總數據官。曾主持或參與近120餘個數據類項目。近些年專註於健康醫療大數據運營與產業化開發。
▍加入數據俠
※極客公園創新大會 IF 2018,大佬雲集講述科技主義的力量
TAG:DT財經 |