從金融科技創新到金融模式變革
摘 要
近年來,以「ABCDE」等為代表的金融科技創新不斷加深與普惠金融、共享金融、移動金融、物聯網金融等新金融模式的相互融合。當前,國內各商業銀行正處於零售金融業務轉型的關鍵時期,針對客戶的各類消費場景生態建設對金融大數據的實時處理提出了越來越高的要求。而流式計算作為金融科技近年來的熱門研究方向,在大數據實時計算領域具有廣闊的業務應用場景。本文以目前商業銀行大零售領域最具創新活動的信用卡業務作為切入點,深入討論了流式計算在信用卡大數據實時應用領域的具體創新應用。
引言
金融科技(FinTech)是指利用科技手段對傳統金融業所提供的產品、服務等進行革新,提升金融效率。其以數字化、移動化、虛擬化、智能化為主要標誌。近年來,以人工智慧(AI)、區塊鏈(Blockchain)、雲計算(Cloud Computing)、大數據(Big Data)、邊緣計算(Edge Computing)等「ABCDE」為代表的金融科技核心技術相繼湧現,成為金融創新的新風口。伴隨著國內金融業的深刻轉型,金融科技與代表著新興金融方向的移動金融、互聯網金融、消費金融、社交金融、普惠金融、物聯網金融、共享金融等相互深入融合,並在逐步重塑金融產品的開發模式、金融活動的流程、與用戶的交互方式,乃至金融組織架構。諸如在邊緣計算與物聯網金融、共享計算與共享經濟、虛擬現實(VR)與智慧銀行、機器學習(MachineLearning)與智能投顧、區塊鏈與新一代金融基礎設施構建,以及金融支付模式變革、生物特徵識別技術與刷臉支付(Smile to Pay)和指紋支付、光學字元識別(OCR)與無感支付等細分金融領域,無一不體現了金融科技在金融創新驅動中的引領作用。同樣,在大數據領域,海量金融交易數據的實時處理與應用,對於需要深耕個人客戶營銷、爭奪客戶金融消費場景並加強金融風險防範的傳統商業銀行零售金融業務,也有著十分重要的意義,也是當前金融科技領域的研究熱點之一。
一、大數據與流式計算
一般意義上,大數據是指無法在一定時間範圍內採用常規軟體工具進行獲取、存儲、管理與處理分析的數據集合,包括結構化、半結構化和非結構化三種數據形式,並且具有Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)的5V 特徵。在大數據的計算模式方面,可以分為批量計算(Batch Computing)和流式計算(Stream Computing)兩種主要類型。相對應的,批量計算處理的大數據我們可以稱之為批式(Batch)大數據或歷史大數據;流式計算處理的大數據我們可以稱之為流式(Streaming)大數據或實時大數據。
(一)批量計算
批量計算又稱為離線計算,在目前批式大數據處理方面,Hadoop 作為一個分散式處理的軟體框架,已經成為公認的業界標準,具備高可靠性、高效性、高擴展性、高容錯性、高可伸縮性等突出特點。Hadoop 分散式計算平台最核心的三個部分為:HDFS(Hadoop Distributed File System)、HBase(HadoopDatabase)以及MapRduce。其中,HDFS 是Hadoop平台下的一個分散式文件系統;HBase 是一個構建在HDFS 上的分散式列存儲資料庫NoSQL ;MapRduce 是一個並行計算模型,用於完成對大數據集並行計算任務的處理。在具體的批數據處理模式上,Hadoop 先將待處理的大數據以離線方式匯聚成批,之後藉助HDFS 將數據載入並分發到各個節點,最後MapRduce 通過調度批量任務,來並行操作處理這些靜態大數據並得出計算結果。
在大數據時代,隨著越來越多的應用場景,特別是在金融領域,對於數據的時效性和實時處理的要求不斷提高,傳統的大數據批量計算方式開始顯現出諸多不足之處。現有的大數據處理方式將在線事務處理和離線分析從時序上完全分割開來,存在天然的數據遲滯性高的問題。另外,傳統的資料庫並不是為快速連續存放單獨的數據單元而設計,無法滿足一些實時性要求很高的應用。若把大量、快速、時變、持續到達的數據流簡單地放到傳統資料庫管理系統中並在其中進行操作,不僅不切實際,也有悖於傳統的計算機存儲關係模型。近年來為了解決這一問題,作為專門對時延敏感的業務提供海量數據集實時處理的流式計算新技術應運而生,成為海量大數據處理的另一利器。
(二)流式計算
流數據
在詳細闡述流式計算的定義、特點、應用場景、發展概況等內容之前,有必要先明確流數據的概念。我們可以將大數據的生成看作一連串發生的離散事件。如果對這些離散事件以時間為軸進行考察,可以將其看作是一條條數據流。不同於離線數據,流數據是由小到若干個、大到成千上萬個不同數據源在源源不斷的事件流驅動下,所持續生成的一組順序、快速、大量、連續到達的數據序列。由於驅動流數據生成的各種事件流可以是互聯網上的網頁鏈接點擊動作、移動客戶端社交工具的各種溝通行為、金融領域客戶的消費支付交易等,因此我們也可以將流數據視為一個隨時間延續而會無限增長的動態數據集合。其具有數據規模不可預知性、一般只能被讀取一次、只能有限存儲的特點。
流式計算
在當前傳統互聯網、新興的移動互聯網和物聯網,尤其是針對個人客戶的商業銀行大零售等領域,智能獲客、客戶精準營銷與個性化服務提供、金融支付、實時風控、事中智能決策等具體業務場景,對實時大數據的應用提出了更高的要求。為了滿足這些高實時的業務需求,新的大數據計算模式必須能實現低遲滯以及在毫秒級,甚至微秒級的響應時間內返回處理結果。這對傳統的大數據離線處理模式提出了嚴峻的挑戰。傳統的大數據批量/ 離線處理模式對於數據分析與處理均遵循日清日畢的模式,即以小時或以天為計算周期,對當前匯總的批數據進行處理。顯然,這種處理方式完全無法應用於上述數據處理時延要求苛刻的業務應用領域與場景。
從數據生成的那一刻開始,數據的業務價值就隨著時間的流逝呈現指數式下降,所以必須儘快地對產生的數據進行計算與處理,最好是在數據一出現便能對其進行實時處理,而不是緩存起來再成批進行處理。流式計算技術的產生即來源於為解決上述數據價值隨時間快速降低造成業務應用瓶頸的金融科技創新。
流式計算是一種專門針對流數據處理的實時計算模型。該計算模型具備了對海量、流式、實時大數據進行瞬時捕獲、處理與計算的能力。流式計算通過對海量流式大數據的實時採集與實時計算,來協助業務系統平台實時感知外界變化,包括從事件流驅動數據流的產生、從數據流的輸入感知到變化、到最後輸出計算結果並主動推送展示,整個過程可以在毫秒級內完成。圖1 為一個典型的流式計算平台架構。
在流式計算環境中,流數據是以元組為單位、以連續數據流的形態持續到達。因此,流數據無法一次性以全量方式參與到實時計算中,只能在不同時點,通過增量累積的方式,逐步得到最終所需的計算結果。從流數據的定義可知,產生一組流數據的數據源往往有多個,因此如果有業務場景需要對過往數據流進行重放,前序數據流中各個元組間的相對順序是無法控制的,也即在數據流重放的過程中得到與之前完全相同的數據流(包括相同的數據元組和相同的元組間順序)是一個NP-hard 問題。絕大多數情況下,流數據的流速具有高速性和非勻速性。隨著時間的推移,流數據的流速大小在不同時間點可以呈現出不同的數值波動狀態。在數據的裝載傳輸上,一個處於流動狀態的數據流中,各個元組的內容(語義)可能會在不同時間點發生變化,即所謂流數據的概念漂移現象。對於流數據來講,其本身存在的生命周期一般很短,從流數據的生成、傳送到最後被流式計算平台獲取與處理,正常情況下只有秒級,因此在時效性上其數據本身的時間價值愈發凸顯。但由於流數據本身的海量性,流數據本身只能被流式計算平台進行有限存儲,又由於實時性的要求,絕大部分的流數據僅會被處理一次就丟棄,因而只有很少量的、必要的數據可以被存儲下來,用於滿足後續其他應用場景的需求。
總體上看,流式計算具備以下兩大特點:第一,實時且無界。由於流數據本身的時間價值,流式計算必須實時對到達的數據流進行訂閱與消費。此外,由於流數據在各種事件流的驅動下源源不斷地生成,流數據將持續地進入到流式計算平台中,這一過程在時間維度上是無界的。第二,持續且高效。由於流數據是持續流入的,因此流式計算也就一直處於持續性的計算與處理狀態中,且每一次計算任務一般都在微秒甚至納秒的時間內完成,計算效率高。
目前,在流式大數據處理領域,業界主流的三種企業級應用框架分別為:Storm、Spark 和Samza。這三種框架都特別適合處理連續大量的實時流數據,具有低延遲、分散式、易擴展、高容錯等特點,且均已實現開源。在以上三種應用框架中,最有名的當屬Storm。其是分散式實時計算的先行者,並逐漸發展為事實上的行業標準,被稱為流式大數據處理領域的Hadoop。目前,使用Storm 計算框架的具有代表性的公司有Twitter、淘寶、蘇寧、騰訊、Spotify 等;使用Spark 計算框架的代表性公司有Amazon、eBay、百度等;使用Samza 計算框架的代表性公司有LinkedIn 等。
二、流式計算在信用卡業務領域的創新應用
在目前國內各家商業銀行紛紛加快推動大零售戰略轉型的背景下,信用卡集資產、負債與中間業務於一身,並具有支付、結算、信貸、吸納存款等多重特點,已經成為銀行大零售金融生態圈建設版圖中最具增長與盈利潛力的一款戰略性金融產品。與一般的零售金融產品不同,信用卡不僅能夠滿足購買者的金融需求,還能夠在產品生命周期內向購買者提供持續、多樣化的後續金融服務。特別是在當前消費金融、互聯網金融、移動金融、普惠金融、共享金融、物聯網金融、社交金融等金融創新相繼湧現並成為國內經濟新常態發展模式下新風口的大環境下,信用卡業務已成為商業銀行創新最為活躍的領域之一。在信用卡大數據實時應用領域,伴隨著近幾年國內各主流商業銀行信用卡發卡量保持持續增長趨勢,以及各行對客戶金融消費場景生態建設力度的不斷加大,每日的客戶聯機交易數據也呈現出快速增長勢頭。這對於正處於零售金融業務轉型期的各家商業銀行來講,既是機遇,也是挑戰。而在用好日益增長的信用卡實時大數據來進一步深耕客戶營銷,進一步管控客戶風險,進一步提升經營決策水平方面,流式計算具有廣闊的創新應用價值。
(一)實時營銷
在具體談及流式計算在信用卡實時營銷業務中的應用場景之前,先來概述一下目前商業銀行信用卡業務所採用的主要營銷方式、實時營銷自身的定義以及實時營銷與精準營銷之間的關係。在這裡,本文將信用卡業務目前常用的營銷方式歸為以下六類:
第一類是非定向式營銷。這類營銷方式是指商業銀行將零售金融產品的營銷信息通過自身行內渠道(例如,銀行官方網站、網上銀行、掌銀APP、手機簡訊等)、第三方關聯渠道(例如,官方微信公眾號、官方微博等)、各種公共媒介(例如,電視廣告、戶外平面廣告、互聯網等),推向所有客戶群。
第二類是分類定向式營銷。這類營銷方式是指商業銀行根據自身制定的市場發展規劃與經營策略,藉助深入的市場調研與分析,有目的性地針對某些特定的市場細分客戶群,通過購物中心、電影院線、機場、汽車4S 店、品牌實體門店、相關互聯網線上的媒介(例如,京東商城、淘寶網、攜程旅行網、美團網等)投送營銷金融產品信息、發布或擺放促銷活動海報等,向目標分類客戶群進行宣傳與推介。
第三類是交叉銷售式營銷。這類營銷方式是指充分利用本行內相對豐富的借記卡客戶資源,通過行內聯動,充分挖掘具有辦理信用卡資質的優良借記卡客戶進行重點營銷。
第四類是客戶群型精準營銷。這類營銷方式是在分類定向式營銷的基礎上藉助於數據挖掘、大數據分析等技術手段,對客戶群體進行更細粒度的區分,根據不同客戶群的消費能力、行為偏好與價值取向,為每個分類客戶群提供更為精細化、差異化、個性化的金融產品服務。
第五類是個體型精準營銷。這類營銷方式是指在一個可以靈活設定的較短時間周期內,商業銀行根據自身的相對優勢與實際情況,選取合適的客戶接觸點,通過最為經濟的接觸方式,直接深入每一位具體的存量客戶進行營銷,關注和挖掘客戶潛在的主動性消費意願,為其量身定做最優化的金融產品與服務組合,並進行營銷信息的端到端推送,進行周期性的循環營銷,最大化營銷效率。
第六類是實時營銷。以上五種營銷方式從營銷事件觸發的時滯性上來看,又可稱之為離線營銷(Offline Marketing)。相較於離線營銷,實時營銷(Real-time Marketing)是指客戶發生了某種金融性或非金融性交易行為的業務場景,亦或是客戶日常非交易性行為的生活場景滿足了發卡銀行後台系統的專家營銷規則條件,觸發了發卡銀行在短時間內(一般為秒級)通過手機簡訊、銀行掌銀APP、銀行微信官方公眾號等與客戶直接接觸的快捷渠道,進行實時營銷信息推送。推送內容可以包括推薦的定製化金融產品或服務、關聯性強的打折促銷等優惠活動信息等。
從以上實時營銷的定義可以看出,實時營銷是建立在精準營銷基礎上的營銷。實時營銷信息的推送內容包含了對於客戶交易行為本身或是客戶當前所處生活場景的智能分析與判斷,但如果沒有對客戶即時顯性需求、即時潛在需求的精準性判斷,一味追求實時性則毫無意義。同時,如果精準營銷脫離了時效性維度(如上述提及的幾種離線營銷方式),在當前客戶需求稍縱即逝、市場競爭格局異常激烈的大環境下,營銷效果就會大打折扣。即使對客戶需求在當時時點上的判斷再精準,脫離了客戶當時所處的業務場景或生活場景,客戶的需求也很可能會發生變化,甚至已經失效,或者已經接受了其他發卡行的類似實時營銷推薦。因此,藉助流式計算平台、具備對客戶需求捕獲高靈敏度的實時營銷,代表了今後信用卡營銷方式的發展方向。可以預見,今後主流的信用卡營銷方式將是以實時營銷為主、以離線營銷為輔的業務模式。
流式計算在信用卡實時營銷業務中的應用場景可以體現在以下三個方面:第一,客戶的金融性交易業務場景。當客戶在綜合類商場、酒店、餐飲店等各類生活場景用卡消費時,發卡行可以藉助流式計算平台對實時交易數據進行獲取與計算,結合當前正在推廣的營銷活動與之進行關聯性匹配。例如,客戶在餐飲店就餐,可以提示客戶下次在與發卡行開展促銷活動的其他類似餐飲店消費可以有相應折扣;客戶在便利店、超市等地點進行購物,可以提示客戶下次使用手機Apple Pay、HCE 等移動支付方式進行付款時,可以進行打折;客戶在家裝建材賣場、汽車4S 店、電器城等進行消費時,提示客戶可以對該筆付款交易辦理分期付款;客戶通過線上渠道購買飛機票時,可以提示客戶辦理相應的航空聯名卡,可以享有哪些額外的乘機與酒店預定等服務。第二,客戶的非金融性交易業務場景。在客戶通過手機端登陸發卡行掌銀APP 時,可以根據用戶在APP 頁面上的實時瀏覽軌跡、相關頻道欄目的客戶點擊量等操作日誌流進行實時計算,分析客戶感興趣的產品、服務和促銷活動等,並向客戶進行有針對性的實時推薦。第三,客戶的日常非交易性行為生活場景。可以利用掌銀APP 上的LBS(LocationBased Service)應用服務,獲取客戶的實時生活軌跡,當客戶途經發卡行正在開展促銷活動的商戶時,可以向客戶進行實時推薦。
(二)實時風控
信用卡在發卡與用卡環節的風險管控是發卡銀行的一項核心工作。風險防控工作開展的好壞、風險防控水平的高低,直接關係到發卡銀行的資產質量與盈利水平。近年來,隨著各家發卡銀行自身發卡量、用卡交易量的不斷增長,以及市場上各類風險事件的逐年上升,給各家發卡銀行的風控工作帶來了很大壓力。
信用卡的風控工作貫穿於從客戶申請卡片到最後卡片銷卡的整個卡片生命周期全過程。從風控工作的業務涵蓋範圍上看,具體可包括貸前風控、貸中風控、貸後風控三個方面:貸前風控主要是針對信用卡申請人的虛假申請、欺詐申請;貸中風控主要是對持卡人日常用卡交易過程的監控,也包括對卡片被盜或卡片被測錄等非客戶本人發起的異常交易行為的監控;貸後風控主要是針對已經發生賬戶逾期或存在惡意透支風險的客戶在日常用卡過程中的風險預警,防範客戶的惡意透支或不按期歸還欠款造成發卡銀行更大的資金損失。
當前,各發卡銀行的風控體系建設普遍存在的一個問題是對實時風控的支持力度不夠,缺少專業的技術支持平台。尤其是在貸中交易風控環節,目前只能夠做到准實時監控,即先讓交易成功,通過發卡銀行後台核心系統的授權、交易金額入賬,完成整個支付過程,再聯機對這筆交易進行風險度辨識;如果識別該筆交易為風險交易,則對該張卡片的後續交易進行阻斷。
流式計算在實時計算處理髮卡銀行流式交易大數據方面具有很好的業務應用場景,具體體現在以下幾個方面:第一,在貸前風控上,可以藉助流式計算平台的實時計算能力,並融合離線監督式、無監督式機器學習模型對欺詐案例的強大偵測能力,實現對於信用卡申請欺詐風險識別的在線實時決策。第二,在貸中風控上,利用流式計算技術搭建以實時交易監控為主、准實時交易監控為輔的新型貸中交易監控體系架構,進一步加強對於風險交易的預警與提前阻截功能。第三,在貸後風控上,目前發卡銀行普遍採取客戶賬單逾期三期以上未進行還款才發起催收工作,藉助於流式計算平台,可以搭建起針對已經發生逾期但暫未達到發卡銀行入催條件的持卡人的實時預警機制,通過實時監控其日常用卡交易行為來識別此類客戶是否存在潛在惡意透支風險,便於及早發現並及時處理。這不僅減輕了後續催收的工作量與難度,也可為發卡銀行挽回潛在、不必要的資金損失。第四,在客戶風控數據收集上,由於發卡銀行核心系統的定位問題,傳統上很難將客戶交易數據相關的大量輔助性但卻具有相當價值的信息保存下來;而藉助流式計算平台,則可以有選擇地將平台獲取到的流數據中能夠表徵客戶細分屬性的相關基礎性數據域。例如,日常活動範圍、交易支付習慣、常用手機終端型號、常用地域等轉存下來,為後續離線機器學習模型不斷調優提供精準的訓練樣本數據。
(三)智能經營決策支持
目前,各發卡銀行的業務經營決策在一定程度上依賴於定期的匯總業務經營數據統計與展示,其數據加工方式主要包括兩種形式:一種是存在一定遲滯性的、由相關係統生成的格式與數據域固定的業務報表,通常以周、月等的時間維度進行展示;另一種是藉助於離線大數據,通過SAS 等專業數據統計工具編寫程序,獲取針對某個專題的數據報表展示。相比於第一種方式,其抽取的數據源表範圍更廣、具體數據種類及數據域選擇性更大,但本身的數據抽取、程序編寫與調試、程序執行與報表生成均需要一定的時間。以上兩種方式目前在對發卡銀行的經營決策支持上仍存在很大的局限性,主要表現有二:第一,報表生成的時效性不高,很難將最新的業務運營情況及時反饋到決策者手中;第二,由於相關係統留存的數據種類限制,生成的報表內容無法完全滿足業務經營決策的需要。
流式計算能夠有力推動信用卡業務經營決策支持進一步向實時化、精細化、智能化方向發展,具體表現在以下幾個方面:第一,新產品發行的後評價。流式計算平台能夠從客戶申請流數據中實時統計新產品發行後各個渠道的累計對應申請量、申請客戶的結構與質量等,便於決策者能夠及時優化、調整新產品的申請渠道、產品宣傳的策略以及產品後續的升級方向等。第二,市場營銷活動開展的後評價。流式計算平台能夠從客戶交易流數據中實時篩選並統計出參與營銷活動簽約商戶的對應交易量與交易金額、整個營銷活動按時間段累計的總交易筆數和金額等,便於決策者能夠及時評估營銷策略、調整營銷活動部署並將數據統計情況與相關營銷活動簽約商戶進行反饋與溝通。第三,更細粒度地收集一般系統未考慮、也很難進行保存的客戶行為類數據。流式計算平台可以實時收集並統計客戶與發卡銀行的掌銀APP 之間的行為交互數據。例如,客戶對頁面上放置的哪類產品或營銷活動介紹的關注度高、點擊次數多,哪些頁面功能的使用率高,客戶在掌銀APP 內的平均訪問路徑長度,哪些配色和哪種圖片風格的頁面更容易受到客戶的點擊瀏覽等。這些數據對於發卡銀行後續調整掌銀APP 的頻道菜單設置與頁面布局、風格設計、圖片搭配,營銷活動的推送順序及熱門營銷活動的頁面擺放位置、受客戶歡迎的實用功能訪問的路徑長度設計等,均具有關鍵性的參考意義。第四,日常業務運營情況實時匯總。流式計算平台可以實時採集客戶使用掌銀APP、網銀等銀行與客戶間主要線上交互渠道的具體情況並進行分類匯總統計,包括日新增APP下載量、日新增用戶量、日活躍用戶量、頁面日訪問量、用戶日均登陸次數、用戶日均在線時長、最高在線客戶數、日均在線客戶數、日金融性交易筆數、日金融性交易額等指標。通過每日的實時運營數據的匯總展示,可以讓決策者掌握最新的客戶行為動向,為後續進一步策划出針對客戶引流、促活與促銷的不同形式的促銷活動提供決策依據。
作者簡介:高尚,中國農業銀行信用卡中心部門科長,高級工程師、中級經濟師;中國農業銀行信用卡中心集中採購委員會評審專家,金穗信用卡獨立審批人;上海金融學會會員,上海市大數據社會應用研究會會員,上海市計算機學會多媒體專委會委員。
來源:國際金融雜誌
TAG:銀行家雜誌 |