天雲大數據雷濤:Fintech實踐:從BI到AI的演進路徑
數據猿報道,2017年6月29日,由數據猿主辦,互聯網普惠金融研究院聯合主辦,中國信息通信研究院、大數據發展促進委員會、上海大數據聯盟、首席數據官聯盟、中國大數據技術與應用聯盟、上海金融信息行業協會協辦的「數據猿·超聲波」之金融科技-商業價值探索高峰論壇在上海隆重舉辦。
本次峰會主要聚焦產業方、服務提供方、投資方、業界專家學者等一起從風控、區塊鏈、量化金融、個性化保險、大數據技術服務、客戶管理,六大方面共同探索「大數據在金融領域的商業價值」,推進金融科技領域的發展與創新。
在峰會的主論壇上,不但發布了由數據猿聯合HCR慧辰資訊、DataPipeline聯合編撰的《數據驅動金融升級,商業價值落地探尋調研報告》,還為多家企業及個人頒發了「2017金融科技·大數據優秀案例」之技術創新獎、應用創新獎、最佳實踐獎以及數據猿專欄優秀徵文獎在內的多個【金猿獎】獎項。
以下是數據猿現場直播「天雲大數據CEO雷濤」的發言實錄:
我們可以深刻地感受到,大數據並不是今天才做起來的,事實上,BI已經做了20年,那麼在新技術領域裡面,與AI相比BI有什麼路線呢?
大家知道,現如今更多的數據利用都是面向人去做決策的,我們自己也參與了一些BI的項目,從中可以發現, BI裡面確實有一些局部的創新,在整體結構上,數據驅動對於業務流程衝擊的變化更多是由AI帶動的,從一個面向人去做決策的過程開始走向自動化實施的過程,就像淘寶購物,都是直接嵌入到前端的。
在過去的幾十年里,計算機被廣泛應用於完成自動化任務,後者是被清晰的規則和演算法描述的,如今機器學習技術允許我們在難以精確描述規則的邊界內完成同樣的任務。
最傳統的BI階段是由人定義出一個清晰的規則,再放到決策引擎里去跑,這是第一個階段。但是小數據時代仍然離不開「老三樣」,需要一套SaS的保險平台、一批科學團隊做數據科學服務,以及基於這兩者生產出來的策略引擎。大家可以看到,現如今的人工智慧,比如阿爾法狗等等,都非常清晰簡單,圖象只有IGB在象素上面的填充,但是在後台反饋出來的都是非常豐富的語義環境。當這些特徵和內容很難被人類用簡單的、清晰的語言描述出來的時候,BI失效的前提下我們該怎樣用AI的方法提供更大規模的計算?針對這個問題,我想跟大家分享三個觀點:
第一個就是離線抽樣to在線全量。當大家談論到人工智慧的時候,第一印象是怎樣的?也許是一個客服機器人,又或者是人臉識別等等,大多局限在很窄的場景應用裡面。而我今天跟大家分享的是泛AI的概念,就是怎麼樣利用很基礎的機器學習能力支撐你的企業流程的改造BI的升級。
首先,最重要的過程是數據資源的建立。當你跑一些很前瞻性的,捕捉這些隱含變數非線性事實的時候,數據已經被抽樣,很難去面向我們的APP,微信等技術做營銷了。而對於現在比較漂亮的前端應用、智能投顧的項目、閃貸的項目來說,無疑都面臨著即時性很大的挑戰,因此我們現在要用到全量數據建模,而不是用抽樣的方法去做統計了。這個概念所存在的最大的差距就是學習型的模型輸出上的差距。
第二個觀點是從靜態個體到動態關聯。在金融業務裡面,我們現在面臨著太多的挑戰,數據維度不夠,或是處理信息的方式方法太LOW了,我們傳統上只有一維的方式從頭讀到尾,二維數據標的格式,但是大量的信息結構裡面,複雜的高維結構很難量化和處理。
第三個觀點就是我們傳統的基於統計思路開始逐步進入到大規模的學習階段。這個學習跟傳統小數據學習也有很多差異性的本質區別。比如說在反欺詐方面,反欺詐最大的挑戰就是在申請的時候,數據資源非常有限,只有你的申請進件的表格信息,沒有更多的數據。按照BI的思路怎麼解決呢?BI的思路獲取更多的數據員核實,因為僅靠銀行的這些信息橫向比較有效性非常少,因為覆蓋的比例很低,這個時候我們怎麼去滿足呢?包括這些黑名單,黑名單整個的客戶佔比太低,信息量完全不足,尤其是團伙型犯罪。
我們接到的一個項目,廣東一個村子都不還,每個都是真實的身份證電話號碼和住址,就是集團性的犯罪,這種方式給銀行企業帶來的損失非常大。這個時候我們開始考慮,不是從豐富外部數據源的角度,而是如何用高維的手段將已經有的信息提高識別率。
我們早期做的風險種子平台就是將圖譜應用起來,我身邊有多少騙子,通過這些信息我們把特徵扔到學習平台上,這個學習平台如果是使用傳統小數據的邏輯回歸,決策樹這些方法肯定是失效的,而現在深度學習可以通過路徑強化和強化學習將有效的數據很好的保留起來。
現在在AI領域裡面最成熟的是將答案交給機器,用一個有監督的訓練方式,通過大規模的持續的重複數據的輸入通過深度學習的層級網路把這些隱含的我們無法定義的金融屬性特徵表達出來。
最後講一下業務價值的融合
ABC就是從Algorithm bigdata cloud,我們能不能有效的做融合提交。大家不需要掌握太多的前沿的知識範疇也可以實驗一下深度學習。
PaaS本身從去年已經出現了趨勢性的平台,無論是谷歌,還是今年國內的幾個大型的BAT廠商也都開始出現了PaaS化的平台趨勢,我們現在已經在兩家大型的股份制銀行投入了AI的SaS平台,去年也拿到了對AI平台的認可,和科大訊飛拿到了榜單。
AI不是基於少數科學家的團隊能駕馭的,而是通過AI的PaaS化,以前沒有用過AI的團隊也可以快速地進入這個領域,那麼以前使用傳統SaS的這些數據挖掘平台的團隊可以更高效規模化的使用,謝謝大家!
※大數據周周看:京東與商務部合作發力消費大數據
※大數據24小時:阿里巴巴投資10億美元進軍東南亞市場
※大數據24小時:特斯拉挖來計算機視覺專家任AI主管
※印度人工智慧導購公司Unbxd獲得1250萬美元C輪融資
TAG:數據猿 |
※獲1億元融資,天雲大數據致力成為AI生態中的Android平台
※天雲大數據雷濤:以AutoML為客戶賦能,降低AI應用門檻是未來方向
※天雲大數據CEO雷濤:DT時代中的人工智慧
※天雲大數據完成一億元人民幣增資 PaaS化AI平台降低人工智慧使用門檻
※斑馬快跑與楚天雲達成戰略合作:斑馬APP將實現客運聯網售票
※為5000+企業提供IT服務 航天雲網引領智能製造邁向新高度
※天雲大數據:賦予平台自動化機器學習能力,沒有數據科學家也可以用好AI
※「EXO」「分享」190107 昨天雲養鵝 不如今天雲養虎吧
※桃花艷艷靜無塵,照溪紅映一天雲....
※見聞:古觀—玄天雲台
※航天雲網領航工業互聯網發展新高度
※【見聞】古觀——玄天雲台
※天雲大數據獲1億元融資,曦域資本、華映資本領投
※外媒關注中國軍民融合成績斐然:航天雲網平台成交額超3000億
※天雲星數據魔方
※航天雲網工業互聯網平台註冊用戶超過200萬
※16號颱風「貝碧嘉」明日登陸粵西,未來幾天雲浮的天氣……
※美甲教程 | 藍天雲海美甲
※俗語:「未到驚蟄先打雷,四十九天雲不開」,今年雨水多不多?
※青鸞杳,碧天雲海音絕。【月上海棠·原頭野火燒殘碣】