螞蟻金服李小龍:「人工智慧+金融」機遇與挑戰並存,螞蟻金服都做了什麼?
編者按:由中國人工智慧學會、阿里巴巴以及螞蟻金服聯合主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智慧大會(CCAI 2017)將於7月22-23日正式召開,屆時,螞蟻金服人工智慧部技術總監李小龍將在智能金融論壇上分享螞蟻金服在「人工智慧+金融」的進展。在此之前,阿里云云棲社區作為獨家直播合作夥伴對其作了專訪。
金融被譽為是人工智慧的風口之一,螞蟻金服無疑是這一風口下的先行者。
螞蟻金服只做Tech(技術),用技術支持金融機構做好Fin(金融),這樣的定位和大多數試水「人工智慧+金融」企業大相徑庭。
不久前,螞蟻金服把其在深度學習圖像演算法研究上的最新成果開放給了保險行業:開放車險定損產品——定損寶。
而這只是螞蟻金服用技術服務金融行業的冰山一角,從支付、智能風控、信貸決策、理財、保險定價、信用到智能客服,螞蟻金服正在在用人工智慧來影響和助力金融行業。
這背後給技術帶來了多大的挑戰?
螞蟻金服人工智慧部技術總監李小龍表示,螞蟻金服所做的人工智慧研究都是基於場景,而這樣的嘗試遠比單純的學術研究複雜。以定損寶為例,產品核心的技術是圖像識別,但它的實現比人臉識別、普通的圖像識別難度更高;除此之外,還需要根據不同的輸出結果來計算出保費的變化情況。
問題的維度更加複雜,這是金融行業獨有的挑戰,這種情況下演算法需要怎樣的創新?模型是否具備可解釋性?螞蟻金服正在攻克「人工智慧+金融」領域最棘手的問題。
以下是雲棲社區對李小龍的採訪實錄:
雲棲社區:您一直專註機器學習和數據挖掘等領域,這些技術在螞蟻金服業務中發揮了什麼樣的價值?
李小龍:機器學習和數據挖掘在螞蟻金服很多場景上都有應用。金融行業非常關鍵的能力之一是洞察用戶,給用戶更精準的畫像,這是數據挖掘裡面很重要的一環,我們可以根據用戶畫像更好的進行產品推薦,或者是智能營銷。
比如支付寶線下支付的營銷活動(獎勵金),應該給什麼樣的人發獎勵金?發多少獎勵金會進一步提升他消費的活躍度?這些會涉及到智能圈人和智能推薦的問題,我們用到了機器學習的模型;還有金融產品推薦,如基金推薦、保險產品的推薦也需要用到機器學習的演算法;而智能客服、理財社區機器人還涉及到NLP、語義匹配、長句分析匹配等問題。
這些應用場景都需要機器學習的模型包括深度學習的模型來解決。
雲棲社區:螞蟻金服一直希望用技術助力金融行業,現在做出了哪些創新?
李小龍:螞蟻金服在技術上有很多的創新,保險產品的推薦就是其中之一,在這個產品中我們利用了多維度的用戶畫像數據。
舉個例子,我們基於大數據分析發現穿緊身牛仔褲的女孩手機比較容易碎屏。因此啟發了手機碎屏險的精準推薦,事實證明轉化成交率也比較高。
還有在智能客服裡面,我們採用了基於語義匹配的大規模層次聚類演算法來做用戶原始問句的聚類,然後用聚類產生的標準問題來代替原來人工定義的知識點的問題,這可以更好的反映用戶的真實訴求,也能簡化知識庫的建設過程。
另一個值得一提的是機器人問答,螞蟻金服客服機器人的解決率現在已經超過了人工(比人工高了三個百分點),這是怎麼實現的呢?除了應用很多業界比較新的深度學習的演算法並且結合我們的實際進行模型創新之外,我們還採用了問題推薦和相關問題推薦,也就是在精準匹配模型的信心分較低的情況下,把多個問題的推薦作為問答機器人的一種輸出方式,另外,即使在信心分較高的情況下,在直接輸出知識點的同時,也會輸出相關問題的推薦(一般對於比較複雜的問題,相關問題往往也是用戶關心的),然後通過點擊數據就能夠得到用戶的反饋來訓練模型,從而通過不斷自學習來提升模型效果,這在QA上是相對比較少的一種做法,但在我們的客服機器人上取得了很好的效果。
雲棲社區:不久前,螞蟻金服向保險行業開放了「定損寶」,這其中使用了哪些人工智慧技術?
李小龍:傳統保險公司的車險處理流程,一般為報案、現場查勘、提交理賠材料、審核、最終賠付。用戶完成整套鏈路獲得理賠的周期往往長達幾周甚至一個月。而定損寶可以通過技術來提升車險理賠的效率。
這其中涉及的人工智慧技術種類非常多,如圖像識別、圖像分割,圖像定位以及決策模型、目標檢測,雜訊去除等等。
當然,這其中實際上存在很多挑戰。雖然在深度學習的成熟讓圖像識別在最近幾年取得了突飛猛進的發展,各項大賽中的識別率每年都在提升,但在圖像定損上依然有非常大的挑戰。這比人臉的識別、普通的圖像識別難度更高,比如光照反光程度的細微變化就會極大地增加識別難度,即便是人眼也很難分辨這其中的差異。我們基於計算機視覺演算法以及多模型才能精準輸出針對各種程度的刮擦、變形、部件的開裂和脫落等損傷的定損結論。
雲棲社區:您之前提到過深度學習的局限性,例如小樣本場景下的挑戰?螞蟻金服是如何解決的?
李小龍:深度學習需要克服的一個問題是不可解釋性,例如芝麻信用是需要強解釋性的,減分和加分都需要解釋,如果用深度學習則是比較難解釋的;另一個例子是信用風控,雖然目前在中國拒絕貸款不需要給理由(在美國是必須要給理由的),但實際上這會給客服帶來很大的壓力,如果不給理由,用戶會打很多電話去問客服。
另外,深度學習在樣本數量過小的場景下也比較難發揮作用,小樣本學習現在是學術界非常感興趣的問題。不過,螞蟻金服的個別場景中存在的另一個嚴重問題就是標註樣本比較少,而大部分機器學習演算法以有監督學習為主,這對樣本的標註需求比較大。例如在安全風控裡面沒有標註,或者說是標註非常少的情況下怎麼去做建模,我們叫做隱案挖掘,這是很大的挑戰,目前,我們採用的是無監督學習或者半監督學習方法來克服這樣的難題。
雲棲社區:針對大規模數據訓練,螞蟻金服現在在使用大規模參數伺服器「鯤鵬」,介紹一下這其中的應用。
李小龍:鯤鵬是螞蟻金服和阿里巴巴一起合作研發的大規模參數伺服器,我們從2014年就開始研發,2015年在阿里集團正式上線。目前它的規模能夠支持百億甚至千億的特徵,千億級別的樣本,以及最大萬億的參數規模,這是業界的一流水平。阿里經濟體內部包括幾乎所有BU的120多個場景都在用鯤鵬訓練模型,包括現在螞蟻很多場景也都在使這個功能,比如前面提到的智能營銷、智能推薦,還有智能客服。另外,在安全風控領域我們也用到了鯤鵬來訓練大規模的深度學習模型。借這個機會也打個廣告:今年8月份在加拿大舉行的全球頂級數據挖掘會議KDD上我們會以Oral報告的方式第一次向學術界和工業界介紹鯤鵬系統和演算法的特點、我們的創新以及在阿里和螞蟻業務的應用,歡迎大家到時候參加和指正。
雲棲社區:金融領域會面臨很多安全問題,螞蟻金服如何通過人工智慧技術來規避這些風險?
李小龍:金融領域最核心的兩個問題就是安全風控和信用風控,針對安全風控問題,螞蟻金服人工智慧部和安全業務部門正在進行緊密的合作,用先進的人工智慧技術,如深度學習模型來代替代原來人工規則為主的體系,這可以大大提高效率。舉幾個例子,我們目前把深度學慣用在了可信領域,即在每天的幾億筆交易中判斷是不是可信的交易,如果不可信就中斷,我們的模型能在儘可能減少用戶打擾的情況下,保持很高的安全性。第二種情況下是盜賬號模型,當一筆交易被系統判斷它是不可信的情況下,我們還要再確認是不是盜帳號,這需要更多精細的特徵來描述,也需要創新的演算法才能實現。我們採用了業界創新的GBDT+DNN的模型,超越了之前的單個模型以及GBDT+LR的效果,在實際業務中取得了很好的效果。
雲棲社區:越來越多的互聯網企業和傳統金融機構都開始著手研究人工智慧+金融,螞蟻金服有哪些技術特點?
李小龍:螞蟻金服的特點就是依託了阿里和螞蟻的豐富場景(安全、信用、徵信、微貸、客服、保險等)來構建機器學習平台。在實時性、安全性、穩定性和可靠性這幾個方面,螞蟻金服的人工智慧技術比常規的人工智慧要求更高,換句話說就是金融級的人工智慧。
因為現在有很多研究是純研究,或者純應用的,而螞蟻金服是基於場景在研究,結合了研究和應用兩個方面,它帶來的挑戰更大。例如,車險定損就是非常好的例子,它比一般意義上的人臉識別或者圖像識別的挑戰更大,因為這些都是基於真實的用戶問題出發的場景。基於真實的用戶問題,基於真實的場景來研究,最終是解決這些大規模的實際問題,實現普惠金融的目標,讓金融觸達80%以上的用戶,這比單純的學術研究更具挑戰性,也更有價值和意義。
雲棲社區:未來,人工智慧+金融的發展方向在哪?現在最需要哪方面的人才?
李小龍:從技術角度看,共享學習、強化學習、遷移學習、無監督學習和圖推理是業界的一個方向,雖然有些方面的基礎研究的進展並不理想,但我相信它們一定是未來的趨勢。
關於人才,懂演算法又懂工程是我們最需要的,同時,演算法不僅要要緊隨國際前沿,在功能上它還需要快速的落地。目前螞蟻金服非常缺的是圖像、信息安全加密演算法以及大規模分布式系統的人才。
雲棲社區:作為 CCAI 智能金融論壇的主席,組織這一論壇的出發點是什麼?本次論壇將主要圍繞哪些內容展開?希望為聽眾解決哪些問題?
李小龍:組織智能金融論壇的目的是為了針對金融智能前沿的一些挑戰,集中學術界和工業界的智慧,大家一起來碰撞然後產生更好的觀點和可能的方向,從而推進人工智慧+金融的進展。
我們邀請了許多學術界和工業界的頂級專家:例如工業界的嘉賓有柳崎峰老師,他現在專註做量化交易的工具,通俗點說是通過智能的方法去判斷交易的風險,然後幫用戶做決策;學術界的嘉賓比如ACM Fellow鄧小鐵老師是專門做博弈論市場機制的,對於金融博弈下的價值學習有很好的經驗和觀點;香港中文大學計算機系的張勝譽老師,他正在研究計算複雜性理論以及AI在資源分配中的應用;王夢迪老師是普林斯頓大學的助理教授,研究的內容包括增強學習在智能金融的應用;還有喬治亞理工學院的傑出教授Sudheer Chava,專註計算金融學的研究,他將帶來對於AI應用在金融界的優勢和挑戰的一些整體思考。
我們希望通過工業界和學術界的頂級專家在論壇上的思想碰撞讓聽眾了解到金融智能的熱點話題,例如有哪些比較實用的方法,學術界在探索哪些新的方法,學術界和工業界怎麼更好的結合,等等。
※深度學習中的奇怪循環 你知道幾個?
※基於HybridDB for MySQL的企業ODS方案
※5個步驟 & 7個提示|一份開啟Kaggle競賽征途的初學者指南
※程序日誌處理挑戰與方案
TAG:雲棲社區 |
※金毛與泰迪誰都不服誰,智力挑戰一決雌雄,金毛的表現亮了
※加密貨幣:瑞士金融中心的機遇還是挑戰
※互金協會李禮輝:去中心化的網路虛擬金融對金融監管構成巨大挑戰
※人工智慧的機遇與挑戰
※金融機構「擁抱」區塊鏈 機遇與挑戰並存
※這到底是什麼黑科技?人工智慧竟「挑戰」競技遊戲
※人工智慧打擊假新聞,機遇與挑戰並存
※金融改革機遇與挑戰並存 業界呼籲構建現代金融體系
※人工智慧:前景與挑戰並存
※單繼進:金融信息服務蓬勃發展 是銀行的機遇也是挑戰
※腹黑又毒舌?敢挑戰「洛熙」的黃聖池其實是軟萌小奶狗!
※人工智慧的問題及挑戰
※鬥魚嘉年華遭「自己人」踢館,金主爸爸帶「女團」挑戰鬥魚一姐權威!
※大牌明星都駕馭不了的衣服你敢挑戰嗎?
※大數據金融帶來的是機遇還是挑戰
※設計師拿什麼對抗「人工智慧-魯班」的挑戰
※人工智慧對人類而言,究竟是挑戰還是機遇?
※為了粉絲穿上古裝的愛豆們,金韶情金度延車銀優,誰可以挑戰古裝劇?
※人工智慧「矽谷」或落戶中國 法媒:是機遇也是挑戰
※肉肉的唐藝昕挑戰唐嫣同款衣服,網友:兩個人的差別真的太大了!