當前位置:
首頁 > 新聞 > 技術研發閉關半年,思圖場景欲借視頻結構化植根金融

技術研發閉關半年,思圖場景欲借視頻結構化植根金融

「我們剛剛經過了小半年的技術研發閉關,將主要的研發精力投入在視頻這塊。我就認準了一個,做跟視頻相關的業務。」思圖場景創始人兼CEO張璐告訴雷鋒網AI金融評論。

思圖場景聚焦金融領域的圖像技術,張璐所說的視頻相關業務,當下而言指的是銀行雙錄視頻的結構化處理。從常見的人臉識別、體態識別、表情識別到重點轉向視頻技術,思圖場景經歷了一番思考。

技術研發閉關半年,思圖場景欲借視頻結構化植根金融

打開今日頭條,查看更多圖片

思圖場景成立於2016年,從企業DNA來看,是天生做圖像識別的好材料。創立之初思圖便十分注重人工智慧視覺金融應用技術的研發,除在金融業內首先將人工智慧視覺應用於證件真偽的鑒別,之後其在人工智慧視覺技術領域持續發力,在2018年獲得由國際計算機協會ACM ICMI 舉辦的第六屆EmotiW2018 視頻情感識別大賽冠軍。其股東依圖科技是國內領先的計算機視覺技術供應商,雖然依圖聚焦醫療領域,甚至有傳言稱已經放棄金融板塊,但依圖的部分底層技術也為思圖場景帶來加分。

思圖場景很快構建起自身的主打產品——Truth-Eye神瞳系列產品,包含面簽所需的靜態圖像及動態視頻的識別及解析功能。官方介紹,目前,思圖場景已累計服務包括工行、平安銀行、寶馬金融、一汽金融、招聯消金、中銀消金、中信保誠、中意人壽等300餘家機構客戶,身份核驗服務調用年均億級。

然而,在這樣蓬勃發展的勢頭下,思圖場景卻選擇技術研發閉關專註於視頻,原因是什麼?

監管驅動的新藍海

2017年8月,銀監會發布關於銀行實行「雙錄」的規定,要求銀行業金融機構在營業場所銷售理財產品或金融產品時,實施專區「雙錄」,即錄音錄像。同年,證監會和保監會(原)還分別發布了《證券期貨投資者適當性管理辦法》、《保險銷售行為可回溯管理暫行辦法》。2019年5月,蘇州銀保監分局最新出台了《深化保險銷售過程現場同步錄音錄像工作試行辦法》。這樣做一方面能夠對金融產品的銷售環節進行有效的行為監管,保護消費者權益;另一方面也能有效抑制金融機構各類欺詐行為的發生。

例如,客戶購買金融機構的理財產品,銀行與客戶接觸,本質上是一種營銷行為。近年來其背後存在一些過度宣傳、不揭示風險、飛單等違規操作。比如營銷人員告訴客戶產品可以保本,但事實並非如此,給客戶帶來損失。這其中,金融機構有風險揭示的責任。但有時,金融機構自身的管理者也很難察覺。因為樹大有枯枝,不論是基層員工還是渠道商都背負著KPI,可能會為了完成任務採取一些手段。

又如,2017年北銀消費金融的著名騙貸案例。為了迅速擴張業績,北銀與中介公司合作擴展業務。合作中介違規操作,購買200多張虛假身份,騙貸4000餘萬元,事發後北銀被處以900萬元罰款。除消金領域,汽車金融領域也是騙貸的重災區。被騙貸後,被盜用身份者發現問題上告法庭,法庭卻很難取證。因為原告對當時貸款的情景並不知情,銀行出庭的法律保全部對業務也並不清楚。金融機構無法真實還原業務全過程,很難找到真正的罪魁禍首。

在這樣的背景下,音視頻雙錄的重要性不言而喻。然而視頻錄下來,存在伺服器里,該揭示的風險仍然沒有揭示,需要大量的人工審核,這給金融機構帶來了不少的人力和時間成本。張璐告訴雷鋒網AI金融評論,通常情況下一單金融業務的雙錄視頻在2-50分鐘不等,審核人員需要一秒不落地完整看完錄像,效率非常低下。

長期身處金融行業的張璐敏感地看到了其中的市場機會,使用AI技術對視頻中的關鍵要素進行結構化處理,不僅可以降低成本,還方便隨時調取,進行數據分析。經過了開篇所述的技術研發閉關,張璐及其團隊已經將視頻結構化技術打造成相對標準化的產品,方便機構客戶調用,已經具備服務行業的能力。

底層重構

「人臉識別在金融行業已經被廣泛的運用起來了,但我認為這並不是演算法與金融行業的深度融合,只是一個適用於各行各業的比較基礎的演算法應用在金融業而已。」思圖場景CTO汪明浩說。

汪明浩向雷鋒網AI金融評論介紹,在視頻結構化的過程中,監管機構及金融機構對視頻是有明確定義的。比如視頻中必須有簽署文件、展示文件的行為,有閱讀並進行風險確認的行為。這些行為在當下的通用模型精度下是不足以被辨認的。一個人到底是單純在拿著筆還是在簽字,對於人類而言很好辨別,但對於現有的AI模型而言就非常困難。

「現有的模型都不能做到,要重新構建。」汪明浩表示,「另外,我們也需要深入到金融場景下,去拿到足夠多的視頻雙錄數據。」

汪明浩透露道,在雙錄視頻中,人的行為是相對較為標準的,更難解決的是每個金融機構的業務流程及文件格式不同。為此,團隊使用遷移學習方法,讓系統能夠快速適應不同客戶的需求。

另外,汪明浩強調,對於金融機構來說,一個系統即便達到了95%的準確率,往往也因不能確定剩下的5%是哪些被測對象而依然需要人力檢查100%的業務。得益於過去幾年的工程化積累,在閉關過程中,汪明浩帶領團隊優化解決方案,能夠對客戶實現100%的業務處理支撐。

下一步,汪明浩計劃帶領團隊通過計算資源分離解決視頻運算成本較高的問題,通過邊緣計算讓前端處理一部分運算,以取得更快的速度及更高的能效比。

「通用技術例如姿態識別、面部識別,我相信各大獨角獸都是具備的。但真的在金融行業深度應用,在我的視野中,我們還是少有的。」汪明浩說。

做寬與做深

業界普遍認為,金融是繼安防行業之後,AI落地的又一龐大市場。但具體這個市場在哪?怎麼做?沒有公司能夠給出很好的答案。

在圖像AI公司的視野里,金融是一個客單價小、流程繁瑣、教育客戶成本高、監管細節多的領域,因此大多呈半放棄半觀望的態度,很少有人願意下手做。這在張璐看來,是再正常不過的事情。

「安防行業已經完全打開,而且是一個萬億級的市場,從商業化的角度來說,客單價也非常高,而且已經能夠很好的落地。與之相比,金融場景非常複雜,普通銀行有幾十個部門,需要深扎到場景裡面去。AI在其中只是一個啟動因素,只佔10%-20%的比例。」張璐說,「對於圖像AI公司來說,自然要抓大放小,選擇做寬而不是做深。」

在招標現場,思圖場景遇到的對手大多是從事雙錄的通信類公司或傳統銀行信息化系統集成商,鮮見AI公司的身影。通信公司沒有視頻結構化能力,系統集成商需要對外採購模塊進行組裝。因此在張璐看來,同行的觀望正是思圖場景的極大優勢。

「這些系統集成商變成了我們的渠道合作夥伴。他們的系統整合能力比較強,同時能夠幫我們減輕對接銀行的工作量,讓我們更專註在技術的研發上。」張璐表示,「我一直相信術業有專攻,像汽車金融、互金、保險這些我們比較熟悉且有標杆客戶的領域,我們選擇自己做,像銀行我們就很願意找合作夥伴一起做。」

張璐坦言不懼怕集成商搶佔思圖場景的市場,她認為雙錄視頻結構化這一市場非常大,單憑一家公司不足以吞下。汪明浩表示,相較於系統集成商,思圖場景具有非常大的演算法成本優勢,擁有降維打擊能力。

同時,汪明浩談到,由於金融業務中很多坑是沒有辦法繞過的,因此思圖場景相較於同業具有先發優勢及時間壁壘。「相比於圖像AI公司我認為有半年到一年的時間,相比於系統集成商會更長一點,我認為有1-2年。」汪明浩認為。

採訪中張璐和汪明浩均表達了對市場的看好,二人談到現在市場需求已經爆發,公司面對的一個核心問題是人員擴充速度亟待跟緊市場發展速度,確保對眾多客戶訂單的承接。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

IoT和它的兩任「女友」在憋什麼大招?| CCF-GAIR 2019
特朗普:我跟庫克是朋友 庫克:呵呵

TAG:雷鋒網 |