當前位置:
首頁 > 新聞 > 阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

雷鋒網按:7月12日-7月14日,2019第四屆全球人工智慧與機器人峰會(CCF-GAIR 2019)於深圳正式召開。峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,深圳市人工智慧與機器人研究院協辦,得到了深圳市政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流博覽盛會,旨在打造國內人工智慧領域極具實力的跨界交流合作平台。

7 月 13 日,阿博茨科技聯合創始人余宙為 CCF-GAIR 2019「AI 金融專場」做了題為「AI金融大腦驅動知識處理變革」的大會報告。

余宙表示,「金融領域的知識處理」是當前金融行業面臨的最大挑戰之一,摳數據、找數據、填數據、畫圖表等粗活累活充斥著金融從業者的日常,「表哥、表妹、金融民工」的自嘲也由此而發,金融公司需要面對居高不下的人力成本和高離職率的雙重困擾。

余宙認為,「人應該成為機器的一部分,而非機器」,通過阿博茨科技的AI金融大腦結合RPA技術,打造一系列超級分析師助理機器人,並運用在日常的數據處理業務中,讓機器這台從不歇止的永動機,把人從繁雜重複的工作中解脫出來,從而投入到更有價值的決策工作中去,是阿博茨科技核心要做的事。

對公司而言,利用機器除了獲得人力成本的下降之外,更大的收穫是對公司知識的沉澱和對人員依賴的減輕,使公司能夠成為「鐵打的營盤,流水的兵」,讓所有的用戶和員工都來訓練同一台超級大腦。

以下為余宙的現場演講內容和會後採訪,雷鋒網AI金融評論作了不改變原意的編輯:

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

大家好,我的名字非常好記,就叫余宙。很多人說我的英文名字是不是就起Universe好了。我們公司的名字更好記,大家先看中文名叫阿博茨科技,可能有90%以上的人聽到這個名字的時候會想「阿博茨」幾個字到底怎麼寫?是什麼意思?其實我們看一下英文就非常容易懂了,ABC。這是一個特別容易測出年齡的問題,一般之前都學過漢語拼音,把ABC用漢語拼音來讀一遍,就是「阿博茨」的發音。

從技術角度講很容易想到,ABC中的ABC分別代表了AI、Big data、Cloud,也就是人工智慧、大數據和雲服務。於是我們就起了一個非常接地氣的名字就叫阿博茨。

此外,因為谷歌的上市公司叫Alphabet,是一個字母表公司,我們也對標了這樣一個目標,就起了一個非常中國化的阿博茨科技。

用機器人解放「表哥表妹」

阿博茨主要做什麼事情呢?我們主要是為金融行業提供四類機器人:第一類是摳數據,第二類是找數據,第三類是填數據,第四類是畫圖表。

剛開始接觸金融行業的時候,都說金融是一個知識沉澱和經驗非常多的行業。去年我去瑞士銀行的時候,出來了一位頭髮花白的客戶經理,說這是我們的資深客戶經理,沉澱了30年的經驗,要培養這樣一位經驗豐富的客戶經理,能夠回答出來你的任何問題,是需要非常大的代價的。那麼我們就想,這些知識和經驗要如何傳承,如何被記錄。

谷歌之前收購過一家公司叫Free base,他們存儲了這個世界上龐大的知識庫,裡面有19億條人類的知識,但這裡面僅覆蓋了不到全球知識的1%。我們現在面臨的最大挑戰和問題,就是人類和機器如何進行溝通。

提到金融,也有一個非常有意思的話題,去年年底很多人在考CFA,非常著急,一定要在2019年之前過,因為從2019年開始的CFA考試要考編程語言了。

打個比方,上個世紀以前學習一門外語是掌握如何和世界上不同的人進行溝通,但在如今的AI時代,掌握一門機器語言是一種最好的和未來世界進行溝通的方式。

那現在我們面臨的最大挑戰是什麼?就是大量非結構化知識如何處理的問題。人類現在產生了大量非結構化的知識,比如說我現在站在台上的一段演講,比如一段視頻、一份新聞稿、一份文件。金融行業經常碰到的是研報、公告、新聞資訊、圖片、電子郵件,每天大家都被這些非結構化的信息給充斥著。

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

(金融行業知識的構成)

為什麼我們有這個idea呢?幾年前我們在做投資的過程中,遇到越來越多金融圈子的人,他們常會說如果你們是碼農,我們就是金融民工,因為每天都在干著摳數據、找數據、填數據和畫圖表的事情,這個行業里對這些人也有一個昵稱就叫做「表哥、表妹」。

實際上,大家在處理這些事情的時候,非常費時耗力,而且出錯率高,業務也重複。根據之前的一項全球統計,有35%的公司倒閉是因為人力成本過高,人力成本可能是壓倒這家公司的最後一根稻草。

隨著現在的年輕人不斷開始走向更重要的工作崗位,我們也聽到很多老闆在抱怨,說現在的90後甚至是00後,大家都非常喜歡創新型的工作,討厭枯燥乏味的工作,每天讓他干著「表哥、表妹」的活,離職率非常高,結果好不容易培訓了一群人,剛掌握了公司的數據結構和信息之後,就離職了。

上次我們就碰到一個首席經濟學家,他有一個培養了三年的分析師助理要離職了,要去尋找人生新的意義。他的工作每天就是從各種金融終端裡面去摳數據,做圖表。這樣的工作非常枯燥乏味,對於人本身的成長來說,老一代的金融分析師可能會說這是一個培養數據感的過程,就是如何對這些數據更加的熟悉。但對新一代的人來說就比較重複了。

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

(處理數據 or 浪費生命?)

對機構來說,去年有一本書非常流行,就是瑞·達利歐寫的《原則》,裡面有個核心觀點對我來說非常有價值,他說:人應該成為機器的一部分而不是機器。因為人是有感情、有情緒的,會累,不能24小時工作,所以,我會考慮我應該如何做一個系統,讓人成為機器的一部分。

剛才提到了重複的工作量,在日常工作中,相信這些工作是大家非常熟悉的金融行業中的一些事情。這裡的什麼事情需要人來干呢?數據挖掘、採集、處理等會充斥在「表哥、表妹」的日常工作中。

因此我們做的事情,就是通過ABC的金融大腦,把自然語言處理、機器視覺技術以及機器學習、深度學習技術,運用在日常的數據處理工作中。就像一條生產線,把原始的材料丟進去,最後能夠有一道精美的菜肴被做出來。金融分析師就像一位廚師,要有人幫他買菜、洗菜,切菜、準備佐料,而這些工作都可以用機器人來替代。

AI三層次成就超級分析師助理

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

(ABC金融大腦三層成就超級分析師助理)

那麼AI分成幾個不同的層次呢?我認為有以下幾層:

第一層是認知引擎層,就是第一步打開了人和機器世界溝通的環節,如何讓機器能夠讀懂一張圖、一張報表、一份文件呢?首先是讓機器人具備一隻眼睛。

傳統的人機交互方式,首先是讓人學會編程語言,讓所有的數據被處理成結構化。不知道現場有沒有數據分析師或數據科學家,我們也會大量地處理資料庫里的結構,在很多應用場景里,有一些分析師要找研究報告裡面的圖表,有幾十頁甚至上百頁。

比如說我想知道前一陣子海底撈剛上市,海底撈的門店數量有多少?如果要搜這個數據,最理想的是丟給你的實習生做,讓實習生在眾多海量的報告里把這個東西找到,幫你提交出來。

這時候如果用機器的話,機器首先要閱讀這些大量的報告,然後才能把這些數據找到。認知層就是把所有非結構化的數據,包括公告、研報、新聞、圖片、視頻和語音都可以解析出來。

第二層是感知層。它和認知層最大的不同是什麼?打個比方,比如說看到街上有一個紅綠燈,知道紅燈停、綠燈行,或者紅色代表的是警示、注意、慌張,綠色代表的是平和,這些都是感知層做的事情。認知層上,機器只能識別是紅色還是綠色,RGP值是多少,是不帶有任何情感的。

那麼在傳統的識別層面上,比如說我們解析一張財務報表,或者是解析一段文字,比如說裡面出現了2.339,中間是一個逗號,百萬美元。中間的逗號到底是屬於單位的分隔符,還屬於金融單位呢?這些都是需要結合上下文,有專業的金融知識,才能把這些數據和信息結構整理得更好,這就是對內容和數據的理解。

所以我們說AI的技術必須放在非常垂直、非常細分的領域,才有可能做好。像谷歌那樣,把人類所有的事情都幹了,那是好事情,但不是創業公司的菜,也不是小公司能做的事兒,我們就要選擇一個非常垂直、細分的市場。

另外一個案例是,可能很多人都在用iphone,號稱有最強的語音助理,但是我們也經常發現它很蠢,因為有時候導航還不如國內的百度和高德,就是因為百度和高德在導航這個上面累計了大量的訓練樣本,所以它的感知層就會做得更好。

第三層是可視化。當機器讀懂信息之後,如何把這些信息回饋給人類的分析師,就要有一套自覺的能夠繪圖、會標的引擎。假設我是一個剛入行的分析師,你丟幾個數據給我讓我生成一個圖表,我就是什麼都不知道,唯一能夠做的就是讀那些老司機的報告。

目前ABC的引擎已經學習了超過3千萬份金融的文檔和報告,閱讀了超過10億張的金融圖片和信息,當你扔過來一些數據之後,可以自動的把表格、圖紙繪製出來,這就是金融大腦。

對於所有人來說,這個機器人就像是一個超級實習生或是超級分析師助理。AI的這幾層,可以極大幫助分析師解決對於公開市場上的數據進行獲取,同時如果在進行私有化部署之後,還能夠大量挖掘自己家裡的海量數據。

經常說很多金融機構是坐在金礦上,但由於這些數據都是隱藏在各種文件中的,被沉澱在金礦里,默默無聞地躺在那裡,只有人肉挖掘機挖掘,但現在我們就可以用機器人去做了。通過自然語言的檢索和語義的分析,可以實現一些簡單的問答,最終能夠把這些數據進行可視化。

創造金融數據的永動機

最近在整個金融行業,尤其是全球的技術行業,RPA機器人特別炙手可熱。我們有的金融大腦,結合RPA的技術,是一種自然而然的延伸,從大腦到手腳的延伸,做到「知行合一」。

RPA和前面的繪圖、找數據的機器人有什麼最大的不同?答案是:它的流程性比前面的更強。我們經常說RPA解決兩個問題,就是在流程上的斷點和阻塞點。什麼是斷點?我們試圖做一個永動機,或者是一個全自動化的流程,讓這個事情從輸入到輸出能夠完整的經歷過去,但現在發現中間存在很多的斷點。

舉個例子,比如說銀行做信貸,收集上來的大量的紙質的掃描信息,現在是不是可以全自動化的錄入到風控系統中去?在沒有金融大腦之前,傳統的RPA機器人需要人作為預處理的輸入終端,由人手抄的方式把信息,或者是通過OCR的方式輸入進去,但是機器人不能識別和理解裡面的內容,導致大量的RPA機器人在複雜的工作中會失效。

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

(傳統RPA和AI時代的RPA的區別)

在終端層,比如說現在的傳統機器人,可以支持一些網頁、windows的程序或者其他的程序,做過程序開發的人就知道,可以在HTMA裡面找各種各樣的標記,但是在這個過程中,如果你碰到一些本地的客戶端的程序員,他是自己繪製的界面,可能是通過坐標和點擊區域進行的描繪,可能對機器來說這個界面就是瞎的。

最銼的RPA機器人是什麼樣的呢?每填一個格子點一下,就是把表單完成填寫。演示的時候,就是QQ彈出一個消息,再往下點就是各種花邊新聞,整個流程就被中斷掉了。

如果是不帶視覺、不帶AI的傳統RPA機器人,很容易在各種事物的處理流程中,像一個機械臂沒有眼睛一樣,被當前的流程所困惑。

而新一代的RPA通過人工智慧夠給RPA附上眼睛、大腦,能夠讀懂非結構化的文本、應用程序,同時進行相應的決策。這樣的RPA就能夠解決傳統的只是模擬手腳操作的過程,進化到能夠模擬一些初級員工在工作中的重複性勞動。

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

(Everdroid - 認知RPA機器人)

我們的RPA機器人叫做Everdroid,Ever是永遠的意思,代表著永不停歇,可以7×24小時為大家提供服務和工作,從成本和代價來說,至少是普通人工的3倍提升,成本上的降低就更多一些。

所以能夠使得賦能的RPA機器人有感知、認知和相應的訓練出來的職業技能。當他所處的工作和流程越垂直、越細分的時候,就越能夠發揮機器學習的優勢,成為一個老司機。

對很多的機構來說,最大的收穫不僅是人力成本上的減少,更多的是對公司知識的沉澱,對人員依賴的減輕,使得機構成為「鐵打的營盤,流水的兵」,讓所有的用戶、所有的員工來訓練一台超級大腦。

當然這個對很多員工來說聽起來是一件很悲哀的事情,但是對未來市場的成長來說,就是需要機構賦能這些用戶,誰家在這場軍備競賽中儲備了更強的武器,反而能夠吸引到更多的優質人才。也使得工作者能夠從事一些更有價值的工作,而不是每天在重複性的勞動中度過。

對於機器人來說,可以適用的場景包括券商、銀行、財務以及各種各樣的其他金融場景,在金融行業,甚至是一些跳出金融行業的跟數字、報表打交道的行業,機器人都是有使用場景的。這讓阿博茨的RPA從金融行業得以拓展到諸如財務等更多的領域,可以覆蓋更多的企業類型。

阿博茨科技余宙:創造金融數據的永動機丨CCF-GAIR 2019

(Everdroid覆蓋的場景)

另外,ABC的RPA與一般公司的區別是,我們建設了一個RPA開放平台。一部分開放是將ABC金融大腦和RPA技術開放出來,讓外部的開發者通過簡單的模型配置,就可以創建一個流程機器人,為企業自動化創造一個獨有的解決方案,為此我們創建了一個開發者社區,網址是www.everdroid.cn ,歡迎開發者的加入。

另外一部分開放,是面向渠道合作夥伴的開放,讓他們可以利用我們的技術,向企業提供服務,以聯合的方式完成項目實施,共同推進中國RPA領域的發展。

我們的上一家公司是做手機瀏覽器的,叫海豚瀏覽器,在全球獲得了2億多用戶,那時候主要的市場在海外,公司有很強的海外市場的拓展基因。我們現在也同樣有著全球化拓張的意識,不僅服務於中國市場的金融機構和大型企業,同時也在不斷開拓海外市場,並且已經和許多國際大型金融機構取得了合作。

好,今天給大家介紹的就是這麼多,希望記住我們非常簡單的名字,ABC,也一個非常有中國特色和接地氣的ABC(阿博茨),謝謝。

以下為演講嘉賓余宙的部分採訪實錄:

問:阿博茨是一家2B的金融科技公司嗎?

余宙:我們不是完全的2B,同時也沒有做2C,所以我們更喜歡把我們的服務方式稱之為2P(Professional),即服務於專業人員。我們的定位是用機器把人從金融行業海量數據處理的粗活累活中解放出來。目前在金融行業,人工智慧還取代不了分析師,我們只能為這些分析師的決策提供輔助依據,相當於做分析師的助理。區別於幫別人投錢的僱傭兵模式,我們不是僱傭兵而是軍火商,就像當年西部大淘金,我們就是賣水賣鐵鍬的。

問:目前業內在語義識別方面的主要挑戰是什麼?

余宙:最大的挑戰是標記樣本太少。語義識別不像人臉識別,人臉識別在樣本標記方面非常簡單,哪裡是鼻子、眼睛一目了然,但如果是對語言文字的標記則會很難,你必須要對這些專業知識有理解,像金融行業的這些標記,你只能找非常專業的人去標它,成本也很高。針對這一塊,一方面,基礎的公開的數據我們會有人標記;另一方面,一些一級市場的非公開的數據,我會提供工具讓客戶自己去做一些相應的標記,因此我們的一個理念是讓使用的過程變成一個標記的過程。

問:現階段做金融行業知識處理的關鍵壁壘是什麼?

余宙:現階段唯一能成為一家公司壁壘的,既不是技術也不是錢,而是時間和經驗。做金融行業的知識處理,最重要的是你所累積的處理材料的經驗,比如說股票、債券、基金、銀行、券商等不同類型的數據。然後通過技術帶來時間上的先發和領先優勢,同時加上你的市場拓展能力強,能拿到客戶,然後就會有客戶給你提供訓練樣本和反饋,反過來給你的技術帶來更大的提升。

拿一個具體的應用場景舉例,如在金融投研領域裡,阿博茨現在給客戶提供的服務的準確率最高已超過95%,這樣就使得我們不用去PK那些大公司的通用性產品。

此外,產品化能力也非常重要,做2P的業務你就需要了解這些專業人士的需求,你要去快速學習他們的使用場景,為此我還曾去基金公司實習了兩周,去扣數據當「表哥」。

問:目前金融行業知識處理這一細分領域的發展在國內外有哪些主要差異?

余宙:不同於國內有金融公司自研和技術公司創業兩種趨勢,國外更多的是金融行業自研,市面上很少有第三方公開的產品去服務不同的客戶,大部分都是金融機構花很大的代價,雇很多技術人在內部自研。自研的優勢是研發出的系統對自身業務的針對性更強,不過也難以對外應用。短中期看,國內外的這種差異還會繼續存在。

問:當初為什麼會選擇在金融領域裡創業?

余宙:當時第一家公司(海豚瀏覽器)賣掉之後,我們做過一段時間投資,但坦率來講我們不是好的投資人,不是那種很佛系的,我們有那種年輕技癢「看別人干不如自己干」的衝勁兒,並且我們是第二次創業,在心態上經得起誘惑,不只是想活下來,我們希望這家公司未來能夠是可持續的,可以去敲個鐘,從經營業務上也希望有穩定的持續的業務發展。

投資的時候我們看過很多行業,遇到了很多金融行業朋友,他們開自己玩笑說是金融民工,問我們能不能做一些機器人來代替他們的一些重複性勞動,我們就開始考慮起來了。

經過一番調查我們發現,AI真正能發揮特色優勢的場景必須滿足幾個點:一是你要有足夠多的數據,尤其是公開可得的數據;二是推崇效率至上的行業;三是時間很值錢,願意花錢來節省時間。而金融行業恰好滿足這三點,因此我們認為AI應用在金融行業目前應該是最成熟的。

問:您怎麼看待AI金融的成熟度?結合如今的創業環境呢?

余宙:如果用Gartner技術成熟度曲線來講,AI金融在去年處於最高峰(過高期望值的峰值),那個時候大家覺得AI無所不能,接下來產生了一定的恐慌,有些金融機構的人員覺得是在搶他們的飯碗,哪怕是臟活累活的飯碗,並且隨著一些不那麼成熟或必要的AI金融應用場景去泡沫化之後,到今年行業開始回歸理性,開始理性地找那些真正能落地的場景。我認為如果說AI安防、AI客服已經走上了正軌,那金融行業可能還屬於一個不斷試錯但開始了理性發展的過程。

我們第二次創業(2016年)時就發現,已經和2010年時候的創業環境很不一樣了,你現在看到的絕大部分知名獨角獸,都是創二代,甚至有的已經是做了五六家公司了。像以前那種剛從公司離職出來三五個人攢個團隊就創立公司、把公司做大的案例,近兩年已經很少見了,現在白戶創業越來越難,比較容易成功的都是之前做過的,要麼很有經驗,要麼就是資本運作能力特彆強。雷鋒網雷鋒網

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

千尋位置破局時空基準,智慧城市最好的時代來了
這個操作很迷:為了美國的國家安全,谷歌勸政府放過華為

TAG:雷鋒網 |