他的法律諮詢AI能深度學習語義 用戶3s獲回復 正確率92%
「律團」創始人趙青山看好未來「虛擬律所」的發展。
文| 鉛筆道 記者 吳曉宇
導語
「被車撞了涉及哪些費用?」
「醫療費、誤工費、護理費等賠償費用,建議電話諮詢或面談。」
這是當事人通過語音或文字方式和「律團」機器人小律的一次對話。
趙青山創立的「律團」,是幫助用戶解決法律問題的SaaS系統。用戶輸入問題後,機器人「小律」會在3秒內給出相關回答。「律團」現使用了谷歌TensorFlow框架,雙向注意力模型讓機器進行深度學習,同時運用了「三核處理技術」進行數據處理。
「律團」現分類正確率為98%,語義關聯度為93%,回答正確率為92%,回答專業性為85%。
注: 趙青山承諾文中數據無誤,為其真實性負責,鉛筆道已備份錄音速記,為內容客觀性背書。
在法律行業深耕十餘年的趙青山,自創業以來踩過兩次坑。
第一次,他想做一個O2O平台,線上撮合律師和當事人,線下讓二者完成交易。然而,「燒掉很多錢,項目依然沒有起色」。
第二次,他試圖做一個專家系統。但苦於系統多為閉合型選擇式提問(yes&no),用戶體驗非常差,趙青山不得不再次放棄。
這一次,他想做一個SaaS系統,嫁接至匯聚法律提問帖子的門戶網站,通過單輪次回答方式,讓用戶可獲得經系統數據處理後的優質答案。
思路的改進源於趙青山對行業的調研。「法律業務是從諮詢開始的。」然而,線下諮詢需要熟人圈介紹,費時費力;同時,諮詢成本高,當事人會花費上百元錢。線上諮詢大多為帖子形式,由於用戶付費意願不足,導致律師回答認真度不夠;此外,律師在忙時,也無法做到及時回答。
「市面上有關法律的人工智慧產品都是假的人工智慧,它們只是讓用戶在做規則選擇題。」趙青山補充到,比如針對離婚問題,系統會提出「有沒有結婚證」等答覆,此類產品不能保證回答的個性化和正確率,同時,不能窮舉用戶所有的客觀情形。
去年1月,「律團」項目正式啟動。該SaaS旨在讓機器通過深度學習演算法,為用戶提供關於法務問題的專業化、即時化回答。
趙青山和他的小夥伴們
與文本分類、識圖、歸納文章概要等技術相比,機器深度學習的第一個難點是對自然語言(Q&A方面)的語義處理。「律團」現使用了谷歌TensorFlow框架和雙向注意力模型。
同時,「律團」運用了三核處理技術。該技術分為三個維度:
首先,是數據分析和統計,系統會藉此挖掘出有價值的東西。比如,律師打了多少場官司、勝負率是多少;其次,是用深度學習搜索文本;最後,是對數據區塊化處理。
鑒於產品現數據量不多,「律團」未採用蘋果Siri,微軟小冰等生成模型,「怕存在語法錯誤」。
「律團」現分類正確率為98%,語義關聯度為93%,回答正確率為92%,回答專業性為85%。法律背景的6人,會隨機抽取1000個「Q&A」,對回答進行驗證。
回答正確率的提高經歷了三個階段:
早期,趙青山使用CNN識圖、剪輯,鑒於它在語義和分類方面做得不好,正確率約為60%;
5月,團隊研發了注意力模型,通過交叉注意的方式,系統可同時學習問題和答案兩方的特徵。此時,正確率達到80%;
隨後,趙青山讓機器人先對問題板塊分類,再深入語義學習。「律團」現分為10個板塊,包括婚姻、交通、消費、侵權、合同等板塊,每個板塊約50~60萬條數據。此外,每個板塊一個模型,「首先學模型的話,機器所需學習的變數便少了很多。」至此,回答正確率為90%以上。
用戶輸入法務問題後,系統3秒會給出回答。「現伺服器有2個GPU訓練模型,同時基於演算法,系統會與5000個類似問答結果相互比較,將得分最高的答案呈現給用戶。」得分的依據為問題的相似值,如Q1和Q2完全相似,則輸出概率值為1;相似度80%,則為0.8。
在數據更新吞吐量方面,系統現收錄裁判文書2000餘萬份,用戶數據1000餘萬條,法律條款、地方性政策5~6萬條,為案件分析的律師博客100~200萬個。
產品現已獲得20餘家意向客戶。在推廣方面,公司一方面採取媒體報道推廣,另一方面通過向相關帖子網站推薦嫁接API(如法律365等)的方式。
公司現階段正研發「連續性交互平台」。據稱,該平台可測試出用戶的深度需求。以撞車事件為例,機器會回答諸如「被車撞了有哪些賠償費用、訴訟途徑、法律對此案件判決的正確率」等問題,並通過所積累的判決文書數據,將案件移送給適宜律師,藉此向用戶收取深度服務費。1.0版本預計今年10月面市。
接下來,公司會在「區塊鏈產品」上發力,研發「虛擬律所」。趙青山透露,該律所幫助律師在此平台找到相關裁判文書並深入學習。另外,產品可實現機器人寫訴狀、租賃合同等。
據了解,該項目目前正尋求500萬元天使輪融資,出讓20%股份。資金將用於增加技術人員、產品迭代開發和市場推廣等。
/The End/
編輯 羅正臣 校對 朱明馳
※無人機日灑農藥200畝 自主規劃航線防重噴漏噴 累計銷40台
※真格基金投融資路演直通車準備開車了,來不及解釋了,快上車!
※傳統招聘費時費力 基於熟人推薦的棗仁網獲天使輪融資
※他為電商開500平聯合快閃店 品牌展示活動營銷日引1000消費者
※融資800萬 她彙集50設計師創襯衣控 1年產62款流水200萬
TAG:鉛筆道 |
※ICLR 2019論文解讀:深度學習應用於複雜系統控制
※MIT 6.S094· 深度學習 L4|學霸的課程筆記,我們都替你整理好了
※「阿里演算法專家」深度學習將業界技術迭代提升100倍,GraphDL 應用廣闊
※ICRA 2018論文全概覽:接收率40%,深度學習/運動與路徑規劃領跑機器人會議
※deepin用戶專屬:深度錄屏V2.7.3正式發布
※NeurIPS2018時間檢驗獎論文回顧:為什麼深度學習適合大規模數據集
※AI 從業者都會用到的 10 個深度學習方法
※RTX 2080 Ti深度學習性能實測:提升最對65% 性價比敗北
※MIT 6.S094· 深度學習|學霸的課程筆記,我們都替你整理好了
※用深度學習理解遙感圖像,識別效率提升90倍,PaddlePaddle&中科院遙感地球所
※使用AMD CPU,3000美元打造自己的深度學習伺服器
※MIUI 10深度體驗
※曠視等提出GIF2Video:首個深度學習GIF質量提升方法
※IBM NeurIPS 2018 poster:把深度學習模型的表現遷移到傳統機器學習模型獲得高可解釋性
※聯想 YOGA 920 深度體驗
※UC Berkeley課程CS 294:深度強化學習
※459頁《Python深度學習》下載
※NVIDIA Tesla M4 低功耗設計加速卡 深度學習
※一秒鑒別ICO詐騙丨2251個項目,研究人員提出深度學習ICO信用評級系統
※Valve 使用深度學習識別 CSGO 的作弊者