當前位置:
首頁 > 最新 > 他的法律諮詢AI能深度學習語義 用戶3s獲回復 正確率92%

他的法律諮詢AI能深度學習語義 用戶3s獲回復 正確率92%

「律團」創始人趙青山看好未來「虛擬律所」的發展。

文| 鉛筆道 記者 吳曉宇

導語

「被車撞了涉及哪些費用?」

「醫療費、誤工費、護理費等賠償費用,建議電話諮詢或面談。」

這是當事人通過語音或文字方式和「律團」機器人小律的一次對話。

趙青山創立的「律團」,是幫助用戶解決法律問題的SaaS系統。用戶輸入問題後,機器人「小律」會在3秒內給出相關回答。「律團」現使用了谷歌TensorFlow框架,雙向注意力模型讓機器進行深度學習,同時運用了「三核處理技術」進行數據處理。

「律團」現分類正確率為98%,語義關聯度為93%,回答正確率為92%,回答專業性為85%。

注: 趙青山承諾文中數據無誤,為其真實性負責,鉛筆道已備份錄音速記,為內容客觀性背書。

在法律行業深耕十餘年的趙青山,自創業以來踩過兩次坑。

第一次,他想做一個O2O平台,線上撮合律師和當事人,線下讓二者完成交易。然而,「燒掉很多錢,項目依然沒有起色」。

第二次,他試圖做一個專家系統。但苦於系統多為閉合型選擇式提問(yes&no),用戶體驗非常差,趙青山不得不再次放棄。

這一次,他想做一個SaaS系統,嫁接至匯聚法律提問帖子的門戶網站,通過單輪次回答方式,讓用戶可獲得經系統數據處理後的優質答案。

思路的改進源於趙青山對行業的調研。「法律業務是從諮詢開始的。」然而,線下諮詢需要熟人圈介紹,費時費力;同時,諮詢成本高,當事人會花費上百元錢。線上諮詢大多為帖子形式,由於用戶付費意願不足,導致律師回答認真度不夠;此外,律師在忙時,也無法做到及時回答。

「市面上有關法律的人工智慧產品都是假的人工智慧,它們只是讓用戶在做規則選擇題。」趙青山補充到,比如針對離婚問題,系統會提出「有沒有結婚證」等答覆,此類產品不能保證回答的個性化和正確率,同時,不能窮舉用戶所有的客觀情形。

去年1月,「律團」項目正式啟動。該SaaS旨在讓機器通過深度學習演算法,為用戶提供關於法務問題的專業化、即時化回答。

趙青山和他的小夥伴們

與文本分類、識圖、歸納文章概要等技術相比,機器深度學習的第一個難點是對自然語言(Q&A方面)的語義處理。「律團」現使用了谷歌TensorFlow框架和雙向注意力模型。

同時,「律團」運用了三核處理技術。該技術分為三個維度:

首先,是數據分析和統計,系統會藉此挖掘出有價值的東西。比如,律師打了多少場官司、勝負率是多少;其次,是用深度學習搜索文本;最後,是對數據區塊化處理。

鑒於產品現數據量不多,「律團」未採用蘋果Siri,微軟小冰等生成模型,「怕存在語法錯誤」。

「律團」現分類正確率為98%,語義關聯度為93%,回答正確率為92%,回答專業性為85%。法律背景的6人,會隨機抽取1000個「Q&A」,對回答進行驗證。

回答正確率的提高經歷了三個階段:

早期,趙青山使用CNN識圖、剪輯,鑒於它在語義和分類方面做得不好,正確率約為60%;

5月,團隊研發了注意力模型,通過交叉注意的方式,系統可同時學習問題和答案兩方的特徵。此時,正確率達到80%;

隨後,趙青山讓機器人先對問題板塊分類,再深入語義學習。「律團」現分為10個板塊,包括婚姻、交通、消費、侵權、合同等板塊,每個板塊約50~60萬條數據。此外,每個板塊一個模型,「首先學模型的話,機器所需學習的變數便少了很多。」至此,回答正確率為90%以上。

用戶輸入法務問題後,系統3秒會給出回答。「現伺服器有2個GPU訓練模型,同時基於演算法,系統會與5000個類似問答結果相互比較,將得分最高的答案呈現給用戶。」得分的依據為問題的相似值,如Q1和Q2完全相似,則輸出概率值為1;相似度80%,則為0.8。

在數據更新吞吐量方面,系統現收錄裁判文書2000餘萬份,用戶數據1000餘萬條,法律條款、地方性政策5~6萬條,為案件分析的律師博客100~200萬個。

產品現已獲得20餘家意向客戶。在推廣方面,公司一方面採取媒體報道推廣,另一方面通過向相關帖子網站推薦嫁接API(如法律365等)的方式。

公司現階段正研發「連續性交互平台」。據稱,該平台可測試出用戶的深度需求。以撞車事件為例,機器會回答諸如「被車撞了有哪些賠償費用、訴訟途徑、法律對此案件判決的正確率」等問題,並通過所積累的判決文書數據,將案件移送給適宜律師,藉此向用戶收取深度服務費。1.0版本預計今年10月面市。

接下來,公司會在「區塊鏈產品」上發力,研發「虛擬律所」。趙青山透露,該律所幫助律師在此平台找到相關裁判文書並深入學習。另外,產品可實現機器人寫訴狀、租賃合同等。

據了解,該項目目前正尋求500萬元天使輪融資,出讓20%股份。資金將用於增加技術人員、產品迭代開發和市場推廣等。

/The End/

編輯 羅正臣 校對 朱明馳


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鉛筆道 的精彩文章:

無人機日灑農藥200畝 自主規劃航線防重噴漏噴 累計銷40台
真格基金投融資路演直通車準備開車了,來不及解釋了,快上車!
傳統招聘費時費力 基於熟人推薦的棗仁網獲天使輪融資
他為電商開500平聯合快閃店 品牌展示活動營銷日引1000消費者
融資800萬 她彙集50設計師創襯衣控 1年產62款流水200萬

TAG:鉛筆道 |

您可能感興趣

ICLR 2019論文解讀:深度學習應用於複雜系統控制
MIT 6.S094· 深度學習 L4|學霸的課程筆記,我們都替你整理好了
「阿里演算法專家」深度學習將業界技術迭代提升100倍,GraphDL 應用廣闊
ICRA 2018論文全概覽:接收率40%,深度學習/運動與路徑規劃領跑機器人會議
deepin用戶專屬:深度錄屏V2.7.3正式發布
NeurIPS2018時間檢驗獎論文回顧:為什麼深度學習適合大規模數據集
AI 從業者都會用到的 10 個深度學習方法
RTX 2080 Ti深度學習性能實測:提升最對65% 性價比敗北
MIT 6.S094· 深度學習|學霸的課程筆記,我們都替你整理好了
用深度學習理解遙感圖像,識別效率提升90倍,PaddlePaddle&中科院遙感地球所
使用AMD CPU,3000美元打造自己的深度學習伺服器
MIUI 10深度體驗
曠視等提出GIF2Video:首個深度學習GIF質量提升方法
IBM NeurIPS 2018 poster:把深度學習模型的表現遷移到傳統機器學習模型獲得高可解釋性
聯想 YOGA 920 深度體驗
UC Berkeley課程CS 294:深度強化學習
459頁《Python深度學習》下載
NVIDIA Tesla M4 低功耗設計加速卡 深度學習
一秒鑒別ICO詐騙丨2251個項目,研究人員提出深度學習ICO信用評級系統
Valve 使用深度學習識別 CSGO 的作弊者