不用再學SQL語言了,Saleforce用自然語言就能在資料庫中查詢
雷鋒網 AI 科技評論按:隨著機器學習蓬勃發展,新的研究領域不停出現。除了創造並解決新的問題之外,現有的應用其實也可以從機器學習中大為受益。Salesforce 近期的一篇論文就介紹了利用機器學習,無需學習SQL語言就可以在資料庫中進行查詢。雷鋒網 AI 科技評論把相關報道編譯如下。
SQL在編程領域越來越少被提及,但是SQL語言的學習曲線仍然陡峭,這就讓很多人放棄了嘗試直接和關係型資料庫打交道。CRM 軟體服務商 Salesforce 的人工智慧研究團隊就從自己的業務開始下手,探索如何讓不具備 SQL 知識的人通過機器學習打開資料庫操作的大門。
在他們近期的論文「Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning」(Seq2SQL:用強化學習從自然語言生成結構化查詢語句)中,構建了一個機器學習中典型的序列到序列模型。在其中用到的強化學習讓模型在翻譯自然語言到SQL資料庫查詢語句任務中取得了讓人眼前一亮的成果。
這就意味著,在實際應用中用戶可以直接問系統:「橄欖球高校巡迴賽排名第一的是哪支隊伍」,系統就會自動查詢對應的資料庫,然後告訴你答案是密歇根大學隊。正如下面這張動圖示意的?
Salesforce 研究員 Victor Zhong,也是這篇論文的第一作者,介紹說:「一個正確的查詢語句其實可以有好幾種寫法。如果給系統里輸入一個自然語言的問題,對應的查詢語句可能會有兩三種。我們用強化學習來鼓勵系統選用能夠查詢到相同結果的語句。」
GIF/626K
隨著自然語言的提問里包含的單詞變多,可以想像這種機器翻譯任務也會很快變得非常複雜。應對方式就是,對於每一個缺失單詞的可能翻譯數目施加的限制越多,翻譯任務就會變得越簡單。Salesforce 的研究人員們就利用了這種想法,他們對系統的提問里、資料庫標籤里和典型 SQL 查詢語句里能夠包含的單詞做了一些限制,從而簡化了翻譯系統的設計難度。
讓 SQL 平民化其實也不是新鮮事了,Tableau 最近收購了創業公司 ClearGraph,後者的業務就是提供用英語而不是SQL語言查詢數據的方案。
Victor Zhong 補充說:「有的模型直接在資料庫上做操作,但是如果提問一個關於身份證號的問題就會有潛在的隱私問題。」
除了論文里的方案本身,Salesforce 的這項研究還有一個貢獻是他們構建的 WikiSQL 數據集,他們的翻譯模型就是用這個數據集訓練出來的。他們首先從 Wikipedia 採集了HTML表單,這些表單就成為了隨機生成的 SQL 查詢語句的基礎;他們從這些查詢生成了對應的問題,然後把問題放到亞馬遜 Mechanical Turk 眾包平台上讓人類把它們改寫成自然語言。每個改寫後的句子都會被確認兩次,而且還安排了單獨的人指導這些確認過程。最終構成的 WikiSQL 數據集也是目前所有同類數據集中最大的一個。
viaTechCrunch,雷鋒網 AI 科技評論編譯
論文地址:https://einstein.ai/static/images/layouts/research/seq2sql/seq2sql.pdf
點擊展開全文
※天貓為海瀾之家打造「智慧門店」;東方網力聯手電筒子科技大學,共建人工智慧聯合實驗室
※微軟「小娜」牽手亞馬遜Alexa,蘋果和谷歌均表示不想回應
※有品負責人高自光:「小米雜貨鋪」不再是貶義詞
※這群世界上最懂漏洞的人開了一個閉門會議 宅客帶你去探班
※探究移動時代的「芯」動力
TAG:雷鋒網 |
※通過 Docker 實現在 Linux 容器中運行 Microsoft SQL Server 資料庫
※HIS系統的資料庫之爭:Oracle和SQL Server到底用誰好?
※Intel Tiger Lake處理器出現在UserBenchmark資料庫中
※SQL資料庫並不是DevOps的障礙
※SpringBoot使用資料庫
※誰說資料庫不適合Docker?解讀 MySQL DB Mesh的創造性實踐
※已經承認!Apple 可以隨意刪除iTunes資料庫中的電影
※springboot項目中使用原生jdbc連接MySQL資料庫
※Amazon Aurora:如何不使用一致性協議實現分散式資料庫
※Python Flask,資料庫,SQLAlchemy,模型類的定義,資料庫添加
※Google 的雲端資料庫Cloud SQL:開始支持 PostgreSQL
※蘋果開源NoSQL 資料庫FoundationDB
※Spring Boot與Kotlin 使用MongoDB資料庫
※雲資料庫TencentDforSQLServer
※Learning Memory Access Patterns,資料庫+機器學習探索
※mybatis使用load data local infile實現導入數據到mysql資料庫
※開源資料庫 PostgreSQL、MariaDB 和 SQLite 的對比
※增量同步mysql資料庫信息到ElasticSearch
※阿里雲鳴嵩喊話Oracle資料庫用戶:想遷就來,隨時stand by
※Django資料庫類庫MySQLdb使用詳解