當前位置:
首頁 > 科技 > 超強大自動NLP工具!谷歌推出AutoML自然語言預訓練模型

超強大自動NLP工具!谷歌推出AutoML自然語言預訓練模型

新智元報道

來源:venturebeat

編輯:肖琴

【新智元導讀】谷歌近日宣布面向全球用戶推出AutoML Natural Language的通用版本,支持分類、情緒分析和實體提取等任務,以及支持各種文件格式,包括掃描的pdf文件。現在戳右邊鏈接上新智元小程序了解更多!

今年早些時候,谷歌發布了AutoML自然語言(AutoML Natural Language),這是其Cloud AutoML機器學習平台向自然語言處理領域的擴展。

經過數月的beta測試,谷歌近日宣布面向全球用戶推出AutoML Natural Language的通用版本,支持分類、情緒分析和實體提取等任務,以及支持各種文件格式,包括掃描的pdf文件。

AutoML自然語言利用機器學習來揭示電子郵件、聊天日誌、社交媒體帖子等文本的結構和含義。它可以從上傳或粘貼的文本、或谷歌雲存儲的文檔中提取關於人、地點和事件的信息,允許用戶訓練自己的自定義AI模型來對情緒、實體、內容和語法等進行分類、檢測和分析。此外,它還提供自定義實體提取功能,該功能可以在文檔中識別出標準語言模型未出現的特定於領域的實體。

AutoML Natural Language有超過5000個分類標籤,並允許訓練多達100萬個文檔,文檔的大小最大10MB。谷歌表示,這使得它非常適合「複雜」的用例,比如理解法律文件或為擁有大量內容的組織進行文檔分割。

自發布以來的幾個月中,它已經得到很大改進,特別是在文本和文檔實體提取方面。谷歌表示,AutoML自然語言現在可以考慮附加上下文(例如文檔的空間結構和布局信息)來訓練模型和預測,提高發票、收據、簡歷和合同等類型文本的識別能力。

此外,谷歌表示,AutoML Natural Language現在已經獲得FedRAMP的中級授權(FedRAMP 是為政府啟用安全雲計算的美國程序),使聯邦機構更容易利用AutoML的功能。

赫斯特集團(Hearst,美國出版界巨頭)已經在使用AutoML Natural Language來幫助組織其國內和國際雜誌的內容,日本出版商日經集團(Nikkei Group)也在利用AutoML Translate來發布不同語言的文章。Chicory是第三個早期採用者,利用它為Kroger、Amazon和Instacart等雜貨零售商開發定製數字購物和營銷解決方案。

AutoML Natural Language的產品經理Lewis Liu在一篇博客文章中解釋說,他們的最終目標是為需要定製機器學習模型的組織、研究人員和企業提供一種簡單、實用的訓練方法。「自然語言處理是揭示文本結構和意義的寶貴工具,」他說,「我們通過更好的微調技術和更大的模型搜索空間,與Google AI研究部門合作,不斷提高模型的質量。我們還引入了更高級的特性來幫助 AutoML自然語言更好地理解文檔。」

值得注意的是,AutoML是在AWS Textract之後推出的。AWS Textract是亞馬遜開發的針對文本和數據提取的機器學習服務,於今年5月推出。微軟在Azure Text Analytics中也提供類似的服務。

官網:

https://cloud.google.com/natural-language/#how-automl-natural-language-works

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

印度理工男上位記:從產品經理到谷歌CEO
剛剛,華為起訴FCC違反美國憲法,並公開回應李洪元事件