當前位置:
首頁 > 新聞 > AWS自然語言處理服務新功能!從複雜文本中提取內容並客制化分類

AWS自然語言處理服務新功能!從複雜文本中提取內容並客制化分類

本周,亞馬遜網路服務(AWS)詳細介紹了自然語言處理服務Comprehend的新功能,可以從非結構化文本中提取內容,即短語、地點、人名、品牌、事件和人類情感。

AWS是亞馬遜所創建的雲計算平台,提供許多遠程網路服務、其他網站及客戶端的服務。其在2002年7月首次公開運作,目前總部在華盛頓西雅圖。Amazon EC2與Amazon S3都架構在這個平台上。現在AWS在全球19個地理區域中提供57個可用區,同時計劃在2018年底和2020年上半年之間,在巴林、香港特別行政區、南非和瑞典共推出12個可用區和4個區域。

Comprehend新推出了無代碼定製工具,客制化欄位和客制化分類功能(Custom Entities and Custom Classification)可以允許開發人員「識別自然語言術語並對專門針對其團隊、業務或行業的文本進行分類」。亞馬遜網路服務公司學習及人工智慧(AI)總經理Matt Wood博士,在博客文章中提到這個新的功能。

Matt Wood表示:「許多客戶告訴我們他們擁有過剩的數據,特別是包含非結構化、自然語言的數據。客戶很難在這些複雜的信息裡面找到想要的潛在信息,而處理複雜數據卻是機器學習特別擅長的東西。」

為此,客制化欄位允許客戶讓Comprehend特定地了解垂直或某個領域的術語。從一小部分示例比如政策編號列表和使用它們的文本,客制化欄位就可以生成一個能夠識別任何給定片段中的目標文本的定製模型。

Comprehend的一個補充新功能是客制化分類,開發人員能夠將文檔分組到自己所命名的不同類別。只需50個示例,客制化分類就可以生成一個能夠對電子郵件、社交媒體帖子、分析報告和其他文檔進行分類的模型,或者根據其內容對其進行分類。

客制化欄位和客制化分類一般都可用於各種情況。Matt Wood博士寫道,律商聯訊集團已經使用客制化欄位功能從超過2億份文檔中提取法律欄位,準確率超過92%。

博士表示:「自從AWS成立之初,我們的目標就是開發傳統上只有大型、資金充足的組織才能獲得的技術,讓它們適合所有開發人員。Comprehend將負責建立、培訓和主導定製的機器學習模型,並通過私人應用程序介面提供這些模型和工具,這些新的功能是這種精神的完美體現。我們很高興看到用戶運用這些功能來建造不同的東西。」

AWS之前在美國東部開設第二個高安全性GovCloud數據中心,旨在滿足政府和其他受到嚴格監管的行業要求。客戶可以享受到更好的服務,以減少延遲,增加數據持久性和彈性,實現更強大的災難恢復能力以及跨多個區域擴展的能力。

同時也宣布計劃於2020年在義大利米蘭開設數據中心,再增加一個雲服務區域,更好地為義大利客戶提供服務。義大利將成為AWS歐洲排名第六的區域,僅次於法國、德國、愛爾蘭、英國和瑞典,預計將於今年年底上線。

Comprehend也陸續推出新的功能或者改進的工具。本月初,AWS成功讓翻譯、轉錄和Comprehend服務符合《健康保險流通與責任法案》的標準。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 前瞻網 的精彩文章:

2018年美國醫療保健管理諮詢市場將達530億美元 醫療保健IT需求最大
沃爾沃展示純電動無人車360c 預計2021年推出重新定義汽車行業

TAG:前瞻網 |