當前位置:
首頁 > 最新 > 基礎卻不簡單:命名實體識別用例詳解

基礎卻不簡單:命名實體識別用例詳解

命名實體識別是一個過程,一個演算法將一串文本(句子或段落)作為輸入,並識別該字元串中提到的相關名詞(人物,地點和組織)。在這篇文章中,我們列舉了一些命名實體識別技術的場景和使用案例。

命名實體識別的用例

為新聞提供者分類內容

新聞和出版社每天都會產生大量在線內容,正確管理這些內容對於充分利用每篇文章非常重要。命名實體識別可以自動掃描整篇文章,並揭示其中討論的主要人物、組織和地點。了解每篇文章的相關標籤有助於自動對定義的層次結構中的文章進行分類,並使內容的發現更加順暢。下面的示例可以看到這個工作的例子。

命名實體識別API已經成功地識別了文章的所有相關標籤,並且可以用於分類。

高效的搜索演算法

假設你正在為擁有數百萬篇文章的在線發布者設計內部搜索演算法。如果對於每個搜索查詢,演算法最終搜索數百萬篇文章中的所有單詞,則該過程將花費大量時間。相反,如果命名實體識別能夠在所有文章上運行一次,並且與這些文章中的每一個相關聯的相關實體(標籤)單獨存儲,這可以顯著加速搜索過程。採用這種方法,搜索詞將僅與每篇文章中討論的小實體列表匹配,從而加快搜索的執行速度。

為內容提供建議

命名實體識別的主要用例之一涉及自動化推薦過程。推薦系統主導著我們如何在當今世界發現新的內容和想法。 Netflix的例子表明,開發一個有效的推薦系統可以為媒體公司的命運創造奇蹟,讓他們的平台更具吸引力和更容易上癮。對於新聞發布者來說,使用命名實體識別來推薦類似的文章是一種行之有效的方法。下面的例子來自BBC新聞,展示了如何在現實生活中實施類似文章的建議。這可以通過從特定文章中提取實體並推薦其中具有與其中提到的最相似實體的其他文章來完成。這是我們有效的用於為媒體行業客戶制定內容推薦的方法。

客戶支持

有很多方法可以使客戶反饋處理流程順利進行,名稱實體識別可以成為其中之一。我們舉個例子來了解這個過程。如果你正在處理全球多家分支機構的電子商店的客戶支持部門,你會在客戶的反饋中提及一些數字。例如:

現在,如果你通過命名實體識別API傳遞它,則會拖出實體Bandra(位置)和Fitbit(產品)。然後可以使用這種方法對投訴進行分類,並將其分配給組織內的相關部門處理。

命名實體識別類似地,還可以有其他反饋推文,你可以根據它們的位置和所提及的產品對它們進行分類。也可以創建一個分類到不同部門的反饋資料庫,並運行分析以評估這些部門中的每個部門的權力。

調查報告

在線期刊或出版物網站擁有數百萬篇研究論文和學術文章。對於一個主題,可以有數百篇文章進行輕微的修改。以一種結構良好的方式組織所有這些數據可能會變得非常煩瑣。通過網上那麼多的數據「瀏覽」,尋找特定的信息可能不是最好的選擇。在相關實體的基礎上分離文件可以節省查閱主題信息的麻煩。例如,可能會有大約兩篇關於機器學習的Lakh論文。如果你根據提取的實體在其上添加標籤,可以快速找到討論使用卷積神經網路進行人臉檢測的文章。

非結構化的文本內容有很多豐富的信息,但找到相關的東西始終是一個具有挑戰性的任務。隨著來自社交媒體、電子郵件、博客、新聞和學術文章的大量數據,對這些信息進行提取、分類和學習變得越來越困難和必要。可以有其他NLP技術來進行流程發現,但是如果你希望分類數據結構良好,則命名實體識別API是最佳選擇。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技一線談 的精彩文章:

TAG:科技一線談 |