ACL 2018:斯洛伐克理工大學:用戶評論意見綜述
這是讀芯術解讀的第137篇論文
ACL 2018 Student Research Workshop
用戶評論意見綜述
Towards Opinion Summarization of Customer Reviews
斯洛伐克理工大學
Slovak University of Technology
本文是斯洛伐克理工大學發表於 ACL 2018 的工作,針對評論類門戶網站如Yelp或Amazon上海量評論數據的分析處理問題,提出了一種基於神經網路的方法,在用戶生成的旅行評論上生成摘要,並考慮意見隨時間推移發生變化的情況。我們概述了未來關於摘要生成的核心方向,並通過解決這些存在的問題,幫助評論網站的用戶做出更明智的決定。
引言
近年來,隨著網路的日益普及,可用的文本語料庫數量迅速增長。用戶每天產生大量的文本。由於文本中包含了大量的文本和信息,因此人們不可能閱讀所有的文本,從而導致信息過載。對於一個普通人來說,即使他只閱讀所有最相關的文本,也不可能閱讀完。文本摘要的任務由來已久。50年代後期,Luhn試圖自動創建文檔摘要。幾十年來,有許多摘要系統處理不同形式的摘要。這項任務屬於自然語言處理中最具挑戰性的任務之一。文本摘要的任務對於決策或相關性判斷尤其重要。
自動文本摘要是一項非常有用的工作,也是幫助用戶無需閱讀所有的原始文檔,卻能獲得儘可能多信息的重要工具。文本摘要可以定義為由一個或多個文本生成的文本,這些文本包含與原始文本相同的信息,並且不超過原始文本的一半。Mani將摘要的目標定義為查找信息源、從中提取內容並以簡潔、對用戶需求敏感的方式,向用戶呈現最重要內容的過程。
我們可以將摘要技術分為兩類:抽象性摘要和提取性摘要。提取性摘要旨在選擇原始文檔的一部分,如部分句子、整句或段落等。抽象性摘要旨在獲取銜接性好、精鍊,且很好的保持原文釋義的輸出摘要。在提取性摘要中選擇部分文本,會導致喪失一部分銜接性,而抽象性摘要卻可以保持。
近幾年來,基於神經網路的方法變得越來越流行。文本摘要的一個特定分支是從人為生成的文本中摘要觀點。我們可以摘要客戶評論或社交網路上的意見。由於存在許多重複和冗餘信息,這個問題與標準摘要任務不同。不同用戶之間的觀點極性也存在問題。這種類型的摘要對於產品的用戶和產品的所有者都是非常有用的。意見摘要對於決策具有特別重要的意義。這種摘要類型還可以顯示從社交網路上的評論中收集的意見趨勢,尤其是當許多文本條目增長非常快時。
在本工作中,我們還討論了意見摘要的具體問題:客戶評論的情感分析。在摘要任務中,情感信息可以與文本語料庫本身一起作為輸入之一。文本片段的情感和整個摘要的情感之間的差異是一個非常有趣的需要考慮的方面。
本文的核心貢獻是:(1)綜述意見摘要的最新發展,(2)組建相當大的意見摘要數據集(來自基於旅行的門戶),(3)基於最新神經網路架構的新穎的意見摘要方法。
意見挖掘與摘要
意見摘要是一種特殊類型的摘要。產品和服務以及社交網路上的評論可能包括數百個條目,並可能導致信息過載。觀點的重複是與新聞摘要的主要區別之一。用戶生成的文本往往顯著區別於通常被廣泛修訂的新聞文本。
用戶意見摘要
產品評論的意見摘要是最常見的意見摘要的例子。這些評論通常來自像Amazon這樣的電子商店。
Opinosis項目提出了一個基於圖譜的摘要框架。該框架試圖生成高度冗餘意見的抽象式摘要。作者表明,與基準提取方法相比,他們的摘要與人類摘要具有更好的一致性。基於方面(aspect)的情感分析可以幫助基於對產品特徵的積極和消極意見生成結構化摘要。該系統不僅考慮句子信息,還考慮來自其他句子或評論的信息片段,稱為背景信息。作者還指出,詞的極性在一個域內甚至可以不同。不同於其他處理情感極性的意見摘要系統,另一項研究將意見摘要歸納為群體領導的檢測問題。作者提出了基於圖譜的產品評論信息句子識別和評價方法。研究提出了在句子圖譜中進行領導檢測的演算法。Gist系統旨在處理大量的文本,並將其自動摘要成信息豐富、可操作的關鍵語句。Gist試圖將原始評論摘要成短文,包括幾個關鍵句子,這些句子將捕捉到關於產品的總體情感。
群體答案(Community Answers)摘要
伴隨著對客戶評論的摘要,一個非常重要的摘要類型考慮將社交網路上的評論或問答(QA)系統中的回答作為輸入條目。在這種形式文本條目上的研究可輔助進行決策。
Wang等人提出了一種基於子模塊的功能框架,該框架可用於query-focused意見摘要。作者在QA和博客數據集上評估了該框架。統計學習到的句子相關性以及與不同主題相關的信息覆蓋被編碼為子模塊函數。Lloret等人既處理社交網路中意見摘要,也處理產品評論中的意見。其特點是綜合了句子簡化、句子再生和摘要任務中的內部概念表達。該方法試圖能夠生成抽象的摘要。Guo等人提出了高度對比的意見摘要模型,特別是對於有爭議的問題。他們把專家意見與普通意見結合起來,創造出對比句對的輸出。該研究還提出了這種方法,作為用戶更好地概括有關爭議問題的的統一意見。Wang等人對電話會話語料庫進行了注釋,研究了兩種摘要提取的方法:基於圖結合話題和情感信息的摘要提取方法和將話題和情感信息作為分類問題的監督方法。Li等人的研究還涉及博客中的意見摘要,基於最近的深入學習研究提出了一種用於意見摘要的卷積神經網路,最大邊緣相關性用於提取代表性意見句。Tsirakis等人提出了一個非常重要的問題:在社交媒體上發表的意見數據的數量和波動性。他們討論了大多數方法只處理少量數據,這些方法非常有效,但通常不會擴大規模。
未來方向
正如前面章節中所述,在摘要生成中仍然存在許多挑戰。通常應用於新聞文章的標準文本摘要仍然涉及抽象性摘要的問題。文本摘要技術可以處於不同的抽象級別,並且通常不是完全抽象的。
另一個巨大的挑戰在於對英語以外的語言的摘要。大多數方法只用英語進行評估,有趣的是其他方法的評估及其細節。另一個方面可以是對多種語言的摘要,其中輸入文本不需要僅使用一種語言。
在評估階段存在一個重要的問題。自動評估是非常有爭議的,因為不存在一個正確的摘要。像ROUGE這樣的自動評估措施,可以使用n-gram來處理這些問題,但是仍然不能處理同義詞的使用。基於基本真理的多重表述的相同問題也可能導致人類評價的問題。用更多的人類參與者評估的實驗必須處理不同用戶之間的低一致性。
在未來幾年中,我們期望意見摘要能夠處理領域細節,並提高用戶滿意度。未來用戶生成內容的持續增長,將導致關注於減少信息過載的研究,如文本摘要越來越重要。
研究建議
正如我們前面所描述的,我們希望集中於一種特定類型的摘要:意見摘要的創建。如今,旅遊網站包括數以千計的用戶評論數據。這些評論對於未來可能的用戶決策非常重要,而且對於網站所有者也是如此。由於每天有數十篇新的評論,用戶不可能閱讀所有的評論,而且通常很難只選擇相關的評論。對於網站所有者來說,不可能手動閱讀所有對服務改進非常有幫助的評論。
神經網路以及文本摘要的最新進展表明,採用編碼器-解碼器架構是非常有用的。客戶評論的摘要問題不同於以前應用模型的標準單文檔摘要。在這個任務中,我們應該考慮多模塊框架。著重提高用戶對評論摘要的滿意度,以及檢查意見摘要的時間方面。
意見摘要應分幾個階段進行:1.方面檢測,2.聚類意見特徵,3.句子生成。
在客戶評論的意見摘要中,時間範圍常常是一個被忽視的特徵,因為客戶的意見可以以一種積極的,但也是一種消極的方式隨著時間的推移而發展。我們創建時間來處理聚類意見的信息以及關於評論者的其他信息,這些信息可以輔助建立準確性更好的摘要,提高最終用戶對輸出摘要的滿意度。另一個值得討論的重要問題是,在觀點摘要任務中採用端到端的深度學習。主要問題是缺乏大數據集,這種數據集的構建是昂貴的,如果手動執行的話,可能需要數百個小時。
為了創建適當的數據集,我們從大型旅遊門戶(例如,TripAdvisor,Booking.com)收集客戶評論。所有的評論都伴隨著其他有用的信息,比如分數排名,這也應該包括在內。然而,任何有關評論者的公共信息也可能非常有用,因為它表明了評論的相關性和重要性。
為了評估生成的摘要的質量,需要進行一些實驗。我們必須創建我們的標註摘要來自動評估摘要的質量。由於這種類型的評估非常耗時且難以獲得資源,因此對於生成摘要的質量評估,後驗評估是更可行的方法。對於意見摘要來說,比較生成的摘要的情感和原始輸入評論的情感是非常有趣的。人工評估中,我們希望為用戶提供原始評論的列表、生成的摘要並詢問他們的滿意度。我們還使用了一些其他的自動測量,如ROUGE,並將生成的摘要與人工創建的摘要進行比較。另一個重要測量是方面(aspect)覆蓋和從原始評論生成的摘要中包括的方面(aspect)的比率。
總結
在本文中,我們描述了摘要任務的背景。更重要的是,我們描述了這個領域最近的貢獻和發展,以及研究中涉及的許多問題。強調了摘要過程中存在的主要問題及今後的研究方向,特別是對意見摘要的研究方向。我們還介紹了我們未來的研究方向,以及最初的實驗和可能的模型和數據集的設計。我們論證了摘要任務,且在接下來的幾年裡意見摘要還有很多開放性問題值得研究。
※威斯康星大學麥迪遜分校:情感分類中領域自適應詞嵌入方法的研究
※5個冷門機器學習項目,助你打怪升級!
TAG:讀芯術 |