鄒炎炎:語義分析介紹及跨語言信息在語義分析中的應用
語義分析(semantic parsing)是人工智慧的一個分支,是自然語言處理技術的幾個核心任務,涉及語言學、計算語言學、機器學習,以及認知語言等多個學科。近年來,隨著人工智慧的發展,語義分析也越發重要。
word embedding 是很常見的 input feature,能夠很大程度地提升語義分析模型的性能。然而,對於 output 對語義分析模型性能的影響,大家的關注度卻並不是很高。
近日,在雷鋒網 AI 研習社公開課上,新加坡科學設計大學在讀博士鄒炎炎就用通俗易懂的語言為大家介紹了 semantic parsing 的概念、背景以及自己在該領域的論文成果,並介紹了關於 output embedding 對於 semantic parsing 的影響。
鄒炎炎,新加坡科學設計大學博士在讀。主要研究方向為自然語言理解
公開課回放視頻網址:http://www.mooc.ai/open/course/544
分享主題:語義分析介紹及跨語言信息在語義分析中的應用
分享提綱:
1.semantic parsing 背景介紹
2.semantic parsing 模型介紹
3. 如何學 output embedding
4. 實驗分析
雷鋒網 AI 研習社將其分享內容整理如下:
今天跟大家分享的內容包括兩個部分:
一是語義分析介紹,考慮參與分享的大多數朋友並不是從事 semantic parsing 的相關工作,所以我會從通俗易懂的角度為大家做一個普及;
二是講一下我們在 ACL 2018 會議中的一篇短文——《跨語言信息在語義分析中的應用》(Learning Cross-lingual Distributed Logical Representations for Semantic Parsing)
對於做 nlp 的人來講,parsing 一般會被默認為 Syntactic Parsing——語法方面的分析,常見的分析有 Dependency parsing(依賴關係分析)和 Constituency parsing(成分句法分析)。
Wikipedia 上對 semantic parsing 的解釋是:把人類自然語言的話轉化為機器能夠讀懂的語言。
為了讓大家更好地區分語法分析和語義分析的不同點,我先介紹一下兩種分析的任務:
Dependency parsing:比如輸入一句話「I saw a girl with a telescope」,Dependency parsing 的目標就是找到哪兩個詞之間是存在依賴關係的,更進一步的話,可能需要給這種關係標記上 Label。例如 「I 」是 「saw」 的修飾詞,其他關係同理。
Constituency parsing:我們以同樣的句子為例,這裡我們關注的不是兩個詞之間是否存在修飾、依賴關係,而是關注哪些詞構成一個短語,一個短語即是一個成分,比如「a telescope」就是一個名詞短語。
Semantic Parsing 則是指輸入一段完整的話,最後輸出 semantic representations(MRL)。那 semantic representation 是什麼呢?就我了解的而言,主要有五種比較流行的 representations :
? Lambda calculus expressions(一般與 CCG 配合使用)。
? Lambda dependency-based compositional semantics(lambda-DCS)
? Forest, or DAG representations (AMR)
? SQL
? FunQL (logical forms with tree structures)
本次分享中,我們主要採用了 FunQL 這種語義分析方式。
※手把手教你十分鐘搞定人物檢測
※開發者必看:8月 Python 熱門開放源碼
TAG:AI研習社 |