再聊聊自然語言處理中的結構化預測問題
最新
08-05
上次文章從廣泛意義上說了結構化預測【見下文】閑聊結構化預測(structured learning)【這是一類問題】本文聊一下自然語言處理中的結構化預測問題。
Structured Prediction
一開始還是說一下結構化預測的概念,結構化預測不是輸出一個標量(回歸問題)或者一個類別(分類問題),而是輸出一個結構,樹、圖或者其它序列能夠互相影響彼此。
在自然語言處理中,結構化預測問題有以下幾種:
Sequence segmentation
Sequence labeling / Tagging
Parsing
下面來分開舉例
Sequence Segmentation
序列分割,指的是將一個序列分割為連續的片段。
更廣泛的有句子分割,段落分割,他們的輸出片段與片段直接其實是互相聯繫,全部構成一個整體sequence。
Sequence Labeling / Tagging
序列標註是一類問題,是對一個序列的每個word打上一個標籤,在nlp中非常多的任務都可以轉為序列標註任務,這裡不是重點,只是說序列標註是結構化預測問題。序列標註問題還有:
以上任務均可以轉化為序列標註任務,然後通過一定的解碼演算法就能得到需要的結果,它們是結構化預測問題,不是簡單回歸或者分類問題。
Parsing Algorithm
最後一類問題是parsing問題,對句法分析的介紹可以看:
上面兩篇文章(知乎搜索相關關鍵字即可!)
本篇文章主要總結了在自然語言處理方向的結構化預測問題,每一類問題其實都可以展開講解,歡迎大家交流!
所以ppt來自哈工大車萬翔老師slides