當前位置:
首頁 > 知識 > 語言學一個小小的星號×,背後水很深!

語言學一個小小的星號×,背後水很深!

翻開任何一本語言學(尤其句法學)書籍,你都會看到的一個符號,是下面這個句子左上角的星號:


(1)*那隻貓的在追老鼠餅乾偷吃了。


把(1)拿給任何一個以漢語為母語的人看,他都會覺得:

—— 我不知道這句話是什麼意思;


—— 這好像不是漢語的正常句子吧?我不會這麼說,也沒有人這麼對我說過;


—— 這句子很不好,是不可接受的。


句法學家把(1)這樣的句子認為是「不合法」,並用「*」標記。請注意,這個判斷是基於母語使用者對(1)的反應和直覺作出的。

然而,究竟什麼是「合法/不合法」?按照上面說的,是否就意味著母語使用者覺得「好,接受程度高」的句子就是「合法」,反之覺得「差,不自然,接受程度低」的句子就是「不合法」?


不!由喬姆斯基開創的對語言學領域產生革命性影響的生成語法(Generative Grammar)理論,其核心就在於區分這兩個概念:


代表「語言能力」(competence)的「合法性」(grammaticality)



代表「語言行為」(performance)的「可接受性」(acceptability)

這上面有四個關鍵詞,可以分成兩組來講:


首先,為什麼要區分「語言能力」和「語言行為」?「語言能力」是從實際語言行為中抽象出來的一種知識,去除了那些與語言本身沒有直接關係的因素。我們在說話時候由於分心、口誤、記憶力等原因,實際的語言表現是紛亂複雜的。生成語法理論認為這種具體的表現不是語言學的研究對象,語言學要研究的是一個「理想的語言使用者」(ideal speaker)關於語言的直覺(instinct)(詳見喬姆斯基1965年著作《句法理論問題》)。

語言學一個小小的星號×,背後水很深!



其次,「合法性」和「可接受性」呢?在做語感調查時,我們可以直接觀察、測量到的是「可接受性」,即大家覺得這個句子好不好、是否自然。這是一個綜合性的判斷,而代表語言能力的「合法性」只是決定某個句子「可接受性」的因素之一。比如下面的句子(2),想像一個7分的評分系統,一般人可能會給它打個5-6分。

(2)那隻主人在打的狗喜歡的貓在追的老鼠偷吃了餅乾。

語言學一個小小的星號×,背後水很深!



但是這句話無疑是「合法」的,導致它可接受性降低的原因只是它嵌套了太多個定語從句,而人在理解時受記憶力等原因的影響一下子沒有「反應」過來。如果我們利用停頓把句子的各個部分劃分出來,這句話完全是母語使用者可以理解的、正常的一個漢語句子:

(2)[那隻[[[[[主人在打的]狗喜歡的]貓]在追的]老鼠]]偷吃了餅乾。


又如句子(3),我們覺得它有點奇怪是因為句子表達的意思不符合我們的常識,「綠色思想」怎麼又是「無色的」?「思想」怎麼「睡覺」?「瘋狂地睡覺」又是什麼情況?


(3)無色的綠色思想在瘋狂地睡覺。


但是我們有強烈的直覺句子(3)在語法結構上並沒有問題。跟(1)的奇怪比較起來,(2)(3)的奇怪不是同一種,這種直覺就是用「合法性」來區分,雖然表現到「可接受性」時,這三句話都或多或少有一點「不好」、「不自然」。

語言學一個小小的星號×,背後水很深!



這些區分,看似無關痛癢,實則有很深的理論內涵。「語言能力」、「合法性」這兩個東西都是看不見、摸不著的抽象概念,有人會說,既然能直接觀測到的數據只是「語言行為」、「可接受性」,如果我們能建立一個可以預測這些數據的模型,那為什麼還需要假設中間這一層抽象的知識結構?


現在很火的自然語言處理、機器翻譯大抵抱有這樣的指導思想。而生成語法理論,則堅持認為,這一層抽象的知識結構(即語言能力和代表語言能力的合法性),才是語言學學科研究的對象和重心。

語言學一個小小的星號×,背後水很深!



再具體一點說,這兩種方法論在對人類語言的理解上是有本質性的不同的:假如人類語言是一台生成「句子」這種產品的機器,前者認為這台機器會產出從不好到好梯度分布(gradient)的句子,這些產品是基於概率的分布(好的句子高頻,壞的句子極度低頻);後者則認為這台機器本質上是二分的(binary),只產出「合法」的句子,至於人類呈梯度分布的語感,是受與語言本質無關的其他因素導致的概率性分布。

語言學一個小小的星號×,背後水很深!



隨著近些年人工智慧、自然語言處理等領域的飛速發展,前一種觀點(我們姑且統稱為「概率派」probabilistic view)在應用方面取得了巨大的成功,以至於業界有「每開除一名語言學家,我的語音識別系統錯誤率就降低一個百分點」這樣的說法。


但這否意味著堅守生成語法的(這裡簡稱為「二分派」categorical view)理論語言學家就要「失業」?


答案顯然是否定的。如果仔細看,我們會發現二分派從來沒有否認過「語言行為」或「可接受性」是概率性、梯級分布這個事實;而概率派無論如何提高預測語言行為的模型的準確率,他們的結論也止步於「既然語言行為可以用概率分布模型預測,那麼語言的本質可以是概率性的」。


拿小編最近看到的一篇文章,2016年Lau等人發表在Cognitive Science的「Grammaticality, acceptability, and probability: a probabilistic view of linguistic knowledge」來說,他們從不同來源(各大語料庫,語言學課本,並用谷歌翻譯來獲得一些不那麼自然的句子)組建了一些句子庫,由人類對這些句子作出語感判斷(根據自然程度打分),然後用當下非常流行的N-gram, Bayesian HMM, RNNLM等各個模型預測人類的語感判斷。結果發現,不少模型可以達到相當水平的準確率。


然而,最後他們的結論並不「強硬」:


We consider the relevance of these results to the debate on the nature of grammatical competence, and we argue that they support the view that linguistic knowledgecanbe intrinsically probabilistic.


(我們認為這些結果與人類語言能力本質之爭有直接的關係,且它們支持了「人類語言知識本質上可以是概率性的」這一觀點。)


注意這個「can」,「語言知識本質上可以/可能是概率性的」。正如剛才所說,這兩派觀點原則上並不能構成「爭鋒相對」,概率派的目的是預測語言行為的分布,但沒人真正敢斷言,這種依靠統計、大量語料所建的模型真正刻畫了人類的「語言能力」。


如果仔細看文章中的數據與分析,你會發現很多「隱患」:比如,各個模型的準確率在不同類型的句子庫非常不同,如果句子普遍比較短,演算法偏簡單的N-gram模型準確率就上去了;但我們直覺上都知道,靠前(n-1)個詞推斷第n個詞的概率(N-gram簡單來講就是這個意思)顯然不會是真正的語言能力,因為我們掌握的是句子的結構,而非線性順序。這種準確率的浮動意味著隨意性和不穩定性,也就是說,我們通過數據分析發現了某幾個模型在某幾個句子庫上的預測率非常高,但我們並不(完全)知道為什麼這幾個模型在這些時候就成功/失敗了。

語言學一個小小的星號×,背後水很深!



(Lau et al. 2016文章中部分數據)


反觀理論語言學的研究,他們的結論是基於可推廣的規則,雖然會不斷受到新現象的挑戰而需要進行調整、修正,但每一步都是紮實而有跡可循,自成一個完整的、動態的形式系統。


最後,要強調的是,小編個人認為對於理解人類語言本質這項事業來說,二分派和概率派並無輕重、高下之分:一方面,兩者的研究重心和(短期)目標本來就是不同的;另一方面,隨著模型的複雜性(complexity)提高,模型處理、分析語料的方式某種程度上也在像人類(語言學家)靠攏,小編相信兩個陣營中真正的遠見(insights)是趨同的,因為,great minds think alike!


參考文獻


Adger, D. (2003).Core syntax: A minimalist approach(Vol. 33). Oxford: Oxford University Press.


Chomsky, N. (2014).Aspects of theTheory of Syntax(Vol. 11). MIT press.


Lau, J. H., Clark, A., & Lappin, S.(2016). Grammaticality, acceptability, and probability: a probabilistic view oflinguistic knowledge.Cognitive Science.

語言學一個小小的星號×,背後水很深!


您的贊是小編持續努力的最大動力,動動手指贊一下吧!


本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 語言學午餐Ling-Lunch 的精彩文章:

周杰倫______了?計算語言學告訴你答案
人生最大損失居然發生在六個月——下半輩子還怕什麼
厲害了!音樂和語言,原來這麼像哪
為什麼林丹的一句「做為一個男人」會惹惱網友?
程工教授:詞庫應該是什麼樣的?

TAG:語言學午餐Ling-Lunch |

您可能感興趣

入門,C語言學習的四個點
小語種,大視野——語言學習新選擇,小語種前景更廣闊
看完《降臨》一臉懵逼?語言學碩士教你一秒學會外星語
牛頓差一點就成為了語言學家
選擇一所好的語言學校,就是你日本留學成功的一半
預告| 這位小提琴爸爸,為兒子造了一台靜電音箱!培養一雙敏銳耳朵,音樂啟蒙+語言學習輕鬆掌握
在日本語言學校就讀,是一種怎樣的體驗?
日本的語言學校只是學習語言嗎?
著名語言學家、「漢語拼音之父」周有光先生去世,享年112歲
開團|小提琴爸爸,為兒子造了一台神器!育兒大咖力薦,培養敏銳耳朵,音樂啟蒙+語言學習輕鬆掌握
語言學的詩與趣
華裔語言學家王士元:語言是怎樣演化的?
研究了那麼多的「混血」鳥寶寶,依舊解不開語言學習的迷題
真的存在語言學習的關鍵期嗎?
日本語言學校的秘密,只有1%的學生知道!
現如今孩子想出國學語言學,有前途么?
從語言學到深度學習NLP,一文概述自然語言處理
看動畫片對孩子的語言學習有好處嗎?
關於日本語言學校這大概是最全的介紹了!