當前位置:
首頁 > 新聞 > 漢語方言調查技術取得歷史性突破

漢語方言調查技術取得歷史性突破

1915—1926間,瑞典著名漢學家高本漢陸續發表了他的代表作《中國音韻學研究》。這部書不僅是中國現代音韻學的開創之作,也是中國現代漢語方言學的發端之作。中國學術界同仁驚喜地看到,現代漢語方言的調查研究不僅可以使我們了解到方言的地理分布和共時差異,還可以根據這些差異來重建漢語的歷史。時任中央研究院歷史語言研究所所長的傅斯年先生認為,「以後我們的漢語學不得不以方言的研究為成就的道路……我們現在要於漢語學的致力,左也是方言,右也是方言」。他擬訂了具體的方言調查計劃,陸續延攬了趙元任、李方桂、羅常培等著名語言學家。在這些語言學家的努力下,現代科學意義上的漢語方言學迅速發展壯大,為中國現代語言學的百年振興奠定了堅實基礎。其中,趙元任先生的貢獻尤其重大。在方言調查領域,趙元任先生髮明了記錄漢語聲調的五度制標調法,完善了方言調查字表和方言語音的記錄方法,創立了辭彙、句子、長篇語料的記錄方法,組織領導了六次方言調查,寫出了《現代吳語的研究》(1933)、《鍾祥方言記》(1939)、《湖北方言調查報告》(1948)等系列經典著作,正式確立了漢語方言學的調查研究範式。

從趙元任開始,使用《方言調查字表》等調查材料到田野實地調查,調查結束後整理調查材料,撰寫調查報告或科研論文,成為漢語方言調查的規範操作程式。上述工作環節中,整理調查材料花費的時間最長,工作最為辛苦。通常情況下,把一兩個月的調查材料整理成可發表的調查報告,需要數年時間。以《湖北方言調查報告》為例,開始調查的時間是1936年5月5日,結束的時間是5月21日。實際調查的時間只有半個月。但《湖北方言調查報告》到1948年才正式出版,材料整理的時間長達12年。其間雖然有戰亂因素的影響,但把筆寫的音標符號整理成音系,整理古今對比關係表和排同音字表,做辭彙對照表,根據錄音轉寫長篇語料,繪製方言地圖,這一系列繁複的工序和流程才是歷經12年才把調查材料整理成書的原因。

到20世紀50年代全國漢語方言普查時,雖然丁聲樹和李榮設計了可反覆使用的記音卡片,但以人工排同音字表和古今對比關係表來對比方言之間的異同,仍是極其繁瑣的事情,稍不留神就會出錯。即使是曾被美國語言學同行譽為「永遠不會錯」的趙元任先生,在方言材料整理中也曾留下過遺憾。

計算機技術是人類有史以來最偉大的發明創造之一,尤其是在資料庫和統計計算能力方面,早已遠超人腦。因此,從20世紀90年代計算機技術開始普及以來,一直有人試圖把計算機在數據處理方面的優勢移植到方言材料整理上,做得比較多的是各種整理方言同音字表的軟體。有的軟體還可以排音系表,可以作古今對比等。但經我們試用,就已有的功能看,這些軟體排的同音字表和古今對比表都不規範,不能直接使用。此外,軟體的用戶體驗也很差,動轍死機崩潰,與專業軟體的差距很大。此外,這些軟體功能也很少,一般只能用來做同音字表,方言學界常用的古今對比,多方言比較,排聲韻調、排音節表等功能都不能實現。而且,這些軟體都只能用於整理調查材料,不能用于田野調查。

有鑒於此,筆者於2005年申請到中國社會科學院語言研究所的一個所級項目,計劃開發一款專業軟體,以期全面模擬方言調查過程,並用于田野調查記音和即時整理調查材料。2007年,「中國社會科學院語言研究所方言處理系統」1.0版完成。此版本的軟體集成了《方言調查字表》3810個字音的資料庫,配備了記音界面,可以用來記單字音,並即時生成同音字表,可以做古今對比關係表以及聲韻調完全配合的音節表。2013年,筆者申請到國家社科基金的資助,結合語言研究所甘肅方言調查的創新項目,對這個軟體做了大規模的升級更新,前後升級了17次,版本從1.0版升到9.0版。利用這個軟體,課題組順利完成了甘肅全省的漢語方言調查任務,並初步完成了甘肅省92個調查點的材料整理工作。

該軟體重要功能包括如下方面。

其一,設計了多種數據導出導入方式。軟體既可以把一個方言的全部數據一次性打包導入導出,還可以對單字音、連讀、辭彙、語法例句、長篇語料進行分項導入導出。導入導出時還可選帶錄音或不帶錄音數據導入導出。這個功能特別適合多人合作的團隊項目。團隊不同成員在不同地方調查記錄,結束後即可上傳給項目負責人,及時分享數據,及時解決調查中碰到的問題。

需要著重指出的一點是,利用軟體的數據轉移功能,可以大幅度減少調查時間,節約經費。具體做法為:由於鄰近方言的差別很小,當記錄了一個方言後,就可以把這個已記音的方言材料導入到新的調查點中。因為是用已記好音的方言來對照需要記錄的新方言,這時只要對已有記錄數據稍作修改即可,不必重複全部記音工作。用這種方法,熟練的調查者只需兩天就可以調查一個方言並全部錄好音。

其二,設計了符合田野調查實踐的記音界面及多種快捷記音方式。在單字記音界面上定義了七個快捷記音鍵,不必重複記音。在記錄連讀、辭彙、句子或長篇語料時,可以根據原來記的單字音,自動為已有的漢字匹配音標,從而實現了自動記音功能。

其三,設計了多種錄音播音方式,可以自動做語圖。而且,所有錄音文件都自動切分並與記音數據相關聯,當點擊記音符號時軟體即播放錄音,這樣就可以審核原來的記音是否準確到位。

這也是一項革命性的技術創新。原來紙記筆錄記下來的方言調查材料,使用者都無法核實記音,無法驗證其記音的準確性。利用我們的軟體,不但可以核查方言調查者的記音水平,如果記音水平達不到專業要求,使用者還可根據錄音材料重新記音。

其四,軟體提供了多種修改功能,可以一次只修改一個字音,也可以批量修改某一類聲母、韻母或聲調,甚至可以在播音界面上根據錄音來修改原來的記音。

其五,軟體功能強悍而且魯棒性達到專業水平。這個軟體現在可以做六種同音字表,可以自動做同音字表、多方言的連讀對照表和多方言的辭彙對照表,在最近一次升級中,軟體新增了詞典編寫功能,可以自動完成全部詞語的字音提取和方言詞語的首字音序,還可以做方言詞語的筆畫排序。而這些工作原來不但要花費大量人力物力,還不容易保證質量。如今在這個軟體中,這些工作只消輕點滑鼠即可迅速完成。

其六,由於軟體中的所有數據在錄入過程中都經過了數據化處理,把這些數據導出後,可以直接導入到地理信息系統軟體的資料庫中,對其做分區分類、地圖繪製等更深層次的數據加工處理。

甘肅漢語方言調查在漢語方言調查史上有重要的開創意義。這次調查,首次做到全軟體、無紙化對所有調查材料進行錄音。對甘肅方言四年多的田野調查,核驗了這個軟體,提升了這個軟體。這個軟體也為甘肅方言的調查工作提供了強大助力。

通過甘肅方言調查研究的實踐,我們確信,我們為漢語方言工作者提供了一個功能強悍的軟體,漢語方言調查研究技術取得了歷史性的重大突破。

(作者單位:南方科技大學人文科學中心、中國社會科學院語言研究所)

來源:中國社會科學網-中國社會科學報

責任編輯:張卓晶 排版編輯:張卓晶


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國社會科學網 的精彩文章:

陝北發掘明代土洞式佛窟遺址
王一川:當前藝術產業需要承擔的文化使命

TAG:中國社會科學網 |