當前位置:
首頁 > 新聞 > 張子軾:文史研究學者如何「後發先至」用好資料庫?

張子軾:文史研究學者如何「後發先至」用好資料庫?

「大數據」如今已滲透到人類生活的方方面面。隨著各種資料庫的大量出現,傳統文史研究也發生了變化。近年來,與「e考據」和「數字人文」相關的研究日趨增多,因此,進一步探索如何更切實地將理論、方法與研究實踐有機結合,就變得十分重要。

揚棄既有研究成果

大數據時代對傳統文史研究產生的影響,首先表現在資料上。近些年新推出的電子資源在內容上甚至有超越傳統出版物之勢,檢索的快捷性和精確度,可以令學者省卻翻檢群書、遊歷訪書之勞。在這樣的學術環境下,探討某些疑難問題可能只需簡單檢索,許多「懸案」的解決難度也相應大幅度降低。前人因資料局限而不得不大量運用的「理校」「推論」「悟證」諸方法,在大數據時代無疑要重新進行揚棄。

在學術史研究中,清人往往因所見善本不豐而大量運用「理校」法展開研究,其中有的結論或與善本相合或遭善本否定。今人既然已經能夠在研究中大量佔有善本供校勘,那麼這種研究方法雖仍有學習的必要,但其實用性也難免會打些折扣。大量新材料理應引發大量新結論,一些「常識」或「定論」必然也會隨之遭到質疑甚至顛覆,這對於現有的研究自然會有相當明顯的刺激作用。近年來學界對於近代學人的成就時有爭論,原因之一就在於當時學者以一人之力所做的資料性工作,精度和效率都很容易被資料庫所超越。不少在民國時期「古史辨」中幾乎成為公認的定論,隨著出土文獻的發現而被推翻(典型的例子如對《孫子兵法》的辨偽),足見新材料在某些研究領域確實處於相當核心的地位。

通過資料庫重新打撈那些以往不被關注的文獻,這實際上仍是發現新材料,其性質與考古相似,亦可稱之為當下的「預流之學」(陳寅恪:《敦煌劫餘錄序》)。與此相關的一個問題是,在超過120億字的可檢索的古典文本,以及各種不同類型的資料庫中,還蘊藏無限問題可供發掘。而這些數據資源能否被學者使用,很大程度上取決於其所在單位購買的資料庫數量。在高校間已有明顯「數位落差」的現實條件下,學者個人的學術水準有可能受到所處文獻環境的制約,而不同文獻環境導致的信息素養的差異可能會進一步拉大這一差距。

資料庫大量湧現,學術評判標準也會發生變化。出於「功利」眼光計算,當代學者費盡周折的考據工作,很可能被下一代學者輕易解決。其原因並非人的智力、才能有別,而是文獻環境不斷變化提供的巨大方便使然。一代有一代之學術,面對不同的環境,學術範式也應隨之轉移。所以,當下正是海量文獻可供使用、可以大有作為的時代,也是考據研究缺乏亮點而趨於同質化的時代。換言之,即使是在數據仍未被充分電子化的當下,考據研究的合法性也正在受到衝擊。一般性的文獻挖掘仍然重要,但能夠解決核心學術問題的研究更為重要。

引發學術倫理討論

在電子檢索受到學界矚目的同時,一些批評尤其是對於學術倫理的討論也隨之熱門起來。電子檢索的高效快捷,令不少學者擔憂其可能引發更嚴重的學術不端。比如,有的研究者可能對相關領域了解有限,但在檢索工具的助力下仍敢匆匆上馬,輕易立說;有的研究者徵引繁複,可謂博瞻,但實際上許多材料是脫離語境的「遙讀」,經不起細加辨析;有的研究者過於迷信電子文本的全面性,但卻因此而忽略了那些未被電子化的文獻;有些電子文本存在錯誤,研究者未核查原書導致誤引誤斷;等等。

對這些實際存在甚至時顯泛濫的問題,我們可以嘗試從以下幾個方面來進一步認識。首先,技術本身是中立的,上述批評很大程度上是在針對研究者個人的文史素養和治學態度,並未否定技術能夠令優秀學者如虎添翼。而擅長檢索的學者也能夠認識到文史素養的重要性,並非一味依賴電子資源。從現實情況看,電子技術確實使那些曾經看上去遙不可及的一流學者(尤其是實證型學者),變得可以企及了,這至少是正在提升學術研究的平均水準。校勘、箋注、考據中的一些前期工作,可由計算機更精準地代勞,在人機結合的研究過程中,「高明子弟,自然沉潛」。

其次,當下的電子文本絕非完美,即使是掃描版也往往不能完全忠於原書,引用之前必須與原始文獻核對,不能徑用。但這恰好說明,現在的資料庫還沒有脫去以往「工具書」的性質。前人做研究,亦會查閱類書、索引等,甚至常有轉引、代查的現象,這證明「工具」本來也不被排斥。如將資料庫理解為一種高級的「逐字索引」,則其學術價值自然彰顯。此外,紙質文獻(尤其是整理本)同樣常常有誤。古籍校勘中,也多有以「通行本」為底本的典範。事實上,核心問題不在於當下的電子文本有多少具體錯誤,而在於能否使注釋具有可回溯性和規範性。如果一味排斥徵引電子文本,很可能也會使資料庫開發者缺乏將電子文本精確化的動力。

促進材料深度辨析

一般觀點通常認為,電子檢索作為一種「捷徑」,往往令學者過於重視關鍵詞,卻忽視同一詞語所處的不同語境。時代的風氣、作者的習慣、史料的性質等,都在大數據時代的考據中付之闕如。在筆者看來,這種弊病在傳統文史研究中同樣並不少見,卻有可能在大數據時代覓得新的解決契機。

首先,大數據時代資源豐富,找尋輔證、反例的難度都較以前小,可以在一定程度上防治孤證武斷,並有益於深入理解史料所處的特殊語境。

其次,當大數據呈現出全部信息時,可以在多方面幫助學者辨析問題,甚至可以用「結構取義」的方式展開新的研究思路。例如高樹偉在研究《永樂大典》的輯佚條例時,推翻了認為《大典》「直取全文」的成說,並且依靠海量文本對校的方式,提出了《大典》征書的新通例。這一認識既變,或許在一定程度上可以藉助通例建立參考系,並以此來重新認識前人輯佚的成果,不妨稱之為類似於「理校」的「理輯佚」。黃一農最近在脂批本「寧」字抄寫避諱的研究中,也提及抄本研究應建立參照系,這些見解似可遙相呼應。又如在文本細讀工作中,作者究竟是直接使用某一典故,還是受到文化傳統影響,實際存在多種可能。箋注、考據家往往側重於鎖定甲乙間的因果承襲關係,但容易忽視文化大傳統的潛在影響。近年來古代文學研究引入「互文」理論,嘗試說明這種影響往往是網路狀、多源多流的。張昊蘇在此基礎上提出「e互文」思路,意在指出大數據時代有助於深入理解這種多樣性。

藉助大數據提供的便利,考據學出現了「後發先至」的現象。前輩學者經年研究的難題,很可能被新一代學人在短時間內解決。至少在這類問題上,信息素養的意義很可能要高於傳統知識體系,掌握查找知識的能力很可能也比掌握知識更為高效且重要。這裡並非是說新時代的學者可以不掌握知識而解決問題,而是說,信息素養可以出於研究的需要,迅速進入新的領域並建構具有針對性的知識體系,這種大幅度的跨界是傳統學者較難做到的。當然,就目前的研究狀況來看,大數據時代「數字人文」研究還沒有作出第一流的成果,多數成果仍然是在研究具體問題,而尚未建立新的範式。但近十餘年來這一領域的學術積累正以指數級速度增長,足以令人期待由「量變」產生「質變」。或許,未來傳統學者也應該未雨綢繆,需要考慮能否做出不被資料庫遮蔽、凸顯研究者個性的學問。

(作者單位:南開大學文學院)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國社會科學網 的精彩文章:

《中華智庫影響力報告(2018)》發布 哪些智庫排名前10?
《歷史轉折 偉大變革——指尖上的改革開放40年圖片展》正式上線

TAG:中國社會科學網 |