「數字人文」浪潮來襲,倡導之餘仍要警惕過分樂觀
數字人文
數字人文(digital humanities)是近年在人文學科各領域中逐漸興起的研究趨勢,國內外學界關注甚多。但數字人文到底是什麼,為何出現,又能為人文研究帶來什麼,依然眾說紛紜。本文試圖對以上問題進行剖析。
全文大約3900字,閱讀時長約為10分鐘。
報紙原文:《我們為什麼需要數字人文》
作者:哈佛大學博士後研究員 徐力恆
南京大學藝術研究院副教授 陳 靜
數字人文是什麼
一般來說,數字人文的前身是「人文計算」(humanities computing)。人文計算的提出,代表著人文研究中運用電腦運算的技術已經形成一套理論化的思考。學界普遍認為,人文計算的起源可以追溯到義大利神父羅伯托·布薩(Roberto Busa,1913-2011)在1949年開始使用電腦處理神學家阿奎那(Thomas Aquinas)的全集,半自動地生成其中中世紀拉丁文字詞的索引。這項工作歷時數十年,並曾得到IBM公司的協助。這種取向影響了不少文學研究者,使他們利用電腦處理機器可讀文本的內容,對大規模作品作出分析。
隨著數字技術更新迭代、數字化內容不斷增加,這種研究趨勢得到了更廣的應用,其影響遍及各個人文學科。大約在2000年以後,「數字轉向」(digital turn)時代到來,個人電腦變得十分普遍,成為大多學者能方便使用的設備。「數字人文」在這個過程中逐漸取代了人文計算的說法。 綜合相關論述,數字人文至少和人文計算有著以下不同:第一,它擁有更龐大的數據量;第二,它不只是強調計算,還經常應用其他研究手段;第三,進入這個領域的門檻變得更低,並且產生了比人文計算大得多的學術影響。
數字人文可被定義為一套提出、重新定義和回答學術問題的更智能辦法。所謂「更智能」,不只意味著文科學者驅使數字技術(尤其是電腦資料庫)作為外在的工具,來回答他們過去已經提出的學術問題;也應該包含學者由於受到數字技術和思維的影響,而提出新課題,甚至產生新的研究範式。因此,數字人文研究往往包含兩個層面:一是學者一直在做的研究工作,例如對大量資料進行爬梳,找出有用的記載。沒有數字技術,學者同樣可以做得到,但技術可以幫助學者更有效率地執行這些研究的步驟。二是學者不利用數字技術就無法做到的一些研究工作,例如同時比對上千條數據,辨識其中模式。
簡而言之,數字人文研究的內涵是強調人腦和電腦哪一個在什麼時候、什麼情況下更智能和更能發揮作用。當然,不是在所有情況下都是電腦最智能的,有時候人腦可以更妥善地處理問題。所以,在適合使用電腦的時候,數字人文研究者會加以利用;人腦更能發揮優勢的部分,就以學者本身的學術素養來處理。 從研究範式的角度而言,這也是大數據時代「遠讀」(distant reading)策略與傳統印刷媒介時代「細讀」(close reading)方法的結合:計算機及計算方法能幫助學者在紛繁複雜、數量龐大的信息中快速梳理、定位和把握議題,宏觀地「看到」一個學科甚至多個學科脈絡中的焦點問題;同時又需要學者發揮個人學養所長,微觀地去「探究」複雜信息交匯凸顯之處的內在肌理與癥結。
數字人文浪潮的到來
按照數字人文學者蘇珊·霍基教授的劃分,數字人文的發展(主要在北美及歐洲地區)可以分為四個階段。1949年到1970年代主要還是在語言學研究方面。開始使用基於穿孔卡和磁帶存儲的計算機對古典文本進行語彙索引、作者身份界定等文本分析研究工作,其間最具代表性的文檔索引方式為COCOA,出現了首個主題研討會、學術期刊和專門的研究機構。[參見《數字人文指南》(A Companion to Digital Humanities, ed. Susan Schreibman, Ray Siemens, John Unsworth, Oxford: Blackwell, 2004)。
1970年代到1980 年代中期是「聯合」階段。伴隨計算機的逐漸普及和一系列在英美召開的定期研討會,數字人文學者之間、計算機和人文學者(主要是語言學學者) 之間進行了聯合,以最優化資源投入使研究成果最大化,以COCOA 二代、牛津語彙索引程序(OCP) 和希臘語庫(TLG)為代表的一系列程序被開發出來。學者主要致力於語料庫的建設與對文本創建、維護和存儲方面的程序進行聯合開發和推廣。
1980年代中期到1990 年代早期被霍基教授稱為「新發展」階段。其間個人計算機的出現促使更多的學者通過更便捷、有效和創新的方式進入數字人文領域,而電子郵件,特別是1987 年Humanist 郵件群的出現,使得數字人文領域的學術共同體得以在網上活躍交流,更具備影響力。在這個階段中,最重要的成果是文本編碼倡議(TEI),體現為《電子文本編碼和交換指南》(Guidelines for Electronic Text Encoding and Interchange) 。另一個值得關注的現象則是計算語言學逐漸從計算人文學中獨立出來。
1990年代早期到現在的「互聯網」時期是數字人文的成熟階段。由於互聯網特別是萬維網的出現,使得計算機,特別是圖形界面的計算機及超文本成為任何人都可以使用和介入的資源,大量冠名為「檔案」的學術出版和研究項目在網路空間中出現,並聚集了學者、編輯、圖書館員和程序員等一批致力於數字人文研究的團隊。高校出現了數字人文的專業,藝術領域也出現了相關項目,數字人文的邊界得到了極大的拓展。
從近幾年由「數字人文組織聯盟」(Alliance of Digital Humanities Organizations) 組織的、全世界最大的數字人文大會的日程和發言里也可看到,數字人文的邊界擴展到了一個非常寬泛的範圍,基於自然語言分析、統計方法的「傳統」的文本分析已經進入方法的擴散和多樣化的階段,特別是隨著R語言、Python語言在人文學者中的日益普及,學者們越來越多地自行開發各種「定製化」的工具包來解決人文研究中的特定問題。而GIS技術和HGIS也被大量應用,成為數字人文中的基本方法與途徑之一。相對較新的VR和3D建模也開始從考古、建築走向了歷史、文學與藝術領域。圖像識別及數據可視化也成了這幾年的熱點議題。
中國高校的第一個數字人文中心是武漢大學在2011年建立的,至今仍是中國大陸地區唯一的數字人文中心,是數字人文中心網路(centerNet)旗下亞太數字人文中心網路(Asia-Pacific DH centerNet)的成員。在組織形式上稍有不同的另一機構是南京大學的「數字人文與超媒體GIS工作室」,著重對歷史地理信息系統的建設和研究。台灣地區則主要有台灣大學長期投入、項潔教授領銜的數位人文的研究,2007年已成立「數位典藏研究發展中心」,2012年改名為「數位人文研究中心」;而台灣政治大學既有金觀濤、劉青峰兩位教授開創的數字人文計劃,也成立了文學院下屬、鄭文惠教授領導的「數位人文研究中心」。香港的公開大學也在2015年成立了「數碼文化與人文學科研究所」,舉辦相關會議,推動數字人文的學術交流。而從2015年開始,包括上海大學、北京大學、南京大學、南開大學、清華大學等在內的多個內地高校都舉辦了與數字人文相關的主題會議,引起了學界的諸多關注,各院校數字人文相關的研究項目也越來越多。
尚未完成的知識生產方式轉型
數字人文不是憑空出現的——如果以史學研究為例的話,數字人文的一些研究項目正是建立在史學的悠久學術傳統之上的。以哈佛大學包弼德(Peter K. Bol)教授領導的「中國歷代人物傳記資料庫」(CBDB)項目為例,收錄數據時就利用了大量學界的既有成果,例如前輩學者對各類古代官員資料的系統整理和考證,方便學者利用。
但伴隨數字人文在國內的日益熱門,也有不少學者提出疑問。數字圖書館、數字檔案館、數字標準化、計算語言學、GIS、HGIS,這些國內已經有學者做了很多年了,為什麼現在還要提「數字人文」?這個專門的提法有什麼意義嗎?能帶來什麼新鮮的內容?尤其是對於一向走在「數字學術」(digital scholarship)前沿的圖書館學及情報學,本身就是基於計算的「計算語言學」和已經大量使用數據的量化歷史研究,強調「數字人文」似乎是錦上添花的事情。綜合這幾年看到的國內外已發表的相關討論或者會議上的交流情況,筆者的思考是,「數字人文」強調的是面對尚未完成的數字革命中的知識生產方式轉型,其面對的是未來的知識體系及方法的建構,其回應的是大數據時代基於學者導向(research oriented)的研究需求與基於資源共享的網路基礎設施建設(cyberinfrastructure),其建設的是面向數字出生(born digital)的新生代人類的認知方式系統與路徑。使用「數字人文」這個術語不是為了改頭換面來強行圈地,而是一種處於更大願景下的策略考慮,是順應數字時代而生的。
正如金觀濤教授在《數位人文研究的理論基礎》中提到的:「因數位技術在大量文本分析中的地位直接和判定知識真實性有關,故它在人文研究中將比自然科學和社會科學中更具中心位置。隨著適應於各類人文研究(如語言學、歷史、文學、傳播、民間文化等)不同研究需要的各類專業電腦資料庫的建立,以及使用IT技術對文本深度挖掘技術的發展,將會出現一門稱之為數位人文學的新學科。」(見項潔編:《數位人文研究與技藝》,台灣大學出版中心,2014)
數字人文所帶來的最重要也最有影響力的一點是,從「基礎數據」的層面,實現真正的跨學科協同合作,並從方法和路徑的層面打通自然科學、應用工程、社會科學、人文科學與藝術的綜合研究,也使得研究者從自身的學科立場出發,得以擴展到其他領域,並能以「問題導向」出發,與其他學者協同研究,實現研究層面的資源最大共享化、分析方法的最大通約化和知識內容的最大綜合性。
然而,數字人文發展也面臨諸多挑戰,倡導之餘也要警惕過分樂觀。就目前而言,數據的獲取和開放程度是中國數字人文面臨的一大挑戰。以中國古代典籍為例,已經數字化材料的獲得遠遠不是開放的。各類古籍資料庫多如牛毛,但數據共享的做法仍然非常罕見——許多資料庫都以商業模式運營,必須得到學術機構和研究者的訂購,才能生存。因此,它們的數據開放程度肯定是有限的,這對不同電子資源之間的協作造成一定障礙。
與此相比較,基於互聯網的社群討論和傳播,卻顯得更為融洽、富有活力。許多關於數字人文的學術交流和討論已經通過非傳統的渠道進行,並受到眾多學者的關注。例如,不少相關的學術動態是在微信號和群組上發布與傳播的。與此同時,推動數字人文的發展,還需要更多注重研究的實踐,例如培養研究者製作可視化的技能,或傳授如何對數據進行分析、操作、解讀等技能。隨著各種數位學術資源變得盛行,資料庫的使用越來越重要,對研究者的培養也理應加入關於這些工具的內容,讓學生們對它們的特點和優劣有系統的了解。面對充斥著學術報告和論文的可視化圖像,我們需要帶著什麼意識去解讀與提問?學者在自己製作的時候需要注意什麼?誠然,不是每一位人文學者都要系統地學習數據科學的技術和方法,但不管是否用於自己的研究之中,都值得所有文科學者接觸數字人文的研究方法,對其進行系統的反思。人文社科學生的培養如何應對數位人文帶來的新典範,也成為學界不得不面對的問題。
文章原載於社會科學報第1572期第5版,文中內容僅代表作者觀點,不代表本報立場。
大家都在看
點擊展開全文
※對話漢斯·約阿斯:每個人都是神聖的嗎?
※共享經濟:想說愛你不容易?
※夏洛茨維爾:種族主義在美國年輕人中回歸?
※90後都當博導了,這個時代需要仰望星空、腳踏實地的年輕人!
※兩個月兩次「提醒」,在印的中國公民一定注意安全!
TAG:社會科學報 |
※盾之勇者成名錄:尚文組隊瘋狂練級,下一波浪潮即將到來
※百萬直播「撒幣」遊戲,引爆知識變現浪潮,附答題攻略
※襲擊猶太人浪潮再度興起,反猶借口花樣百出,細數三大原因
※數字貨幣浪潮之下的辭職潮
※這次不要再錯過了,第二波VR浪潮來襲
※盾之勇者成名錄:最後的浪潮來襲,隊友不給力,盾勇無奈一打三
※是機會還是挑戰?今日頭條大變革引起新一波浪潮!有人歡喜有人愁
※機器人「步伐」如此之快,大浪潮中暗藏了多少偽命題?
※信息化浪潮來了,誰與之並肩作戰
※爆炸!中國將迎來新一波財富浪潮,很多人居然不知道
※區塊鏈浪潮來襲,資本熱錢蜂擁而至,殊不知泡沫尚未消散
※音樂劇浪潮來襲 主題不同各有體會
※浪潮SDS,讓視頻分發無阻塞,播出更精彩
※走勢分解-浪潮信息
※美股史上最強回購浪潮或將來襲,有何啟示?
※樓市要變天,這個政策出台,新調控浪潮來襲,開發商笑了!
※《盾之勇者》浪潮來了,奴隸不止變身成為美女,還變為了表情包!
※互聯網媒體浪潮帶來「文化亂象」?只是你的錯覺而已
※心有無盡浪潮,皆因你而起
※當細分市場浪潮退去,誰才是最有實力靠岸的人?