當前位置:
首頁 > 天下 > 你見過剛出生的「綜合性學術地圖」嗎?

你見過剛出生的「綜合性學術地圖」嗎?

二十一世紀是數字化走向資料庫化進而走向智能化的時代。目前,世界各國都在加緊本國文獻的數字化並對業已數字化的文獻進行數據挖掘,建立各種類型的資料庫,並結合最先進的現代科技,向智能化的方向邁進。在這樣的背景之下,中國人文研究何去何從,也是我們必須思考的問題。

原文 :《加快我國人文資料庫建設——從哈佛大學的人文資料庫說起》

作者 |浙江大學教授 徐永明

圖片 |網路

海外關於中國研究的四大資料庫

1

中國歷代人物傳記資料庫(CBDB)

CBDB是「China Biographical Database project」的簡稱,中文名為「中國歷代人物傳記資料庫」,網址//isites.harvard.edu/icb/icb.do?keyword=k16229。

該項目是由哈佛大學東亞語言與文明系Peter K.Bol(包弼德)教授主持的項目,合作單位有北京大學中國古代史研究中心和台灣「中研院」歷史語言研究所。

Peter K.Bol(包弼德)教授

「中國歷代人物傳記資料庫」是目前世界上最大的中國歷史人物傳記資料分析資料庫,迄今上線的中國歷代人物已有40萬人之多,此外還有中國地方志等其他數據源近50萬人的數據還在源源不斷地添加中。

該資料庫不僅能查找一個人物的生卒年、字型大小別名、籍貫、科舉仕進等最基本的傳記資料信息,而且還可以查找一個人物的親屬關係、社會關係,並將其可視化。該資料庫目前免費開放,使用者可以在線查詢或將資料庫(access)下載到本地電腦查詢。

譬如,當我們利用access資料庫查到宋濂的社會關係並想將其可視化的時候,可以將查找的數據保存為網路分析工具Pajek或Gephi的存貯格式。

2

中國歷史地理信息系統(CHGIS)

CHGIS是「中國歷史地理信息系統」(China Historical Geographic Information System)的簡稱,也是由哈佛大學東亞語言與文明系Peter K.Bol(包弼德)教授主持的項目,項目經理Lex Berman(貝明遠)。它是開源性質的中國地理信息系統網站,網址http://www.fas.harvard.edu/~chgis/。

該項目與復旦大學史地所合作,將中國歷史地名和歷史地圖矢量化,並且以關係型資料庫的方式記錄地名的層級及沿革信息,由此凡涉及中國古代歷史地名的,都可通過數字化的中國歷史地理信息系統得以可視化的展示。網站提供了中國歷史地名經緯度的查詢和中國矢量化歷史地圖的下載。矢量化歷史地圖包括點(points)和多邊性(polygon)兩種類型。

3

世界學術地圖(Worldmap)

Worldmap是哈佛大學地理分析中心(the center for geographic analyisis)開發的一個全球地理信息研究成果發布和共享平台。網址為worldmap.harvard.edu。

其中中國部分,包括了人口統計、宗教、交通、城市研究、少數民族和語言、能源、環境、教育、氣候、公共健康、經濟、歷史等諸多領域的地理信息和地圖。譬如,與文史有關的,有明代進士分布圖、明清驛站路線圖、金華文人社會關係地理分布圖、1820年中國寺廟分布圖、明代衛所分布圖等。比如我們可以根據Worldmap下載的數據,利用QGIS在本地電腦顯示明代驛站圖。

4

文本自動標識平台(Markus)

Markus是由荷蘭萊頓大學中國史教授魏希德(Hilde De Weerdt)主持的數字人文項目,其網址為http://dh.chinese-empires.eu/beta/。

魏希德(Hilde De Weerdt)教授

該平台利用CBDB的資料庫及其他資料庫,將讀者上傳的古代文獻文檔自動標識,讀者可以對自動標識出來的結果進行編輯修改,並可將最終的結果導入資料庫,進行定量統計分析。除此之外,讀者還可對標識的字詞進行點擊,平台的右側會自動出現該標識字詞的相關信息。如果是地名或名物字詞,平台還具有可視化功能。

開發中國的學術地圖發布平台

第一,加緊建設中國古代文史地理信息資料庫。地理信息與人類活動息息相關就單個人物來說,包括人物的籍貫、行跡、社會關係的地理分布;就群體來說,包括一個群體的地理分布和遷徙軌跡;就非生命的物體來說,也有其存在、分布和變化的區域與軌跡;就一個地方來說,則包含了既往時間裡人、事、物等地理信息的總匯。

根據本人的初步統計,《中國古籍總目·集部》各類型的作者約有16000餘人(不包括子部中的小說類作者),如果按一、二、三流作者的標準衡量,歷代一、二流的集部作者至少也有幾百人。而這樣作者及其作品的地理信息,就包括了作者著述的地理分布、作者社會關係的地理分布、作者籍貫的地理分布、作品所涉及地名的地理信息、作者的個人行跡路線、某一時間點全國作家所在的位置等地理信息。這些地理信息都需要我們進行調查、著錄,配上經緯度,建成資料庫。

第二,加緊建設中國名物圖片資料庫。中國古代文學作品中有著大量的名物詞語,如動植物、器皿、藥材、器械、服飾等。這些名物詞語,即便有了文字的釋義,有的我們還是不能得到清晰的認識。但如果配上圖片,則一目了然,印象深刻。

實際上,我們的古人已經做過這方面的工作,譬如,關於《詩經》《離騷》之類的作品,都有對其中的草木蟲魚進行注釋並配有圖片的著作。像《本草綱目》這樣的中醫藥著作,也配有大量的圖片。但是,古代文獻中的圖片,大量的還是以紙本或電子掃描本的方式存在,今人鮮有對其挖掘和標識,並建立可供查詢和可視化的資料庫。從荷蘭萊頓大學魏希德主持的Markus文本標識平台中我們可以知道,文本和圖片只有建立起一一對應的資料庫格式,才能對文本進行自動化標識和可視化呈現。

第三,加緊建設學術地圖發布平台。雖然中國的學者可以將自己的研究成果在哈佛大學的Worldmap上發布,但也存在著一些問題。其一,由於Worldmap的伺服器在哈佛大學,受防火牆的影響,雖然我們可以訪問Worldmap網站,但速度非常慢。其二,Worldmap所使用的地圖底圖和圖層,沒有九段線,不符合中國的法律。因此,有必要在中國境內建立可供中國學者乃至海外學者發布的、適合中國國情的學術地圖發布平台。

浙江大學與哈佛大學於2017年10月13日簽訂了合作共建學術地圖發布平台的協議。根據協議,浙江大學將對哈佛大學的Worldmap安裝系統進行改造,開發出適合中國學者發布的學術地圖發布平台,其伺服器將設在浙江大學。經過幾個月的艱苦奮戰,由浙江大學社會科學研究院與哈佛大學地理分析中心(The Center for Geographic Analysis)共建的「學術地圖發布平台」(http://amap.zju.edu.cn)上線發布會於2018年3月在浙江舉行。這標誌著適合中國國情的綜合性學術地圖發布平台真正誕生。

文章原載於社會科學報第1612期第5版,未經允許禁止轉載,文中內容僅代表作者觀點,不代表本報立場。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 社會科學報 的精彩文章:

新能源車產業的「狼」來了,中國準備好了嗎?
國家與社會的博弈:啟蒙時代法國的公眾輿論

TAG:社會科學報 |