第一期  2008年12月發行
 

中國歷代人物傳記資料庫(CBDB)與宋史研究

方震華
國立臺灣大學歷史學系副教授

在今年(2008)11月21日至23日於哈佛大學舉行的「中國史傳記資料數據庫第一屆國際研討會」中,由哈佛大學、北京大學及中央研究院歷史語言研究所合作進行的「中國歷代人物傳記資料庫」(CBDB),無疑是討論的主軸。此一資料庫不論在涵蓋規模及進行時間上,都不是其他數據庫所能比擬。原始設想就是資料庫內的傳記資料可無限擴充,提供所有中國史研究者使用。目前已建立的資料主要根基於Robert Hartwell蒐集的傳記資料,以及王德毅編的《宋人傳記資料索引》。因此,當下能提供的資訊,對於宋史研究者較有助益。

此一資料庫是使用Access系統來運作,以每位傳主為中心,設計多個欄位以包括其生平,例如:生存時間、官位、婚姻、親屬、社會關係、反對何人、支持何人等等,再由程式關連這些欄位,以進行分析。整個資料庫的構思由Hartwell奠定,目的在於探討中國古代的社會網絡,希望透過電腦進行多層次分析,找出事實性資料中沒有明確著錄的間接數據。例如:我們想要知道某一家族的完整婚姻網絡,若此一家族延續三代,有資料的成員為廿位,則可以一位成員為檢索條件,以程式找出這廿位成員,再找出此家族所有的婚姻關係。如果研究者個別去研究這二十位傳主的文獻資料,恐怕很難(雖然並非不可能)歸納出此種完整的結果。

除了利用電腦處理大量傳記資料,設計者也希望將「群體傳記學」的研究方法導入中國史研究。此一方法是對一群歷史行為人的生平做集體性的研究,對這群人物提出一組相同的問題,例如:關於婚姻與家庭、社會出身與經濟地位、居住地、教育、宗教、仕宦經歷等等。然後,將此研究範圍中所有人物的各類信息加以羅列、組合,再通過對這些信息的考察,找出具有顯著意義的變量。最後,以這些變量作為分析史實的工具。

由於各個欄位的資料靠人工輸入和校對,進展頗為費時。目前的使用者會發現,高級官員或知名文人的資料較為完備,北宋也較南宋齊全,這都有待時間來改善。建置單位也希望透過「資料探勘」(data mining)或「文字探勘」(text mining)的方式改善資料建檔的速度。但是,由於這些資訊技術的發展尚未成熟,目前較可行的方式是匯入其他資料庫中已建置完成的數據。但是,此舉仍不可能在短期內使資料庫內容的數量大增。

相對於個別性或特殊性的資料庫的功能較可預期,中國歷代人物傳記資料庫由於規模太大,產生的影響較難預測。要等待相當數量研究者利用此資料庫進行各種研究,才能呈現其具體的影響。不過,此一免費使用的資料庫仍為全文檢索資料庫之外一個可以嘗試的選擇。尤其在史料蒐集的初步階段,若有興趣的歷史人物恰為此資料庫收錄,可以快速得到傳主人際關係資訊。

目前此一資料庫是放在哈佛大學的網站之下,最簡單的進入方式是在入口網站中鍵入「中國歷代人物傳記資料庫」或英文「CBDB」,進入首頁後,選擇線上使用或直接下載此一數據庫在自己的電腦上使用(須先安裝Access系統或Foxpro系統)。(「中國歷代人物傳記資料庫」網址:
http://isites.harvard.edu/icb/icb.do?keyword=k35201

附記:「中國史傳記資料數據庫第一屆國際研討會」的內容涵蓋甚廣,展示的資料庫將近十個,部分可以免費使用,詳情可至CBDB網頁下載會議內容或進行連結。

本系地址:10617臺北市羅斯福路四段1號文學院2樓•電話:886-2-3366-4700
本網站版權屬於國立臺灣大學歷史學系中國中古近世史研究領域發展計畫所有