第三期   2009年 5月出刊   
 
 
 
中國歷代傳記資料庫

▲「中國歷代人物傳記資料庫」 (按此連結)

 

傳記資料庫與歷史研究──初步的觀察
方震華(臺大歷史學系副教授、2008-09年度哈佛燕京學社訪問學人)

利用電腦協助歷史研究,是近二十年來史學發展的重要趨勢之一。隨著全文資料庫的技術發展成熟,利用電子資料庫檢索,已成為許多研究者在蒐集史料時必要的步驟。如何在取得資料之外,利用電腦來分析史料,則成為下一步發展的重點。2008年11月21日至23日於哈佛大學舉行的「中國史傳記資料數據庫第一屆國際研討會」,正是此一趨勢下的產物。

該次會議的內容可分為三個部分:(一)各個資料庫建置的簡介、(二)對於傳記資料庫內容與應用的省思、(三)電腦技術的發展與資料庫建立的未來。發表的資料庫以專題資料庫為主,涵蓋的時代從漢朝至現代。多數資料的建立目的在於蒐集大量傳記,以分析人際網絡的形成與變化。例如:Brett Sheehan建置的「民國銀行家資料庫」,和Victor Shih的「中共中央委員會數據庫」,足以代表此種以同鄉、同學、同僚、師生和親屬關係為思考中心的數據庫設計。由哈佛大學、北京大學及中央研究院歷史語言研究所合作進行的「中國歷代人物傳記資料庫」(CBDB),則是架構最為龐大的一種,目前資料庫以宋人傳記為主,並已開放上網免費使用,研發單位計畫將資料擴充至各時代,形成全面處理中國歷史傳記的資料庫。

要建立全面性的資料庫,一個根本的問題在於大量的資料如何輸入(input)。目前使用人工輸入的方式耗時甚久,且因工作人員的素質差參,容易產生標準不一致的問題。會議中亦展示「資料探勘」(data mining)或「文字探勘」(text mining)的提取數據技術,但這些技術尚未完全發展成熟,短時間內仍無補於資料建置緩慢的問題。

會議中的討論十分熱烈,有不少的質疑被提出。一般性的問題包括:建立資料庫耗時、費力,長期經費取得的問題(在全球經濟衰退的時代,此一問題更顯重要)。若潛在使用者不多,如此的投資是否值得?在實務問題方面,電腦程式是按現代人的思維來整理資料,但古代的史料並不會配合此種邏輯來安排,再精密的設計終有其限度,想要全面蒐羅不同時代和類型的史料,只有不斷增加欄位(column),以容納新的項目。但如此一來,又將增加處理資料的時間與難度。在追求完備與可行性之間,似乎總有矛盾存在。

此外,質疑者亦指出,以資料庫處理形式上的人際網路或機構成員名單,未必能真正說明權力運作和實際關係,因為太多活動是透過非常規聯繫管道進行。就算電腦能呈現出複雜的人際網絡,如何說明這些網絡的意義,恐怕才是真正挑戰之所在。對於量性分析的研究而言,這一類的批評很常見。顯然,電子數據庫固然能協助史家處理大量的資料,但似乎不能改變量化史學早已被指出的潛在缺陷。

不過,這些質疑恐怕不會改變發展傳記數據庫的趨勢。二十世紀以來,龐大傳記資料的留存,既是史學研究者取之不盡的寶藏,也是難以承受的負擔。試想,中國各地公安局中存放文化大革命期間眾多受害者的資料,或是美國中央情報局所蒐集的世界各國人物資料,若一旦公開,單憑人力要如何有效處理?因此,不論是個別研究者為了解決自己的課題而建立資料庫(目前都是利用Access程式),或大型研究機構建立網上可供廣泛使用的資料庫,似乎都有其必要性。目前這樣的技術仍處於發展階段,有待更多學者加以利用,並探討新的研究議題和發展方法論,才能顯現傳記資料庫對於史學研究的具體影響。

對於多數的史學工作者及機構而言,既無足夠的資金及電腦知識發展自己的資料庫,對於像是「中國歷代人物傳記資料庫」這樣開放給大眾使用的計畫,應是抱持歡迎立場的。

此一資料庫架設於哈佛大學的網站下,可以在搜尋引擎輸入「CBDB」或「中國歷代人物傳記資料庫」,找到其首頁,並加以利用。

 

中國歷代人物傳記資料庫

▲「中國歷代人物傳記資料庫」首頁

(按此連結)


(「中國歷代人物傳記資料庫」網址:http://isites.harvard.edu/icb/icb.do?keyword=k35201

 

臺大歷史系學術通訊歡迎投稿 聯絡信箱:history@ntu.edu.tw 地址:10617臺北市大安區羅斯福路四段一號  電話:886-2-33664702
本網站版權屬於國立臺灣大學歷史學系暨研究所 Department of History, NTU All Rights Reserved.