也談《四庫全書》電子版
王清珍 北京大學中文系博士生
|
|
近年來,隨著電子技術的發展,將古代典籍以光盤的形式出版發行,已成為學術界的熱門話題,自然也是出版界所關心的主要問題之一。計算機界更是開路先鋒,為中文錄入索檢以及掃描識別在硬軟兩大件上開闢了道路。出版發行何種光盤、以何種手段等則是學術界與出版界多次研討的主要問題。他們也提出了一些整理方案,申報了一些古籍整理的開發項目,如深圳大學中文系整理的“全唐詩”及《紅樓夢》檢索系統,河北大學整理的《資治通鑒長編》,北京大學整理的“全宋詩”,北大語言研究室開發的《廣韻》研究系統、臺灣整理的“二十五史”以及南京師範大學整理的“全宋詞”等。這些古籍的電子化極大地方便了學術研究,促進了學術的發展,得到了學術界的廣泛好評,並贏得了普通讀者的喜愛和讚揚。這對弘揚民族文化無疑具有十分重要的歷史意義。
將迄今為止世界上最大的叢書《四庫全書》電子化,以百十來張光盤的形式出版發行,自然成了出版界的目標。
一. 學術界的分歧
然而對於《四庫全書》的電子化,學術界有兩種不同的看法,肯定電子化工程的人認為,《四庫全書》本就是人類文化史上的一大創舉,將計算機技術引入其整理之中,必然會對人類文明產生極為深遠的影響,從而成為歷史的又一創舉。原本的《四庫全書》,卷帙浩繁,價格昂貴,體積又大,一直難以為普通讀者所接近和接受;而電子化則可以將幾千卷的大部頭著作數字化到數張光盤上,可以逐字逐詞甚至成字串地檢索,可以直線讀,亦可以跳躍讀,隨意查找和翻閱,將會極大程度地促進學術的研究;並且其體積微小、價格較低,能夠達到被普通讀者認可和接受的程度,因而將會促進中華文化的發展,對人類文明亦是一大貢獻。
否定此工程的人,認為當時《四庫全書》的編纂是以犧牲大量的原本典籍為代價的,所謂“四庫出,天下書亡”,《四庫全書》編纂的過程中,四庫館臣們將收集到的原本圖書作了大量的刪節、篡改等工作,使得原書之貌盡非,以致相當多流傳至今的“四庫本”較之原書有很多錯誤,其學術價值遠不及民間流傳的其他版本。運用現代化的計算機手段去整理開發《四庫全書》,必然會使《四庫全書》的錯誤擴大化,從而阻礙學術的發展。
以上兩種觀點於目前之學術界均有一定影響。但我認為,二者均有偏頗之處,持第一種觀點的人,憧憬的是先進的科學技術手段與世界上最大圖書的奇妙結合,期待的是這種結合帶來的更奇妙而且完美的研究工具;持第二種觀點的人,更著重於《四庫全書》本身的學術價值,尤其是對滿清所修之書帶有一定的感情因素。兩者各執一端,其分歧是必然的。本文試從《四庫全書》本身和電子技術兩個方面進行考察。
二. 《四庫全書》的歷史價值
清代統治者為箝制人民的思想,對知識分子採取高壓和籠絡相結合的政策,以收羅全國圖書進行整理為手段,統一禁錮思想,因而在整理和編纂《四庫全書》時,毀壞了大量不利於其統治而又極有價值的圖書。這種行為固然是摧殘了文化,阻礙了歷史的進步,但畢竟那個時代已經過去,歷史的事實已無法改變。作為今天閱讀《四庫全書》的我們,正確的態度應是:第一,健全學術機制,制定切實可行的方案保護我們的文化遺產,儘可能地避免以後不再發生這樣的悲劇。第二,既然祖先留給了我們這樣一部世界上最大,本身就需要電子化手段進行研究的叢書,我們就該避其弱點,發揮其優長,讓它更好地為我們今天的學術研究和文化發展服務。
《四庫全書》作為完整的一部叢書,它清晰統一的體例,規模的宏大,收羅的全面,資料的豐富,都是其他圖書難以比擬的。我們通過閱讀《太平御覽》、《文苑英華》,可以瞭解宋以前中國歷史和文學發展繁榮的狀況,但我們無法瞭解全貌。但《四庫全書》就不同,它幾乎收羅了從上古至乾隆時代所有的典籍資料,分經史子集詳細羅列,有了它,幾乎無需再閱讀其他文獻,就可以對中國歷史和文化有一個全面而且細緻的瞭解。因此從收羅文獻之歷史跨度來說,《四庫全書》是所有叢書中最長的,因而就單部的叢書來說,它的歷史意義也最為深遠。
在保存圖書方面,《四庫全書》亦功不可沒。中國歷史上浩如煙海的典籍,至《四庫全書》而得以全面地涵蓋整理。尤其是相當多已經散佚的圖書,因它而有了書名存目,這對全面保存中國文化典籍和保持歷史原貌有著十分重要的作用。還有,《四庫全書》輯錄並保存了大量散佚民間的《永樂大典》中的圖書,且收入時仍保持其原貌,這對我們瞭解和認識《永樂大典》具有不可替代的作用。
三. 《四庫全書》電子版的特色
由香港迪志公司和上海人民出版社聯合出版、北京書同文公司負責開發的電子版《四庫全書》,即是在對《四庫全書》有此種認識的基礎上進行的。由於《四庫全書》的特殊性(字數最多、卷數最大、含書最廣),在它的開發過程中遇到的各種問題,在開發其他典籍中都可能會遇到,如古漢語的文字識別系統(OCR),二元語法分析,標題檢索數據庫的建立等,從單字檢索到詞組檢索到書名卷內標題的檢索,從原文圖形到版本比照,不但促進了電子技術的進步,更為其他典籍的開發樹立了典範和標準;尤其是即將出版的全文檢索版,更會使學人的研究受益無窮。不用說,這種利在當代、功在千秋的事業,非有遠見卓識之士者不能。
下面我具體談一談《四庫全書》電子版。
電子版/圖形版《四庫全書》有以下幾個明顯的特點:
第一是能最大程度地保持原書真跡。
電子版《四庫全書》分為圖形版和全文檢索版兩種,目前出版的圖形版採用先進的掃描技術,將原手抄本《四庫全書》以圖形的方式保存在一百多張光盤上,在檢索過程中可以隨時查看對照原文真跡。有了真跡的可靠保證,研究者就可以根據各自所需而糾正或《四庫全書》本或其他校勘本的錯誤。全文檢索版以俟他日。
第二是檢索起來十分方便。
有了原文圖形還不行,還必須有根據讀者所需而跳讀原文的功能。檢索目錄可以解決這個問題。目錄分兩級,(一)是書目檢索,(二)是卷內標題檢索。書目檢索又包含有綜合條件檢索(含書名、作者、時代)、四庫分類條件檢索、書名檢索、作者條件檢索和特殊屬性檢索(含地方志和海外著者著作)四類;卷內標題檢索包括結合四庫分類條件、書名條件、著者條件和特殊條件(海外方志和海外著者著作)。輸入任何一個你想要的數據,無論是書名還是卷內標題,系統均可幫你找到。具體操作介面如下:
然後是“改進當前檢索條件”,即可重新查找到符合條件的檢索項。
需要說明的是,每一種檢索模式下都有輔助檢索項目,如書名可按“書名新筆形排序”和“書名拼音排序”,作者可按“姓氏新筆形排序”和“姓氏拼音排序”作為輔助輸入項,這樣就可加快檢索的速度。
第三是具有多種顯示模式。
顯示模式分為簡單、具體和詳細三種,簡單模式也即第一次檢索顯示的結果,具體模式顯示包括書名、CD盤號、作者情況、所屬類別,而詳細模式則不但包括具體顯示模式下包括的內容,另外還包括《四庫大辭典》入口,即由此入口可以隨時查閱《四庫大辭典》中提供的包括作者、書名等方面的信息。《四庫大辭典》包含Hyperlink模式,可以由一本書、一名作者跳躍查看與此書、此作者有關的其他信息,因此就相對增加了單本書、單個作者的信息量,對檢索者是一大幫助。
第四是原文圖像頁功能齊全。
原文頁設有本光盤所含書目、主要標題功能,讀者可以首先依此選擇所需書名和標題,以免除多餘勞動;對原文頁圖像,讀者可以根據需要選擇全屏顯示,亦可以為查找方便選擇一屏多頁顯示模式;對於需要詳細閱讀的資料,閱讀者可以打開放大鏡按鈕,可以根據需要選擇放大倍數,以便清晰地辨認原文字樣;對於單屏顯示不全的,可以在放大模式下使用捲動功能,在頁面捲動的狀態下,看清全頁文字。對於所需文字,可以選擇“列印”,從而打印出自己所需的頁面內容;若在寫作過程中需要所需文字,可以選擇“複製”功能,將原文圖像複製至所操作的文檔中;另外,讀者還可以根據自己喜愛選擇設定原文圖像的顯示顏色,收到既實用,又美觀的效果。
傳統閱讀方式中重要的一條是讀書需動筆墨作筆記,尤其是要通過作大量的讀書卡片,方能順利完成一項研究,著名學者吳(1),動員全家人為其作明史的卡片數萬張;當代學問大家錢鍾書亦深得近萬張的卡片之功。之所以如此者,是為避免翻閱書籍過程中有用的東西一掃而過,需要時很難順利地翻檢到;而讀書過程中的心得體會,所記之筆記又很難與原書原文放置一起,故其整理筆記之勞動量亦很是可觀。而電子版原文圖像頁設有“箋注”功能、筆記本功能,既可以在原文頁作箋注,又可以在筆記本上記下心得體會,完全解決了傳統研究中繁瑣麻煩的弊端,其大大節省學者之勞動是可以想見的,甚至可以說是學術研究的一次革命。
第五是直接促進了“四庫全書學”的發展。
“四庫全書學”從《四庫全書》誕生起就已有之,但興起“四庫全書學”熱似乎是近幾年的事情,近年全國有幾所高校都設有“四庫全書學”課程,為學術界瞭解世界上最大的圖書開了先路。但《四庫全書》那樣浩繁的卷帙,宏富的資料,除非搞專題研究,單其查找圖書原文就很難對付;即使是碩學鴻儒之輩,積累年之功,也很難窺見“四庫”之全貌,更不用說普通讀者了。因此,我們從前談“四庫”,衹能說談個大概,甚至“大概”都不是太有可能,而是像莊子那樣“以管窺天,以錐指地”,管窺一番罷了。而現在有了電子版的《四庫全書》,就可以真正實現四庫“全”書“全”字的功能,我們所翻檢索所查找的全部是“全書”的材料,而不再是某一部或某幾卷,不再是部分或專題。而且電腦的檢索大大節省了我們檢索原文之勞苦,衹那麼輕輕一點,我們所需要的東西立即就會呈現在面前。就專題研究而言,全本的《四庫全書》衹是個工具而已,它不是用來精讀的,而是方便查找的,計算機高速精確的檢索,省卻的何止是重複的勞動,簡直就是人們須臾難離的助手。更為重要的是,圖形版的《四庫全書》製作有三千名作者,四千個書目,近二百萬條“標題”的數據庫,綱舉目張,為這部巨大的叢書編織了清晰的電子經絡,讓讀者縱橫檢索。無庸置疑,隨著圖形版《四庫全書》的發行和普及,以及全文版功能的改進和提高,學術界對《四庫全書》的研究會得到長足的深入和發展,“四庫全書學”作為一門專門的學問必定能夠更快地成熟。到那時,普通讀者亦可以撩開它深藏於皇家寶閣的神秘的面紗。
四. 《四庫全書》標題版的局限性
當然,圖形版《四庫全書》還存在著這樣那樣的局限,如《四庫全書》本身存在的某些圖書版本不好的問題;檢索項衹能是有限的書名、作者名和開發者製作好的插題數據等,而使用者不能隨意地於原文中檢索出自己所需的某一個字串、某一句話等,從而影響了《四庫全書》功能的全面發揮,但我們相信,隨著全文版《四庫全書》的推出,這一狀況定會得到極大的改善。
一九九八年七月十六日
*電腦未能顯示之外字
(1) 以(左日,右含)表示
|