<%@ codePage="65001" %> 四庫全書的集合性價值及其借助現代技術的提升
四庫全書的集合性價值及其借助現代技術的提升
李偉國  摘自 上海《文匯報》2005.4.3

  隨著價格達39萬元一套的宣紙線裝本《文淵閣四庫全書》、19萬元一套的《文津閣四庫全書》影印本的面市,以及明年將有42萬元一套的《文瀾閣四庫全書》推出的消息的傳出,關於《四庫全書》價值、功過的討論又一次被提起。有些學者誇大了清廷在編修《四庫全書》的同時禁毀和刪改圖書的消極影響,更多的學者則喜歡用放大鏡去一本一本地照看《四庫全書》,然後說,這部書是通行的,那部書所選版本並非最佳,還有一部書被刪改了,於是得出結論,《四庫全書》中有價值的圖書實在不多。雖然這樣的爭論在差不多一個世紀裏已經發生了好幾次,但是人們無論是持否定態度的也好,還是持肯定態度的也好,都忽略了或者沒有充分強調最重要的一點:《四庫全書》的集合性價值。

  我所說的《四庫全書》的集合性價值,指的是《四庫全書》作為一個圖書、文獻或資訊集合體所體現出來的價值,這種價值與這個集合體中的單個個體或某些局部所能體現出來的價值是有質的區別的。

  一、《四庫全書》當得起一個"全"字

  1. 從《四庫全書》的來源和初選考察

  為了彙聚天下書籍,《四庫全書》開館前後,清政府運用政權的力量,在全國各地搜訪圖書,凡經史百家、文人專集等等均在採集之列,唯坊間舉業時文、民間族譜、尺牘屏幛壽言以及屑屑無當之酬唱詩文之類,均無庸採取。乾隆的初衷,是要通過此次徵集活動,盡收天下有用的圖書。此舉頗為有效,短短幾年時間,從各地徵集10000餘種(包括各省採進本、私人進獻本和購入通行本),除四川、貴州等地因有事未上繳外,征書範圍遍及全國,江浙等人文薈萃之地尤多,從宮廷各處藏本檢出約2000餘種,從明朝大類書《永樂大典》輯錄圖書500餘種,再加上由朝廷組織臨時編纂之書,總數達13000餘種,其間包括不少舉世罕見或海內僅存的珍本秘笈。章學誠說:"四庫搜羅,典章大備,遺文秘冊,有數百年博學通儒所未得見而今可借抄於館閣者。"【《章氏遺書.為畢制軍與錢辛楣宮詹論續鑒書》】這次徵集,除了朝廷明確不收的"舉業時文"等,以及大量的佛道藏圖書、普通地方誌和戲曲小說等等以外,已經基本上囊括了當時存世的圖書。《四庫全書》以後,阮元《四庫未收書提要》收書170種,上世紀20年代至40年代編修的《續四庫全書提要》稿、近人孫殿起《販書偶記》及其續編和建國後編纂的《中國叢書綜錄》,各收錄了30000餘種、20000種和近40000種圖書,其中屬於乾隆以前而未被收入《四庫全書總目》的圖書,數量也很小,上海古籍出版社近年出版的《續修四庫全書》,共收書5200餘種,其中約47%為《四庫全書》以後之書,約40%為《四庫全書》開館時已徵集到而不錄入《四庫全書》之書,確屬《四庫全書》開館時未徵集到的圖書只有10%左右。本該網羅的漏網之魚肯定有,像《宋會要》就是非常有價值的一部大書,居然沒有收,留下了極大的遺憾,但這種情況不多。

  當時所徵集的圖書,除少量因屬重本或被認為實在沒有保留價值而被淘汰外,有3000餘種被禁毀,被禁毀的書籍內容主要是明末清初的史料、文集、筆記、石刻碑銘、郡邑誌乘、劇本曲目,以及天文占驗之書等等,這些被禁毀的書籍雖然後世大多尚存(僅孫殿起所撰《清代禁書知見錄》即收書1400多種),但此舉畢竟對中國文化的發展造成了危害,而未選收此類書籍的《四庫全書》,其本身的價值也受到了損害。

  2. 從《四庫全書》錄入圖書和存目圖書的關係考察。

  清朝政府為了編修《四庫全書》,聚集了13000餘種圖書,禁毀了3000餘種圖書,最後將10254種圖書編入了《四庫全書總目》,但是被編入了《四庫全書總目》圖書又大部分沒被正式錄入《四庫全書》,《四庫全書》僅收圖書3461種,這還能夠說《四庫全書》已經可以代表當時的主要典籍了嗎?我們來分析一下這個問題。

  《四庫全書》編修者當然希望將最好的著作編入《四庫全書》,通過廣泛徵集而得到的萬餘種圖書,必然良莠不齊,簡單地將它們拼湊成一盤大雜燴,是不可取的,也是任何時代的一流學者們所不願意做的。但那些被淘汰的圖書,在他們看來也並非全無價值,於是就有了所謂"存目","存目"的意思,是原書不必錄入《四庫全書》,只保留一個目錄。乾隆38年2月11日諭:"其中有書無可採,而其名未可盡滅者,只須注出簡明略節,以佐流傳考訂之用,不必將全部付梓。"館臣秉承乾隆的旨意,從學術和政治兩個方面進行選擇,將他們認為不合標準的圖書排除在《四庫全書》之外。

  關於四庫館臣"存目"之書的類別,司馬朝軍先生綜合考察《四庫全書總目》的"序"和"案",認為可以將分為三大類十小類,即:從形式上分,有《永樂大典》輯本、同書異本之別本、屬於"未竟之稿"的稿本;從內容上可分為庸、俗、偽、殘本;從政治與思想上可分為禁毀之書、異端之書和雜學之書。【《四庫全書總目研究》,社會科學文獻出版社,2004年2月】

  至於我們今天應當如何看待"存目",鄧廣銘先生曾在《光明日報》撰文以一個現代學者的眼光提出精闢見解:"被四庫館臣棄擲到《四庫存目》的大量古籍,決不能排除其中必還有值得加以印行、整理、研究的東西,但為數必然有限,我們絕不能因為要拯救這為數有限的可以保存的古書,而把《存目》中的全部加以印行,使文化‘沉渣’全部‘泛起’。"

  被列入《存目》的大部分圖書價值不高,這是學術界的共識。上文提到的《續修四庫全書》,從《四庫全書》存目圖書中選收了800種,為全部存目圖書的12%,這就是摒棄了清朝統治者偏見的當代學者的鄭重選擇。

  我還想從一些數量關係方面角度補充一點材料。

  從品種角度來說,錄入《四庫全書》的部分只有《總目》的三分之一,存目品種是錄入圖書的2倍。但從卷數角度來說,《四庫全書》3461種79309卷,存目6793種93551卷,存目的卷數為錄入圖書的卷數的1.18倍,也就是說,錄入圖書佔了總目的47%。

  鄧廣銘先生的文章中還指出《存目》中的書籍有為了避免與《四庫全書》已經著錄之書相重覆而只保存其書名的。我們來剖析幾個個案。前述存目6793種,93551卷,其中僅《永樂大典》一書即佔去了22937卷,如從存目中減去此數,剩下的6792種圖書,總卷數為70614,已少於錄入《四庫全書》的79309卷,而《永樂大典》乾隆時已殘缺數千卷,館臣複從中輯出數百種約5000卷錄入《四庫全書》,認為"精華已採,糟粕可捐"(當然這種說法從現在來看也是片面的)。類書類存目中之《裁纂類函》160卷、《唐類函》200卷、《詩雋類函》150卷等,或純出於它書,或已全為它書所取代,已經沒有保存價值。別集類中之《居士集》50卷、《東坡外集》86卷、《朱子文集大全類編》111卷等等,都與已錄入《四庫全書》的同類著作內容重合,且質量較差,當然也不必重覆抄錄。由此觀之,存目中圖書之與錄入《四庫全書》同類圖書之內容基本重合者實不在少,再加上以現在的眼光衡量確實也沒有什麼價值的大量品種,那麼正如鄧廣銘先生所說,存目中有價值的東西為數有限了。反過來也可以證明,《四庫全書》所錄入的3461種圖書,已經可以基本涵蓋當時的主要圖書了。

  所以,我的結論是:《四庫全書》大體可以當得起一個"全"字。

  二、《四庫全書》當得起一個"精"字

  1. 人才保證。乾隆38年2月,《四庫全書》正式開館,乾隆46年底,第一部《四庫全書》告竣,在長達9年的纂修過程中,四庫館不僅吸收了很多學有專長、名重一時的學者文人(其中不乏如于敏中、王際華、金簡、紀昀、陸錫熊、陸費墀、周永年、戴震、邵晉涵、翁方綱、程晉芳、任大椿、朱筠、姚鼐這樣的人物),而且還召集了大量的辦事人員,形成了一個360餘人的龐大的辦事機構。數百名優秀學者濟濟一堂,按照一定的取捨標準,對通過各種途徑集中到四庫館內的13000餘種書籍,甄別採擇,爬梳輯校,考訂辨正,整理編目,完成了包括著錄、存目在內總計10254種書的《四庫全書》及其《四庫全書總目》的編纂,除了當時的歷史條件限制和統治階級的偏見所造成的缺憾以外,應該說,其編纂質量是可以有保證的,否則就有失公允。

  2. 程式保證。《四庫全書總目》的編纂幾乎與《四庫全書》的編纂相始終,既保證了《四庫全書》所收圖書的質量,也保證了整部《四庫全書》資訊的完整性、均衡性和條貫性。在乾隆37年發佈的征書諭令中,就要求"將各書敘列目錄,注係某朝某人所著,書中要旨何在,簡明開載,具折奏聞",在朱筠的著名的開館校書奏摺中,具體提出了編纂目錄的設想,其後,四庫館總裁一致推舉著名學者紀昀和陸錫熊擔任總纂官,全面負責《總目》的編纂工作。徵集、校閱、撰寫提要、選擇、編次等工作幾乎是同步進行的,其中撰寫提要是非常關鍵的一步,每篇提要的後面,都附有纂修官提出的"應刊刻"、"應抄錄"、"酌存目"、"毋庸存目"等意見,總纂官據此再檢閱原書,決定各書的錄存與否。乾隆原來以為,如此纂辦提要,"未免過於繁冗",後來改變了態度,乾隆39年7月25日諭:"四庫全書處進呈總目,於經史子集內分晰應刻、應抄及應存書目三項,各條下俱經撰有提要,將一書原委撮舉大凡,並詳著書人世次爵里,可以一目了然。"各篇提要經考核審定後,總纂官們便按照經史子集四部分類體例,排纂成編。四部分類法是古代圖書分類法中最好的一種,而《四庫全書》的分類體系被公認為是最為成熟、最為嚴密的,《四庫全書》按照經史子集四部分類法,部下分類,類下再分子目,計四部四十四類六十六子目,雖然大多沿襲前人成法,卻能折衷諸家,自出新意,無論在類目的設置歸併,還是在圖書的具體歸屬方面,都有改進和創新。嚴密的分類體系保證了《四庫全書》知識體系的完整性(重要的知識資訊大體已經包含在內)和條貫性(使上萬種圖書組合成一個有機整體,編排有序,極易尋找)。

  所以,《四庫全書》又當得起一個"精"字。

  三、《四庫全書》也當得起"實用"二字

  《四庫全書》成書以後,學人得以利用,特別是杭州的文瀾閣和北京的文津閣,查閱、抄錄世不經見之重要文獻者不絕,還派生出了大量的中小叢書。但由於《四庫全書》沒有刊刻出版,只抄寫了7部,後來又被毀掉3部半,沒有充分發揮作用。於是民國以後就提出了影印的動議。

  1919年,以葉恭綽等學者為首的中國代表團赴歐美考察,同時參加巴黎和會,在他們的宣傳下,法國巴黎大學首設中國學院,準備向中國政府借用《四庫全書》以研究中國傳統文化,同年5月,法國總理班樂衛來華,建議退還庚子賠款,用以影印《四庫全書》,與此同時,金梁等中國學者也大力倡導,北洋政府總統徐世昌允許影印後分贈法國總統及中國學院,並擬將此事交商務印書館辦理,但由於資金、紙張等問題,未能辦成。此後商務印書館以及章士釗、張學良等多次提出影印《四庫全書》,可是由於政府、藏家的阻撓和學術界對《四庫全書》價值的評價不一,多次被擱置。

  有識之士主張從選印入手。1935年,商務印書館終於印出了《四庫全書珍本初集》。在中斷了30多年以後,臺灣商務印書館繼續選印《四庫全書珍本》,共印出13集,收書1878種,已超過了《四庫全書》收書的一半。於是,他們就一不做,二不休,於1982年籌印整套《文淵閣四庫全書》,至1986年出齊,嗣後,上海古籍出版社等複以各種方式影印出版《四庫全書》,圖書市場上《四庫全書》的總銷量應已超過2000套。

  《四庫全書》影印出版以後受到出乎意料的歡迎的原因主要是,世界上藏有中國古籍的圖書館,沒有一個能藏有《四庫全書》所收圖書的全部原本的,購入一套《四庫全書》影印本,對於古籍藏量較小的圖書館來說等於增加了一個中型的古籍圖書館,對於古籍藏量較大的藏書單位來說,則不僅不同程度的補充了古籍品種,還增加了一個便於閱讀流通的古籍書庫。近現代關於印行四庫全書的有趣爭議,既有政治因素的糾葛,也有傳統學術觀點的困擾,但最終達到了對其實用價值的共識。《四庫全書》的普及,有力地推動了中國傳統學術的發展。

  所以《四庫全書》當得起"實用"二字。

  搜羅圖書較為完備(信息量大)、品種結構較為合理(資訊種類均衡)以及編纂質量較高(資訊的優化程度較高)使《四庫全書》這個中國古代典籍的特殊群體獲得了很高的集合性價值。長期接觸古籍的學者都有這樣的體會:找古籍先查《四庫全書總目》,找古代人物特別是學者文人也可以先查《四庫全書總目》,在大多數情況下,《四庫全書總目》都不會讓你空手而歸。這就是《四庫全書》的集合性價值在起作用。《四庫全書》影印本的普及使其集合價值第一次得到了較為充分的體現和利用。

  四、《四庫全書》集合性價值借助現代技術的提升

  不管《四庫全書》編纂者的意圖是什麼,不管他們自己是否意識到《四庫全書》的最大價值就在於集合。印行後日益顯現的集合性價值使之變成了運用現代電子技術將中國古籍資料化的首選物件。

  早就聽說有人要做《文淵閣四庫全書》電子版,我曾想,如果仍按原樣以圖像掃描配一些書名、篇名、作者索引的方式製作,雖然也有用處,但文獻的集合形態依然沒有發生革命性的變化,仍無法加以深層次的利用,而如果要做到全文檢索,則其間異體字的規範認定工作是極其繁難的。令人驚訝的是,香港迪志和上海人民出版社的光碟基本上解決了這個問題。他們動員了大批專家來認定並規範由清朝學人手抄的7億個漢字,編製了一套非常實用的程式,將這樣一座內容極其豐富的資料寶庫數字化,做到可以全文檢索的美妙境地。處理《四庫全書》資料的過程和方法將成為處理傳統文化資訊的典範。

  經過資料化處理的《四庫全書》的集合性價值得到了提升,因為資料庫在一定程度上改變了這份巨大文獻的集合形態和使用方式,經史子集的構架是它原有的集合形態,在資料庫中,這個形態還保留著,但已經不是主要的形態,在資料庫中《四庫全書》的主要形態是可以用多種方式任意、迅速調用的資訊集合態,原來的順序和條貫已經模糊,現在起作用的是其資訊的"全"和"優"。如果換了一部普通的圖書,就不會有這樣的效果:只要是研究與《四庫全書》時代吻合的有關問題,你走進《四庫全書》就幾乎不會空手而歸。

  前輩學者陳援庵先生認為,凡作一項學術課題,必須將相關材料全部收集到手,仔細梳理研究,才能做到沒有遺憾,其成果也更有價值。陳老自己的一些足以傳世的論文,就是這樣寫出來的。我牢牢地記著這一嘉訓。上世紀70年代末80年代初,為了撰寫關於宋代內藏庫問題的碩士論文,幾乎翻遍了宋代的史料、文集、筆記乃至類書,後來踏上工作崗位,又寫了許多論文,在收集資料方面仍然不敢疏漏。但即便如此,在文章發表以後,也常常會發現一些先前沒有看到的重要資料,或者可以作為更好的觀點佐證,或者足以動搖原先的論述,頗感愧疚。

  於是我深知,只有沉下心來,大量讀書,帶著問題逐步積累資料,思考問題,到一定的火候才動筆撰作,方能使自己的學術成果少一點遺憾。

  當然,除了下苦功夫以外,讀書做學問還要有好的方法,特別是善於使用各種工具,以期取得事半功倍的效果。比如充分利用目錄、索引和專科辭典等工具書,即可有效地縮短積累資料的過程,並且搜尋到平時讀書不容易見到的資料。可惜目前已經編製出版的索引不多,且僅限於經典名著,而為浩如煙海的全部文獻資料編製可供全文檢索的索引加以出版,又因為編製的工作量太大、索引的篇幅會超過原文而根本不可能。

  看來,不改變古代文獻資料的形態,不改變查找資料的方式,我們這一代學人很難趕上老一代學人,因為在他們從小所受的教育中即已打下了比我們更好的基礎。

  現在我們經過努力,應該可以做到這一點了。

  比如我研究和整理朱熹的《八朝名臣言行錄》多年,一直想寫一篇論文,但由於有許多資料手頭沒有,又抽不出時間出外訪讀,總覺得所需的資料尚未完備,難以下筆。有了《文淵閣四庫全書》電子版光碟以後,我抱著試試看的心理以各種相關的辭彙、短語等為搜索引擎從中尋找有關朱熹《八朝名臣言行錄》的資料,結果收穫很大,不僅找到了其他學者引用的資料,並糾正了引用中的一些問題,還找到了許多新的材料。在我沒有使用《文淵閣四庫全書》電子版光碟的時候,已經基本形成了自己的觀點,在利用光碟搜索到許多新材料以後,不僅充實了相關的論證,還對原有的觀點做了一些修正,如果不使用這些新材料,我的觀點就會發生偏差,這是多麼危險的事情。除了搜尋材料以外,在寫作過程中,遇到人物、年代、史實等方面的問題,如果手邊沒有合適的史書、工具書可供翻閱,我也利用光碟尋找答案,大多能達到目的。在我整理《八朝名臣言行錄》的過程中,需要用大量的宋代文獻加以比對,當時因為沒有這個光碟,只好將數百種古籍一本一本地借回來,一本一本地翻過去。而在我讀校樣的時候,已經有《文淵閣四庫全書》電子版光碟可供利用,於是數百處疑問足不出戶就得到了解決。

  但如同任何其他工具書一樣,光碟不能解決一切問題。比如,許多有內在聯繫的資料,卻沒有相同的外在特徵,在光碟裏也就不可能同時出現,這就需要將讀書與使用光碟結合起來,由此及彼,層層深入,邊讀邊查,邊查邊讀,天網恢恢,疏而不漏,將問題研究和闡述得更清楚。

  五、餘論

  1. 同義語場搜索引擎問題。

  在從《四庫全書》等大型文獻資料庫中索取語詞及與之相關的資料時,常常會遇到這樣的情況:由於不瞭解某種概念的表述形式不止一種,而遺漏了相關的重要資料。這對於學術研究是十分不利的。比如"淳化閣帖",有人又稱之為"淳化法帖"、"閣帖"、"淳化帖",朱熹的著作"五朝名臣言行錄"和"三朝名臣言行錄",古人又常常稱之為"朱子名臣言行錄"、"朱熹名臣言行錄"、"名臣言行錄"、"五朝錄"、"三朝錄"甚至"言行錄",而司馬遷又被稱之為"馬遷"、"史遷"、"太史公",至於李白被稱為"李太白"、"太白"、"詩仙",杜甫被稱為"杜子美"、"子美"、"杜工部"、"工部"等等,是為大家所熟悉的。在大多數的場合,學者或使用者對於一個概念的不同表述方式,是只知其一,不知其二,或者不知其多的。

  我將對某種概念的不同表述形式稱為"同義語",也可以稱為同位語、同價語,"同義語"比一般的同義詞更為寬泛。在普通語詞中,除了同義詞、近義詞以外,還包括類義詞,比如"死"這個概念,據統計有600多種表述形式,而對同一人物、地區、職官、日期、事物、事件等等的各種不同的稱謂,則更為豐富,簡繁異體漢字、同一人物的不同語言的人名表述,也可以視作"同義語"。把各類"同義語"的"一對一"、"一對多"對應資料加以搜集處理,形成一個"同義語"的集合體,這就是我所說的"同義語"場,其實,"同義語場"本身就可以編成一個資料庫。

  如果《四庫全書》資料庫能夠安裝一個相應的同義語場作為搜索引擎,則其集合性價值將得到進一步的提升。

  2. 《續修四庫全書》的數字化問題。

  在《四庫全書》資料庫獲得巨大成功以後,國內外許多機構和學者都在從事古籍數字化的工作,這是一件好事。但是我想,數字化的物件一定要選準,我們要把有限的資金和人力用在刀口上,特別是那些集合性價值高而又能填補空白的圖書上。既能救《四庫全書》之偏,又能續《四庫全書》以後之古籍的《續修四庫全書》應當成為首選。

本文作者介紹
  李偉國
  上海人民出版社 總編輯