《四庫全書》電子版問世的啟迪 朱岩教授 1999/4/19
99年春,《文淵閣四庫全書》電子版(原文與標題檢索版)問世,並裝載在國家圖書館的網上向讀者提供服務。原文與全文檢索版年內也將完成。這不僅是我國出版界由傳統印刷出版向現代化電子出版方式轉變的一件大事,而且是我國傳統文化信息資源實現數字化參與世界範圍共享取得突破性 進展的重要標誌。
電子版不是紙張版翻印
電子版《四庫全書》以當代最先進的信息技術,在保持原書真跡的基礎上,將書中一切具有檢索意義的書名、作者、類目、標題乃至全文中的字、詞、語全部數字化,同時還掛接了擴充的《中華古漢語詞典》、《四庫大辭典》、《四庫全書簡明目錄》等電子工具書,從而給讀者提供了手工查閱難以比擬或從未有過的快捷有效的檢索、統計、整理和編輯功能,有利於讀者開展更廣泛更深入的研究。
一部《四庫全書》原書大約需要五百平方米以上的存放空間,影印本也需要百平米空間,而電子版只需手提箱大小的機箱(百G硬盤)就可存儲。過去,一部書在一個時間裡只能供一個讀者閱讀,現在電子版《四庫》通過網絡可供多個讀者同時看一部書。電子版實現了書名、著者、類目和全文中的字、詞、語等多途徑檢索。讀者可以進行單項檢索,也可以多項信息組配檢索。檢索時,可以輸入檢索的全部信息也可以輸入其中部分信息,即“任意一致”檢索。如果讀者對輸入漢字的一些方法不熟悉,可以選用電腦提示的拼音、或筆畫、或部首三種不用學習就可以掌握的簡單方法即可確定檢索文字。查詢效率又是過去無法比擬的。一般情況下,一次檢索均可在五秒鐘以內獲得結果。閱讀時,可隨意在電腦上作閱讀筆記,可摘錄檢索到的有關內容,或編排下載、打印。多種電子工具書又與《四庫》掛接,給讀者帶來更多方便。例如,你對某些字義不明,可以點擊古漢語字典,對某個作者或某部作品不熟悉,可點擊《四庫大辭典》,或《四庫簡明目錄》,有關的解釋說明會立即顯示其旁。還可從解釋說明中的書名、作者再去查檢《四庫》。
過去,人們查閱圖書,一般是先通過目錄找書,查到後再查書中目次,據目次直接順序的翻閱。而電子版《四庫》,讀者不僅可以在瞬間查到所要圖書,而且可以直接深入文獻中查到局部。不只如此,還可以把與一個或與多個主題相關的專著、專著中與主題相關的篇章、段落查到。現代檢索技術,不僅能在一部文獻的縱深方向搜尋,也可以在多部文獻之間橫向搜尋,並進行精確的統計、整理。這種能力極大地啟發和擴展了學者研究的廣度與深度,並加快學者們多出成果。
下表顯示的事例是利用大家熟悉的詞語在《四庫全書》全文版經部查檢的結果,這些精確的結果都是在瞬間完成的,是過去手工查詢辦不到的。
檢索事例(經部全文檢索)
綜上所述,《四庫全書》電子版不是紙張版本簡單的翻版,而是具有豐富研究功能與工具的中華傳統文化信息寶庫。
有利於對中華文化的認知與研究《四庫全書》是迄今為止人類歷史上規模最大的一部百科全書,它對我國古代文化主體的儒家學說以及歷史、人文、科技、眾多學科的歷代典籍進行了成功地整理與總結,它是具有重大歷史價值的中華傳統文化寶庫。
《四庫全書》電子版的出版、發行,使《四庫》從過去廣大讀者難以利用的“鎮館之寶”走向百姓的“案頭”,使我國成系列、大規模、具有代表性的文獻資源數字化,並可進入因特網,參與全球信息資源共享。這不僅有利於更多的國內外研究中國的學者、專家開展更深入、系統、有效的研究,也有利於更多的人利用現代化手段學習中國古籍,瞭解中國傳統文化。
《四庫全書》成書以來,學術界對清廷的編纂,對《四庫》本身,一直有不同的評價與爭議,有人稱之為“四庫學”。 《四庫》電子版問世,由於可以使更多的人接觸到此書,因而可以使更多的學者參與研究。而這種研究可以借助電子版進行準確、充分的定量統計與分析,因而才有可能獲得切合實際的定性結論。像清廷在纂修《四庫》時對一些典籍的刪、改、取、捨,以及由此體現的清人文化史觀,讀者利用電子版則可能得到準確的統計數據,予以恰當的評價。
學者研究的課題也絕不僅限於《四庫》本身,電子版可以幫助學者開闢更多更廣的專題開展研究。
中文信息處理技術的重要突破
《文淵閣四庫全書》電子版成功出版,標誌著中文信息處理技術實用化有了重大突破。該電子版是科技含量極高的產品。如:國際標準大字符集(ISRO/IEC 10646 UCS,亦稱UNICODE,含三萬多個中、日、韓古今漢字)文字平臺的投入使用,基於超大數量和種類繁多的多特定人手寫文字光學識別、編碼轉換、聯機無紙快速準確的校對軟件技術等,均屬於首創。跨平臺與跨語境(Single Data/ Single Binary)全球版產品製作技術,多途徑模糊與精確以及布爾邏輯組配的全文檢索技術,全文與多種字、詞典工具書掛接以及多種文字關聯查詢的規範控制等一系列高新技術,正是該電子版的研究開發使其完善與實用,同時還帶出一批新的研究課題。這些突破意味著不只我國近代文獻可以實施計算機處理,我國古代文獻也可以實施計算機處理了,這必將加快我國中文信息數字化的進程。
推動我國電子圖書館建立與發展
《四庫全書》電子版研製成功,將推動我國電子出版物的出版,加速我國電子圖書館的建立與發展。
在我國,電子圖書館的建設與發展日益引起重視。這件事涉及兩個方面:一方面是電子圖書館所需的網絡通信環境、計算機軟硬件手段的發展與配備。另一方面也是最重要的一個方面,即信息資源的數字化,而這也是最費時費力的。《四庫全書》電子版的問世恰恰帶來了一個好的開頭。因為它實現的信息量最大,所處理的文字包括圖形種類多而且複雜,它的OCR技術具有代表性而且解決問題的難度大、水平高,這些技術難關的攻破為更多的單位開發信息資源掃清了障礙。
我以為,更可貴的是《四庫》電子版研製運作過程積累的經驗:
信息資源擁有者、與資金擁有者、與高新技術擁有者三者相結合,走合作之路加快我國信息資源數字化開發。這一經驗十分重要。因較長時間以來,常有一些人總想甚麼都自己幹,甚麼都自己得到,結果由於資金或技術不具備,遲遲幹不出來。事實說明,手工作坊式的思維與方式是建設不了中國的數字圖書館的,走社會化合作之路,走資源與收益共享之路,這才是成功之路。
作者簡介
朱岩教授簡歷:
中國圖書館學會學術委員,曾長期任職於中國國家圖書館(前北京圖書館)。
在任期間,曾主持國家館的採、編、檢等綜合管理系統的開發及ISDS系統、漢字屬性系統的研發。並主編CN MARC格式和漢字屬性字典,參與ISO/IEC 10646(Unicode)CJK部分的研究及製定。屢獲國家級、部級科技進步獎。
自1998年11月起,於北京書同文電腦技術開發有限公司任職,參與電子出版物的開發等工作。