深闺|文化观察丨从宣纸到数字化,古籍这样走出“深闺”

手写或印刷在薄薄宣纸上的方块汉字走出“深闺”,古籍数字化像一把钥匙……
打开“用”与“藏”环环相扣的铁锁
深闺|文化观察丨从宣纸到数字化,古籍这样走出“深闺”
文章插图
深闺|文化观察丨从宣纸到数字化,古籍这样走出“深闺”
文章插图
孔子博物馆藏《乾隆御定石经》初拓本
□ 本报采访人员 卢 昱
40余种珍贵宋元刻本、写本,著名藏书楼嘉业堂、密韵楼的抄本,文澜阁《四库全书》零本……近日,这批珍藏于美国加州大学伯克利分校的中文古籍善本,以数字化方式进驻“汉典重光”古籍平台(网址为https://wenyuan.aliyun.com/home)。
古籍中那些手写或印刷在薄薄宣纸上的方块汉字,经过数字化,飘起在“云端”,文化积淀又有了新的保存与光大的途径。
钱钟书的敏锐与远见
据统计,目前全国各公藏单位拥有古籍总量超过5000万册,需要修复的古籍约1500万册。即使在古籍不再继续遭到破坏的前提下,以当前的修复人才及修复条件计算,要完成全部修复工作仍需数百年。
深闺|文化观察丨从宣纸到数字化,古籍这样走出“深闺”】古籍文献集文物价值和学术价值于一身。从保护的角度看,古籍应在合适的环境中收藏,尽量减少在普通环境中的时间,降低使用时可能带来的损伤。有测试表明,一部宋元古籍,离开专用书库,置于普通阅览室中供人翻阅一小时,其寿命就会缩短数月。
从利用的角度看,古籍若沉睡在库房,就无法发挥其价值,而且许多学者的研究与古籍内容息息相关。此时,古籍数字化像一把钥匙,打开了“用”与“藏”环环相扣的铁锁。
事实上,“古籍”与“数字化”已相遇三十余年。
古籍数字化,最初扎根在红学研究领域。在1980年国际红学会议上,美籍华裔学者陈炳藻提交《从字汇上的统计论红楼梦的作者问题》,提出用计算机统计《红楼梦》的字词,以辅助确定《红楼梦》尤其是后四十回作者的问题。国外的这些信息激发了国内部分学者的兴趣,他们开始关注并尝试将计算机技术应用于人文研究。
受此启发,镇江的红学研究者彭昆仑开始利用计算机程序探讨《红楼梦》人物年龄的问题。1985年他调到镇江市科委后,又与东南大学(原南京工学院)合作完成《红楼梦》数据库。此后,深圳大学建成“红楼梦多功能检索系统”。
1980年前后,钱钟书的女儿钱瑗到英国访学,看到英国学者用电脑储存、查阅莎士比亚的资料。回国后,她把这一信息告诉钱钟书。钱钟书敏锐地意识到这一新鲜事物的价值,让助手栾贵明从事相关研究。
在钱钟书的指导下,栾贵明主持的课题组先后完成“《论语》数据库”“《全唐诗》速检系统”等课题,并荣获1990年“国家科技进步奖”三等奖。这些都是利用计算机进行人文研究的早期实践。
当时,古籍数字化还在萌芽状态。在1987年12月人民日报出版社出版的《论语数据库》一书卷首,钱钟书写道:“从理论上来说,计算机和人类使用过的其他工具没有什么性质的不同。它在还未被人广泛使用的时候,除自身尚待完善以外,总会遭到一些抵拒。惯用旧家什的人依然偏爱着他们熟悉的工具。有了纸墨笔砚‘文房四宝’,准还有人用刀笔和竹简;有了汽车、飞机、电报电话,也还有不惜体力和时间的保守者。对新事物的抗拒是历史上常有的现象,抗拒新事物到头来的失败也是历史常给人的教训。”——当前古籍数字化的潮流,可说是对他远见的最好褒奖。
数字古籍为“母本”代言
上世纪九十年代后期,古籍文献数据库的建设步入快车道。
1996年,书同文公司启动的文渊阁《四库全书》电子版是一个标志性工程,被誉为大型中文电子出版工程的典范。该工程动用300名校录人员、60名技术、学术和管理人员,历时三年多完成。
而今,国家图书馆的“中华古籍资源库”已在线发布超过3.3万部的古籍影像;中华书局的“中华经典古籍库”已发布3000多种、15亿字的点校本古籍;爱如生公司的“中国基本古籍库”收书1万种,既有可供检索的全文,又提供古籍原版图像;像家谱、方志、中医药等专类古籍在多地兴起……
除了以上大而强的综合数据库,在网络上,很多古籍爱好者,出于热爱和自觉,建立古籍数据库,如“书格”“殆知阁”等,与以上数据库多头掘进,共同成为诸多文史研究者的助手。
近年来,古籍数字化在服务于学术研究方面,立功颇多。比如中南民族大学王兆鹏主持的“唐宋文学编年系地信息平台”、浙江大学徐永明团队与哈佛大学共建的“学术地图发布平台”、中国社科院刘京臣的“宋代文学地图数字分析平台研究”等值得关注的数字人文成果,其平台的建设离不开数字化古籍的基础作用。