古籍数字化技术日趋成熟,一键直达《永乐大典》

古籍数字化技术日趋成熟,一键直达《永乐大典》

古籍数字化技术日趋成熟,一键直达《永乐大典》

本文系商业周刊App付费文章,禁止转载。

撰文:王若霈

出于文物保护与利用的目的,古籍数字化并存档已经成为普遍的做法

“古籍是最脆弱的文物,我们常说,打开一下,损寿60年”

耗时十年,哈佛燕京图书馆收藏的中文善本数字化工作全部完成,并于今年8月公之于众。这是目前海外图书馆公开的首个最大的中文善本库。其中不仅包括三册国宝级文物《永乐大典》,还有诸如明代杨继盛手稿《弹劾严嵩奏疏草稿》、明蓝格抄本《钦明大狱录》、清初汲古阁抄本《离骚草木疏》等国内没有收藏的善本书。该项目得到了中国国家图书馆、蒋经国基金会、广西师范大学出版社、中国社会科学院中国地方志指导小组,以及浙江大学CADAL(China Academic Digital Associative Library,大学数字图书馆国际合作计划)图书馆等机构的资金支持。“一批文化遗产以数字化方式回归中国,意义重大。”中国国家图书馆副馆长、国家古籍保护中心副主任张志清说。

数字化需求

哈佛燕京图书馆是哈佛大学专门收藏与东亚相关文献的图书馆,成立于1928年,原名为哈佛燕京学社和汉图书馆。其早期中文善本收藏主要来源于委托北平燕京大学图书馆中文采访部选购,日本侵华时期在北平、上海购入,并在“二战”后(1945年)在日本广泛搜集。目前哈佛燕京图书馆的藏书将近150万册,中文文献逾80万册。此次被数字化影印的中文善本数量多达4200部(53000卷)。古籍专家沈津说:“经过80多年的搜集,无论从古籍收藏的数量,还是善本书的质量,哈佛燕京都可以和欧美地区收藏中国古籍最多的美国国会图书馆相颉颃。”他曾任职哈佛燕京图书馆善本室主任。中文善本中,沈津表示,“仅‘明刻本’就有1500部,其中藏有国内各大图书馆所空缺的版本有189部之多。”而且此次数字化的中文善本品相完好,如明朝万历本《金刚般若波罗蜜经》上的罗汉画像插图,历经数百年后细节仍清晰可见。

古籍数字化技术日趋成熟,一键直达《永乐大典》

哈佛燕京图书馆

但古籍影像化并不像表面上看起来那么简单。“古籍是最脆弱的文物,我们常说,打开一下,损寿60年。”张志清说。出于文物保护与利用的目的,古籍数字化并存档已经成为普遍的做法。在中国,国家图书馆、上海图书馆等大型公共图书馆和北大、清华等高校图书馆古籍部都有古籍数字化的需求。

古籍数字化目前主要有三种形式:影像,即为古籍进行高清扫描,实现图像浏览;全文,将古籍全文内容从影像底本提取出来,形成全文检索库;知识库,是在全文整理基础上进一步注释、标引,可以提供更多维度和专业化应用。

“全文和知识库的数字化形式成本高、速度慢,在这种情况下影像能够相对更快速地为用户提供更接近于原始文献的资料,因此影像数字化是不可替代的,对于研究和古籍整理有很大帮助,”中华书局数字出版中心副主任洪涛说。中华书局从2003年开始古籍数字化工作,主要采用后两种数字化形式。由于古籍多收藏于博物馆、图书馆等机构,因此影像化多由公共机构完成,哈佛燕京图书馆完成的就是这项工作。张志清认为,此番善本数字化意义在于“促进国内学术发展、文献整理和民众利用,提高国家的人文水平”。

意义深远

不同于画卷只要展开即可扫描,多数古籍装订成册后都无法完全摊开,但为了保护文物也不能拆开装订线拍摄;古籍书页是“筒子叶”(古籍装订将书页背对背对折,有文字一面向外装订,形成一个纸筒),而古籍用纸通常较薄,如果直接扫描,会透出背面的文字,需要安排专人在“筒子叶”中衬上比宣纸更软的衬纸。影像化对于扫描机器也有特殊要求,比如尽可能采用冷光源、非接触式扫描,以降低对古籍的损耗。因此,古籍影像化成本非常高,影像精度越高成本越高,现在在国内扫描一页要花费9元,还不包括底本费、修复费以及人工费用等。

哈佛燕京图书馆设有专门办公室负责数字化项目,包括修复部门、技术部门等,分工解决古籍数字化过程中出现的各类问题。为完成卷帙浩繁的中文善本数字化工作,哈佛燕京图书馆又额外招了一名负责人,负责统筹和记录。从善本出库开始,这名负责人需要做扫描前整理、统筹善本修复、扫描、扫描后整理直到入库。

古籍数字化技术日趋成熟,一键直达《永乐大典》

善本扫描

2009年,中国国家图书馆与哈佛燕京图书馆的合作正式开始。在数字化大部头之前,张志清先将两书架的“齐如山小说戏曲专藏”数字化作为实验。戏剧理论家齐如山是梅兰芳的经纪人,他所藏的小说戏曲的写本抄本对于戏曲史研究有非常重要的价值。“这部分不到一年就做完了,每页费用只要1美元。”张志清说。此后,中国国家图书馆与哈佛燕京图书馆陆续完成了中文善本的经部和史部,共花费了人民币1000万元左右,善本的子部和集部在其他机构资助下完成。

国内曾有人质疑“哈佛燕京图书馆宋元善本少,一些明代刻本国内已有,全部数字化价值不大”。但张志清认为这个项目意义并不只在于种类。“同一本明版书可能国家图书馆就有,但是哈佛燕京图书馆的版本有可能存在很多差异,刻印早晚、流传情况、印章收藏等都不一样,据此可以研究中华文化是如何流传到国外的,对于世界有什么影响,其他国家又是如何研究吸收中华文化的等等。”他说。

古籍数字化技术日趋成熟,一键直达《永乐大典》

哈佛燕京博物馆部分即将数字化的珍稀古籍

但张志清也强调,大众欣赏古籍仍然有一定难度,“古籍用繁体字写成,竖排版又没有标点。但是古籍中有很多可供欣赏的角度,比如纸墨、书法、版式、插画,古气盎然,有助于提高大众对于中国传统艺术的欣赏水平”。现在公众可以通过哈佛燕京图书馆或中国国家图书馆的网页免费查看并下载这些善本的高清彩色图像。

编辑:冯艳彬、黄琬钧

◆  ◆  ◆  ◆  ◆  

点击你感兴趣的关键词

立即获得关于TA的更多信息!

机场健身丨廉价iPhone丨睡眠丨结婚

丁磊丨摩托车崛起丨日本百元店丨塔吉特危机

教育丨中国地产丨啃小族丨迪士尼丨比特币分叉

汽车革命丨腾讯刘炽平丨狼人杀丨省钱套路丨涨工资

知识付费丨赌城丨拼飞机丨iPhone设计师丨机器人语言

......

古籍数字化技术日趋成熟,一键直达《永乐大典》