古文字考释与人工智能( 二 )


第三 , 穷尽资料 , 并尽可能地缩小考释范围 , 是准确考释古文字的一个重要途径 。
在三晋玺印所见的姓氏中 , 有一个怪字作[~符号~] , 它既作为单字姓氏出现 , 又出现在复姓中(这里用俗称 , 实际是氏) 。过去曾有学者释为“佗” , 字形上虽然也马马虎虎可以通过 , 但实际上解决不了跟已知古代姓氏的对应问题 。也就是说 , 这样的考释最终还是无法落实 。后来我在检阅旧材料时发现 , 这个怪字在复姓中 , 不但出现在后一个字的位置上 , 如“大~”;也出现在前一个字的位置上 , 如“~中” 。这样一来 , 释读的可能范围便大大缩小了 。于是我检查了所有已知复姓 , 最终知道此字实际上就是古文字里很常见的当“叔”字用的“弔” , 只是它的写法在三晋变异了 。“大叔”氏、“叔中”氏和“叔”氏 , 不但见于传世文献(即太叔、叔仲) , 也见于汉代私印 。后来我又在魏国兵器上发现同样写法的“弔梁”氏 , 那自然就让我们马上想起孔子的老爸名纥字叔梁 。晋有叔梁氏 , 是见于古姓氏书记载的 。
以上几个古文字考释的例子 , 如利用人工智能技术 , 大约涉及:(1)手写汉字字形的精准图像识别 , 含反书、合文、重文等特殊情形;(2)语料库的建设 , 含通假标识与断句等;(3)古代历史与制度的相关数据库建设 。假使通过计算机读图并与各种相关的“库”建立起有效的勾连与筛选 , 也就是通过人工智能技术达到较为精准有效的数据处理 , 那么古文字考释的速度与成效自然会大大提高 。虽说这些恐怕还都属于比较低端的人工智能 , 未来一定还会有更高级的诸如机器自我学习提升以及人机嫁接互动等技术 , 但这已是我们当下可以憧憬和努力的方向了 。
古文字考释与人工智能】《光明日报》( 2020年11月07日 12版)