计算机|沙马拉毅:让1165个彝文字符在屏幕上“重生”

让古老文字告别铅与火,走进光与电的时代,是文字现代化、信息化的必然过程,被认为具有划时代的意义。在彝文信息化的进程中,有一位勇敢无畏的开创者,他就是彝族第一位博士生导师沙马拉毅。他发明“沙马拉毅输入法”,推动了彝文信息处理有关国家标准及国际标准的建立。而今,他仍然奔忙不息,致力于推动彝文的规范化,使彝文信息处理技术不断向前发展。
 计算机|沙马拉毅:让1165个彝文字符在屏幕上“重生”
文章插图
丨沙马拉毅近照
1
让彝文赶上信息时代
回首来时路,沙马拉毅说,是一种责任感和使命感,推着自己与彝文信息处理结下不解之缘。
上世纪80年代初,沙马拉毅在图书馆看到一篇文章,介绍我国的一种民族文字,被英国人拿去研制出编码后输入到计算机里,又把处理好的民族文字信息重新拿回中国测试与使用。这一事件让沙马拉毅寝食难安。彼时,他刚从西南民族学院(现西南民族大学)毕业留校任教不久。
沙马拉毅想到了自己的母语。彝族人口众多,分布区域大,彝语使用者超过800万人。1975年,《彝文规范方案》试行,1980年由国务院批准正式推行。“我是彝族知识分子,为什么不能自己研究彝文信息化的问题呢?”他想。当时,国内诸多学者也在讨论,中国应该重视民族语言文字的计算机处理,不能让这一技术掌握在外国人手中。这样的反思与争论激发了沙马拉毅,从此,他义无反顾地投入彝文信息处理的研究中。
彝语方言多,彝族文字数量多,形体、繁简不同,要实现信息化可谓困难重重。“我是学文科的,不懂计算机。那时候,我们没有计算机课程。”沙马拉毅骑着自行车跑遍了成都的书店,把与计算机有关的书籍都买了回来,总计37本。那段时间,沙马拉毅天天看书、天天琢磨。两三个月后,他就开始边看书边整理彝族文字。
 计算机|沙马拉毅:让1165个彝文字符在屏幕上“重生”
文章插图
丨沙马拉毅伏案研究彝文信息处理系统
文字的信息处理包含输入和输出两方面,关键是要设计一套能方便对应每个字符的编码方案。彝文也一样,要为1165个字符找到一整套简洁的编码方案,这些编码要形成一系列的计算机指令;在输出时,要有彝文字库,计算机的输出指令对应着不同的彝文字形信息。
沙马拉毅独自面对的,无疑是一项浩大的工程。
他花高价买来一台苹果计算机,这台机器仅具备计算能力。沙马拉毅搭上所有的业余时间,开启了艰辛的探索之旅。
为解决彝文的编码问题,需要对每一个彝文字符进行数值换算。实际上就相当于在一个数字化的点阵中,计算出哪些点应该有脉冲信号,哪些没有脉冲信号。因脉冲信号分布不同,一个独特的字符就会显现出来。
于是,沙马拉毅找来数学演算坐标纸,把字描在坐标纸上,再计算出字符的对应数值。这一看似简单的工作其实相当复杂,需要进行大量的计算。他足足耗费了超过3大麻袋的坐标纸。为节约坐标纸,沙马拉毅想到先用火柴棍在坐标纸上摆成彝文,然后再输入坐标,这样,一张坐标纸可以多次使用。
1982年底,沙马拉毅开发出彝文计算机处理系统。应用这个系统,千百年来书写在树皮、草纸上的彝族文字显示在计算机屏幕上。此时,这些彝文还不能打印输出来,沙马拉毅的工作仅完成了一小半。
1984年,在内蒙古召开了“全国首次少数民族语言文字信息计算机处理学术讨论会”,沙马拉毅作为代表参加了会议。5天的日程中,他一刻也没有耽误,不断向专家学者讨教有关硬件、软件、信息处理等各方面的问题。讨论会传递出一个信息,尽管民族文字信息处理尚处于起步阶段,但全社会十分关注,这给了沙马拉毅无穷的动力。
 计算机|沙马拉毅:让1165个彝文字符在屏幕上“重生”
文章插图