票据|重庆工程学院:两个月研发投用票据识别系统


票据|重庆工程学院:两个月研发投用票据识别系统
文章插图
重庆工程学院大数据与人工智能研究所内,陈吉博士(站立者)正在指导学生写代码。采访人员 栗园园 摄/视觉重庆
11月25日,重庆工程学院大数据与人工智能研究所内,陈吉博士在电脑上调出一张火车票的正面照片,然后打开OCR系统选择“车票”选项后,一眨眼,该火车票上的车票号、车次号、乘客姓名、身份证号、始发站等详细信息就成功转化为文字形式出现在系统界面上。
研究成果受到众多银行青睐
就在10天前,这个基于OCR(文字识别)技术开发的票据识别系统成功引来重庆银行、华夏银行、三峡银行等30家银行上门,与研发合作方数宜信信用管理有限公司签订了战略合作协议。
事实上,文字识别已经不是一项新技术了,重庆工程学院的这个系统究竟有何不同,受到众多银行机构的青睐?陈吉给出的答案是:“我们除了在OCR技术基础上做了算法优化外,还根据行业实际需求扩大了技术的应用场景。”
票据|重庆工程学院:两个月研发投用票据识别系统】今年9月,秉持着一贯的校企合作办学理念,结合目前全市产业布局,重庆工程学院与金融科技企业数宜信信用管理有限公司合作,成立大数据与人工智能研究所,团队共有教授2名、技术人员10名、学生60名。这也是国内高校中首批开展票据识别系统研发的团队。
研究所成立后,主要针对金融行业的需求,重点从文字识别、人脸识别、智能硬件3个方向开展工作,并迅速取得了成效。也就是说,这个票据识别系统从研发到投入使用,仅用了短短两个月时间。
识别火车票上13项信息只要0.1-0.3秒
“OCR技术确实已经不新鲜,但它的可应用场景很多。我们这个系统主要就是为帮助一些机构、部门、企业等解决信息录入量大的问题。”陈吉说,以火车票为例,铁路部门若要在春节期间分析旅客出行行为,必须对客流量、人员流向等信息进行搜集,而每一张车票就是最基础的数据。以往这项工作都是由人工操作,纯手工录入,工作量大、效率较低,还存在准确率问题。
针对这一情况,陈吉所在的大数据与人工智能研究所通过使用EAST算法、YOLOv4算法等先进算法,对文字识别技术进行优化,使系统识别准确率达到99.9%。然后,再通过系统将识别出的信息转化为文字形式输出。
重庆日报采访人员数了一下,一张小小火车票上包含了13项信息,若人工输入,预计最快也要2分钟。但在陈吉的演示中,整个过程也就是一眨眼的工夫。“根据我们测算,这个过程基本上控制在0.1秒至0.3秒之间。”陈吉说。
除了识别车票外,这个OCR系统还可以识别营业执照、身份证、发票、驾驶证等票证信息,不仅效率高,操作也简便。
下一个目标:攻克手写汉字识别技术难题
对于这个“年轻”的团队来说,这个OCR系统只是小试牛刀,他们还有更大的“野心”——攻克手写汉字识别技术难题。
众所周知,汉字数量多,字体也多,再加上每个人的书写习惯不同,若要实现手写汉字的识别,难度不小。目前放眼全球,还没有相关技术问世。
“这项技术也只能由我们中国人来做,因为我们才是最了解汉字的人。”陈吉说,要实现这项技术有两个途径:一是通过大量数据采集,二是利用生成式对抗网络。而他更倾向于第二种途径。
生成式对抗网络是一种深度学习模型,也是目前比较先进的技术,此前很火的AI写诗就是通过该技术实现的。陈吉形象地将该过程比喻为:一个“造假者”通过不断模仿、学习、改进,最终达到与“真品”高度相似甚至以假乱真的效果。
“我们可以通过学校的学生,搜集足够多的手写汉字基础样本,然后通过生成式对抗网络,对每个人的书写习惯进行深度学习,进而演化出更多手写汉字样本,最终实现更精准的识别。”陈吉说,目前针对手写阿拉伯数字的识别技术已经在研发当中,预计明年下半年就能够问世。
“根据我前期在农村地区的超市、农贸市场实地调研的情况,许多经营者对我们这项技术都十分期待。”陈吉说,届时经营者们利用团队研发的一款App,将往年的账本数据识别出后,就能够快速准确分析出历年进货、销售情况,进而可对未来的经营思路进行调整。
本报采访人员 栗园园