科技俱乐部| 「达观数据」获深创投领投2.7亿元B+轮融资,持续拓展AI+RPA产品落地,36氪首发

36氪获悉 , 「达观数据」本日宣布正式完成2.7亿元B+轮融资 , 由深创投领投 , 软银赛富、宽带旗下基金晨山资本、众麟资本等跟投 。 本轮融资将进一步投入到产品技术研发和市场扩张上 , 逐步完善AI+RPA的主要业务 。
此前 , 达观数据还曾于2018年11月获得1.6亿元的B轮融资 , 由宽带旗下基金晨山资本领投 , 元禾重元、联想之星、钟鼎资本及老股东等跟投 。
36氪曾多次报道达观数据 。 达观数据成立于2015年 , 以自然语言处理(NLP)、光学字符识别(OCR)、知识图谱等AI技术起家 , 建立了较为完整的文本数据采集、标注、训练体系——在数据知识层构建知识仓库和知识图谱;在数据应用层训练机器学习模型 , 并结合业务场景来开发出一系列智能机器人产品 。 在具体场景上 , 达观能够提供文档审阅、智能推荐、资料搜索、知识图谱等多款文本自动化方案 , 凭借着这套系统服务了包括招商银行、中国平安、华为、中国移动等数百家金融、制造、军工、科技等领域企业和政府机构 。
随后 , 达观于2017年接触到RPA技术 , 发现与原有的业务有强互补性 , 即计划将RPA作为公司的重要战略开始推进 。 36氪此前报道 , 达观自2018年年初开始研发RPA产品 , 2019年1月落地1.0版本 , 推向试点客户 。 在去年7月推出的NLP+RPA+OCR的新解决方案中 , 达观可以将RPA的应用场景覆盖面提升80%以上 , 比如能更好地解决传统RPA无法处理的非结构化数据源问题 , 包括图片验证码识别、证件识别、纸质文档识别、合同抽取、财务报表抽取、报告生成等业务需求 。
这轮融资完成之际 , 达观数据创始人兼CEO陈运文也与36氪分享了这段时间公司的最新进展 。
技术:重点发展AI+RPA产品 , 覆盖更多业务场景
科技俱乐部| 「达观数据」获深创投领投2.7亿元B+轮融资,持续拓展AI+RPA产品落地,36氪首发
文章图片
三大智能解决方案Source:达观数据
首先 , 达观数据在底层技术上的各项指标都有长足进步 。 CEO陈运文表示 , 公司从成立以来一直专注于书面文字资料的识别、挖掘等 , 不管是技术深度和广度都有积累 。 在这段时间内 , 达观可以识别的文档资料种类有接近10倍的提升 , 已经覆盖到了类似物流行业货单、运单、报关单等种类 , 在语言方面也能够支持中英文乃至其他语言的处理 。
“比如像海关运单、企业报关单、发票等 , 国内各行各业企业用到的文档资料、财务报表的格式都非常多样化 , 识别是一大难点 , ”陈运文表示 , “在成立之初 , 我们发现现有的NLP和OCR产品可能无法覆盖这么多元的材料种类 , 于是选择自行研发相应模块 。 ”
经历了多年发展 , 目前达观数据的产品在财务、税务、法律等领域应用较多 。 在财务领域 , 其产品的识别准确率能够达到98%以上 。
而在RPA方面 , 达观于2019年正式推出“达观智能RPA” , 融合语义理解模块 , 是“NLP+OCR+RPA”一体化的智能化机器人 。 这与主流RPA产品的不同之处在于 , 主流RPA产品大多数基于微软的开源框架研发 , 而达观选择走自研开发框架的路线 。
陈运文表示:“比起借用国外现成框架 , 虽然研发的过程代价更高更困难 , 但是回头来看是非常值得的 , 因为掌握了从底层向上的所有核心技术 , 软件的跨平台适应能力更强 , 能在国内外各种操作系统上运行 , 比如安卓、国产系统等 。 ”
达观在这段时间重点投入到AI+RPA的产品研发中 , 目前已经迭代至8.0版本 , 内部集成了众多AI组件 , 成熟度上了一个台阶 。 具体到产品落地上 , 融合了达观自研的NLP和OCR模块的机器人已经能够进入到较为复杂的场景 , 比如开展自动阅读和自动写作等 , 自动阅读包括让机器人帮助人类核对文档内容、辅助提供审批意见、查验材料有效性、分析语句意图、智能派发工单、搜索推荐资料、归纳分析原因、回答疑问等 。 而自动写作则可以让机器人像人类助手一样完成如起草报告、润色纠错、自动填表、摘要撰写、样式排版等工作 。