分享丨看这个国际算法竞赛的世界冠军,如何在张江挑战人工智能皇冠( 二 )
第一财经: 目前国内人工智能文本处理方面的企业大概有多少家?达观是什么样一个位置?
陈运文: 国内在这个领域的创业企业大概不到10家 , 达观是这个行业里的最领先的企业 , 不管是公司体量、业务规模还是应用场景都是最丰富的 , 我们建立了规模巨大的中英文语言资料库 , 开发出来的自动化办公机器人已经非常成功地运用在很多领域里面 , 比如说在银行 , 帮助客户经理自动化完成信贷报告的填写 , 在政府 , 帮助公务员自动完成审批的工作 , 在500强企业 , 把人事、财务、行政、供应链这些原来大量靠人做的重复性的、枯燥的工作 , 实现自动化 。
第一财经: 那是不是很多的白领工种会被您的这个技术取代?
陈运文: 应该说部分会被代替 。 但其实白领的工作分成两类 , 一类为创造性的工作 , 一类为重复性的工作 。 机器人来完成的是重复机械性的工作 。 我们公司也有一些同事来自于传统行业 , 我问他们为什么要离开原来的岗位?他们说是因为每天的工作没有意义 , 就像一个机器一样在重复 。 我就说 , 你说对了 , 这些工作就应该由机器人去完成 , 人类就应该去做那些有创造性的、有情感的、有温度的工作 。 所以我们期望未来的工作是人和机器人互相搭配的一个状态 , 机器人是我们人类的助手 , 帮我们完成那些不太愿意去触及的工作 , 才能够让社会运转的更有效力 , 大幅度提高效率 。 比如 , 一个机器人和一个人力资源的职员同样做表格填写的工作 , 机器人的速度大概是人类的20倍以上 , 准确率也会比人类高 。 我们人会疲劳 , 会随着心情的起伏导致工作质量的下降 , 但是机器人一天工作24小时 , 我们开发出来的RPA机器人 , 它能够在各行各业很好地发挥作用 。
第一财经: 怎么样去理解RPA?
陈运文: RPA , 它的英文叫Robotic Process Automation , 翻译过来就是机器人流程自动化 。 它把白领的工作步骤变成一、二、三、四、五、六明确的流程 , 编出程序安装在电脑里以后 , 就能像白领一样自动化去完成日常办公了 。
第一财经: 你预期市场覆盖率或者对人工的替代能够达到一个什么样的规模?目前已经做到了多少占比?
陈运文: 我们预期十年之内有50%的重复性日常办公处理可以让RPA机器人去完成 。 今天连1%都不到 , 所以这个有广阔的市场空间 , 未来从1%都不到到50%这个巨大的市场空间 , 我们是有希望去占领的 。
第一财经: 在这个方向上 , 最核心的技术难点是什么?
陈运文: 最难的地方就是文字资料的理解 , 这个需要有一个非常强大的语言模型 。 因为机器人它不会像人类那样思考 , 对文字资料所有的理解工作都是来自于大量的运算 , 我们要建立一个非常优秀的、聪明的数学模型才能让机器人像人类一样去理解每一个字词背后的含义 。 我们的汉语非常神奇 , 它充满了各种各样的暗示、省略、双关……上下文一变 , 意思往往会发生变化 。 我举个例子 , 我们经常讲说:“今天天气很冷 , 能穿多少穿多少”和“今天天气很热 , 能穿多少穿多少” , 同样都是“能穿多少穿多少” , 上下文一变 , 意思就完全相反了 。 人类来理解毫无困难 , 但是机器人理解非常费劲 , 我们就要花很多精力 , 让机器人去阅读大量的文档资料 , 进行各种各样的训练 。 同时 , 我们在日常工作中 , 除了普通的文字理解外 , 还要叠加人类的专业技能 。 比如你是一个律师 , 你去看一个合同的时候 , 不光看文字本身的意思 , 还会结合法律经验和条款去解读它 。 所以机器人还要去阅读大量的法律法规 , 案件卷宗 , 才能够像我们的法务人员一样的去完成这些合同的审阅工作 。 虽然我们已经积累了超过2000亿字的文字语言库 , 构建了非常庞大的算法模型 , 但是还是有很多语言文字现象没有得到好的理解 , 所以我们还在不断地升级我们的算法模型 , 让计算机越来越聪明 。
文本挖掘工作 , 一半是技术 , 一半是艺术 。 陈运文笑称自己的名字早已注定了与文字为伍的“宿命”:“运文、运文 , 运用文字 。 ”而取名达观有两个原因:一是寓意通达乐观 , 第二 , 公司的英文名称Datagrand就是大数据的英文 。
第一财经: 上海是一个国际化大都市 , 达观能够处理多少国家的语言和相关的信息呢?
陈运文: 目前集中在处理中文和英文两种语言 , 但是我们也和外国语学校有非常深入的合作 , 加大中小型语种语言模型的积累 。 我们服务了全球的货运巨头 , 它们的的货单、箱单、报关单上有各国文字 , 我们需要计算机系统自动去完成报关 , 自动进行货运单据的识别填写工作 , 已经取得很好的效果 。 所以我们也看到 , 整个全球的供应链体系里面也可以让自动化办公机器人发挥很大的作用 , 语言文字不分国界 。
- 长安|长安傍上华为这个大腿,市值暴涨500亿!可见华为影响力之大?
- 手机|这个超强App,让手机快3倍,流畅到起飞
- 桌面|日常使用的软件及网站分享 篇一:几个动态壁纸软件和静态壁纸网站:助你美化你的桌面
- 小区|超方便!晋安这个平台在支付宝上线!快来体验
- 纳闷|英媒纳闷:安道尔这个国家微信用户高达2000万,可只有8.5万人!
- 却是|海外最受欢迎的国产手机,不是小米华为,却是这个大家都没听过的品牌
- 白皮书|这个370亿美元的市场,因为新四化,中国企业的机会来了
- 用户留存|比起完播率,在抖音这个指标更重要
- 热点功能|旧手机别乱处理,分享旧手机6个小妙用,放在家里好值钱
- 流畅|手机里垃圾太多,关闭这个开关,彻底清除垃圾,手机立刻流畅