爱数智慧CEO张晴晴:中文不是一种语言,而是十三亿种语言

7月9日,由世界人工智能大会组委会办公室指导,亿欧EqualOcean主办,上海交通大学产业经济研究中心、上海市人工智能行业协会、上海市人工智能学会支持的2021世界人工智能大会“AI商业落地论坛”在上海圆满举行。
爱数智慧CEO张晴晴:中文不是一种语言,而是十三亿种语言】为了解读人工智能的智能交互作用,北京爱数智慧科技有限公司创始人兼CEO张晴晴博士出席发表题目为《对话式AI赋能商业落地》的精彩演讲。
核心观点:1. 我们人类说话表达的方式真的差异化很大,中国有13亿人口,我们会认为每一个人的表达方式都是特殊的,所以中文不是一个语言,从某个意义上来讲是13亿的语言,对于13亿语言我们怎么去理解它?这部分也是非常大的挑战。
2. 训练数据的数据量决定智能系统的上限。
3. 我们要兼具模型的通用性,我们会使用数据二八原则,即所有数据80%是共性的,20%会根据不同客户企业需求定制开发。
4. 北京爱数智慧科技有限公司主营业务为智能化企业提供数据服务,其核心是人机交互系统包括语音识别、语音合成、自然语音理解相应的数据处理和服务。今年Q3季度,公司将正式上线智能化系统Annotator5.0智能化标注平台的私有化的部署版本以及SaaS版本。预计系统与市场上通用版本比较效率提升100%,同时私有化部署版本支持快速一键部署、一键运维等优化处理。
5. 作为数据公司来讲数据的合规和个人隐私是立命之本。我们是国内首批拿到全球个人隐私认证ISO27701认证的,这也表现我们在数据这个行业对于数据合规的重视,接下来我们也会在这个方面不断筑高我们的门槛。
6. 自然语音理解的核心是让机器理解人说话的目的和意图,并拆解出来做相关的动作。由于人们表达方式的巨大差异化,准确的理解和识别语言需要大量的数据支持。
以下是演讲正文:
各位大家好!非常感谢线下和线上听我们报告的朋友们,我是来自北京爱数智慧创始人兼CEO张晴晴,今天带来的报告题目是“对话式AI数据赋能商业落地”。
我们说在整个人工智能领域有数据、算力、算法三驾马车,这三驾马车目前对于数据的关注度越来越高,我们就着眼数据这个领域看看我们为整个人工智能领域带来最底层的数据支撑。
这次的报告会分成四个部分,首先介绍一下我们北京爱数智慧公司的情况,以及目前整个人工智能领域人机交互作为非常重要的一个方向,现在也得到越来越多的重视,而在人机交互里对话式AI就是一个终极问题,这个终极问题通过数据处理的方式对对话式AI支撑起到更大帮助作用。最后会发布我们公司五年以来所打磨的智能化数据标注系统Annotator5.0,这也是为底层数据定向做标签化来降本增效的工具。
首先介绍一下公司的情况,北京爱数智慧公司主要为智能化企业提供数据服务,核心是围绕人机交互,包括语音识别、语音合成、自然语音理解进行相应的数据处理和服务,在这个里面我们也有已经标签化好的标准数据集,在后面公司也会在数据的二八原则讲到这个部分的产品推荐逻辑。
目前我们公司服务于整个人工智能领域行业的客户,今年的重点将会放在刚刚提到的人机交互的行业客户上面,包括像比较火的出行、智能座舱、智能家居和智能社交,以及刚刚提到的智慧金融也是目前服务行业客户群体。这些是我们公司的核心团队,在企业服务以及人工智能领域包括数据合规领域也都有十到二十年的经验。
作为数据公司来讲数据的合规和个人隐私是立命之本。我们是国内首批拿到全球个人隐私认证ISO27701认证的,这也表现我们在数据这个行业对于数据合规的重视,接下来我们也会在这个方面不断筑高我们的门槛。
第二个部分讲一下对话式AI,时间关系对于一些细节部分做一个大体介绍,对于对话式AI来讲核心是完成人和机器的交互,这个过程人会发出语音,我们会通过语音识别的方法,把语音转化成相关的文字,机器的内部需要对文字进行理解以及意图的识别,识别完之后机器会给一个回馈,回馈会使用语音合成的方式,将回馈的内容播报出来,这样就完成了人机交互。
我们看到语音识别、语音合成、自然语音理解这三者是我们的技术核心,这三者在语音交互和对话式落地时有明确特点。中国人说普通化,很多时候我们都有当地特色的口音,这种口音会使得语音识别的性能变得不好,听不懂你在说什么。在语音合成里的客服场景也会用到,我们希望机器播报出来的声音有情感,听上去像真人一样,但是这个部分目前感觉声音还不够真实,还是比较机械的,也是需要提高的。