灵隆科技汤跃忠:人工智能帮助传统行业升级换代

小编温馨提示:前方高能,《灵隆科技汤跃忠:人工智能帮助传统行业升级换代》需要您认真观看!

正文开始:

2018年1月17日,由IT耳朵主办的主题为【万物皆有AI】的IEIC·IT耳朵智能创新大会暨智能行业创新企业颁奖盛典在亚洲大酒店隆重开幕。国内诸多人工智能领袖登台发表主旨演讲,各领域菁英从多个角度探讨了如何推动中国智能+产业蓬勃发展。大会全面展现了中国人工智能学术研究和产业投资现状,为未来五到十年中国智能产业健康发展提供了路线图。

图:灵隆科技首席科学家汤跃忠博士

灵隆科技首席科学家汤跃忠博士解释了为什么2017年以来智能音箱类产品特别火爆的原因。他把人工智能的学习过程分为四步,信号拾取、信息认知、理解和决策、执行和反馈,这四个环节学习的比较好就可以是人工智能,而音箱恰恰是集合了这几个特点。从语音识别、语义理解,到搜索识别匹配的资源,再到最终执行播放恰好是一个完整的过程。虽然现在中国和美国智能家居大的环境不台一样,但是都有智能家居入口的市场需求,所以才会有人工智能音箱空前火爆的情况发生。

以下为汤跃忠演讲实录:

这一次人工智能的高潮和以前不同,当时90年代经历过人工智能的高潮和低潮,经历过2000年左右语音识别的高潮和低潮,这一次高潮和以往最大的不同是什么?这次高潮是人工智能和产业结合最紧密的一次。那是各行各业都在人工智能当中,都在运用人工智能,而且各种提出的软硬件条件和网络,以前在90年代、2000年左右是不可想象的,所以我很看好这一次人工智能高潮会带给我们的一些进步。

因为我们是做智能音箱的,而且大家知道目前智能音箱比较火,但是很多人可能不太清楚智能音箱,为什么加上智能?智能在哪里?今天的演讲主要是介绍这一块的。

大家现在都在说PC时代到移动时代和AI时代来临,这一块过一下就完了。AI时代刚刚说了智能音箱,大家第一个认识上是说Alexa,亚马逊也没想到Alexa会成为爆款,成为爆款有偶然和必然性原因在里头,形成了国际国内智能大爆发。国际上美国2016年大爆发,国内从去年2017年开始爆发起来。最近参加工信部组织的制定人工智能产品的标准,其中第一个选定的人工智能产品就是智能音箱,说明从上到下都很认可智能音箱。

智能音箱智能在哪?

回到这次的主题,什么是智能音箱?智能在哪里?那就要回到最初的什么是人工智能?其实人工智能就是模仿。我们来把人的整个过程,可以把它分解成为四个环节,信号拾取、信息认知、理解和决策、执行和反馈,这四个环节模拟比较好都可以是人工智能。

信号拾取,听声音、摄像头、看拍图像、麦克风听声音这是比较好的,还有一些感知幻觉做得不好的,比如说嗅觉、触觉还有很大的空间需要提升。信息认知,大家都知道语音识别、图像识别,包括物体识别,有很多的工作要做。理解和决策,其实前边提到的Alpha Go,Alpha Go的时候应该主要是这个环节,做一些理解和决策性的工作。

最近Alpha Go比较火热,其实在大概20年前在IBM的时候,IBM当时做的是深蓝下国际象棋,那个应该是Alpha Go的鼻祖,我们当时是他们那个小组的人,我们在一起交流也是做类似的领域。然后是执行和反馈,刚才严博士举的波士顿动力的机器人和机器狗怎么控制和怎么翻阅障碍,包括刚才说的自动驾驶都是很多是执行和反馈的领域。

为什么说智能音箱是人工智能比较典型的产品?因为在这四个环节里面智能音箱都有所体现。所以它是集大成的产品,比如说在信号拾取,智能音箱目前用了麦克风贞烈,它是软硬件综合的解决方案,它要能够感知原厂的声音,能够去除噪音的影响。信息认知这里面应用了语音识别、唤醒、声纹识别。理解和决策用到了自然语言理解、对话、个性化推荐。执行和反馈用到了语音合成,如何有情感的声音,带有个性化的声音是我们现在在研究的范围。智能电声,研究怎么样出的声音能够自动根据周围房间的布局、房间的大小、房间别的家居物质不同自动的进行适应发出更好的效果,其实这都是属于执行和反馈环节。

AI算法的三大流派

前面说到了很多的AI算法,可以把它分成三大流派:经验主义、连接主义、符号主义。经验主义在机器学习、统计主义比较多。连接主义大家很熟悉了,神经网络,深度学习。符号主义是逻辑、知识、知识图谱。其实这些方法没有好坏之分,它们各有特色,在我们自己的智能音箱里面,比如说在我们语义理解的环节,这三个方法全部都用了,同时在用,其实没有什么好坏之分。

除了刚才前面说到的四个环节以外,其实还要提一些别的智能。比如说安全智能,最近国家也在提要注重互联网产品的安全,其实智能音箱作为互联网产品它也是有安全的问题,而且现在我们也碰到了。所以说我们有专门的安全小组,每天都在检查我们的音箱安全是否会被黑客攻破。比如说安全涉及到几个方面,设备和网络的安全,数据加密,我们的手机和音箱之间,音箱和网络云之间,甚至音箱和设备之间都有数据的加密。数据加密,智能音箱还是智能家居的入口,现在它有很多的不同的应用,对安全的要求是不同的,如果用智能音箱来购物涉及到支付对安全是最高的,如果只是拿来控制一个电视,安全性的要求不高,如果是来控制大门呢?它的要求就比较高了。所以说,这个时候我们要设定不同的安全等级,然后给予不同的测定。刚才说了音箱不是一个独立的产品,它是智能家居或者是生态的部分和入口。

以Alexa为例,现在应该是有8万多种应用,在它的应用商店里头可以供大家使用,有游戏、娱乐、信息查询。通过音箱来完成,和以往根据手机来完成给了用户不同的体验,给用户新的体验以后,让用户可以很完美的达到自己的要求,这是给我们提出了新的要求。

另外赋能,有很多的应用服务商能够提供大家很多服务,但是他的能力是有缺陷的。比如说天气预报,可以提供很多的信息给你,但是如何查询天气预报?需要自然语言理解的能力和IOP的能力,这时候我们给他赋能能力。

智能家居入口,现在有各种各样的智能家居平台,当然中国和美国智能家居大的环境是不一样的,各有特色,但是都有智能家居入口的需要。所以目前从我们的试验来说,用户的应用越来越多,对这个需求越来越强烈。

隐私保护,隐私保护的问题,其实以前不太重视,现在有很重要的一个问题。我们通过智能音箱可以查询很多信息,比如说银行的账号,我说银行里剩多少钱,这个时候钱数是通过银行的系统传到我的音箱。在这过程当中,银行知道你的余额,音箱播放出来也没问题,但是在中间过程当中,我们是中间的传递者,这个时候对我们来说信息是不应该让我知道的。如何能给用户、给银行保密?把信息保证它的安全?这是我们现在正在实现的一个方面。这些因素都应该考虑进来,让信息是透明,对于中间环节是不透明,不可知的。

开发者友好,这是我们生态要完成非常重要的一点,就是说要吸引越来越多的开发者,尤其是那些个人开发者,然后让它形成一个完整的生态。开发者越多,生态越完整,整个行业才能欣欣向荣。

这里面就是我们自己的一个开放平台的大概介绍,这儿不用详细的介绍。这里面包括刚才前面提到的安全管理、赋能、开发者界面这些都有了,现在我们已经大概有700多个个人开发者在里面开发。

智能的未来

最后,我介绍一下下一代(产品)和思考。现在智能音箱大概的形式已经知道了,外表上跟传统的差不多。下一代智能音箱会是什么样的?下面列了一张图,今年刚刚在CES合作推出的一款产品,我们认为是下一代的智能音箱。首先是带了屏幕,会支撑新的应用,比如说视频通话、视频点播,而且会用到新的技术,比如说人脸识别和AR、VR,现在也在上面运行,然后它会有一些新的体验。既然带了屏,也就意味着音频和视频同时支持,这时候给用户带来新的体验同时,也给我们带来了新的挑眼。如何在视频和音频同时支撑的情况下,能够让用户得到无缝的体验。

所以说,我们觉得未来的展望是什么?智能音箱行业,第一是开放平台的发展,开放平台是智能音箱生态的一部分,开放平台是搭建整个智能生态,所以说开放平台的发展是未来肯定要做重点发展的一个事情。

还有是用户体验,刚刚前面提到了,尤其是带屏,带了有视频交互以后,怎么样视频和音频之间能够完美的结合在一起,这其实给我们提出了很大的考验。最近和大学和一些企业都在合作,一起来做用户体验。以及多种技术的融合,大家知道生物识别现在用的比较多,声纹识别,人脸识别都在用,如何把这两个结合起来?而且结合起来以后可能是谁的权重更大,在于不同的环境下面权重是不一样的,这融合起来也是我们要研究的一个话题。然后是个性化服务,大家都知道现在用户的需求越来越高,都有个性化的需求,尤其是今年要开始尝试一些收费的服务。

如果没有个性化用户是不买账的,刚刚前面也提到的个性化服务就需要用户的画像,对AI的要求也会越来越高。低成本的解决方案,我们和AR、VR不一样是智能硬件的领域,所以就意味着有成本的问题。用户当然是希望越便宜越好,如果保证在低成本下实现方案也是目前我们的挑战。最后是帮助传统行业的升级换代,这也是我们现在正在做的。

举两个现在正在做的例子。第一是帮助了传统的音箱行业,像现在已经做的和索尼合作,他们是做传统音箱的,把他们的传播音箱改造成智能音箱,这是一个例子。第二最近和康佳电视合作,现在很多的电视用智能电视,用过的人都有体会,查几千上万个台很困难就是用摇控器,我们的音箱和他们合作起来用语音迅速查找内容,这是强需求。所以说通过这个我们的合作能帮助传统的行业、传统的产品提高用户的体验,这也是未来我们会做的一些事情。

赞赏

长按二维码向我转账

受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。

小编温馨提示:前方高能,《灵隆科技汤跃忠:人工智能帮助传统行业升级换代》需要您认真观看!

正文开始: