腾讯AI Lab科学家内部讲座:技术将如何变革传媒业

《腾讯AI Lab科学家内部讲座:技术将如何变革传媒业》的文章是傻大方资讯网小编转载于网络,如有侵权请联系删除。

12月22日,第一期「全媒对话」顺利开展。「全媒对话」由腾讯学院与全媒派合办,每月进行一次聚焦内容行业的对谈。

第一期主题为“多媒体AI:技术实现和行业影响”,请来的主讲嘉宾是腾讯AI Lab计算机视觉中心负责人刘威博士,同时我们还请来了腾讯新闻OMG资讯运营部副总经理王永治老师,担任对话嘉宾,与刘威博士围绕AI与传媒业展开一系列探讨。

腾讯在多媒体AI方面的探索已覆盖图像和视频的处理、识别、理解等多个领域,而AI具体对内容产品产生了何种影响,未来又会向什么方向发展?这场讲座能够揭示一些答案。仅限于腾讯内部的高峰对话,全媒派为你揭秘。

“打造机器之眼”

刘威博士与腾讯AI Lab

腾讯AI Lab成立于2016年,专注于机器学习、计算机视觉、语音识别、自然语言处理等人工智能基础研究,同时在内容、社交、游戏和平台工具型AI四个方面进行研发与应用合作。

腾讯AI Lab科学家内部讲座:技术将如何变革传媒业

而本次主讲嘉宾,担任腾讯AI Lab计算机视觉中心负责人、负责图像视频数据相关AI研究的刘威博士,是世界计算机视觉方向的领军人物之一。在之前“2017腾讯媒体+峰会”中,他也带来了专业而精彩的分享,从计算机视觉方向,来拆解人工智能重塑的资讯星球新版图。

腾讯AI Lab科学家内部讲座:技术将如何变革传媒业

始终站在行业前沿的“打造机器之眼”的科学家,在讲座中都提出了哪些洞见?

十八般武艺,玩转计算机视觉

在会上,刘威博士大方分享了团队正在进行的各项“黑科技”研发。从图片到视频,从人像到环境,AI Lab在计算机视觉领域已经创造出亮眼的成绩,未来在这里,触手可及。

人脸超分辨率&跨年龄识别

AI Lab最近成功研发的人脸超分辨率项目,可以将人脸长度、宽度成倍数放大,提升分辨率。“例如一张人脸本来是80*20的分辨率,我们把80和20各放大8倍,20放大到160,80放大到640。”从技术层面来说,已经完全可以保证放大得出的人脸图像可以满足感观需求。

人脸检测

通过构建全新的安防网络,图像中非常小的脸都可以检测出来。该技术的应用,可以极大地发挥出人脸检测的功能,目前已接入腾讯互联网+公共服务平台等多个应用场景,每日技术调用量超六亿次,未来有望更广泛应用到政务、金融、安防等多个领域。结合人脸超分辨率,我们可以把检测的人脸进一步放大,后续使用人工或者机器算法进行后续的辨别。

#人脸检测视频



腾讯AI Lab科学家内部讲座:技术将如何变革传媒业

图像描述生成

图片如何产生文字以描述其所代表的语义内容?AI Lab大开脑洞,将这一图像到文本的转换做得高端又有趣。团队即将推出“把照片唱给你听”活动,结合了图像描述生成技术(image captioning)和文本转语音(text to speech)的AI技术。用户上传照片,AI会识别照片内容、生成相关的文字描述并匹配歌词,再通过合成语音配合旋律唱出来。

#“把照片唱给你听”