【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

2017 年 11 月 8 日,在北京国家会议中心举办的 AI WORLD 2017 世界人工智能大会开放售票!早鸟票 5 折 抢票倒计时 7 天开抢。还记得去年一票难求的AI WORLD 2016盛况吗?今年,我们邀请了冷扑大师”之父 Tuomas 亲临现场,且谷歌、微软、亚马逊、BAT、讯飞、京东和华为等企业重量级嘉宾均已确认出席。

AI WORLD 2017 世界人工智能大会“AI 奥斯卡”AI Top 10 年度人物、 AI Top10 巨星企业、AI Top10 新星企业、AI Top 10 创投机构、AI 创新产品五个奖项全部开放投票。谁能问鼎?你来决定。

关于大会,请关注新智元微信公众号或访问活动行页面:http://www.huodongxing.com/event/2405852054900?td=4231978320026了解更多

1新智元编译  

来源:Forbes

作者:Hovhannes Avoyan

编译:常佩琦

【新智元导读】移动AI,尤其是智能手机上的计算机视觉应用,已经成为人们生活中重要的一部分。本文将会从最新趋势、未来机会、用户将如何使用手机上的AI等方面进行分析。本人作者是PicsArt的联合创始人兼首席执行官。PicsArt是一家领先的社交照片编辑公司,每月有超过9000万活跃用户。

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

毫无疑问,人工智能和机器学习是近来最热门的话题。大数据和强有力的GPU使得人工智能为几乎所有行业提供动力。现在,AI甚至可以放在手机一类的设备上。移动AI,尤其是计算机视觉,已经成为人们生活中重要的一部分。本文将会从最新趋势、未来机会、用户将如何使用手机上的AI等方面进行分析。

三个计算机视觉方面的应用正在兴起:图像识别、图像优化和图像生成。

图像识别:时尚、零售、设计、医疗……各行业的有趣应用

我们可以期待更多类似于Shazam的应用程序(Shazam 是一款可以识别您周围播放的音乐和电视节目的移动应用程序)。时尚、零售和室内设计等垂直领域能从处理图像的应用程序中受益。看到吸引你的东西时,你可以拍张照片,然后这种图像识别的软件就能帮助用户在线上商店里找到相同或类似的产品。举个其他例子,如果你喜欢某人的外表,你可以给那人拍照,用软件查询在哪里能买到类似的衣服和首饰。

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

例如,Pinterest最近推出了其镜头工具,用户将手机摄像头对准一个物体,在Pinterest就能查到相同或类似的产品。Houzz是一家家居装饰公司,他们提供视觉匹配服务,帮助用户找到喜欢的图片中的物品。The Flow用户通过相机就能识别在亚马逊销售的产品并获得有关的信息,包括物品描述、评论、视频/音频片段。

在医疗领域,尤其是皮肤病检测,图像识别也很重要。用户可以拍摄照片,获得初步诊断。斯坦福大学的研究人员开发了可以发现皮肤癌的算法。根据结果,其诊断皮肤癌的效率与专业医生相当。该算法并未投入生产,仍有商业机会。我们也期待医疗保健app的出现,特别是x射线诊断和超声诊断,以及可以通过图片诊断糖尿病患者不能吃哪些食物。微软、谷歌、亚马逊提供的云服务消除了开发人员将计算机视觉应用生产的障碍。

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

我自己的公司,PicsArt,提供自动标记和搜索服务,可以分类用户提交的照片。用户每月上传超过2亿张图像到我们的服务器,我们每天收集20亿次用户活动。这使我们能够大量收集图像编辑历史,并将产品开发成具有用户体验个性化的智能编辑器。 例如,平台会向建议用户与他们曾下载过照片类似的图片,来帮助他们发现更多相关照片。

计算机视觉的一个分支是光学字符识别(OCR),可以理解图像中的文本,并将识别的词提取为机器编码的文本流。 这适用于各种领域,包括视觉信用卡扫描和银行支票存款。 ABBYY是市场上最准确的OCR引擎之一,并且具有开发更专业的文本和表单扫描器(例如,在医疗保健,银行,零售服务等)的巨大潜力。

图像识别领域还有一个重要的部分是图形分割,应用程序不仅能定位图片中的特定物体,还能识别该物体的界限。这对面孔识别、背景移除、制作贴纸都很有用。

图像美化

图像美化是另一个值得注意的领域,包括风格改变和图像美化。这方面已经有了很多出色的应用。

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

此外,我们还可以期待一些新产品的出现,比如美妆品牌能通过App在人脸上实现化妆效果,或者用户可以通过App看到他们接受整容手术后的效果。(FaceApp正在朝这个方向发展。)

图像生成:更多创意应用

第三个区域是图像生成,涉及使用脚本生成动画视频或草图。 这可以应用于娱乐行业,当它从静止图像(例如哈利波特动画图片)创建电影,漫画或视频或从图像切割以创建贴纸(超分辨率功能,允许用户放大小的物体,从照片中删除而不失去其质量)。 

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

例如新智元此前介绍的AI“文森特”,能够将用户在平板上画的简笔画几乎实时地转换为古典大师风格画作。

还有Google的AutoDraw,一个自动绘图机器人,分析用户的涂鸦,并提出更多抛光的剪贴画替代它们。

AR和VR技术将探索图像生成 ,将真实对象与生成的图像混合,以产生与现实世界的另一层交互,或显示对现实世界对象的掌控,如给建筑物上标记附加信息。

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘

苹果的ARKit

根据美国商业媒体Business Insider,今年人们会拍1.2万亿的数码照片。随着移动设备功能越来越强大,计算机视觉模型越来越小,这些丰富的产出正在给商业带来巨大变化。对新老企业来说,迅速适应变化非常重要。机会是无限的,使用移动AI没有天花板。

原文:http://www.forbes.com/sites/forbestechcouncil/2017/09/27/what-can-computer-vision-do-in-the-palm-of-your-hand/2/#1f2983a54ba5

【扫一扫或点击阅读原文抢购五折“早鸟票”】

AI WORLD 2017 世界人工智能大会购票二维码: 

【掌上计算机视觉大有可为】智能终端图像识别、美化、生成应用盘