打下|阿里云打下AI地基,更多的开发者走向了前台( 二 )


在团队的共同的努力下,这一平台也不断迭代更新。2020年4月上线第二版。截止今年9月,已经有共计150多个视觉相关API进行上线,并很快得到开发者青睐,日调用量迅猛提升。
阿里云特色的视觉智能开放平台
阿里云推出视觉智能开放平台时,业界已有围绕第三方AI开放平台的讨论。打造阿里云特色的视觉智能开放平台就成了摆在大家面前的一道新议题。
星瞳和大家一起分析,视觉智能开放平台的初衷是辅助各个行业的开发者降本提效、助力创新。阿里云视觉智能开放平台的优势则在于:一是易用,依托阿里云智能坚实的基础设施服务,提供普惠易用标准的AI能力,用起来省心省力;二是专业,达摩院科学家及集团专业工程师加持;三是实用,上线的视觉技术是通过阿里巴巴海量场景和最佳案例检验的;四是全面,平台集合了规模化、多样化、场景化的视觉AI能力,为开发者和用户提供一站式能力选择。
开放平台既要在视觉基本面(识别、检测、分割、生成等)通过达摩院等打造核心基础能力,又要在目标应用基本面(文字、商品、内容、行业场景等)中做最佳案例,不断为用户提供多种视觉AI原子能力,包括:图像识别、文字识别、视频理解等多种视觉基础技术。开放平台将阿里巴巴视觉智能技术实践经验开放给视觉应用的开发者与用户,让他们可以在阿里云视觉平台上选择相关能力,自行封装产品、服务或者是解决方案,满足自身或者最终用户的应用需求。目前阿里云视觉智能开放平台上大约有15大类、150个能力,聚焦在视觉理解、视觉生产等环节,提供“专业、多样、易用”的工具,助力创新,帮助开发者快速试错、低成本试错。这也在一定程度上实现了普惠科技的初衷。
除了满足技术上的生态覆盖面,公共云平台一大优势是规模化的性价比能力,希望在成本上做到尽量人人可用。在目前已经公开的产品中,平台采取了一些免费的策略。这些免费策略根据输出的“能力”的不同而不同,比如有的是根据用量,有的按QPS多少,平台都给予一定程度上的免费额度,基本能满足一些要求不高的用户。
当然,AI既要做普惠,也要考虑市场需求。基于视觉基本面,团队做了相关的分析,规划了“市场驱动能力”的研发过程,尽量优选“规模大能实用”的能力,比如与“理解”相关的能力具有明显的普适性和需求广泛性,并从视觉的需求面分析,寻找视觉最广泛的应用场景,比如视频在B 端、C端的应用,以及结合阿里的特色能力。最终两点交汇处的这些能力,诸如车辆检测、对象分割、OCR、商品识别等,也成为平台上的首批爆款API。
事实上,这一过程,也”变相回馈“了参与到平台建设上的团队,平台也成为了验证这些能力与产品的“试验田”。以往,很多算法工程师,往往不会去考虑匹配用户需求、真实场景考验,但API需要上线开放平台时,就意味着不能仅仅只从学术的角度、自己场景设想出发,去做研发,这也意味着一个市场驱动的研发机制形成。
当AI专家走向幕后,更多的开发者走向了前台
星瞳接受采访时提到,阿里云视觉智能开放平台上线的第一天就通过阿里云天池平台与开发者深度链接,彼此高质量互动。
2020年,作为国内主流的AI开发者社区,阿里云天池平台联合阿里云视觉智能开放平台,举办了一场以“无行业不AI”为主题AI开发者创新应用赛。期间,名为启明瞳行的团队,借助平台的能力,开发了一款为盲人出行保驾护航的产品。团队自研了适用于盲人的特殊旋转交互方式,借助GPS高德定位导航、视觉智能开放平台上的图像、文字、 颜色识别等算法,帮助盲人用户识别环境信息、路况信息、物体信息等,同时,依托由志愿者和肢体残疾人担任的视频客服人员进行补充,最终达到了为盲人出行保驾护航。
要实现盲人可用的产品,就意味着必须研发“万物识别”的计算机视觉技术。但开发能落地的AI技术应用,显然不是一件容易事,招到大牛不易、积累训练数据很难、优化算法耗时,技术门槛、资金门槛、算力门槛高,让人望而却步。对于擅长交互和用户体验的团队来说,并非易事。借助阿里云视觉智能开放平台,团队用时不到4个月就完成了原型Demo的开发。
这样的故事,在平台上还有很多。阿里云视觉智能开放平台通过提供高可用性、高可靠性的AI算法,大幅降低开发者的开发难度和开发周期,“低代码”即可创作AI应用。参赛团队闪电的主人の魔法屋,参赛成员为高中生,通过阿里云视觉智能开放平台的相关算法实现视频工具的开发。