打下|阿里云打下AI地基,更多的开发者走向了前台

很长时间没与星瞳(谢宣松)打交道了,之前他的身份一直在变。从早期的图像搜索拍立淘创始成员,到业内第一个智能设计产品鹿班的技术负责人,再到后面研究医疗AI的技术负责人。这些前沿技术的探索和应用经历,让他看起来像一个连续创新创业者。
现在,星瞳又多了一个新身份——阿里云视觉智能开放平台负责人。过去一年多的埋头苦干,他和伙伴们完成了平台从0到1的搭建,并上线了超过150个API接口。
星瞳并不是个例。包括现在视觉智能开放平台的团队成员也有类似的背景和经历。当外界还在种种猜测阿里AI专家们在做什么样的探索时,他们早已拓展了新的边界——不仅做前沿的智能技术探索,也要打造开发视觉开放平台这样的产品,将人工智能变成人人可及的普惠科技。
这也导向了另一种商业故事剧本。越来越多的算法专家走向幕后,将原有技术能力整合成开放平台,让更多有创意的人只需要少许的技术基础,就有可能开发出有价值的AI应用。
阿里云视觉智能开放平台源起
2016年,AlphaGo 大胜李世石。人工智能浪潮席卷全球,成为“高大上”IT技术的代名词。每一家知名AI公司的背后,都有不少“AI业界大牛”坐镇。AI人才资源被巨头争抢的话题向来被大家津津乐道。行业的火爆,人才的稀缺,每一位AI大牛的动向都引得圈内格外关注。挖角抢人大战不断,不仅将这个行业的薪资抬到八位数年薪,也不断抬高了AI应用的门槛。
AI概念很热,但一谈应用AI就容易冷场。居高不下的应用成本,制约着人工智能技术的普及与规模化应用落地。从各种强行与AI沾亲带故到谈AI色变,也只用了短短三年。
星瞳身在行业,也感受到了这种变化。与2015年相比,人工智能产业快速发展,广泛应用于政府、金融、医疗、交通、零售、工业、制造等领域。有数据显示,到2020年市场规模或达到710亿元,同比增长大约44.5%。作为人工智能领域的三要素之一,算力成本也在大幅下降,从2014年到2020年,芯片价格对比下降了近70%,为人工智能技术能够在这十年内快速发展最终商用提供了土壤。 此时,放眼行业,对于小公司来说,搭建顶级技术团队,推出操作系统级别的内部通用平台,从0到1完成整套AI应用的开发,这样的AI故事已经不再动听。反而是利用AI技术,改造传统行业或者应用、提升产业效率的需求不断涌现。这也意味着推出AI的智能开放平台市场需求逐渐成熟。
另一面,整个阿里巴巴集团有大量研发人员围绕着视觉技术在电子商务、城市大脑、金融支付、交通物流、通信会议、新零售、文娱等多个行业的应用需求,对外贡献了许多产品和解决方案,这其中沉淀了诸多视觉基础能力。同时,阿里巴巴的许多内部业务,如淘宝、天猫、优酷等诸多明星产品都有视觉能力在背后的支持有着海量的用户规模,对这些视觉智能技术能力进行了千锤百炼。但早期,这些基础视觉技术并没有被聚合在一起。
于是,建设阿里云视觉智能开放平台的想法应运而生。2019年8月,在阿里巴巴集团视觉技术小组的牵头下,开放平台作为一个重点战役开始启动,这一计划也得到了包括阿里巴巴副总裁、达摩院城市大脑实验室负责人华先胜等上层支持,这也与星瞳一直以来的判断不谋而合。
星瞳牵头启动项目后,就迅速得到了包括淘系、优酷、蚂蚁在内的20多个有计算机视觉经验的项目团队的支持。
经过一个季度的研发,2019年12月20日,第一版视觉智能开放平台正式上线。在星瞳的规划里,平台定位是视觉AI能力开放中心和能力再生产中心,也可以看成一个视觉智能核心零部件的供给库。这些零件有自营的,即阿里巴巴团队自己研发的;也有第三方供应商的,即生态伙伴或者其他相关方提供的。其次,开放平台也是一个效率工具,有着大量的场景案例,可以帮助开发人员更高效开发落地产品。开放平台是双向的,内部和外部都可以使用,对外主要面向视觉智能技术的开发与应用用户,为其提供好用、易用、普惠的视觉智能API服务,帮助企业、开发者快速建立视觉智能技术的应用能力。
达到这样的规划并不容易。一方面,当团队希望更短的时间内上线更多能力时,需要调动其他业务同事的支持。这里不仅既涉及到基础设施、文档案例、各种测试等基础工作,也需要进行市场的调研,结合场景和市场需求进行产品化,开发工程量非常大。
另一方面,当机器视觉的能力来自各个地方,首先需要验证这些API是否能够达到作为公共能力的要求。为此,平台制定了专门的算法接入规范,其中既包括了视觉能力的分类规范,同时为了保证上线API的质量,也设置了评测机制,会对API的各种性能进行评测,只有达到一定的标准才能上线。事实上,研发期间,也有多个团队开发的API,就因为在性能、封装等方面不达标,被拒绝上线。