镜像翻转|图片翻转,没那么简单
文章插图
今年秋天,林之秋从康奈尔大学毕业,开启了自己的博士之路。
文章插图
图片进行镜像翻转后,相当于得到了双倍数据。
在2020CVPR(国际计算机视觉与模式识别会议)上,来自美国康奈尔大学四年级的中国留学生林之秋以第一作者身份提交的“Visual Chirality”(视觉手性)论文荣获大会最高级别荣誉“最佳论文”的提名,在全球科学界精英提交的6424篇论文中,仅有26篇获得最佳论文提名,占0.4%,林之秋是本次大会唯一一个还在本科阶段的获奖者,也是年龄最小的第一作者。
识别“AI换脸”
手性的定义为“一个物体无法与其镜像相重合”,这种不对称性在自然界中广泛存在,并应用于不同领域。
神经网络训练需要大量标注数据,但数据总是有限的。为了用有限的标注数据来拟合函数,人们使用数据增强的方法来低成本地获得更多标记数据。而镜像翻转是最常用的图像数据增强方法之一,只需将所有图片都进行一次镜像翻转,就相当于免费得到了双倍数据。
但事情当然没有这么简单。当翻转了数据集里的所有图片时,神经网络所拟合的函数还能代表原先的图像分布吗?林之秋以第一作者身份提交的这篇论文,讨论的正是这一问题。
神经网络可以通过自监督训练的方法,在判断图像翻转的任务上达到非常高的精度,并能指出图片中哪些区域可以被用于识别镜像翻转。
通过最新的神经网络技术与严谨的数学证明,康奈尔团队发现了数字图像中一些人眼难以识别的微小对称性,从最简单的图片镜像翻转出发,重新探讨了神经网络训练下数据增强和图片防伪的意义。“我们这项工作对于普通人来说意义不是特别大,因为这是一项人工智能中比较基础和理论的研究。但对于前沿学术界来说意义很大,这或许也是这项工作最终能获得最佳论文提名的原因。”林之秋说。
识别镜像翻转,为图像防伪提供了技术应用空间,比如AI换脸。林之秋说:“网络上的一些AI换脸、或者之前被人恶搞的外国政要换脸,尽管所生成的图像对于人眼来说非常逼真,但我们的工作证明了,这类换脸技术可能会破坏数字图像固有的对称性模式,因此能被计算机准确监测和识别出来。”
科研填满生活
2016年,在美国纽约州伊萨卡小镇,群山包围之中,17岁的林之秋在康奈尔大学开启了自己的科研生涯。
康奈尔课业繁重,竞争压力很大。在高中阶段提前自学完课程后,林之秋跳过了大一、大二的基础课,并在两年内修完了数学和计算机两个专业的学分。这为他大三全力投入科研腾出了时间。
大学第一年所选的5门高年级课程全部拿到A+,多元微积分、线性代数、人工智能、高等抽象代数等多项专业课第一名,这是林之秋交出的成绩单。
学业之外,他很喜欢帮教授做一些专业课助教的工作。帮忙代课、设计课程,每周花几个小时为同学解答问题。在林之秋看来,这些经历对他个人学业的提升也有帮助,可以让他学到如何把知识化繁为简,再深入浅出地分享给大家。
到了大三,林之秋已经当上了机器学习高阶课程的助教,给博士生的期末试卷打分。大学毕业时,他凭借GPA总分4.2,在学院数千名学生中名列前三,被授予学院最高荣誉,并代表学院在毕业典礼上举旗。
他还同几名美国同学一起,创办了康奈尔历史上第一个面向本科生的研究人工智能的社团,组织大家每周一起研读最新的学术论文,一起做些研究。这个社团还幸运地拿到了脸书人工智能实验室4万美元的赞助,支持他们从事神经网络研究。
做科研的忙碌,意味着不得不牺牲生活闲暇。林之秋在中学时就爱拳击,利用业余时间练过4年,还在“北京市青少年拳击比赛”中获得过67公斤级的亚军。如今,他基本没有时间再进拳击房,不仅没有时间重拾爱好,甚至有一次还因为赶会议,两周时间里每天坐在电脑前近20小时而犯了腰病,不得不去校医院做康复训练。出于对科研的兴趣与热爱,这一切从未让他觉得辛苦。
前路道阻且长
2013年,当时已从谷歌离职,回国加入腾讯的著名计算机科学家吴军在中关村举办了一次关于计算机未来应用的讲座。林之秋早早地占好了前排的位子,那时他刚上高一,这场讲座让他对计算机人工智能产生了兴趣。
【 镜像翻转|图片翻转,没那么简单】“讲座中提到了摩尔定律,讲到计算机的飞速发展会对人类文明所产生的深远影响,比如互联网大数据、医疗影像、机器人等。”出于对技术的憧憬,林之秋开始通过慕课等线上教育平台,提前自学微积分、数据结构与算法等大学计算机的基础课程。
- 亚马逊|当物联网遇到元宇宙
- 芯片|谁能救滴滴?
- 联想|成也算计,败也算计
- 数码|快速提升权重14天BD玩法
- excel|Excel超级好用的图片批量表格对齐技巧
- 高通骁龙|双12骁龙870机型推荐
- 显卡|显卡和处理器如何组合?
- 东南亚|虾皮引流,七个引流秘诀
- 5G|全球“港机之王”竟这样用5G!
- GPU|python装饰器一篇看懂