按关键词阅读: 阿里巴巴 算法 机器学习
漆远当时一心想做学术、当老师 , 说了谢谢 , 拒绝了邀请 。
第二年谷歌在纳斯达克上市 , 市值迅速上涨超过230亿美元 , 许多谷歌的雇员瞬间成为亿万富翁 。 拉里·佩奇作为创始人名声鼎盛 , 不知道漆远当年有多少感慨 。
但他当时还是坚持着自己的人生规划 。 他从麻省理工又跑去了剑桥的微软实验室 。 在剑桥他遇到了Chris Bishop , 还帮他审了几章书 , 名字被写入了前言的致谢 。
这本书叫《模式识别与机器学习》 , 后来成了国际上机器学习的经典课本 。
剑桥的实习结束 , 漆远去了伦敦城市大学的盖茨比中心待了3个月 。 日后名声大
那时候Facebook还在大学里推广的时候 , 漆远许多同学就陆续去了这家还在起步的交友网站 , Facebook也向他递来了橄榄枝 。
而他则专注在机器学习领域的研究 。 机器学习和可穿戴计算结合用于分析学生学习专注度和司机开车注意力;分析大脑图像数据 , 基于小数据建立大脑皮层沟回发育模型;把大规模机器学习用于解码人类基因调控网络......
在人工智能还算冷门学科的时候 , 他已经是这方面的专家 。
他在2008年开始研究使用如今大热门的GPU来加速机器学习算法 , 并探索分布式大规模机器学习 , 拿下了美国科学基金NSF Career奖和微软的牛顿研究突破奖 。
他的学术生涯可以说是如鱼得水 。 象牙塔里的学者 , 31 岁麻省理工大学博士毕业 , 39 岁成为一流大学终身教授 , 在美国拥有自己的实验室和独栋别墅 , 学术成就斐然......朋友都以为他要把终生贡献在学术和教职上了 , 结果他突然决定回国了 。
“因为它是一家非常独特的公司 , 不是复制美国的模式 , 完全是一个崭新的模式 。 这家公司所面对的问题规模和复杂度 , 是很多公司都没有的 。 ”
初春阿里的饼画
2014年中国互联网市场还处在模式创新的初级阶段 。 王坚为了拓宽“电商公司”的想象边界 , 要让这家以商业利益为本的企业 , 打造出一所技术驱动的研究院 。
这在国内算是破天荒头一遭 , 没有任何成功的营运模式可以参考 。
漆远接到的第一个任务是为阿里打造一套大规模机器学习平台 。
需要落地到淘宝的广告平台阿里妈妈 。 项目刚启动时 , 阿里现有的存储数据却都不符合实验要求 。 他手上只拿到14 天的数据 , 2000万特征 。 这在机器学习领域 , 算是极小的数据量 , 项目至少要等待半年 , 积累足够的数据量才可能启动 。
与此同时 , 供给他手头项目的服务器数量也严重不足 。
他提交了一份申请书 , 计划拿到数千台服务器 。
符合需求的一块英伟达的计算卡 , 最少要价 2000 美金 。 几千台服务网即使对整个阿里来说都不是个小数目 。 他等了半年 , 都没能拿到自己要的GPU 集群 。
甚至还惹得阿里老员工们一顿抱怨 。 人家不信论文 , 只看实打实的业务水平 。 他们不相信漆远可以拿出更高效算法 。
而漆远团队被困在一个悖论里 , 没有 GPU 集群 , 就证明不了自己的算法和技术高效 。 但如果不能证明自己的算法和技术高效 , 就没有办法争取到 GPU 集群 。
“同事们认为 , 你们这帮教授老师过来 , 基本不懂业务 , 也不懂技术 。 ”
漆远和高层僵持了半年 , “团队一度走在解散的边缘” 。 终于拿到了足够的资源 , 启动分布式机器学习平台 。
为了这个难得争取到的机会 , 全团队都放弃了年假和春节 , 终于在第二年双十一 , 首次实现了淘宝、天猫的个性化推荐 。
俗称“千人千面”的算法应用 , 让手机淘宝在移动端站稳脚跟 , 也让蒋凡和张勇在阿里内部的地位急速上升 。 这是后话 , 不表 。
漆远团队包揽了这一年阿里巴巴集团算法大奖16 项奖中的 6 项 。 漆远成为达摩院金融智能方向的负责人 。
寒潮
但随着AI的风越吹越热烈 , 曾经高在云端的大厂技术 , 慢慢露出了自己的短板 。 海内外一度掀起热潮 , 一批大学知名教授先后跳槽到互联网大厂 。
在行情好的时候 , 科学家的加入自然是锦上添花 。 从PR宣传 , 到兜售方案 , 大牛们的背书让品牌愈加金光闪闪 。
只是这个投入产出比 , 让逐利的资本发现 , 这笔买卖已经没有当年划算 。
科学家们拿着大笔预算做研究 , 同样背负CPI或者OKR的压力 。 美化数据的方法千千万 , 实际应用的效果见真章 。
稿源:(未知)
【傻大方】网址:/c/11209CN02021.html
标题:阿里巴巴|凛冬将至!阿里技术大牛出走,这个行业要有新动荡( 二 )