分析1400家公司后发现:数据工程师比数据科学家更受欢迎


分析1400家公司后发现:数据工程师比数据科学家更受欢迎
文章图片
作者|MihailEric
编译|Don
MihailEric , 亚马逊AlexaAI机器学习科学家 , 斯坦福大学计算机科学硕士 , 曾担任斯坦福大学自然语言处理(NLP)研究助理 。
近些年来 , 我都在数据科学和机器学习人力市场的风口浪尖进行研究 , 我尝试用我的研究回答一些问题 , 就是市场上到底需要什么样的数据科学相关人才 。
通过分析Y-Combinator发布的2012年来各家公司数据相关工作岗位的招聘信息(大约1400家公司) , 我发现在各大公司的招聘需求中 , 数据工程师的需求量要远远大于数据科学家的需求量 。
数据是人工智能之本 。 数据源于生活 , 我们的举手投足都能映射成一段段奇妙的样本 , 它会随着人们生活的继续和传感器的采集而不断增加 。 海量的数据让机器越来越理解人类 , 认识万物 。 在过去的5到10年间 , 数据的巨量增加让这种现象愈发明显 , 也正因为此 , 数据科学领域吸引了大量的科学家和小白投身其中 , 尝试这种由海量数据带来的''禁果'' 。
那就不禁让我们好奇了 , 如今随着大量科研和开发人员涌入数据科学应聘市场 , 数据科学相关岗位的招聘需求行情如何呢?
为了不耽误各位童鞋宝贵的时间 , 我们简练滴总结了最终的结论:
一句话总结:在各大公司的招聘中 , 数据工程领域的岗位需求比数据科学高出了70%!因此 , 各位童鞋和老师请注意 , 我们在教育或者成为下一代的数据科学相关从业者的漫漫长征路上 , 不要一味的追求学术成就 , 更要注重培养工程技能 。
作为一名数据科学教育平台的开发者 , 我十分关注学员们的就业情况 。 同样的 , 我也深刻思考了数据驱动相关领域(也就是数据科学和机器学习)的人力需求是如何演化的 。
我曾经和数十位数据分析领域的从业者进行了深入交流 , 其中不乏世界顶尖院校的高材生 。 在交流的过程中我逐渐产生了一个巨大的疑惑 , 就是到底什么技能才能给我们的从业者''镀金''?哪些技能会让我们的学员在愈来愈多的相关从业者中脱颖而出 , 从而为自己步入职场做好重要的准备 。
那到底需要哪些职业数据科学相关的技能呢?我觉得只要和以下关键词沾边即可:机器学习建模 , 可视化 , 数据清洗和处理(即SQL争用) , 工程和生产部署 。
那作为一个初次接触数据科学的小白同学来说 , 有什么入门的学习课程和学习路径推荐吗?
数据胜于雄辩 , 讲了半天的大道理可能都不如一篇朴实无华的数据分析更有说服力 。 所以我对Y-Combinator自2012年以来的每家公司招聘的数据科学相关招聘需求进行了分析和统计 , 力求回答如下的问题:
大公司们聘用的数据科学相关从业者人员大多是去干什么的?
我们经常谈论的传统数据科学家到底受不受市场欢迎呢?
如今来说 , 那些开启了数据科学革命的技能之间是否相关呢?
如果你对这些问题感兴趣的话 , 请往下读吧:
1调研方法
YC投资组合公司是一家以数据为本的公司 , 他们号称是''将数据作为公司的价值主张'' , 听起来很靠谱 , 所以我选择使用他们的统计数据作为数据支撑 。
YC公司除了价值观和旗号打的响 , 他们还额外提供了一个用起来很方便的搜索目录 , 里面都是他们收录的公司数据 , 查找起来十分方便 。

分析1400家公司后发现:数据工程师比数据科学家更受欢迎
文章图片
此外 , YC还是一个特别具有前瞻性思维的孵化器 , 十多年来一直在为来自世界各地的公司提供跨领域的孵化资金 , 成功扶持了不少新兴企业 。 我觉得他们能够慧眼识珠 , 起码不至于将一些外强中干的皮包公司收录其中 。 他们起码能提供一个具有代表性的样本集合来支撑我们的分析 。
为了收集数据 , 我搜集了自2012年来的每家公司的YC网页网址 , 目前统计了大概1400多家公司的数据 。
有的同学可能会问 , 为啥是统计2012年来的数据呢?哈哈 , 因为2012年是AlexNet在ImageNet比赛中大放异彩的一年 。 自那之后无数的数据分析公司受到了AlexNet的启发和感召 , 如雨后春笋一般疯狂的成立 。 换句话说 , 2012年后 , AlexNet催生了一些最早的数据科学大公司 。
在这些最开始的大公司中 , 我使用关键词过滤来减少那些无关的样本干扰 。 主要来说 , 我只考虑那些用如下关键词描述的公司:包括AI,CV,NLP,自然语言处理 , 计算机视觉 , 人工智能 , 机器 , ML , 数据 。 我也忽略了那些官网无法访问的公司 。