Python遥遥领先——Kaggle 2017数据分析职业大总结!
源 | Kaggle 译 | 徐天宇
以下详细数据可点击文末阅读原文获取
谁在做数据分析?
可以通过很多种方式看一看谁在做数据分析工作,我们先从人口统计学和其它背景信息的角度来看一看。
年龄平均来看,调查反馈人员的年龄在30岁上下。不同的国家有一定的区别,比如印度的数据分析人员比澳大利亚的数据分析人员平均年轻9岁。
当我们用“使用代码来分析数据”作为工作内容来定义“数据科学家”的时候。我们发现有很多的工作名称都叫数据科学。比如,在伊朗和马来西亚,做数据科学工作最受欢迎的工作名称叫做“科学家或研究人员”。
虽然从我们的调查中来看“薪酬和福利”比“职业发展机会”要稍微不重要一点。我们仍然有必要看一看合理的薪酬是怎么样的。在美国,平均来看机器学习工程师的薪资是最高的。
学历背景
你需要再拿一个学位吗?总的来说,数据科学领域工作的人,占比最高的是有硕士学位的。但是在最高薪资区间($150K-$200K以及$200K+)的,更倾向于有博士学位。
典型的受访者是一个30岁,有硕士学位,工作名叫数据科学家,并且月收入$55000的人。但是每个人都不是典型的人,这些人口统计角度的数据给出的是关于Kaggle数据科学社区活跃的人在年龄、性别、国别、工作名称、薪资、工作经验和教育背景的分布情况。
数据科学家在工作的时候做什么?
我们将数据科学家定义为“写代码来分析数据的人”。我们询问了这些人,它们每天主要干点什么事情。下面是我们得到的回答。
工作的时候用什么数据科学的方法除了军事和安全领域,神经网络是最常用的方法外,其它各行各业,逻辑回归是最常用的数据科学方法。
工作的时候用什么工具
Python是最常用的数据分析工具,而对于统计学家来说依然钟情于R。
除了学术界和军事与安全领域,文本数据是最常用的数据之外,其它各行各业关系型数据依旧是最常用的数据类型。
虽然大部分受访者通过Git共享数据,但是中小企业还是有一定差异。比如,大企业更少使用云,而倾向于使用像Email这样的文件共享软件。对于微型企业来说通过使用云共享代码会更加灵活。
脏数据。除了那些数据库工程师,总的来说,脏数据是数据科学领域工作的人遇到的最常见的问题。除了脏数据,公司政治、缺乏管理和财政支持都是数据科学家所面对的问题。
如果你点击过滤器,你可能会注意到各行各业的受访者都说在他们的组织中缺乏数据科学人才。这对于数据科学家新人来说是一个好消息。文章下面部分将介绍受访者是如何适应工作的。
新的数据科学家如何进入本领域
当你要开启一段新的职业生涯的时候,看一看别人是如何获得成功的会非常有帮助。我们访问了数据科学领域的工作者,让我们看看他们是如何做到的。
你会推荐新的数据科学家首先学习哪一种语言
每个数据科学家对于要先学哪一门语言都有自己的观点。从结果上看,只用一种语言的人,R也好Python也好,他们都倾向于他们自己所使用的语言。但是同时使用R和Python的人却大都推荐Python。
数据科学是一个快速变化的领域,有很多学习的方式可以让你提升自己,从而保持职场竞争力。那些已经在数据科学领域工作的人比刚进入领域的人更频繁的通过Stack Overflow Q&A,会议和Podcasts来学习。如果你是内容提供者或者开发开源软件的人,记住领域新人倾向于使用官方文档和观看YouTube视频来学习。
怎么找工作
当你在找工作的时候,很可能去公司网站或者专注于科技的招聘网站。但是根据已经在数据科学领域工作的人说上面的方式是最没有效果的几种。取而代之的是通过联系公司的招聘人员或者通过建立自己的网络来进入这个领域。
-END-
译者 | 徐天宇
上海船研所通信与信息系统研究生在读,正在学习嵌入式。主要兴趣:数据分析,体育运动。
后台回复 “志愿者”
了解如何加入我们
- 【重大改革】Python编程要纳入高考和小学教材!
- 重大改革:Python 语言将被加入高考科目,VB 惨被淘汰!
- 播报 | 瓜子二手车禁止“遥遥领先”,国产苹果X只卖7百!
- 用Python给数据分析穿上嫁衣,炫的不要不要的...
- 【北京】Python爬虫数据抓取实战开课啦
- TensorFlow神经网络教程
- 从小白到大神,一文掌握 Python 密集知识点
- 成交量遥遥领先就是霸主? 二手车电商到底该看什么?
- Python列表对象实现原理
- 为什么说瓜子证明不了自己“遥遥领先”?