45 个快速提升数据科学技能的方法
作者 | Kirill Eremenko
编译 | 夜风轻扬
在大数据时代,一名合格的数据科学家钱途广阔,如何能快速起步少走弯路呢,希望本文会对你有所启迪。
当询问领英群组成员:在成为成熟数据科学家过程中,面临的最大挑战是什么?得到最多的回答有:
不知道目标是什么
缺乏经验
无法形成网络
难以接触到真正有用的人
作为回应,笔者从SuperDataScience 播客嘉宾中收集了45种方法,希望能有所帮助。
开始起步
学习
1. 挤出时间
Kimberly Deas建议花费1年时间来学习数据科学中的必要技术,学习类似c++的脚本语言,以熟悉编程的语法和编程技巧。
2. 阅读!
播客的嘉宾推荐了很多书目,这里不能一一列出,只给出其中的几本:
The Signal and the Noise(信号与噪声), Nate Silver
Big Data: A Revolution That Will Transform How We Live, Work, and Think(大数据:将会改变我们生活,工作和思考的革命), Viktor Mayer-Sch?nberger and Kenneth Cukier
Moneyball: The Art of Winning an Unfair Game(点球成金:赢取一场不公平比赛的艺术), Michael Lewis
The Future of the Mind(思想的未来), Michio Kaku
Dataclysm(数据灾难), Christian Rudder
3. 采用多种学习方法
千篇一律的学习方法让人厌烦。采用在线课程?尝试订阅一份期刊。只阅读课本?为何不在上班的路上听听播客呢?还可以向行业里的老司机学习
练习4. 不要陷入理论中
像Emma Whyte那样,把所学的知识应用到实际生活中。
5. 利用EXCEL进行训练
对于初学者,Chris Dutton推荐使用EXCEL来掌握数据科学的基础,因为可以帮助你观察如何操作数据的。
6. 利用Python或R入门
这是我们大部分播客嘉宾的偏好。如果不知如何下手,Python 会因其用户友好的特性而成为初学者最好的选择。
7. 通过现实案例进行练习
Damian Mingle说:数据科学家必须将他们的知识应用到现实世界的数据集中。
8. 了解你自己的弱点
每周进行一下复习,找出可以改进的地方。
9. 构建自己的应用
即使它不会广泛应用:例如,为了在线购物,Paul Brown用Python编写了一个简单的程序,发现打折最给力的商家。
10. 练习向外行解释复杂问题
Greg Poppe说数据科学家必须能够和投资者交流观点,他们其中的很多人可能对这个领域一无所知(Caroline McColl 说在悉尼,与投资者交流通畅者会有额外$2万-3万的加薪)。
参与11. 加入对等导师项目
这是Daniel Whitenack推荐的。这些项目对于很多初学者规避22条军规,去结识“对的人”大有益处。
12. 获得隐秘导师
例如,发起一个讨论来听取他们对于你工作的想法。
13. 在线发布
这样可以向面试官展示你自己,并证明你的努力。
14. 充分利用社交媒体
Beau Walker建议向社区咨询解决问题的方法,而不只是阐明你的观点。
15. 帮助公民科学
正如Garth Zoller所说,回馈社会是有益的。很多公民科学项目需要志愿者。
16. 获取关注的重点
不要笼统的自我介绍,获得关注的最好方法,是解释为何要与对方进行交流。
17. 参与竞争
Eu Jin Lok说竞争会提高数据科学技能,并能提供施展这些技能的舞台。
准备申请
社会化
18. 培育自己的网络
David Tanaskovic说,首先需要构建一个熟悉者组成的人际网络,然后向外扩展这个网络。如果不知从哪开始,在线群组和 Data Science events是好的起点。
19. 保持社会化
如 Caroline McColl 所说,公司经常会在大型活动中推出新的技术-所以需要多参与这些活动。
20. 保持信息通畅
阅读有关数据科学的最新消息。它们不仅是访谈中的话题;而且会让你在行业中保持领先。
提升21. 管理好领英中的简历
Andy Kriebel 说猎头会一直关注领英-所以一定确保要照看好自己的数字足迹。
22. 写一份优秀的模板简历和求职信
Richard Downes建议要突出录取你的原因,以及你会给公司带来的收益。
23. 强调你的经验和教育
像Erika Dorland那样,考虑如何在面试中把“这些无关”主题转换为重点。
过滤24. 关注你的兴趣
并寻找与兴趣有关的工作。不要走那些顺途,尽管这是最安全的道路。Nadieh Bremer说,只有你充满热情,你才能保持领先。
25. 考虑大公司还是小公司
是的,有Tesla和SolarCity这样的大公司,但是也有很多可以给你展示才能的小公司。
26. 分析竞争
研究你向往公司所招员工的特点,找出和你才能相似之处。
准备 27. 准备相关的问题
类似于:“你如何定义一个数据科学家”和“公司其他数据科学家是如何投资他们的个人培训和发展的?”
28. 提到过去工作的经历…
并准备讨论这些经历。Nicholas Cepeda在其Tableau课程中提到,他就是这样获得了工作机会。
29. 面试中的技巧
Sam Flegal 建议找出公司使用的工具,并研究这些工具提供的数据。这样你会脱颖而出。
作为数据科学家进行工作
(再)发现30. 复习基础知识
Deepak Prasad说数据科学的基础知识应该扎实。
31. 在开始项目前要框定问题
对Garth Zoller来说,数据科学家最重要的技能是思考如何思考一个问题。在处理问题前要理清问题的相互关系及上下文。
32. 明白为什么要使用所选的工具
David Venturi说,采用特定的工具来解决某个问题的原因背后有很多学问,所以弄明白每一种工具的用途很重要。
33. 提升自己
Josh Coulson喜欢那些保持“一颗进去心”的员工-他们能一直不断的学习、寻求反馈以及改进现状。
适应34. 保持灵活性
Harpreet Singh说最好的数据科学家,是那些善于提出问题和假设的,而不是一头扎进项目的人。
35. 保持积极主动
Damian Mingle期望数据科学家能从业务问题中找出数据科学解决方法。这样做可以为公司创造未来。
36. 必有我师
良师可遇而不可求,所以不要害羞也不必挑剔:Paul Brown说他的一些导师只是些普通的经理,但是他们发现了他的潜能。
37. 要有大局观
并且自问你工作的价值。如果工作不能给公司带来价值和收入,那么要考虑采用其他的方法。Richard Hopkins相信经常会忽视如何在运行环境中利用数据。
38. 不要遗忘可视化工具
理解数据的形态会有助于分析。 Tableau对Megan Putney完成工作帮助很大,因为让她能够一眼就能找到所需的数据
39. 与对的人交流
Ruben Kogel与那些面临类似困难的人联系,在讨论中找到灵感,使他们能很快的发现最佳方案。
生产40. 会说故事
Vitaly Dolgov的导师建议他带着客户去旅行,首先描绘出问题,然后提供一个合理的方案。
41. 要有选择性
Harpreet Singh说,拥有领域的专业知识是至关重要的,这可以产生更大的影响。在职业生涯的这个阶段,需要足够的知识基础。
42. 创立在线课程(I)
YouTube是一个很好的网站,提供了一个进行试水的平台,而不像Udemy网站课程那样严谨。Geoffrey Hinton推荐观看Geoffrey Hinton关于神经网络开发的系列课程。
43. 创立在线课程(II)
当更有信心以后,可以到 Udemy网站看看有无对你主题的需求。然后规划你课程的内容,在网站上开设课程。
44. 从不直接获益处入手
谁知道将来哪些事会让你获利呢?
45. 成为一个咨询顾问
Jen Underwood说,拥有一家公司的好处是:可以把精力集中在催人奋进的项目上。
- 音乐桌面 2.0:音乐工作者如何提升生产力?
- 阿里自研分布式强一致关系型数据库——X-DB
- 如何挑选出优质基金,实现财富快速增值?
- 邬贺铨:卖设备不如做服务,做服务不如做互联网
- 12月15日台州房产交易数据.
- 皮蓬:詹姆斯荣誉虽不及乔丹 但数据已超越篮球之神
- 最权威的2017全球挖机产销数据!日本竟然生产了全球40%的挖机…
- 五连红,近期18中14,2017-12-15周五竞彩大数据分析
- 超级数据暴赚后,投资心态回归理智!
- 我国学科建设取得一批重要成果 整体水平大幅度提升