这份宝典火了,小哥学后加薪30W+
数据科学该怎么学?必备技能有哪些?
最近 , 一份数据科学领域的学习宝典在推特上火了 , 吸引点赞1k+ 。
文章图片
之所以能够引起大家的关注 , 是因为这份教程将数据科学广而杂的知识内容 , 梳理成了14个方面及各自要点 , 同时解答了许多学习中的常见疑问 。
比如“用什么语言比较好”、“哪些工具最适合” 。
这份学习宝典的作者为MattDancho , 他是一个数据科学学习网站的创始人 。
那么 , 具体这份干货到底讲了什么?是否真的如此神奇?
我们一起来看 。
更推荐R语言
进入正题之前 , 我们先来浅聊一下数据科学(DataScience) 。
数据科学是指通过挖掘数据、处理数据、分析数据 , 从而得到有用信息的技术和研究 , 再将这些信息应用到不同领域的各个方面 。
该学科结合了诸多领域中的理论和技术 , 包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算等 , 覆盖知识面非常广 。
文章图片
作者表示想要掌握这些技能 , 大概每周要投入10个小时来学习 。
那么在开始真正学习之前 , 先来看一个最关键的问题——
用什么语言?
文章图片
在这里 , 作者认为选择R语言或者Python都可以 。
如果从从业角度出发 , 他会考虑以下三个因素:
编程语言对数据科学的影响有多大?就业市场的需求如何?就业市场的竞争力如何?
【这份宝典火了,小哥学后加薪30W+】第一方面 , 作者直接将二者进行了对比 。
文章图片
Python非常适合机器学习和深度学习 。 但是在市场报告方面的优势不大 , 能用于统计经济学等重要领域的库比较少 。
R语言在业务分析、数据科学方面都拥有完善的工具支持 , 在深度学习方面的应用比较弱 。
不过作者认为 , 深度学习在数据科学中的应用不多 , 而且在需要深度学习或者其他API时 , R语言可以和Python集合 。
再从就业市场角度来看 。
作者统计了美国招聘市场上的数据 。
结果显示 , Python方面在招职位的数量 , 是R语言的2.4倍 。
但是了解、掌握Python的人 , 也比掌握R语言的更多 。
可能达到4-32倍 。
最终作者认为 , 选择R语言更有优势 。
文章图片
那么还有一些其他基础技能呢?
比如推荐使用Excel吗?
作者认为 , 虽然Excel的使用人群更广、商务人士非常喜爱 , 但是它在处理机器学习、大数据方面都不具有优势 , 而且单元格中的函数也容易报错 。
所以 , 建议大家慎重使用Excel 。
而在选用什么开发工具方面 , 作者展开了一项小调查 。
针对喜欢使用R语言的人群 , RStudio是大家最喜爱的开发工具 。
文章图片
Python方面 , Jupyter、VSCode更受人们欢迎 。
文章图片
在这里作者没有给出明确的推荐 , 大家可以按照喜好选择 。
只需4步 , 上手数据科学
接下来 , 就到了正式学习的环节 。
大致可以分为4个步骤:
掌握基础技能学习建模学习时间序列分析将模型集成到应用程序
所需要点亮的技能树如下所示:
文章图片
看到这里 , 先不要头皮发麻……作者给出了一些具体的学习tips 。
第一 , 从基础技能学起 。
可能很多人一上来就想搞定机器学习 , 但这可能会影响学习兴趣&效率 。
文章图片
作者用R语言进行了示范 , 列举了一些基础技能:
导入数据:使用数据库 , 连接到SQL , readr包,readxl包;转换数据:处理异常值、缺失数据、重塑数据、聚合、过滤等;可视化数据:静态/交互式数据可视化 , ggplot2以及plotly;处理文本数据、函数式编程……
如果以上这些基础技能都掌握后 , 接下来就可以学习机器学习了 。
- 一年级创意思维题 汽车和火车同行与货车过桥
- 小学生思维扩散测试题 小偷之死和划火柴
- 小学生思维分析测试题 火车与鸟
- 2022年必火的微商项目有哪些 抓住机会不要错过
- 火柴中的数学游戏
- 倍数 一定会输的比赛
- 日子越过越红火,人善心甜的3生肖女,财运足福气旺
- 40岁的碧昂丝还是这么火辣!穿嫩黄裙和老公闪耀晚宴,霸气如女王
- “最嫩爸爸”火了,在家带孩子被误认为是哥哥,妈妈:这是我老公
- 拼图趣味数学题:拼三角形【火柴棒游戏】