数据科学入门指南:新手如何步入数据科学领域?


数据科学入门指南:新手如何步入数据科学领域?
本文插图
【数据科学入门指南:新手如何步入数据科学领域?】
作者:Sangeet Aggarwal
翻译:陈之炎
校对:冯羽
本文长度为2900字 , 建议阅读6分钟
本文将带大家讨论如何从零开始数据科学之旅 。
标签:数据科学 , 机器学习
数据科学 , 据说是本世纪最吸引人的工作 , 已经成为我们许多人梦寐以求的工作 。 但对某些人来说 , 数据科学看起来像一个充满挑战的迷宫 , 让人无从下手 。 如果你也是其中之一 , 那就继续阅读 。
在本文中 , 我将讨论如何从零开始数据科学之旅 。 我将详细解释以下步骤 。

  • 学习Python编程的基本知识
  • 学习基本统计学和数学
  • 学习使用Python进行数据分析
  • 学习机器学习
  • 项目实战
学习Python编程的基本知识
如果有IT背景的话 , 你可能已经熟悉Python编程 , 此时 , 你可以跳过此步骤 。 但是如果从未接触过编码的话 , 应该从学习Python开始 。 在所有编程语言中 , Python语言最容易学习 , 它被广泛用在开发中 , 也被用在数据分析中 。
首先 , 可以搜索免费的在线教程 , 这些教程将有助于理解Python的基础知识 。 我列出了下述一些链接 , 这些教程可以帮助你在短时间内自学Python 。 可以尝试一下 , 自己作出选择 。
  • learnpython.org(https://www.learnpython.org/)
  • 谷歌的Python类
  • Estudy免费Python课程(视频教程)
  • 代码学院(使用在线编辑器编程)
上述列表并非详尽无遗 , 你可以在网络上找到更多其它的资源 , 这些资源助力学习Python的基础知识 , 此外 , 你还可以在YouTube上找到许多为初学者提供的Python教程 。
一旦掌握了编程语法和其他基础知识之后 , 你就可以开启Python的中级和高级学习之旅 。 要做到在数据科学领域游刃有余 , 我建议你至少学完中级 , 这样可以熟悉Python中的数据结构和文件系统 。
下一步 。
学习统计学和数学
数据科学是分析数据并得出有用的和可操作的见解的技能 。 为此 , 必须具备基本的统计学和数学知识 。 虽然不要求你成为一个伟大的统计学家 , 但需要对数据分布和算法原理这些基础知识有所了解 。话虽如此 , 来看看需要学习哪些内容 。
首先 , 复习一遍高中的统计课程 , 对基本概念有所了解 。 为此 , 我推荐可汗学院的“高中统计”系列课程(根据自己的实际情况做出选择) 。
刷完高中统计课之后 , 可以开始阅读以下任何一本书:
  • 统计学习简介(R语言)(强烈推荐)
  • 统计思维(Python语言)
以上链接将直接访问到这些书籍的各自pdf版本 , 你也可以根据需要方便地购买到纸质的书 。 读完这些书之后 , 你将熟悉数据分析的基本原理 , 对进一步深入学习有帮助 。
注意:虽然我建议你从学习Python语言来开启数据科学之旅 , 但在学习过程中 , 你会遇到其他几个工具 , 如R , 它们也用于统计计算和数据分析 。 我的一般建议是 , 无论你遇到哪一个工具 , 都要有一个开放的心态 。 如果你正在使用两种不同的语言执行任务 , 其底层工作和逻辑通常是相同的 , 这只是一个不同的语法和框架问题 。
第一次体验数据分析 。
学习Python进行数据分析
这便是它的有趣之处 , 在掌握了了Python编程的基本知识和统计之后 , 是时候一试身手了 。
如果想在不付钱的情况下学习 , 你只需在Udacity上开设一个帐户 , 注册免费课程-数据分析入门 。 这门课程将介绍数据分析所需用到的Python库 , 如Pandas和Numpy 。 你可以按部就班地学习 , 在几周内轻松完成课程 。