数据科学入门指南:新手如何步入数据科学领域?
本文插图
【数据科学入门指南:新手如何步入数据科学领域?】
作者:Sangeet Aggarwal
翻译:陈之炎
校对:冯羽
本文长度为2900字 , 建议阅读6分钟
本文将带大家讨论如何从零开始数据科学之旅 。
标签:数据科学 , 机器学习
数据科学 , 据说是本世纪最吸引人的工作 , 已经成为我们许多人梦寐以求的工作 。 但对某些人来说 , 数据科学看起来像一个充满挑战的迷宫 , 让人无从下手 。 如果你也是其中之一 , 那就继续阅读 。
在本文中 , 我将讨论如何从零开始数据科学之旅 。 我将详细解释以下步骤 。
- 学习Python编程的基本知识
- 学习基本统计学和数学
- 学习使用Python进行数据分析
- 学习机器学习
- 项目实战
如果有IT背景的话 , 你可能已经熟悉Python编程 , 此时 , 你可以跳过此步骤 。 但是如果从未接触过编码的话 , 应该从学习Python开始 。 在所有编程语言中 , Python语言最容易学习 , 它被广泛用在开发中 , 也被用在数据分析中 。
首先 , 可以搜索免费的在线教程 , 这些教程将有助于理解Python的基础知识 。 我列出了下述一些链接 , 这些教程可以帮助你在短时间内自学Python 。 可以尝试一下 , 自己作出选择 。
- learnpython.org(https://www.learnpython.org/)
- 谷歌的Python类
- Estudy免费Python课程(视频教程)
- 代码学院(使用在线编辑器编程)
一旦掌握了编程语法和其他基础知识之后 , 你就可以开启Python的中级和高级学习之旅 。 要做到在数据科学领域游刃有余 , 我建议你至少学完中级 , 这样可以熟悉Python中的数据结构和文件系统 。
下一步 。
学习统计学和数学
数据科学是分析数据并得出有用的和可操作的见解的技能 。 为此 , 必须具备基本的统计学和数学知识 。 虽然不要求你成为一个伟大的统计学家 , 但需要对数据分布和算法原理这些基础知识有所了解 。话虽如此 , 来看看需要学习哪些内容 。
首先 , 复习一遍高中的统计课程 , 对基本概念有所了解 。 为此 , 我推荐可汗学院的“高中统计”系列课程(根据自己的实际情况做出选择) 。
刷完高中统计课之后 , 可以开始阅读以下任何一本书:
- 统计学习简介(R语言)(强烈推荐)
- 统计思维(Python语言)
注意:虽然我建议你从学习Python语言来开启数据科学之旅 , 但在学习过程中 , 你会遇到其他几个工具 , 如R , 它们也用于统计计算和数据分析 。 我的一般建议是 , 无论你遇到哪一个工具 , 都要有一个开放的心态 。 如果你正在使用两种不同的语言执行任务 , 其底层工作和逻辑通常是相同的 , 这只是一个不同的语法和框架问题 。
第一次体验数据分析 。
学习Python进行数据分析
这便是它的有趣之处 , 在掌握了了Python编程的基本知识和统计之后 , 是时候一试身手了 。
如果想在不付钱的情况下学习 , 你只需在Udacity上开设一个帐户 , 注册免费课程-数据分析入门 。 这门课程将介绍数据分析所需用到的Python库 , 如Pandas和Numpy 。 你可以按部就班地学习 , 在几周内轻松完成课程 。
- 疫情|美国疫情速报:确诊数已逼近284万;特朗普发话:99%新冠病例完全无害;美专家:实际感染数或是现有数据10~24倍
- 最新趣闻|Redmi 9 体验:2020 年的入门机做成什么样了?
- 主从|Redis系列(五):主从复制
- 红刊财经|蒙泰股份拟创业板注册上市 营业收入数据异常问题难解
- #中国科学技术大学#中国科学技术大学2019年在各省录取最低位次,考上的都是真学霸!
- 美国|美国疫情严重程度被大幅低估 实际感染人数或是现有数据10到24倍
- 科技数码迷华为+荣耀别不报!入门级机型你们真没有Redmi良心
- 环球科学猫7月第2次,日本火山又喷发了,产生8300米灰烬,今年咋了?
- 富途资讯|| 重磅数据及事件一览表,一周前瞻
- 数据港湾|| 外资最新持股数据,农林牧渔