老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶( 二 )


推荐指数:★★★☆☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
由数据清洗开始窥窃数据分析 , 介绍了很多有意思的东西 , 轻松读物 , 适合没有编程基础的同学阅读学习!
优点:算是还可以的爬虫入门书籍 , 有技术讲解 , 最后也有案例说明;
缺点:内容过于杂乱 , 而且对于已经有编程基础的人来说非常简单 , 没有看的必要;
大数据分析进阶系列
1、《Hadhoop数据分析》
推荐指数:★★★★☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
大数据分析科学的必看读物 , 主要内容是集群计算和分析概述 , 为数据科学家深入了解特定主题领域铺平道路 , 从数据科学家的视角介绍Hadoop集群计算和分析 。
优点:十分强悍的理论著作 , 比较亮点的地方是第一部分的分布式讲解;
【老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶】缺点:翻译十分不友好!
2、《Spark大数据分析》
推荐指数:★★★★☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
一书针对使用ApacheSpark框架执行批处理、互操作、图表、数据流分析 , 以及机器学习等不同类型的大数据分析项目提供了实用的指南 。 其中介绍了Sparkcore及其加载项库 , 包括SparkSQL、SparkStreaming、GraphX、Mllib , 以及SparkML 。
优点:入门spark的教科书 , 没有什么阅读难看 , 通俗易懂;
缺点:具体的实际操作代码还是比较少 , 同时也没有提供比较好的分析数据;
3、《鲜活的数据:数据可视化指南》
推荐指数:★★★☆☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
《鲜活的数据:数据可视化指南》这本书是我最开始了解数据可视化看的第一本书 , 让我对数据可视化从一个看一团迷雾的小白白可以大概的了解到了一个轮廓 。
优点:作者的可视化功底非常强 , 内容丰富 , 设计可视化的方方面面;
缺点:需要R语言基础;
高级数据分析系列
1、《机器学习》
推荐指数:★★★★☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
这本书用简单的语言把复杂难懂的机器学习算法解释清楚了 , 它将机器学习的基础理论与日常数据分析的实际工具相结合 。
优点:对机器学习有一个很全面的解读和介绍 , 适合新手;
缺点:这本书已经比较老了 , 内容中有一些过时的地方;
2、《数据分析实战》
推荐指数:★★★☆☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
本书首先介绍了商业领域里通用的数据分析框架 , 然后根据该框架 , 结合8个真实的案例 , 详细解说了通过数据分析解决各种商业问题的流程 , 避免纸上谈兵 。
优点:商业数据分析领域必看的一本书 , 对其他行业借鉴意义不大;
缺点:R语言和代码部分的占比比较大 , 需要R基础;
数据化运营系列
1、《数据化管理》
推荐指数:★★★★★
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
本书从企业的一个个具体的需求出发 , 使读者对数据分析的了解循序渐进 , 将复杂的数据分析知识体系串成有机的整体 。
优点:大量的企业经营案例 , 系统阐述数据分析的专业思路、方法和技能;
缺点:局限零售电商行业 , 其他行业借鉴意义不大;
2、《如何用数据解决实际问题》
推荐指数:★★★★☆
老王技能厂 优秀数据分析师必看的养成书单,从入门到进阶
文章图片
这本书整体非常通俗易懂 , 通过缜密的假设原因 , 推断可能问题 , 检验结论 , 到最后给出实际可操作的建议 , 这才是一个数据分析该有的流程 。