趣投稿用pandas-profiling做出更好的探索性数据分析(附代码)( 三 )


趣投稿用pandas-profiling做出更好的探索性数据分析(附代码)
本文插图
结论
大数据的潜力还在不断增长 。 充分利用这一优势意味着公司必须把分析和预测系统并入战略视野中 , 并且用此来做出更好更快的决策 。 通常来说我们拿到的数据含有错误和缺失值 。 为了使工作变得有效率 , 这些数据必须被分析和处理 。 这就是数据科学家要做的工作 。 数据科学家用pandas-profiling可以更省力地产出快速的探索性数据分析报告 。 这份报告清晰且容易使用 ,还可以被任何有点统计基础的人看懂 。
有了对数据的全局理解 , 您就会有一些思路去进一步分析、处理数据或寻找外部数据源以提高数据质量 。
我希望您喜欢这个关于pandas-profiling的小介绍!这是我在medium上写的第一篇文章 , 欢迎评论和改进建议!
原文标题:
A better EDA with Pandas-profiling
原文链接:
https://towardsdatascience.com/a-better-eda-with-pandas-profiling-e842a00e1136
编辑:于腾凯
校对:林亦霖
译者简介
趣投稿用pandas-profiling做出更好的探索性数据分析(附代码)
本文插图
廖倩颖 , 马里兰大学公园分校市场分析专业硕士毕业 , 本科毕业于上海海洋大学包装工程专业 。 喜欢音乐、电影和看书 , 我对于数据科学和数据可视化比较有兴趣 , 最近在学习CV和机器学习算法基础 , 希望能与各位大佬交流切磋长姿势 。
—完—
想要获得更多数据科学领域相关动态 , 诚邀关注清华-青岛数据科学研究院官方微信公众平台“数据派THU ” 。