读芯术Python抓取国家医疗费用数据:哪个国家花得最多、哪个花得最少?( 三 )
数据帧
绘制图表之前 , 必须使用Pandas准备一个数据帧 。 首先我们得明确DataFrame是什么:
DataFrame是一个二维大小可变的、潜在的异构表格式数据结构 , 带有标记的轴(行和列) 。 创造一个数据帧非常简单直接:
df = pd.DataFrame(Data,columns=[‘country’, ‘expense’])
可视化
我们大部分时间都花在收集和格式化数据上 , 现在到了做图的时候啦 , 可以使用matplotlib和seaborn 来可视化数据 。 如果不太在意美观 , 可以使用内置的数据帧绘图方法快速显示结果:
df.plot(kind = ‘bar’, x=’country’, y=’expense’)plt.show
现在 , 结论出来了:许多国家每天的支出都低于一美元 。 这些国家中大多数都位于亚洲和非洲 , 看来世界卫生组织应更关注这些国家 。
本文插图
图源:unsplash
这不一定是一个值得出版的图表 , 却是结束一个小项目的最佳方式 。
学习技术技能最有效的方法就是动手实践 。 学习的过程比最终的结果更重要 , 在这个项目中 , 展示了如何使用3项关键的数据科学技能:
· 网页抓取:检索联网数据
· BeautifulSoup:分析数据以提取信息
· 可视化:展示所有的努力
比起技术更重要的是 , 找到自己感兴趣的项目 , 不一定是能够改变世界的事物才具有价值 , 从生活中探索有趣的项目吧 。
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
如转载 , 请后台留言 , 遵守转载规范
本文为***作者原创 , 未经授权不得转载
- 光一样的少年|可以用于“抓取”病毒的工具:光镊
- 悠家娱乐 VS Code 中的 Python 体验,#新闻拍一拍# 微软推出 Pylance,改善
- Python1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源
- Python之王 Pandas数据合并与拼接的5种方法
- Python 初学者进阶的九大技能(附代码)
- Python不像想象那么简单!学会这些小技巧,离精通更进一步
- Linux中国TB VS Code 中的 Python 体验,微软推出 Pylance,改善
- Linux中国TB微软推出 Pylance,改善 VS Code 中的 Python 体验
- 三微授渔Python超级教程,使用Python进行检测面部特征
- 训练集|python机器学习:如何划分训练集和测试集
