不常见的Pandas小窍门:我打赌一定有你不知道的( 二 )
可以看到 , 压缩文件小于正常CSV文件的一半 。
这可能不是一个好例子 , 因为该随机数据帧中没有任何重复值 。 在实践中 , 如果存在分类值 , 压缩率会非常高!顺便一提 , 如你所想 , Pandas可以直接将压缩文件读入数据帧 , 无须在文件系统中解压它 。
df = pd.read_csv('sample.csv.gz', compression='gzip', index_col=0)
文章插图
gzip是优先选择 , 因为它默认存在于大多数Linux系统中 。 Pandas还支持其它压缩格式 , 比如“zip”和“bz2” 。
文章插图
多列获取DateTime(时间日期)
文章插图
图源:unsplash
在Pandas中 , 你一定用过pd.to_datetime()方法将某种字符串转换为DateTime格式 , 这通常用于处理诸如%Y%m%d的格式字符串 。 然而 , 也有时可能会使用下方所示的数据框架作为原始数据 。
df = pd.DataFrame({'year': np.arange(2000, 2012),'month': np.arange(1, 13),'day': np.arange(1, 13),'value': np.random.randn(12)})
文章插图
在数据框架中 , 将年、月、日作为单独列分隔开来屡见不鲜 , 可以使用pd.to_dateframe()将其一步转换为DateTime列 。
df['date'] = pd.to_datetime(df[['year', 'month', 'day']])
文章插图
本文分享了一些关于Pandas Python库的省时小窍门 。 简而言之 , 人生苦短 , Python值得 。
文章插图
留言点赞关注
我们一起分享AI学习与发展的干货
【不常见的Pandas小窍门:我打赌一定有你不知道的】如转载 , 请后台留言 , 遵守转载规范
- 智能手机市场|华为再拿第一!27%的份额领跑全行业,苹果8%排在第四名!
- 会员|美容院使用会员管理软件给顾客更好的消费体验!
- 行业|现在行业内客服托管费用是怎么算的
- 人民币|天猫国际新增“服务大类”,知舟集团提醒入驻这些类目的要注意
- 国外|坐拥77件专利,打破国外的垄断,造出中国最先进的家电芯片
- 技术|做“视频”绿厂是专业的,这项技术获人民日报评论点赞
- 面临|“熟悉的陌生人”不该被边缘化
- 中国|浅谈5G移动通信技术的前世和今生
- 页面|如何简单、快速制作流程图?上班族的画图技巧get
- 桌面|日常使用的软件及网站分享 篇一:几个动态壁纸软件和静态壁纸网站:助你美化你的桌面