小伙伴们,大家好,我是专治各种疑难杂「数」的农夫~
今天,我就为大家介绍一种高效的数据清洗方法,助你告别熬夜加班,拥抱美好的夜晚时光~
日常工作中,我们经常需要将其他同事发来的 Word 文件中的数据提取出来 。
文章插图
但粘贴进 Excel 表格后,数据就成了介个样子,出现很多空行、重复的标题行、多个相同的部门数据等~
文章插图
看到这样的表格,大家的内心可能是这样的~
文章插图
如果我们想处理成下图这样规整的数据,应该如何操作呢?
文章插图
那么,现在请大家先思考几秒~~~
01问题分析Word 中的数据表格,基本上不能直接操作计算,在数据处理上被认为是张「死表」 。
(而且 Word 中常常有合并的行列、重复的标题行,「无脑复制粘贴」容易出现格式问题 。)
而 Excel 中的数据相当于数据仓库,我们可以随意取部分数据,
或者全部数据进行计算、合并、数据透视等,这类表格我们称之为「活表」 。
知道了这些可能存在的问题,接下来,我们就需要逐个击破,把 Word 中的「死表」变成 Excel 中的「活表」 。
文章插图
应该怎么做呢?小伙伴们请随农夫走进本期的「数据农场」~
02解决方法▌备份数据
? 数据处理数据之前,我们需要先将原表进行备份,保留原始数据 。
文章插图
备份原始数据是处理数据中很重要的习惯 。不然,原始数据被修改了,想要从头再来,你可能只能哭了~
▌清理无效行列
? 删除不需要的行,即「分部」和「投诉受理量」列 。
数据清理中,根据自己处理需求保留或增添数据列,不要让无效数据列影响到数据清理 。
? 删除列中的无用行,包括 Word 中合并单元格形成的大量空行,及设置「重复标题行」形成的多个标题行 。
这些数据是 Word 粘贴进入 Excel 之后,生成的冗余数据 。
我们从以下两点进行操作:
首先,去除列中空值行,选中整列—【F5】快捷键进入【定位】条件页面—点击「定位条件」—勾选空值—确定 。
即可选中列中所有空值,然后右键,选择【删除整行】即可!
文章插图
文章插图
其实,空值也可视为重复值 。数据选项卡下的【删除重复值】按钮,也可以删除列中重复值 。
但是,考虑到某些部门办件数量相同,因此本次不用这个方法 。
其次,删除「重复标题行」所形成的无用行 。
① 点击【数据】选项卡—【筛选】—勾选带有「部门」的行 。
② 选中除第一行之后的其他部门行,右键删除,最后取消筛选 。
还是基于上面刚刚说的原因,没有使用【删除重复值】功能 。
以上就是我们初步的预处理数据了 。
我们用动图来演示下:
文章插图
这个时候离最终的数据,是不是有那么几分像了?
好了,下面我们继续进行数据处理,也是本次数据清洗最为关键的操作 。
▌错行填值
数据错行:即第二列的第一行数据引用的是前一列或后一列的第二行数据,以次类推 。
? 命名新列(办件量)存储数值 。
以错行形式引入前一列(部门)数据 。
即当填充 B 列第 2 行的时候,我们在 B2 单元格中引入 A3 单元格的数值 。
公式为:
=A3下拉单元格即可填充整列,或使用快速填充功能,双击即可自动填充整列 。
文章插图
文章插图
? 这是最简单的一步,当然也是最为重要的一步哦!
选中填充好的办件量列,复制—单击【右键】—粘贴为【值】 。
如果不进行这个操作,最后的数据全部都会出现#REF 错误哦!
- 苹果手机怎么才能录音 苹果手机不能通话录音解决办法
- 荣耀magic4和华为p50e哪个好 华为p50和荣耀magic4怎么选
- 电脑无法连接手机热点怎么解决 电脑找不到手机热点是什么原因
- 苹果怎么导入自定义动态壁纸 苹果手机如何更换动态壁纸
- 狗牌寄语怎么写
- 雪纳瑞指甲怎么剪
- 雅马哈mt03和本田cb400f怎么选 雅马哈mt03参数配置
- 喂奶期间喝茶会怎么样 喂奶期间喝茶有影响吗
- 宝宝跪趴睡觉好不好 新生儿怎么睡觉姿势正确
- 花甲内脏怎么清理