标题|数据格式规范,这些方法的格式你都get了吗?
文章插图
正确的数据格式是分析的基础,一直以来大家问得最多的就是数据格式的问题。什么样的格式才能分析?为什么我的数据显示格式不对?怎么批量添加标签?针对这样那样的问题,今天我们就来总结一下。
一、格式规范1、基础格式
数据格式是基础,其中我们最常见的数据格式是原始数据格式。下图即是一份原始数据,它的特点是:一行代表一个样本,一列代表一个属性。
文章插图
这样的数据有多少样本,就需要录入多少行,100个样本录入一百行,每一行即代表一个样本的回答数据;每列代表一个属性即一个变量。而不能是已经进行过统计的数据。
2、文字标签
上传时数据须为数字格式,如果想让结果显示成具体的文字标签,而不是数字。可以在Excel中添加一个工作表批量为数据设置标签。
标签设置步骤如下:
第1个sheet里放收集到的数据;新建一个sheet“tags”放置标签。
“tags”工作表中共包括3列内容:“标题”、“数字”和“标签”
“标题”列,放置标题,且不能有完全相同一模一样的标题。
“数字”列,放置每项的数值,比如5个选项“1,2,3,4,5”就分5行放置。
“标签”列,放置对应数字的标签信息。
文章插图
3、无法识别数据如何处理
有时上传数据会提示“无有效数据”或只识别出部分数据,大概率还是由于数据格式不规范导致的。
遇到上面的问题,可以按这样的步骤检查数据:
第一:如果EXCEL上传,数据应该放在第一个工作表里面,如果不是请调整后再上传。
第二:EXCEL数据中不能合并单元格,如果有合并单元格,请取消合并。
第三:数据第1行一定是标题,如果本该有标题但是为空,请处理后再上传。
二、常见方法格式在日常分析中,有些分析方法使用的格式与常规的格式不太一样。因此我们除了用到原始数据,有时也需要根据所用的分析方法,将数据整理成可以分析的格式。
1、T检验、方差分析
T检验、方差分析都是研究不同组别的差异,比如不同学历时满意度的差异。因此数据格式中一定需要有组别X(比如学历)和分析项Y(比如满意度)。
文章插图
有时候只有分析项(比如3个分析项),但是现在希望此3个分析项的差异,那么就需要对数据进行改造,自己加入一列‘组别’,然后把数据重叠起来得到分析项Y,类似如下图:
文章插图
如果是用t检验对比两组数据,比如实验组和对照组,也需要加入一列‘组别’项,类似如下图:
文章插图
2、配对T检验
配对数据的格式相对较为特殊,包括配对t 检验、配对卡方、配对样本Wilcoxon等。比如实验组和对照组数据的差异。如下图:
文章插图
配对数据一般是在实验时使用,而且配对数据的特点为:行数一定完全相等并且只有两列。如果研究数据的行数不相等,那可能不是配对数据,如果还想对比差异,可能需要使用独立t 检验。
3、多选题
在问卷研究时会使用到多选题,多选题的数据格式比较特殊。比如一个多选题有4个选项,那么其数据中就会有4列,分别代表4个选项。而且使用数字1表示选中,数字0表示没有选中。如下图:
文章插图
分析时将同一多选题下的选项一起放入进行分析才可以。
文章插图
4、卡方检验
SPSSAU系统中的卡方检验,支持两种数据格式:一是常规格式,另一种是加权数据格式。
对于只有汇总结果的数据,无法整理成原始数据。此时就可以整理为加权数据格式。格式要求如下:
比如下图中X有2种情况,Y有3个情况,一种有2*3=6种组合,数据信息只有6种组别的汇总项(即加权项),分别是40,10,20,30,20,50;相当于总共有170个样本。整理为加权格式即只需要录入6行即可。
文章插图
- 优派|美国很满意:150多家芯片厂商,都“自愿”提交了详细数据
- 苹果|要是不看真实数据,我还以为国产机将iPhone打成下一个三星了呢
- 短视频|运用5种套路写好短视频标题,视频播放量提升90%!
- 何树山|合肥国际互联网数据专用通道开通
- Python|联想真的没有问题?中国院士公布数据,胡锡进改变立场
- 台积电|夹击台积电?“银弹”风暴将袭来,交出数据后的台积电可能没料到
- 数据库|提前三天自动续费,这合理吗?
- 联想|联想5年前旧闻变新闻,公众苦网络平台“标题党”久矣
- 微软|打工人必备技能!django查询数据库操作合集!
- 安卓|django怎么连接数据库?你知道吗?