这些不常见的统计图你都懂吗?

作者:有福有德
来源:计量与统计
SAS软件系统计出身 , 相应的围绕这个主题的图形输出功能与统计本身一样很全 , 我们可以借助原始数据绘制自己需要的图形 , 也可以在统计的基础上 , 将常用的统计量保持下来 , 绘制需求的图形 。 SAS/base有效地整合了这些方面 , 至少作为普通用户的我来说 , 使用起来像一款软件 , 而没有不同模块间带来的差异之感 。
另外 , SAS软件几乎在每一个统计过程里都提供了ODS输出系统 , 这就更方便统计结果的可视化输出 , 这只需要设置plots=all , 就可以看见所有可能的输出 。
一些常见的统计输出图形 , 总体视之 , 些许会帮助用户更好的了解统计模型 , 下面介绍一下不太常见的图形 , 其他图形的功能将不再详述 。
这些不常见的统计图你都懂吗?文章插图
第一行第一个的这个线图 , 是在聚类分析的输出 , cluster聚类分析 , 提供判断多少聚类数是最优的 , 分别提供CCC、伪F和伪t方三个指标作为判断依据 。
一般来说CCC、伪F需越大越好 , 伪t的读法有点特别 , 但大致也是在找一个拐点 。 另外一个功能是提供异常信息 , 这与CCC的指标有关 。
第一行最后一个 , cook距离值 , 用于侦察异常值的信息 , 这个图在reg的ODS输出系统中很常见 , 不过这个指标一般不作为最终判断异常信息的结论 , 而是与其他指标一起使用(学生化残差、杠杆值等) , 然后再综合判断异常信息 。
这些不常见的统计图你都懂吗?文章插图
第一行第二个图:多重检验图 , 这个图在glm过程中可见 , 这个图表面上看很复杂 , 其实很简单 , 横坐标和纵坐标都是离散变量对应的均值 , 不同离散变量的不同取值依据在图中标识出了 , 通过这些信息可以找到不同取值间的对应的交叉点 , 红、蓝色分别表示是否显著 。
第二行第三个图:交互效应图 , 在glm过程中可见 , 显然这个图可以很直观的观察到两个离散变量间的交互状况(有一点 , 但不明显) , 主要是交叉的地方很微弱 。 另外 , 如果是连续变量的话 , 往往也会将连续变量离散化后(像上图一样) , 在绘制这个图 , 以便更直观的显示交互关系 。
这些不常见的统计图你都懂吗?文章插图
第一行第一个图:多维偏好图 , 可以在prinqual中实现 , 用于表示哪些消费者对哪些产品更加喜爱 , 或偏好 。
该图读法基本与主成分图、对应分析(双标)图、典型相关图相同 , 它们均归属于多变量过程之中;SAS软件中的这个过程还提供其他功能 , 如变量转换的一系列方法 , 像最优尺度变换的序列方法、非最优尺度变换的序列方法等等 , 这其中就包括了我常见的对数转换、box-cox转换等方法 , 尤其最优尺度的变换方法中 , 可以延伸出一个功能 , 就是分类主成分分析的方法 。
这些不常见的统计图你都懂吗?文章插图
第一行第一个 , ROC图 , 这个可以在logistic过程中完成(当然可以自己写) , 当然一般在logistic过程这中会比较容易一些 , 可以实现不同变量面积间的比较 , 而且可以输出单个和组合图形的结果 。
这些不常见的统计图你都懂吗?文章插图
第一行第二个 , 残差-残差 , 这个图形没有专门的绘制过程 , 需要大家自己绘 , 绘制两组残差的散点图 。 当用户需要比较不同模型拟合同一组数据时 , 这个图形会提供很多有用的信息 , 例如散点的线性关系、局部非线性这两个视角 。
这些不常见的统计图你都懂吗?文章插图
【这些不常见的统计图你都懂吗?】第一个图:贝叶斯图形 , 在SAS很多过程里均有提供 , 也可以使用MCMC过程 , 这个过程是专门用于这类分析的 。