如何看箱线图

看箱线图的方法如下:
1、首先收集数据,把你需要分析的数据输入到Minitab当中;
2、在菜单栏依次点击,图形,箱线图;
3、分析的数据是两组对比数据,在弹出的对话框中选择;
4、将左栏中的两组都添加到右边框里面;
5、点击标签,表头,确定;
【如何看箱线图】6、得到了箱线图,异常点就是偏离主题的点,就是需要改善的点,解决即可 。
纵轴是不同碱基的箱线图怎么看纵轴是不同碱基的箱线图怎么看:横坐标代表每个每个碱基的位置,反映了读长信息,比如测序的读长为150bp,横坐标就是1到150;纵坐标代表碱基质量值,图中的箱线图代表在每个位置上所有碱基的质量值分布,中间的红线代表的是中位数,用填充的区域的上下两端分别代表上四分位数和下四分位数;箱线图最上方的短线代表90%,最下方的短线代表10%,蓝色的线代表平均值
去除芯片和样本间批次效应从上面的箱线图结果可以看到,数值的表达量并不在同一条水平线上,并且有成败上千,也有零,很明显是没有经过log的 。这是需要把数据log后再用 boxplot 来看数据的分布,用 boxplot 来看数据的分布非常重要 。不能仅仅用[1:4,1:4]来查看,因为[1:4,1:4]并不能看到整体的数据情况 。关于为什么要log,是因为做差异分析的limma包要求表达矩阵中的数据是经过log的 。可以参考老大的这篇: 关于limma包差异分析结果的logFC解释

接下来这个函数厉害了,从上面的图中可以看到有一个样本的中位数和其他样本明显不在一条水平显示,这个 normalizeBetweenArrays 函数,可以把他拉回正常水平, normalizeBetweenArrays只能是在同一个数据集里面使用。

从上面的箱线图可以看到,exp2的数据的分布基本在一条水平线上 。

接下来将exp2的数据保存

看一下获得的探针和circ_RNA的对应关系

上面这张图,就是非常明显的看到了,由于后面的三个样本就是来自另一个数据集的 。从前面的 boxplot(exp2) 也可以看到他的表达量在8以上 。

得到的 deg 如下图