多案例分享:如何规范撰写统计分析方法


针对统计分析方法的撰写 , 小咖整理了来自医咖会合作伙伴石瑀博士的一场讲座《临床研究方案中统计分析部分的撰写》 , 上一期我们推送了前半部分内容 , 涉及:连续变量的分组方法和依据、主要和次要结局的统计分析方法以及亚组分析 。

本期为大家介绍后半部分的内容 , 包括缺失数据处理和敏感性分析 , 并通过一个研究计划书的修改案例 , 让大家直观感受规范的统计分析写法 。
缺失数据的处理无论开展多么高质量的临床试验、病例对照研究或者队列研究 , 缺失数据的问题都是不可避免的 。 此时 , 对于缺失数据的处理方法 , 需要在统计分析部分进行详细的描述 。

比如有篇论文写到:“我们对缺失数据的分析基于随机缺失假设 , 使用了MICE方法在STATA中进行填充 。 通过多因素logistic回归分析了10个填充后的数据副本 , 根据这10个副本中的估值 , 计算了均值并且计算调整后的标准误….”

下图中是另一个案例 , 由于有些患者收集的资料不全 , 或者患者脱落、死亡等原因 , 存在缺失数据 , 需要进行多重数据填补 。


多案例分享:如何规范撰写统计分析方法
本文插图


下图是我近期刚投稿的一篇文章 , 估计大气污染物对心衰患者预后的影响 。 评价的是长期污染物的暴露效应 , 长期暴露的定义为患者入组前365天的平均暴露水平 。 但是大气污染物监测站点数据存在缺失 。 在这篇文章的方法学部分描述如下 ,12天的缺失数据相对于计算365天的均值而言 , 影响有限(limited effect) , 因此对于这部分缺失我们直接忽略 。 虽然是直接忽略 , 但是仍需要在方法学部分进行描述 。 对于处理缺失数据的方法 , 例如采用末次观测值结转或者多重填补甚至是忽略 , 一定要在统计学方法部分进行详细的描述 , 并给出选择该方法的依据或考量 。


多案例分享:如何规范撰写统计分析方法
本文插图


敏感性分析敏感性分析往往是为了验证研究结果的可靠性 。 例如 , 从专业角度考虑在某研究中研究人群中有一小部分人可能跟研究总体存在异质性 , 这时候研究者可以考虑进行敏感性分析 , 操作的方式可以是剔除该部分人群 , 对剩余的样本人群进行重新分析 , 判断此时的结果与原来的结果是否一致 。 此外 , 如果某些研究采用某个新型的统计模型 , 研究者可以通过调整模型中一些参数 , 来判断研究结果可不可靠 。

下面的研究进行了两种敏感性分析 。 第一个是把有过敏史或者慢性鼻炎的患者排除以后 , 以剩余的研究对象作为研究对象进行分析 。 另一个是校正其他几个可能会影响PM2.5效应估计的污染物 , 判断校正后的PM2.5效应与校正前有无差异 。