样本量计算

一、样本量计算的意义

假设两个总体存在差异,那么最少需要多少的样本才能在统计学上得出两个总体有差异?这个过程就是样本量计算。

例如,总体A有100个数,总体B有100个数,他们之间有差异。那么当从总体A中抽取样本A,总体B总抽样本B。当样本A和样本B都是5个时,样本A和样本B大概率统计学差异不显著,这就会得出假阴性的结果。当样本A和样本B都是95个时,样本A和样本B大概率统计学差异显著,这就可以推断总体A和总体B有差异。但是,在实际收集数据时会投入过多的资源。所以样本量计算就是通过假设两个总体存在差异,计算出统计学差异显著的最小样本量。

二、样本量计算的重点

两个样本是否有统计学差异主要取决于样本的集中程度和离散程度(以参数检验为例就是均值和标准差)。所以,计算样本量中最核心的预设指标就是均值和标准差。

样本量计算本质上是主要指标统计方法的逆运算。以t检验为例,如下图公式A是两独立样本t检验的公式。通过推导即可得出公式B平行设计的两独立样本均值比较样本量计算公式。这个公式中未知数包括两组均值、两组方差和Ⅰ类错误和Ⅱ类错误。其中Ⅰ类错误和Ⅱ类错误在假设检验中就需要自己设定,可以提前得知。而两组均值和两组方差就需要研究者根据既往研究和临床实践经验给出符合常理的值。

三、如何估计样本量计算的参数?

一般是通过两个途径获得估计样本量计算的参数依据:

  1. 通过预试验。在正式试验前可以先进行预试验,通过较少的样本计算均值和标准差,再结合临床实践调整,设置较为可靠的样本量计算参数。
  2. 参考类似的文章中的研究结果。例如某文章使用初级运动皮层高频rTMS治疗脑卒中,主要指标是ARAT,结果显示有统计学差异。你准备使用高频rTMS加OT治疗脑卒中,用的主要指标也是ARAT,那么你的治疗效果可能和这篇文章类似,那么你就可以参考这篇文章的各组均值和方差设置样本量。

四、样本量计算的简单方法

以上介绍的是通过公式计算样本量。在实际操作中,可以使用各种统计软件计算样本量,这样更加方便快捷。

目前最常用的计算样本量的软件是G*power。

其他计算公式见:邓伟.临床试验设计与统计分析[M].人民卫生出版社,2012.

发表回复