【见解】纳入标准、亚组分析和异质性的理解

我们在进行临床研究时主要关注四个重点:对什么样的被试进行什么的处理,通过什么手段评估,期望得到什么样的结果。其中研究对象是第一步需要考虑的问题。研究对象的纳入排除标准有很多细节可以研究,其中最容易被关注的就是纳入被试的范围,而这直接影响了后续数据分析中的亚组分析。而这一切都根源是患者个体间,包括不同患者功能障碍(或疾病)的异质性。这一点在神经病学研究中显得极为重要。

实际上,这一问题不存在标准答案,但有较为固定的逻辑。

异质性中的共性

但我们的临床实践将某一类疾病、症状或功能障碍归为一类的时候,无论他们具有多大的异质性,都肯定具有至少一个共性。这个最大的共性就是纳入标准中的下限。

例如,脑卒中患者的运动功能障碍的异质性非常大。可以分为粗大运动功能障碍,精细运动功能障碍;也可以分为皮层梗死,基底节梗死和脑干梗死等。但是,这些异质性中表达的共性是运动功能障碍,他们都存在运动环路的直接或间接损伤。面瘫的病人可以是中枢性的,也可以是外周性的,二者机制差别很大,但是二者的共性是都存在面部肌肉运动障碍,都是面部肌肉神经传导通路的问题。以面瘫为例,我们完全可以设计一种干预方式将二者都纳入研究中,比如一种从外周传导到中枢而修复传导通路的药物(瞎编的)。这就是共性。在一个尚不清楚的领域,总是先进行共性的研究,在此基础上再进行分组的更小的共性研究来分离异质性。这是面对异质性的基本逻辑,而不是一上来就奔着最小单位来研究。共性研究的缺点是显而易见的:无法应用于个体化的精准治疗。

我所理解的进入一个未知领域的研究推进逻辑是:

  1. 第一个研究先进行共性研究,发现共性规律,同时总结出可能存在的异质性。
  2. 基于第一个研究,优化研究设计,继续验证共性规律,同时把异质性正式作为亚组分析的内容进行研究。
  3. 基于前两个研究,把异质性中的一个或多个作为纳入标准加以限定,从而推进更细致的研究。
  4. 接下来的研究就是将简单的,能够显著分类的异质性单独列为一种分类,进行不同分类间的交叉效应研究,并通过机器学习和深度学习等先进技术获得更多的交互机制,指导个体化的精准治疗。另一个方向是对于无法解释的异质性特点进行技术革新,继续研究。
所以,盲目的不考虑阶段的要求纳入标准足够精细,对亚组的考虑足够充分是不现实的。但研究者心里应该清楚自己处于哪一个阶段,有理有据有节的回答别人的疑问。

亚组分析的基本要求

亚组分析这个词最近非常流行,很多人看到异质性就想到亚组分析,甚至在研究结束后发现没有阳性结果,想要通过亚组分析获得阳性结果。实际上,在统计学中,亚组分析必须是提前设定好的,而不是研究结束后临时补充的,这是统计学的灵魂。

那么当我们对一个领域了解甚少,还不知道可能存在异质性(亚组),又如何提前设计合乎逻辑的亚组分析呢?当然,在一些成熟的领域,可以通过前人成熟的公认的研究结果去进行亚组分析的设计,例如TMS治疗对运动功能障碍的疗效,通过分为皮层、皮层下等亚组是完全提前设定的。但是对于大多数有创新性的研究来说,第一次的研究往往对存在的亚组(其实也就是影响因素)并不清楚。而且在时间充分的情况下,我也不建议直接参考他人的文章或结果进行亚组设定。最好还是通过共性研究-异质性研究的逻辑进行,这样研究者对研究的掌握程度会更高,一些基础的问题得到了解决和解决的经验,下一次的研究设计会显著进步。

在共性研究中如何处理异质性?

异质性是客观存在的,如何在早期研究中处理这些异质性并获得异质性对共性的影响程度显得极为重要。正如前文所述,在早期我们无法通过亚组分析来获得这些信息。即使我们已经能够预想到一些可能的亚组因素,这些因素往往非常多,从而形成的亚组太多,导致研究无法进行。例如,单我们在脑卒中运动功能障碍研究中把部位作为亚组分析时,我们就要考虑亚组的样本量是否足够。如果我们再加一个引述,病程早、中、晚期,那么亚组就太多了,病例数爆炸。这种情况下,协变量分析和回归分析在早期研究中就可以发挥比较好的作用。对于异质性因素较少的时候,我们可以通过量表等方式对这些因素进行评估,并在分析中将这些因素作为协变量加入的数据分析中,从而控制这些协变量的影响。此外,我们还可以通过相关分析和回归分析的方法去发现哪些变量对结果具有显著影响,这可以为第二阶段的研究提供参考信息。

总之,我们在早期研究中对于异质性的处理不应该是直接进行细分和粗暴的亚组分析,而是应该通过客观的分析和寻求统计学的帮助来优化研究设计。科研需要循序渐进,逐步深入,而不是一步到位。

发表回复