
临床试验的统计学设计多聚焦在样本量的计算过程,其核心是提出与临床设定相对应的统计学考虑,其中预期效应值的合理假设是决定试验规模的关键。而在试验的统计分析阶段,实际观察到的效应值决定了统计检验的结果,观察效应值与预期效应值间的对应程度,是决定试验结论和临床意义合理解读的基础。本文将就上述临床试验设计与评价阶段的关键方法学考虑进行介绍。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
在循证医学框架下,确证性临床试验多采用随机对照设计,通常具有更高的证据等级,其结果也更有可能被领域指南所引用,进而将对应的诊疗策略传递到临床实践中。统计学方法在这一过程中起到重要作用,虽然以统计检验P<0.05作试验结论的依据受到诟病[1],但其仍是对临床试验结果做判断的关键参考[2]。需要指出的是,统计学显著和临床显著间并不统一[3, 4],如果一项试验仅获得了统计学显著、但缺乏临床意义,这样的研究结果若被指南采纳并推荐,其对临床实践、患者权益和医疗资源投入都会造成严重的负面影响。试验设计阶段对预期效应值的假设,本身与统计分析阶段的统计学推断相关,前者决定样本量规模,后者则在方案设计的样本量前提下确认观察效应值的统计学意义,所以两者具有天然的“内在”联系。如果将试验设计阶段的预期效应值,与试验结果中获得的观察效应值相结合,不仅可以加强试验设计阶段对研究问题的理解,还可辅助判断试验结果临床意义的充分性[5]。因此,本文就这一问题进行相应的介绍。





















