统计方法与案例点评
分类资料组间比较的思路及误区分析
中华全科医师杂志, 2017,16(6) : 490-492. DOI: 10.3760/cma.j.issn.1671-7368.2017.06.022
引用本文: 冯国双. 分类资料组间比较的思路及误区分析 [J] . 中华全科医师杂志, 2017, 16(6) : 490-492. DOI: 10.3760/cma.j.issn.1671-7368.2017.06.022.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权归中华医学会所有。

未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。

定性资料也称分类资料,其组间比较相对定量资料而言较为简单,无需考察数据的正态性和方差齐性,只要确定数据类型便可选择相应的方法。但在实际应用中,仍有不少临床医生在方法选择上存在疑惑,甚至即使软件已有结果,却不知该选择哪一部分。本文主要是针对这些临床中常见的疑问进行解析,并通过案例说明如何正确选择分类资料的比较方法。

一、分类资料组间比较的思路

分类资料组间比较方法的选择,只需要考虑两点即可:

第一,明确设计类型,是完全随机设计还是配对设计?作为研究者,这一点应该很清楚。

第二,确定结局的数据类型,是有序资料还是无序资料。这一点很容易明了。

图1给出了分类资料组间比较的常用方法及其选择思路。简单用一句话来概括就是:如果结局是无序分类资料,通常采用χ2检验;如果结局是等级资料(有序分类资料),通常采用秩和检验。所以关键的是如何确定结局资料的类型。

点击查看大图
图1
分类资料组间比较的常用统计方法小结
点击查看大图
图1
分类资料组间比较的常用统计方法小结

什么是"结局"变量和"分组"变量,不是根据行或列来区分,而是根据研究目的。例如,随机对照研究中,将研究人群随机分为服药组和安慰剂组,观察有效率。此时分组就是是否服药,结局是是否有效。再如,比较吸烟和不吸烟人群的肺癌发生情况,分组是吸烟与否,结局是肺癌发生与否。

方法的选择只跟结局有关,与分组变量关系不大。如按病情分为轻、中、重3组,比较3组的死亡率。此时病情为分组变量,是否死亡为结局变量。尽管病情是有序资料,但结局是二分类资料,因此无需采用秩和检验,选择χ2检验即可。

二、分类资料组间比较的常见错误案例

分类资料的组间比较,常见的错误应用主要有以下几种情况:

1.对于有序分类资料,难以把握到底用χ2检验还是秩和检验。

2.配对χ2检验经常出现结果选择错误。

3.多组分类资料的两两比较往往直接用χ2检验而不进行检验水准的校正。

例1:某研究比较2种仪器治疗颈椎病的疗效,结果分为显效、有效、无效三类,作者在研究中采用χ2检验进行比较,结果发现两组差异有统计学意义(χ2=6.536,P=0.038),作者认为2种仪器的疗效有差异。表1列出了该研究的主要结果。

点击查看表格
表1

2种仪器治疗颈椎病的疗效分析(例)

表1

2种仪器治疗颈椎病的疗效分析(例)

组别例数无效有效显效
仪器A120403743
仪器B120234948
案例分析:

首先澄清一个不少人都疑惑的问题:到底等级资料可不可以用χ2检验?答案是可以用,从数据来说这是没有问题的。问题是,从专业角度未必合适。χ2检验说明的是两组间的比例分布有无差异,比例是没有顺序的,如血型,按A、B、AB、O顺序和按AB、O、A、B顺序,χ2检验结果是完全一致的。但对于等级资料来说,无效和有效是无法调换顺序的,否则就失去了等级的意义。所以从专业角度来讲,从χ2检验处理等级资料是不合适的,因为无法体现等级的意义。

该研究采用χ2检验,相当于默认结局是无序分类资料,因此结果的解释不能说"疗效有差异",只能说,三种结局的分布在两组间差异有统计学意义。如果想说明两组的疗效等级差异,需要用Wilcoxon秩和检验。但其结果为Z=2.865,P=0.091,不能认为两组疗效有统计学差异。

从该例可以看出,对于等级资料,根据不同的研究目的,选择不同方法时,结果可能会不一致。因此需要结合研究目的,选择相应的统计方法,给出合理的结论。

例2:某研究探讨健康教育对糖尿病患者依从率的影响,对200例糖尿病患者比较健康教育前后依从率的变化。作者采用配对χ2检验比较干预前后的依从率,分析结果显示有统计学意义(χ2=87.503,P<0.001),认为干预后显著提高了依从率。主要结果如表2所示。

点击查看表格
表2

健康教育前后糖尿病患者的依从率情况(例)

表2

健康教育前后糖尿病患者的依从率情况(例)

干预前干预后
依从不依从
依从8913
不依从2177
案例分析:

本研究为前后比较,采用配对χ2检验并没有问题。但如果仔细看一下数据的话,却能发现漏洞所在。干预前的依从率为(89+13)/200=51%,干预后的依从率为(89+21)/200=55%,差别并不大,不应该出现作者计算的如此大的χ2值。

用统计软件重新分析可以发现,统计软件给出了两部分结果:一是χ2检验结果,二是McNemar检验结果。不难发现,作者选择的是χ2检验结果,而这也正是作者的错误之处。因为对于配对的分类资料,统计软件中给出的χ2检验值并不是检验前后差异,而是检验干预前后的关联。从结果可以看出,干预前和干预后一致的人数为(89+77)=166例,可以认为二者有一定的关联,所以χ2检验的P值很小。而如果比较干预前后差异的话,需要选择McNemar检验结果。对于本例,McNemar检验结果为P=0.170,不能认为干预前后的依从率有统计学差异。

因此,对于配对的分类资料,选择结果时一定要注意,你的目的是分析配对之间的关联,还是二者的差异?一定要考虑清楚,然后选择相应的结果,否则可能会导致完全相反的结论。

例3:某研究评价患者对社区医生的满意度情况,结局根据打分情况分为满意和不满意两类。将患者按年龄分为<50、50~60、>60岁共3组,比较不同年龄组的患者满意度是否有所不同。该研究采用χ2检验分别对各组进行了比较,结果显示,<50岁组与50~60岁组相比差异有统计学意义(χ2=5.882,P=0.015);<50岁组与>60岁组相比差异有统计学意义(χ2=5.133,P=0.024)。表3列出了3个年龄组的满意度情况。

点击查看表格
表3

不同年龄组患者的满意度情况(例)

表3

不同年龄组患者的满意度情况(例)

年龄(岁)满意不满意合计满意率(%)
<50864012668.25
50~60912011181.98
>6073168982.02
案例分析:

与连续资料一样,多组分类资料的两两比较如果直接采用χ2检验也会出现假阳性,因此一般建议对检验水准进行校正。常用的校正方法是Bonferroni法,即根据比较次数的多少将检验水准设为0.05/比较次数,然后再进行χ2检验,将计算的P值与新的检验水准进行比较。

本研究共3组,如做两两比较,共需比较3次,因此可将检验水准设为0.05/3=0.017。不难计算出,在此检验水准上,<50岁组与50~60岁组的比较差异仍有统计学意义(P=0.015<0.017),而<50岁组与>60岁组比较则无统计学意义(P=0.024>0.017)。当然这有可能是因为>60岁组的例数较少所致,但不管如何,校正后的结果会给出更为稳妥的结论。

最后补充一点,该研究的分组变量可以看作有序资料,而结局是二分类资料,可以计算率。对于这种结构的资料,还可以考虑进行趋势分析,即随着年龄的增加,是否满意度有逐渐提高或降低的趋势。本研究如果进行趋势检验,结果为P=0.012 3,可以认为存在趋势变化。至于何种变化趋势,则需要结合实际数据来看。该研究可以看出,随着年龄的增加,满意率有逐渐上升的趋势,结合P值可以认为这种上升趋势是有统计学意义的。

 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词