继续教育园地
病例对照研究在健康管理科研中的理论、设计和应用
中华健康管理学杂志, 2019,13(4) : 360-366. DOI: 10.3760/cma.j.issn.1674-0815.2019.04.020
摘要

病例对照研究属于流行病学中一种分析流行病学的方法,在健康管理研究领域的应用尚待扩展。本文将从病例对照研究的基本原理、目的和用途、特点、类型、设计和实施、常见偏倚及控制等内容展开介绍,结合具体案例分析,以帮助读者充分理解病例对照研究在健康管理研究领域中的应用方法、特点、优势及其局限性,以期更好地开展健康管理领域高质量的科学研究。

引用本文: 刘宝花. 病例对照研究在健康管理科研中的理论、设计和应用 [J] . 中华健康管理学杂志, 2019, 13(4) : 360-366. DOI: 10.3760/cma.j.issn.1674-0815.2019.04.020.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权归中华医学会所有。

未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。

在健康管理实际工作中,常常遇到一些居民的疾病、健康不良事件或者管理工作异常情况,例如高血压和2型糖尿病等慢性病患者对生活方式干预的依从性较差、管理效果不佳,体检者对体检中心的管理工作满意度不高等,这就需要健康管理的核心内容——健康风险因素的评估和预测。为了解决上述问题,可以采用病例对照研究,分析出现这些问题的主要原因,然后“对症下药”,针对关键风险因素,提出相应的干预措施,从而提高健康管理工作质量和效果。

病例对照研究(case-control study)是流行病学方法中最基本、最重要的研究类型之一,主要用于探索疾病的病因或危险因素和检验病因假设[1]。本文作为健康管理科研设计方法学系列讲座的第4讲,旨在结合健康管理科研特点,介绍病例对照的基本原理、目的和用途、特点、类型、设计和实施、常见偏倚及控制等内容。

一、基本原理

病例对照研究的基本原理是以当前已确诊的患有某特定疾病的一组患者作为病例组,以不患有该病但具有可比性的一组个体为对照组,通过询问、实验室检查或复查病史,搜集研究对象既往各种可能的危险因素的暴露史,测量并比较病例组与对照组中各因素的暴露比例,经统计学检验,若两组差别有统计学意义,则可以认为因素与疾病之间存在着统计学上的关联。在评估了各种偏倚对研究结果的影响之后,再借助病因推断,推断出某个或某些暴露因素是疾病的危险因素或保护因素,从而达到探索和检验疾病病因假说的目的[1]。病例对照研究是一种回顾性的、由结果推断病因的研究方法,是在疾病发生之后去追溯可能的病因的方法,示意图见图1

点击查看大图
图1
病例对照研究示意图
点击查看大图
图1
病例对照研究示意图

确定疾病或健康事件影响因素的基本过程为:(1)提出病因线索并产生假设;(2)检验和验证病因假设;(3)进行病因推断。此过程需要病因研究的流行病学方法作为支撑。描述流行病学(横断面研究等)可以提出病因线索并产生假设,是病因研究的起点;分析流行病学(包括病例对照研究和队列研究)是针对描述流行病学提出的病因假设进行检验;实验流行病学是对病因进行验证。在因果关系的论证强度方面,病例对照研究优于横断面研究,但较劣于队列研究和实验性研究。因此不同研究方法进行健康风险因素的评估和预测,为健康管理决策提供的证据强度也是不同的,证据论证强度由强到弱的顺序为:实验流行病学和队列研究>病例对照研究>横断面研究[2,3]

二、基本特点

1.观察性研究:病例对照研究客观地收集研究对象的暴露情况,收集的暴露因素是自然存在而非人为施加的。这是与实验流行病学最大的不同点。

2.研究对象的分组:研究设计按发病与否分成病例组与对照组。有些研究者据此认为只要按此分组的研究就是病例对照研究,这种做法有可能犯错误。横断面研究也可以形成病例组和对照组,如体检人群中有人患病,有人不患病,形成两个组,但所有指标在体检时测量收集,是典型的横断面研究方案。

3.由“果”推“因”:这点可以用于区分病例对照研究与同属于观察性研究的横断面研究和队列研究。病例对照研究是由果到因的研究,从结果入手找原因,不同指标的收集或测量的时间点不同。横断面研究的特点是所有指标在同一时间点收集或测量,指标之间可以做相关性分析,不能做因果关系推论。因此,区分病例对照研究与横断面研究的要点就是分析所有指标的收集或测量是否在同一时间点。如果是,肯定是横断面研究,如果不是就有可能是病例对照研究。研究中指标的收集或测量的时间点不同还有一种研究方案,即队列研究。区分病例对照研究和队列研究的要点是看研究从因切入还是由果切入,前者是队列研究的特征,后者是病例对照研究的特征。从因切入的指标往往是危险因素或预后因素;从果切入的指标通常是临床终点,如是否发病或患病、死亡或存活、是否发生并发症等。

4.因果联系的论证强度相对较弱:病例对照研究不能观察到由因到果的发展轮廓,也不能证实暴露因素与疾病之间的前因后果的联系,而且存在回忆偏倚。故在因果关系的论证强度方面,病例对照研究优于横断面研究,但较劣于队列研究和实验性研究。证据论证强度由强到弱的顺序为:实验流行病学和队列研究>病例对照研究>横断面研究[2,3,4]

三、目的和用途

1.广泛探索影响因素:病例对照研究最常用于疾病病因或危险因素的研究,尤其适合于研究病因不明确、潜伏期长及发病率低的疾病病因的广泛探索,从众多的可疑因素中筛选相关因素。在流行病学史上有大量的此类研究,如包皮过长与阴茎癌、输血与乙型肝炎、吸烟与肺癌、妊娠期母亲吸烟与胎儿先天畸形、体力活动与冠心病猝死、单纯疱疹病毒与面神经麻痹、高龄初产与乳腺癌、酒精消耗量与食管癌的关系。

该方法中的“病例”也可以是发生某事件(如自杀、车祸等)或具有某特征(如肥胖)的个体,从而扩大了应用范围。如进行自杀未遂[5]、道路交通伤害[6]、意外伤害[7]、再入院[8]、肥胖与超重[9]、健康体检者就医依从性、健康体检者对体检流程的满意度等相关因素研究。通过对上述医学事件或公共卫生问题影响因素的病例对照研究,可为制定卫生决策和健康管理干预方案提供依据。

2.深入检验病因假设:在描述性研究或探索性病例对照研究已初步形成病因假设的基础上,可进一步应用病例对照研究检验假设。病例对照研究可获得暴露与疾病关联强度的指标是比值比(odds ratio,OR),即病例组中暴露人数与非暴露人数之比除以对照组中暴露人数与非暴露人数之比的比值。与危险比(risk ratio,RR)相同,OR也可反映暴露者患某种疾病的危险性较非暴露者高的程度。若所研究疾病的发病率(死亡率)很低,且所选择的研究对象代表性较好时,OR近似RR。因此,在进行健康风险评估时,也可以使用OR代替RR

3.评价防治策略和措施的效果:该方法也可用于筛选和评价影响疾病预后、临床疗效和健康管理干预措施的影响因素[10,11,12]。同一健康事件会有不同的结局(如疾病预后的死亡与痊愈或并发症的有无,药物治疗后发生和未发生某种临床疗效,健康管理干预措施的有效与无效等)。将发生某种结局者作为“病例组”,未发生某结局者作为“对照组”,追溯产生结局可能的影响因素(如曾经接受的各种治疗或健康干预方法、病期、病情、年龄及社会经济水平等因素),分析产生不同结局的有关影响因素(暴露),指导临床和健康管理实践。

总之,与同属于分析流行病学的队列研究相比,病例对照研究虽然有诸多局限性,但也具有如下优点:所需样本量少、获得结果较快、相对便宜(不需跟踪随访,节省人力、物力、财力和时间)、且较易于组织实施;特别适用于研究发生率低的罕见疾病或健康事件、潜伏期长的疾病;在病因学研究中,适于多种暴露因素与某一种疾病关联的研究,可以分析多种因素间的交互作用;应用范围广[1,2,3]

四、病例对照研究的设计类型

实际工作中,病例对照研究通常采用匹配设计和非匹配设计两种方法。随着流行病学研究的发展,又产生了多种改进的、非传统意义的病例对照研究衍生类型,如巢式病例对照研究[10,11,13]、病例-队列研究[14]、病例-病例研究、病例交叉研究等,详见相关书籍[1]。随着信息化的快速发展,健康管理中心会产生很多高质量的连续性体检或健康管理队列资料,可以应用上述病例对照的衍生类型,结合分子流行病学、遗传流行病学方法和大数据分析技术,进行健康风险评估的精准预测。

1.非匹配病例对照研究:在研究设计所规定的病例和对照人群中,分别抽取一定数量的研究对象,一般对照组的数量应大于或等于病例组的数量。病例组和对照组来自同一个源人群。如欲探索某地胆囊结石的危险因素,可选取该地区全部胆囊结石患者和非胆囊结石患者或其随机样本进行研究,并不要求患者和非患者在性别、年龄、职业等方面的相似或一致[15]。这种研究又称为成组病例对照研究,该方法较匹配法更容易实施,但方法本身控制混杂因素的能力较弱,应在统计分析中予以弥补。

2.匹配病例对照研究:匹配(matching)或称配比,是选择对照的一种方法,指对照在某些因素和特征上与病例一致。这些用来匹配的因素或特征则称为匹配变量或匹配条件,例如性别、年龄、职业、居住地等[7,16,17]。在设计时要求选择的对照在某些因素或特征上与病例保持一致,目的是使匹配因素在病例组与对照组之间保持均衡,从而排除这些因素对结果的干扰。该方法可增加分析时的统计学检验能力,提高研究效率,但增加了选择对照的难度,资料整理与统计分析也较为繁琐。

匹配方式有频数匹配和个体匹配两种形式。前者是指对照组具有某种或某些因素或特征者所占比例与病例组一致或相近,如某研究以年龄和城乡分布作为匹配因素进行1∶3的频数匹配,男性病例组(603例)和对照组(1 909例)比例介于1∶3~1∶4。经χ2检验,病例组与对照组的年龄分布和城乡分布差异无统计学意义,说明年龄和城乡这两个匹配因素在病例组和对照组具有可比性,匹配效果较好[18]。后者是以对照与病例个体为单位进行匹配。1个病例匹配1个对照(叫配对),也可以1个病例匹配多个对照,如1∶2、1∶3……1∶r匹配。一般情况下,总样本量一定时,若病例和对照的来源都较充足,病例与对照之比为1∶1时的统计学效率最高。但若所研究的为罕见病或所能获得的合格病例数很少,可以增加匹配的对照数来增加研究功效,但也不宜太高,为了减少工作量,一般最高为1∶4。

进行匹配时有4个注意事项[1]:(1)匹配变量必须是已知的混杂因素,或有充分的理由怀疑是混杂因素;疾病因果链上的中间变量不匹配,如吸烟对血压有影响,而血压与心血管疾病有因果关系,在研究吸烟与心血管疾病关系的病例对照研究中,按血压水平对病例和对照进行匹配,则吸烟与心血管疾病的关联可能消失;此外,只与可疑病因有关而与疾病无关的因素不应匹配。

(2)匹配因素不宜过多。因为匹配变量越多,选择合格的对照越困难,也可能造成匹配过度。匹配过度是指把不起混杂作用的因素作为匹配变量进行匹配,试图使对照组与病例组在多方面保持一致,结果导致所研究的因素也在两组间趋于一致,从而降低了研究效率。一般除性别、年龄之外,对其他因素是否进行匹配需谨慎。

(3)不能将研究者感兴趣的研究变量作为匹配因素。因为一旦病例与对照按照这些因素匹配,病例与对照在这些变量方面就一致了,即不能分析这些因素与疾病的关系了。

(4)根据变量的性质、必要性和可操作性进行匹配。分类变量(如性别)可以完全匹配;连续变量(如年龄)可以首先划分成若干组后,再按年龄组进行匹配。

五、病例对照研究的设计与实施步骤

1.确定研究目的:一般在开展研究之前需要查阅相关文献资料,总结既往研究结果,结合健康管理工作中需要解决的问题,提出本次研究的假设。例如了解某人群肥胖的主要影响因素[9]、分析心脑血管事件发生的危险因素关系[13]、探讨某地胆囊结石的危险因素[15]、探寻甲状腺癌的危险因素[16]、探讨围孕期环境暴露因素与先天性心脏病发生风险之间的关系[17]、探讨高血压人群不同健康相关行为组合与脑卒中发病风险的关联[18]、分析饮茶与骨质疏松性髋骨骨折的关系[19]、探讨杭州某地岁青少年高血压发生的危险因素[20]、探讨睡眠与2型糖尿病间的关系[21]

2.明确研究类型:根据研究目的明确适宜的研究类型。若研究目的是广泛地探索疾病或健康事件的危险因素,可以采用非匹配或频数匹配的病例对照研究方法;若研究目的是检验病因假设,尤其是预期可获得的病例样本量较小,或者因为病例的年龄、性别等因素构成特殊,随机抽取的对照组很难与病例组均衡可比时,可以采用个体匹配的病例对照研究。

3.确定研究对象:(1)病例的选择。①使用统一且明确的疾病诊断标准。尽量使用国际通用或国内统一的诊断标准、金标准。如癌症病例,尽可能使用病理诊断[16]。如果需要自定标准,或在体检机构中,所使用的体检指标并不是金标准,而是采用筛查方法(如使用空腹血糖筛查糖尿病),此时要注意均衡诊断标准的假阳性率和假阴性率,研究对象可能会因错误诊断而存在错分偏倚,影响结果的真实性[2,3,4]。研究者可以为了某个特殊的研究目的,对研究对象的某些特征做出规定或限制,如老年病例[8]、女性病例[17,22]、重症病例[10]、某地区的病例[7,16,20]等。

②病例的类型。通常可选择新发病例、现患病例和死亡病例作为病例组。在病例对照研究中,首选的病例类型是新发病例,如骨折后入院1周内者[19]。该类型病例包括不同病情和预后的患者,代表性较好;患者确诊时间不久即被调查,对有关暴露的回忆信息较为准确可靠,不受各种预后因素的影响,且相关资料容易获得;但在一定范围或一定时间内较难获得预期的病例数,对于罕见病更是如此。选择现患病例[15]可以弥补上述缺点,但是现患病例患病时间较长,对暴露史回忆的可靠性较新发病例差,难以区分暴露与疾病发生的时间顺序。因此,在应用现患病例时,要尽量选择诊断时间距离调查时间间隔较短的病例。死亡病例的暴露信息主要由其家属提供,准确性较差,但对那些主要靠亲友提供资料的疾病,如儿童白血病的研究,也不排除应用死亡病例,只是在资料整理和分析时要充分考虑到可能的偏倚。

③病例的来源。主要来自医院、健康管理(体检)机构和社区。医院、健康管理(体检)机构来源的病例[15,16]可节省费用,合作性好,资料容易获得,而且信息较完整、准确,但不同医院、健康管理(体检)机构接收的患者或体检人群具有不同的特征,如果仅从一所选择病例,则代表性较差。从社区人群中选择病例是以某一地区某一时期内某种疾病的全部病例或其中一个随机样本作为研究对象。可以从疾病监测资料[22]、居民健康档案[21]或团体体检档案中选择合格的病例或从横断面调查资料[20]中获得,也可以选择人群队列中发生某种疾病的患者[10,11,13]

(2)对照的选择。在病例对照研究中,对照的选择往往比病例的选择更复杂、更困难。

①选择对照的原则。首先,对照必须采用与病例相同的诊断标准确认不患所研究疾病;其次,对照应该能够代表产生病例的源人群。

②对照的来源。对照可来源于以下4个方面:第一,同一个或多个医院、体检机构或健康管理(体检)机构中诊断的其他疾病的患者[15]。该来源对照的优点有易于选取、调查时比较合作,且可利用电子病历等医疗档案资料,在实际工作中经常采用这种对照。缺点是容易产生选择偏倚。第二,社区人群或团体人群中非该病病例或健康人[19]。优点是不易出现上述医院对照可能面临的选择偏倚问题,但实施难度大、费用高,所选对照可能不配合。第三,病例的邻居或同一住宅区的健康人或非该病病例[21,22]。该类型对照有助于控制社会经济因素的混杂作用,一般用于匹配设计。第四,病例的配偶、同胞、亲戚、同学或同事等[20]。此类对照有助于排除某些环境因素或遗传因素对结果的影响,一般也用于匹配设计。在实际工作中,可以选择多种类型对照,以弥补各自的不足。但要注意不同来源的对照可解决的问题不同,在下结论时一定要综合考虑。

③选择对照的方法。主要采取匹配与非匹配两种方法,详见前文设计类型部分。

4.确定样本量:影响病例对照研究样本含量的因素包括研究因素在对照组或人群中的暴露率(P0)、研究因素与疾病关联强度的估计值OR、显著性水平(ɑ值)及统计学把握度(1-β)。关于样本量计算公式,与调查分析的指标类型(计量资料或计数资料)、研究设计类型等有关。具体可以参考卫生统计学教材或相关资料[1]。需要注意的是样本含量估计的相对意义。在实际研究中往往需要同时探索几个因素与研究疾病的关系,而每个因素都有其各自的ORP0,因此,需要根据每个因素的参数估计所需样本量,然后选择最大的样本量,以便使所有的因素都能获得较高的检验效率。虽然样本量越大,所得结果的精确度越好,但常会影响调查工作的质量,增加负担和费用,在实际工作中应当权衡利弊。

5.资料的收集:病例对照研究的信息收集主要靠询问研究对象并填写问卷,包括面访、信访、电话访问、自填式问卷、网络调查等方式;有时需要查阅档案,如疾病和死亡登记资料、医疗档案(门诊和住院病历)以及健康档案等;有时需要现场观察和实际测量某些指标,如体格测量或环境因素的测量、血液或其他生物学标本的实验室测查等(与队列研究嵌套的巢式病例对照研究和病例队列研究采用此方法在基线时收集相关暴露信息)。随着信息技术的发展,目前手机、平板等电子终端可通过应用程序等直接收集并录入数据,形成数据库,大大增加了资料收集和数据管理的便利性。此外,随着区域卫生信息化的不断完善,可以大幅度提高查阅、收集和整合多源数据资料的效率。无论采用何种方法收集资料,都应进行质量控制,以提高收集资料的准确性和可靠性,从而保证研究结果和结论的真实性。如对调查员的培训、调查工作的监督和检查,尽量减少调查和测量偏倚,以保证调查质量。尤其要注意对病例和对照的信息收集应该采用可比的方法,即要求病例和对照收集信息的方式、资料来源、暴露因素测量时间和标准应一致[1]

6.资料的整理和分析:首先要对所收集的原始资料进行全面检查与核实,确保资料尽可能完整和准确,然后,对原始资料进行分组、归纳或编码后建立数据库。在此基础上分析暴露因素与疾病的关联及其关联强度。病例对照研究资料分析的中心内容是比较病例与对照中暴露因素的比例,并由此估计暴露因素与疾病之间是否有关联及其关联强度(OR);也可进一步分析暴露因素与疾病的剂量反应关系等;还可通过分层分析、多因素分析控制混杂因素对研究结果的影响。具体分析内容和方法可以参阅有关教材[1]

六、病例对照研究常见的偏倚及控制

作为一种回顾性的观察性研究,病例对照研究比较容易产生各种偏倚[1,2,4],常见的偏倚有选择偏倚、信息偏倚和混杂偏倚。

1.选择偏倚:如果一项病例对照研究所选择的研究对象只是源人群的一个样本,由于选入的研究对象与未选入者在某些特征上存在差异而引起的系统误差称为选择偏倚。常见的有入院率偏倚、现患病例-新发病例偏倚和检出症候偏倚等。

(1)入院率偏倚。前文病例来源部分已有所介绍,为避免或减少入院率偏倚,应尽可能在社区人群中选择研究对象,保证较好的代表性,结果推及到该人群的可信程度较高。但调查工作比较困难,且耗费人力较多。若在医院、健康管理(体检)机构选择研究对象,最好能在多个不同级别、不同种类的医院、健康管理(体检)机构选择一定期间内连续观察的某种疾病的全部病例或其随机样本,在与病例相同的多个医院的多个科室、多个健康管理(体检)机构、多病种的患者、不同特征的体检者中选择对照。此外,因已知与所研究的暴露因素有关的病种入院的患者不能作为对照,例如,吸烟与白血病的病例对照研究,因心血管疾病、呼吸系统疾病等与吸烟有关的病种入院的患者不能作为对照;但具有心血管疾病或呼吸系统疾病病史,本次入院原因是外伤者,可作为合格的对照。

(2)现患病例-新发病例偏倚。如果研究对象选择存活病例,即现患病例,特别是病程较长的现患病例,得到的一些暴露因素可能只与存活有关,而未必与该病的发病有关,从而错误地估计这些因素的病因作用。例如,男性比女性更易患大肠癌,但由于女性大肠癌患者的生存期明显长于男性,所以现患病例中女性所占比例可能多于新发病例中女性所占比例。另一种情况是,某病的幸存者由于疾病而改变了原有的一些暴露特征(如生活习惯),当他们被调查时容易误将这些改变了的暴露特征当作疾病前的状况,从而导致这些因素与疾病的关联误差。例如,喜食高脂膳食者患冠心病后饮食习惯改为以素食为主,他们接受饮食习惯调查时往往回答改变了的饮食习惯,结果使研究者得到高脂膳食与冠心病无关的结论。因此,为了避免或减少此类偏倚,应选择新发病例作为研究对象。

(3)检出症候偏倚。也称暴露怀疑偏倚。某因素虽然不是所研究疾病的病因,但有该因素的个体容易出现某些症状或体征,并常因此而就医,从而提高了研究疾病早期病例的检出率。如果病例对照研究中病例组包括了较多的这种早期病例,致使过高估计了病例组的暴露程度,而产生的系统误差就是检出症候偏倚。例如,绝经期妇女使用雌激素可能引起子宫出血,后者促使患者常去看病,使子宫内膜癌早期被发现;而在不用雌激素的绝经期妇女中,一些子宫内膜癌可能被漏诊或较迟发现。这就容易出现绝经期妇女使用雌激素可导致子宫内膜癌的假象。因此,在医院中收集病例时,最好包括不同来源不同病程的患者,以便减少此类偏倚。

2、信息偏倚:在病例对照中常见的信息偏倚包括回忆偏倚和调查偏倚。

(1)回忆偏倚。是由于研究对象对过去暴露史或既往史回忆的准确性和完整性存在系统误差而引起的偏倚。由于病例对照研究主要收集研究对象既往的暴露情况,因此回忆偏倚是病例对照研究中最常见的信息偏倚。回忆偏倚的产生与调查时间和事件发生时间的间隔长短、事件的重要性、被调查者的构成以及询问技术有关。例如调查胆结石患者的既往生活习惯,患者对发病前的饮食、运动等习惯已记忆模糊或遗忘,而是更清晰的记得患病后已经改变了的生活习惯,结果患者的生活习惯比对照组更健康。问卷调查时重视提问方式,强调回顾发病前生活习惯,可减少回忆偏倚。选择新发病例作为调查对象也可减少回忆偏倚的发生。

(2)调查偏倚。可能来自于调查者或调查对象。病例与对照的调查环境与条件不同,或者调查者对病例与对照采取不同的询问方式,或者对暴露测量方法、采用的仪器设备或试剂不统一、不准确等均可产生此类偏倚。因此要减少调查偏倚,需要做好调查员的培训,统一对病例和对照的提问方式和调查技术,尽可能使用量化或等级化的客观指标,由同一调查员调查病例与对照,调查环境尽量一致;调查员向被调查者讲清调查目的,尽量取得他们的信任与合作;使用的仪器和试剂精良、统一,按照操作规程使用检查仪器。在健康体检过程中收集体检人群的相关信息时,也要采用上述质量控制方法,提高所收集信息的真实性。

3.混杂偏倚。当研究某个因素与某种疾病的关联时,由于某个既与疾病有关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,造成的偏倚叫混杂偏倚。该外来因素叫混杂因素。例如,在研究身体活动与心肌梗死的关系时,高身体活动组中年长者所占比例较多,而低身体活动组中年轻者所占比例较多,同时年轻者的心肌梗死危险性低于年长者。如果身体活动对心肌梗死具有保护作用.则由于病例组和对照组间的年龄分布不同,最终可能会低估身体活动对心肌梗死的保护作用。此时年龄因素产生混杂作用,掩盖了身体活动与心肌梗死间的真实联系。又如在研究吸烟与消化性溃疡的关系时。需要考虑饮酒和喝茶习惯可能是混杂因素。吸烟人群中喝茶和饮酒者的比率较高,饮酒和喝茶习惯均可能促进消化性溃疡的发生。所以如果忽略这些混杂因素,研究结果可能导致高估吸烟与消化性溃疡的关联性。控制混杂因素的方法包括:①在设计阶段通过对研究对象采取限制、配比等方法。如进行吸烟与冠心病关系的病例对照研究,若认为年龄是混杂因素,可将研究对象的纳入标准限制于某个年龄段,这样,病例组和对照组的研究对象均处于该年龄段,年龄在比较组之间也就具有了均衡性。②在资料分析阶段,可采用分层分析或多因素分析的方法。其中分层分析是按混杂因素分层,然后再分析研究因素与疾病之间的效应,是一种控制混杂因素的有效方法。但在许多研究中,与疾病相关联的因素数不胜数,已知的混杂因素也不止一个,未知的混杂因素更防不胜防。此时,分层分析往往因样本量较小而无法应用,其他各种多因素分析方法更适宜。

七、病例对照研究实例

与实施和分析相对简单易行的横断面研究[23]来说,属于分析流行病学的病例对照研究在体检人群中的研究很少,发表于《中华健康管理学杂志》的两篇病例对照研究文章的研究人群也不是体检人群[15,21]。但采用病例对照研究方法分析健康管理领域关注的可改变危险因素,即生活行为方式与慢性病关系的应用较多。例如,谢海丽等[19]为探讨饮茶与骨质疏松性髋骨骨折的关系,采用1∶1配对病例对照方法,通过面对面访问,对广东省4家医院581例55~80岁中老年骨质疏松性髋骨骨折新发病例及性别、年龄(±3岁)配对的581名对照进行问卷调查。调查内容包括一般情况、详细的饮茶及其他饮食情况、健康相关行为和骨折家族史等。在校正年龄、能量、体质指数、文化程度、父母骨折病史、二手烟暴露史、是否服用钙补充剂及体力活动能量消耗当量等因素后,分层分析显示规律性饮茶可降低中老年男性骨质疏松性髋骨骨折的风险。

下面以张亚等[21]发表的论文《睡眠质量与2型糖尿病的相关性研究》为例进行详细介绍。

1.研究背景与目的:2型糖尿病(diabetes mellitus type 2,T2DM)和睡眠障碍在人群中均呈增长趋势,严重威胁着人类健康。目前,国外大量研究发现睡眠障碍与T2DM的发生密切相关,然而国内在这方面的研究较少。为此,本文采用病例对照研究,利用国际通用的匹兹堡睡眠质量指数(Pittsburgh sleep quality index,PSQI)量表调查研究人群的睡眠质量,探讨睡眠质量与T2DM罹患风险之间的关联性。

2.选择研究对象:(1)病例组。病例组为2013年徐州市慢病基线调查时首次确诊的T2DM患者。纳入标准为①符合中国T2DM防治指南(2010年版)的诊断标准;②年龄25~70岁;③在本地居住5年以上者。排除标准为①患其他类型糖尿病,如1型糖尿病、特殊类型糖尿病等;②患有神经系统相关疾病;③现患其他内分泌系统疾病、心肝肾功能不全、呼吸衰竭、恶性肿瘤等严重疾病者。(2)对照组。纳入标准为无T2DM者,排除标准同病例组。采用1∶1匹配的病例对照研究方法,匹配条件按年龄(±3岁)、性别、居住地、T2DM家族史4个方面,共匹配研究对象771对。

3.确定研究因素及资料收集方法:采用自行设计的调查问卷进行一般情况调查,内容包括,①一般人口学因素(性别、年龄、居住地址、文化程度、职业等);②既往高血压、冠心病、脑卒中等慢性病史;③饮食因素及生活行为(吸烟、饮酒、生活紧张度、体力活动水平等);④体格检查(身高、体重、腰围、臀围、血压、脉搏、空腹血糖等相关指标的测量)。采用PSQI量表评定研究人群最近1个月的睡眠质量。文中对睡眠相关因素及主要混杂因素(如吸烟、饮酒、生活紧张度、体力活动水平和体质指数)进行了较详细的定义。

4.资料的整理与分析:采用EpiData3.1软件对数据进行双份录入进行一致性检验后,运用SPSS13.0进行统计分析,检验水准α=0.05。计量资料以±s表示,采用t检验;分类资料以频数(百分比)表示,采用χ2检验;以T2DM发病与否为因变量,以所选择的研究因素为自变量,采用条件Logistic回归分析睡眠与T2DM的相关性。

5.研究结果与结论:首先对病例组和对照组一般情况进行描述和比较。然后比较了暴露因素(睡眠质量)在病例组和对照组间的差异。病例组PSQI平均得分及主观睡眠质量等7个维度得分均高于对照组;除了夜间易醒早醒、睡眠中感觉寒冷、做恶梦睡眠障碍行为3个因素之外,病例组睡眠障碍相关行为所占的比例均高于对照组,差异均有统计学意义(P均<0.01)。单因素Logistic回归分析显示,睡眠质量差者患T2DM的风险比睡眠质量好者高(OR=2.06,95%CI:1.46~2.90);调整混杂因素后,差异仍具有统计学意义(OR=1.72,95%CI:1.38~2.43,P<0.05)。5个睡眠维度(主观睡眠差、入睡困难、睡眠不足、睡眠效率低、睡眠障碍)和T2DM存在关联(OR=3.34、1.63、1.10、1.87、3.89)。研究结论为睡眠质量差与T2DM发病密切相关。

6.研究的优点与局限性:该研究的优点包括,①选择偏倚的控制。病例和对照均来自徐州市慢病基线调查时首次确诊的T2DM患者和非患者,研究对象的代表性较好,可以减少入院率偏倚。虽然病例组不能保证完全是新发病例,但首次确诊患者可以减少现患病例-新发病例偏倚。若病例组是2013年徐州市慢病基线调查时首次确诊的全部T2DM患者,对照组是基线调查非T2DM者符合匹配条件的随机样本,则病例组和对照的代表性更好。②信息偏倚控制。病例组为新确诊T2DM患者,PSQI量表评定的是研究人群最近1个月的睡眠质量,均可减少回忆偏倚的发生。该研究采用国际通用的PSQI量表调查研究人群的睡眠质量,采用自行设计的问卷调查一般人口学因素和其他相关混杂因素,且睡眠相关因素和混杂因素均有明确的定义,在一定程度上减少了调查偏倚。采用EpiData3.1软件对数据进行双份录入进行一致性检验后进行数据分析,也保证了信息的准确性。若作者再提供PSQI量表在中国人群应用的信效度结果,在方法部分补充现场调查方法及质量控制措施,则能更好地说明信息偏倚的控制效果。③混杂偏倚的控制。在设计阶段采用1∶1匹配的病例对照研究方法,匹配了主要的混杂因素年龄、性别、居住地和T2DM家族史;在分析阶段,调整饮食、高血压病史、冠心病史、体质指数、腰围、生活紧张度、体力活动水平等混杂因素后,采用条件Logistic回归分析睡眠与T2DM的相关性。上述方法均较好的控制了混杂因素对研究结果的影响,保证了的研究结果的真实性。

但该研究也存在一定的局限性。首先,作者说明了与T2DM有关的抑郁这一危险因素本文未进行调整,在一定程度上影响了研究的结果。其次,除了上述偏倚控制方面存在的问题外,研究设计为1∶1配对病例对照研究,在组间比较时应该采用配对设计的统计方法(如配对t检验、配对χ2检验),但文中并未说明。在结果中仅对年龄和性别这两个匹配因素进行了描述和比较,未描述居住地和T2DM家族史在两组的分布情况。最后,该文指出了所使用研究方法本身的局限性[1,3,4],暴露与疾病的时间先后常难以判断,尚不能得出因果结论,两者关系的确定最终有待于利用队列研究深入验证。

利益冲突
利益冲突

所有作者均声明不存在利益冲突

单选题[完成以下单选题可获得Ⅱ类继续教育学分(答题二维码及Ⅱ类学分授予说明见活插页)]

1.在吸烟与肺癌病例对照研究中,调查对象是:

A.病例组是怀疑患肺癌的患者,对照组是未患肺癌的人

B.病例组是吸烟的人,对照组是非吸烟的人

C.病例组是确诊患肺癌的患者,对照组是确诊未患肺癌的人

D.病例组和对照组均为吸烟的人

E.病例组是确诊患肺癌的患者,对照组是怀疑患肺癌的人

2.下列关于匹配的说法,不正确的是:

A.匹配可分为频数匹配和个体匹配

B.匹配后,可以对匹配因素与疾病的关系进行分析

C.匹配的目的之一是控制混杂因素

D.匹配可以提高研究效率

E.把不必要的变量进行匹配会造成匹配过度

3.下列关于病例对照研究特点的说法中,正确的是:

A.暴露与疾病都是现在的情况

B.能够确证因素与疾病的因果关系

C.由因及果的研究

D.需要随机分组

E.属于观察法

4.在病例对照研究中,使研究结果的偏倚最小的病例来源是来自:

A.医院的新发病例

B.社区的新发病例

C.社区的现患病例

D.医院的现患病例

E.社区的死亡病例

5、不属于病例对照研究用途的是:

A.探索病因

B.检验病因假设

C.评价影响疾病预后的因素

D.评价影响健康管理干预措施的因素

E.确证病因假设

参考文献
[1]
詹思延. 流行病学[M]. 8版. 北京人民卫生出版社2017:77-98.
[2]
王培玉袁聚祥马骏. 预防医学[M]. 4版. 北京: 北京大学医学出版社, 2018: 201-237.
[3]
李星明. 流行病学方法在健康管理科研中的应用概述[J]. 中华健康管理学杂志, 2019, 13(1): 88-94. DOI: 10.3760/cma.j.issn.1674-0815.2019.01.014.
[4]
刘宝花王培玉. 危险因素研究中偏倚与混杂的控制[J]. 中华健康管理学杂志, 2011, 5(2): 115-118. DOI: 10.3760/cma.j.issn.1674-0815.2011.02.017.
[5]
吕军城王莹莹卓来宝, . 急诊及住院自杀未遂者危险因素的病例对照研究[J]. 中国心理卫生杂志, 2019, 33(2): 81-86. DOI: 10.3969/j.issn.1000-6729.2019.02.001.
[6]
余金明王迎春陈芳. 道路交通伤害的病例对照研究[J]. 中华流行病学杂志, 2005, 26(5): 344-347. DOI: 10.3760/j.issn:0254-6450.2005.05.011.
[7]
杜琳张维蔚刘伟佳, . 广州市中小学生运动伤害危险因素的配对病例对照分析[J]. 中华流行病学杂志, 2010, 31(1): 27-29. DOI: 10.3760/cma.j.issn.0254-6450.2010.01.007.
[8]
路露胡宁宁芦鸿雁, . 社会支持对老年患者非计划性再入院影响的病例对照研究[J]. 现代预防医学, 2018, 45(20): 3727-3730.
[9]
陈甘讷韦荣忠刘云辉, . 学龄前儿童中度肥胖危险因素的病例对照研究[J]. 中国妇幼保健, 2019, 34(2): 418-420. DOI: 10.7620/zgfybj.j.issn.1001-4411.2019.02.59.
[10]
朱纯纯方钱娟周巧云, . 老年骨科患者术后高活动性谵妄危险因素的巢式病例对照研究[J]. 中华医学杂志, 2018, 98(40): 3230-3234. DOI: 10.3760/cma.j.issn.0376-2491.2018.40.003.
[11]
陆泽雄江朝强胡志兵, . 基于广州生物库队列的轻度认知障碍与卒中死亡关系的巢式病例对照研究[J]. 中国慢性病预防与控制, 2018, 26(12): 890-894. DOI: 10.16386/j.cjpccd.issn.1004-6194.2018.12.003.
[12]
胡伟军刘晓宇王新华, . 用病例对照研究评价流行性腮腺炎疫苗保护效力及疾病暴发原因探析[J]. 实用医学杂志, 2018, 34(22): 3801-3804. DOI: 10.3969/j.issn.1006-5725.2018.22.032.
[13]
陈秋艳卜晓青刘艳, . 白介素6、内皮素1和E选择素与心脑血管病关系的巢式病例对照研究[J]. 中华流行病学杂志, 2014, (10): 1151-1154. DOI: 10.3760/cma.j.issn.0254-6450.2014.10.017.
[14]
NewcombePJ, ConnollyS, SeamanS, et al. A two-step method for variable selection in the analysis of a case-cohort study[J]. Int J Epidemiol, 2018, 47(2): 597-604. DOI: 10.1093/ije/dyx224.
[15]
王娜仝林虎王培玉, . 内蒙古地区胆囊结石危险因素的研究[J]. 中华健康管理学杂志, 2013, 7(4): 233-238. DOI: 10.3760/cma.j.issn.1674-0815.2013.04.006.
[16]
陆凤应丹妮龚巍巍, . 浙江省甲状腺癌患病影响因素的配对病例对照研究[J]. 中华流行病学杂志, 2018, 39(10): 1387-1393. DOI: 10.3760/cma.j.issn.0254-6450.2018.10.018.
[17]
李侠谢胜男王寅, . 围孕期先天性心脏病危险因素的1∶2配比病例对照研究[J]. 中华流行病学杂志, 2014, 35(9): 1024-1027. DOI: 10.3760/cma.j.issn.0254-6450.2014.09.012.
[18]
郭健刘远立关天嘉, . 健康相关行为与高血压人群脑卒中发病风险的关联[J]. 中华预防医学杂志, 2019, 53(2): 223-228. DOI: 10.3760/cma.j.issn.0253?9624.2019.02.019.
[19]
谢海丽欧阳维富吴宝华, . 饮茶与中老年人骨质疏松性髋骨骨折关系的病例对照研究[J]. 中华流行病学杂志, 2013, 34(4): 385-388. DOI: 10.3760/cma.j.issn.0254-6450.2013.04.017.
[20]
程庆林谢立徐勇. 杭州市13~18岁青少年高血压影响因素病例对照研究[J]. 中国学校卫生, 2016, 37(10): 1519-1522. DOI: 10.16835/j.cnki.1000-9817.2016.10.023.
[21]
张亚张盼娄培安, . 睡眠质量与2型糖尿病的相关性研究[J]. 中华健康管理学杂志, 2014, 8(5): 305-309. DOI: 10.3760/cma.j.issn.1674-0815.2014.05.007.
[22]
王妮武继磊张远, . 妇女孕期化肥暴露与其子代低出生体重发生风险关联研究[J]. 中华流行病学杂志, 2018, 39(10): 1324-1328. DOI: 10.3760/cma.j.issn.0254-6450.2018.10.007.
[23]
帅平. 横断面调查在健康管理科研中的理论、设计和应用[J]. 中华健康管理学杂志, 2019, 13(2): 179-184. DOI: 10.3760/cma.j.issn.1674-0815.2019.02.020.
 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词