
回顾分析27年来肝癌领域队列研究的应用趋势,展望未来发展方向。
检索汇总1991年以来中国大陆地区发表的中英文肝癌队列研究文献,对发表时间、科研单位、研究目标与随访调查情况进行统计分析。
27年来肝癌相关队列研究论文数量明显增长,英文核心期刊群已形成。中英文论文发表数量年平均增长率分别为20.4%与35.2%,52.3%的中文论文与73.5%的英文论文为近5年内发表。49.2%的中文论文发表在核心期刊,47.3%的英文论文发表在影响因子>3分的期刊。国内期刊发表的研究以病因研究为主(41.5%),多为大样本研究;SCI论文研究主要着眼于肝癌预后研究(40.7%),生存分析运用普遍。
队列研究在我国肝癌研究领域的应用逐渐增多,其中大样本研究与预后分析较为普遍。虽然队列研究的应用得到重视和推广,但仍需进一步提高研究者对于队列研究的认识,提高随访效果、降低失访率,增加生存分析等科学评估手段的应用,更科学地运用队列研究解决临床问题。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
队列研究(cohort study)是针对一个范围明确的人群,根据是否暴露于某个研究因素及暴露程度进行分组追踪观察,比较结果差异,以确定暴露因素与结局之间因果关联程度的观察性研究方法。常见有前瞻性队列研究(prospective cohort study)、历史性队列研究(historical cohort study)和双向性队列研究(ambispective cohort study)。队列研究的证据级别较高,为循证医学中的Ⅱ级证据,是医学研究中的重要证据来源[1],其在寻找病因和危险因素、筛选预后标志以及检验治疗方法等方面有极大优势。本文检索1991-2017年间国内外发表的中国大陆地区肝癌领域的队列研究论文,汇总27年来流行病学队列研究的应用情况与发展趋势,分析这一研究策略的主要应用方向和相关问题,从而促进未来肝癌领域队列研究的设计与实施。
中文文献以万方数据知识服务平台、中国知网为数据源;在高级检索入口的"题名或关键词"字段,以"队列研究""前瞻性研究""肝癌""肝细胞癌""肝肿瘤"等为检索词检索。英文文献以PubMed数据库为数据源;以题名或关键词检索"Cohort Studies""Liver Neoplasms""China",检索日期均为1991年1月1日至2017年12月31日;检索搜集到中文文献103篇,英文SCI文献708篇。
①国内外公开发表的肝癌研究领域队列研究,包括其衍生研究如巢式病例对照研究、病例队列研究,排除单纯病例对照研究。判定依据:研究具有前瞻性;研究对象为具有某种共同特征的人群;研究具有暴露组及对照组;肝癌研究领域。②仅选用期刊论文,剔除会议论文、学位论文;仅限于论著型论文,不包括综述、Meta分析。③研究区域为中国大陆地区,不包括港澳台地区的研究论文。
利用医学文献V 5.0.3.6软件进行文献管理。对于纳入的文献主要提取以下信息:发表时间、科研单位、研究类型、研究目标、基金支持、样本量、随访信息等。并对信息进行分类统计分析。
采用SPSS 21.0软件进行统计分析,计数资料用频数和百分比(%)表示,构成比差异使用χ2检验,核心期刊群由布拉福德定律算法得出。
共检索得到中文文献103篇,英文SCI文献708篇,依据纳入与排除标准进行文献阅读及筛查。中文文献排除非队列研究文章13篇,非肝癌领域文章25篇;英文SCI文献排除非队列研究文章101篇(其中肝癌队列的随访研究64篇),非肝癌研究领域30篇。最终共得到肝癌领域队列研究中文文献65篇,英文SCI文献577篇。自1991-2017年间中国大陆地区研究机构发表的肝癌领域中文及SCI队列研究论文的时间分布见图1,图2。中文文献方面,论文发表数量年平均增长率为20.4%,1998-2007年间年均发表论文1.5篇,2008-2017年间年均发文量增长至4.8篇,增幅为2.2倍。纳入的中文文献中52.3%(34篇)为近5年内发表,2017年达年发文量峰值13篇。英文文献方面,年平均增长率35.2%,1998-2007年间年均发表SCI论文4.0篇,2008-2017年间年均发文量大幅增长至53.2篇,增幅为12.3倍,有73.5%(424篇)为近5年内发表,2015年达到年发文量峰值110篇。上述数据提示队列研究的策略在中国肝癌领域的应用显著增加,相关结果在国际上的发表交流更为普遍。




中文文献中核心期刊(北大、南大核心)共32篇,占49.2%。英文文献根据其影响因子(Influence factor,IF)进行分组统计(表1),577篇英文SCI论文中近半数文章(47.3%)IF>3分,提示队列研究的SCI文章质量整体水平较高。定义SCI文献IF>4分的89篇研究(IF值前15%)为高质量研究,其发表单位均为三甲医院、省级或国家级研究机构。其中近5年内高质量研究共65篇(73.0%),68篇(76.4%)文献标注了国家级或省级基金支持,平均每篇3.1个。21篇(23.6%)为多中心合作研究,其中17篇为近5年内发表,占近5年高质量研究的24.6%,与5年前(4篇,16.7%)相比有所提高;国际合作项目共5篇。研究类型方面以回顾性研究居多,共50篇(56.2%)。研究地区主要集中在江苏、上海,有17篇中英文文献研究专门针对启东、海门两地肝癌高发地带。

1991-2017年中国肝癌领域队列研究的SCI论文影响因子分布
1991-2017年中国肝癌领域队列研究的SCI论文影响因子分布
| 影响因子(分) | 文献数量 | 百分比(%) | 影响因子(分) | 文献数量 | 百分比(%) |
|---|---|---|---|---|---|
| ≤2 | 88 | 15.3 | 5~ | 49 | 8.5 |
| 2~ | 216 | 37.4 | ≥10 | 17 | 2.9 |
| 3~ | 179 | 31.0 | 合计 | 577 | 100.0 |
| 4~ | 28 | 4.9 |
根据布拉福德定律,某学科领域内的论文数量平均分布在发表论文最多的核心区期刊以及与核心区发表同等论文数量的随后几个区(外围期刊区),此时核心区与后继各区的期刊数存在数列关系:nc∶n1∶n2=1∶a∶a2(a>1),nc为核心期刊数,n1为外围一期期刊数,n2为外围二期期刊数。统计发现中文期刊a<1,无法使用该定律,提示中国肝癌领域的队列研究尚未形成中文核心期刊群。英文文献布拉福德定律分布见表2。通过分析统计得出nc=6,n1=23,n2=117,nc∶n1∶n2=1∶3.8∶19.5≈1∶4∶42,符合布拉福德定律,表明SCI肝癌队列研究领域已形成核心期刊群。

SCI论文的布拉福德定律分布情况
SCI论文的布拉福德定律分布情况
| 期刊类型 | 期刊数量 | 发文量 |
|---|---|---|
| 核心期刊 | 6 | 202 |
| 一围期刊 | 23 | 194 |
| 二围期刊 | 117 | 181 |
| 合计 | 146 | 577 |
本文对常见的肝癌队列研究目标进行了详细分类统计,统计结果见表3。总体分为4类:一是筛选新的病因或预后危险因素;二是评估各类治疗方案的疗效;三是针对前期基础研究或流行病学调查明确的病因或危险因素,进一步评估预测和预后价值;四是针对已有的治疗标准,进行评估验证。从统计结果可见,SCI论文最常见的研究目的为肝癌预测和预后标志物评价,共241篇(41.8%)。其中112篇(19.4%)为全肝癌患者预后标志物研究,92篇(15.9%)为手术患者预后标志物研究,31篇(5.1%)为预测模型研究,6篇(1.0%)为发病预测标志研究。中文文献中仅7篇(10.8%)涉及肝癌预测和预后标志物评价,低于SCI论文中的比例,差异有统计学意义(P<0.01)。中文研究集中于筛选病因或高危因素,共34篇(52.3%),其中多数为发病因素探索,共27篇(41.5%);95篇(16.5%)SCI论文旨在筛选新的发病或预后影响因素,多数为筛选相关因素,共计58篇(10.1%)。中英文文献中这一类型的占比差异有统计学意义(P<0.01)。在临床研究方面,中英文论文占比相近,分别为36.9%与39.6%,中文研究以单独疗法研究居多,共12篇(18.5%);SCI收录文献以联合治疗研究居多,共88篇(15.3%)。其他临床治疗方面的研究包括治疗方式比较、治疗指征、病情评估标准及肝癌分期标准等,中英文论文均有少部分研究涉及。

肝癌领域队列研究研究目标分布
肝癌领域队列研究研究目标分布
| 目标 | SCI文献 | 中文文献 | |
|---|---|---|---|
| 病因与危险因素 | |||
| 发病因素 | 37(6.4) | 27(41.5) | |
| 预后危险因素 | 58(10.1) | 7(10.8) | |
| 小计 | 95(16.5) | 34(52.3) | |
| 临床治疗 | |||
| 单独疗法 | 70(12.1) | 12(18.5) | |
| 联合治疗 | 88(15.3) | 9(13.8) | |
| 治疗方式比较 | 48(8.3) | 2(3.1) | |
| 治疗指征 | 23(4.0) | 1(1.5) | |
| 小计 | 229(39.7) | 24(36.9) | |
| 预后标志 | |||
| 发病预测标志物 | 6(1.0) | 1(1.5) | |
| 肝癌患者总体预后标志 | 112(19.4) | 4(6.3) | |
| 手术患者预后标志 | 92(15.9) | 1(1.5) | |
| 预测模型 | 31(5.4) | 1(1.5) | |
| 小计 | 241(41.7) | 7(10.8) | |
| 临床标准 | 12(2.1) | 0(0.0) | |
| 合计 | 577(100.0) | 65(100.0) | |
注:括号外数据为篇数,括号内数据为百分比(%)
89篇高质量英文文献中,样本量范围为27~497 693例,均值11 584例,中位数为348例;其中样本量>10 000例的有5项,1 000~10 000例的17项,样本量<1 000例的共67项。65篇中文文献中,样本量范围为28~90 236例,均值3 398例,中位数为297例;其中样本量>10 000例的有6项,1 000~10 000例的15项,样本量<1 000例的共44项。在纳入标准方面,中文文献中共有29篇(44.6%)明确列出纳入标准,低于英文文献的47篇(52.8%),二者差异有统计学意义(P<0.05)。研究类型方面平均样本量统计结果见表4。比较发现病因方面队列研究的平均样本量明显大于其他分类,预后研究需要的平均样本量最小,在临床治疗问题上,历史性队列研究的样本量明显大于前瞻性研究。

肝癌领域队列研究的平均样本量
肝癌领域队列研究的平均样本量
| 研究类型 | 英文文献 | 中文文献 | ||||
|---|---|---|---|---|---|---|
| 前瞻性 | 历史性 | 合计 | 前瞻性 | 历史性 | 合计 | |
| 病因研究 | 86 139 | 11 965 | 54 415 | 5 853 | 9 836 | 8 062 |
| 临床治疗 | 261 | 1 270 | 854 | 498 | 1 143 | 1 021 |
| 预后研究 | 345 | 425 | 413 | 948 | 137 | 543 |
| 其他 | 651 | 289 | 515 | - | 388 | 388 |
高质量英文文献中共34篇明确提供了中位随访时间,时间范围6~168个月,平均为43.9个月;共31篇文献提供了最大随访时间,平均为72.4个月;随访间隔一般为首年1~2个月,之后每年间隔3~6个月;截至随访结束,失访率平均为3.0%。中文文献中共24篇提供了中位随访时间,时间范围12.9~168个月,平均70.0个月,共12篇文献提供了最大随访时间,平均为174.3个月;随访间隔常为6个月或1年,共15篇文献提供了失访率,平均为6.7%。生存分析使用方面,高质量英文文献中82篇(92.1%)文献进行了生存分析,其余研究为以发病为终点事件,未涉及患者生存情况;73篇(82.0%)论文绘制了生存曲线,60篇(67.4%)统计了5年以上累计生存率;22篇(24.7%)论文同时提供了累计生存率及时段生存率,41篇(40.7%)文献同时提供了累计生存期及无病生存期;71篇(79.8%)文献对生存情况使用了多变量分析,其中64篇使用多元Cox回归,7篇使用logistic回归。相比之下中文文献的生存分析使用频率明显偏低,共25篇(38.5%)文献绘制了生存曲线并提供了累计生存率,12篇(13.5%)进行了多元Cox分析,与英文论文相比差异有统计学意义(均P<0.01)。
开展队列研究,研究投入风险大,改变暴露因素后易产生偏倚[2]。但随着科研环境的改善,近5年论文的数目大幅增加,通过布拉福德定律统计发现肝癌队列研究的英文文献已形成核心期刊,研究热度高涨。一方面反映出我国医疗机构样本库建设与随访调查方面进步明显,另一方面体现出队列研究的应用前景良好。
在研究类型选择方面,历史性队列研究尽管受行为、地区、回忆等偏倚影响,但操作可行性高,相对省时省力,受到大多数研究者青睐。在高质量英文论文中,历史性队列研究论文多见于大规模调查,例如对一段时间内上海市肝癌发病率变化情况的调研[3],或多中心肝癌肝移植术后死亡率评估指南的研究[4]。这些历史性队列研究需要大规模样本资料,虽然研究难度很大,但也极大限度地降低了干扰因素的影响。
在研究对象选择方面,近年来更多的肝癌研究人员选择院内就诊或治疗的患者作为研究对象,该部分患者具有良好的病史记录及随访依从性,方便统计研究。例如对比早期肝癌高龄患者实施放疗或开放性肝脏切除手术疗效前瞻性研究[5],以及通过对本院大量病例进行历史性队列分析调查病因,制定临床指南的历史性队列研究[6]。在2008年之前,区域性队列研究较为常见,比较典型的如肝癌高发区的启东队列、海门队列。启东地区的HBsAg感染者队列,可以宏观地前瞻性研究HBsAg感染率情况与肝癌发生的关系[7],也可以微观上研究HBsAg载毒量[8]或病毒DNA复制状态与肝癌发生的关系[9],以及长达30年针对HBV感染与肝癌在不同暴露因素下的干预研究等[10]。
队列研究是确定因果关联的有力工具,其在病因探索中起到重要的作用,占中文论文研究数半数以上(52.3%)。20世纪90年代诸多职业暴露与肝癌发生关系的研究[11];2000年以来建立了多个启东地区肝癌高发队列,开始着重研究HBV携带情况与肝癌发病的关联[12];近年来着眼多种危险因素如糖尿病与肝癌的发病风险之间的关系等研究[13]。一方面病因研究观察终点多为发病与否,实施可行性高,但生存情况常不涉及,统计分析不够深入,多发表于国内期刊;另一方面肝癌发病因素多受地域、生活习俗影响,我国发病队列研究对国内肝癌的防治具有较大指导意义,对其他国家的指导偏倚较大,SCI论文涉及较少。在临床治疗方面,早期发表论文中主要以研究传统的手术切除、化疗等单疗法方式在不同类型肝癌中的作用及优势。随着对于发病机制的了解,对预后、生活质量要求的提高,抗病毒治疗、免疫分子治疗、射频消融等创伤小、疗效显著的新兴治疗研究逐渐占据研究的主要位置[14,15]。但肝癌的治疗方面队列研究并未出现突破性进展,大多数研究通过分析患者预后,比较联合治疗或两种现有治疗方式之间对于不同类型或分期的肝癌患者的疗效[16,17]、探寻首选治疗[18],部分探究手术指征外的患者在接受手术后的疗效提升[19],因此肝癌的治疗方面研究还有较多突破点亟待发掘,依然会是未来的研究热点。在SCI文献中,预后标志物研究占据最大比重241篇(41.8%)。目前认为在肝癌的治疗过程中,早诊早治起到关键作用,因此寻找可靠的肿瘤标志物是指导治疗的关键及研究的热点。目前大多数研究通过分析以往患者的检测报告以及预后状况,寻找某种标志物对肝癌自然预后的作用[20];或对接受治疗的患者检测某种标志物含量,前瞻性研究其在预测患者复发及术后生活质量中的作用[21]。然而,目前为止,自然预后及治疗预后标志物过多,共204篇(35.4%),可靠的发病预测标志物依然稀少,相关研究仅6篇(1.0%),寻找可靠的发病预测标志物依然具有广阔的研究前景。
队列研究设计方面,中英文论文样本量中位数均在300篇左右,既考虑到纳入足够的样本减小偏倚,又兼顾随访的可控制性,但病因研究需排除多种混杂因素,样本量普遍偏大,最高可达10万以上。随访方面,中英文研究普遍能做到3年以上的随访,随访间隔多为3个月至1年,失访率均在10%以下,但仅部分文章详细提供了随访情况,导致统计分析存在一定误差。绝大部分(92.1%)高质量英文论文曾使用生存分析,Cox多元回归使用率(71.9%)高,但在中文论文中生存分析使用率仅38.5%,明显偏低,多数研究也只进行了单变量分析,因此中文研究在统计分析的严谨性与科学性方面还有待进一步提高。
队列研究在肝癌领域应用已十分广泛,进一步提高研究者对于队列研究的认识,建立良好的随访计划、降低失访率,增加生存分析等科学评估手段的应用是当下亟待进一步提高之处。疾病表现形式的多样性已逐渐不满足于针对某特定范围内的研究,多中心合作型队列研究可以增加患者队列的代表性,更全面地认识疾病在不同情况下的表现形式,取得更具突破性的研究成果。增加临床中心之间的合作,也有助于拓宽队列研究的思路,丰富研究内容与研究代表性,进而为队列研究的发展注入新的活力,在未来的疾病研究中起到更重要的作用。
所有作者均声明不存在利益冲突





















