
领先时间偏倚和病程长短偏倚是观察性筛查队列研究中常见的系统误差,也是导致筛查效果被夸大或歪曲的常见原因。在考虑领先时间偏倚和病程长短偏倚的基础上准确地估计筛查的真实效果是当前流行病学研究的一个难点。本文结合案例分析,阐述如何利用肿瘤细胞倍增时间和非齐次泊松过程校正领先时间偏倚,如何使用加权法校正病程长短偏倚,并讨论不同分析方法的使用条件,以准确、恰当地评价不同肿瘤筛查方案的真实效果。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
筛查是运用快速简便的试验、检查或其他方法,将健康人群中那些可能有病或缺陷、但表面健康的个体,同那些可能无病者鉴别开来[1]。肿瘤筛查可从健康人群中发现可疑患者,尽早进行治疗,是提高肿瘤早诊率,延长肿瘤生存时间的重要方法。作为降低人群肿瘤疾病负担的措施之一,众多肿瘤筛查已经在全国开展。偏倚是流行病学研究中最常见的系统误差,其描述了估计值高于或低于真实值的现象,因而具有方向性[2]。通常,偏倚可分为选择偏倚、信息偏倚和混杂偏倚。在实际研究中,研究者通常根据偏倚的来源在试验的不同阶段采取相应的策略,以降低偏倚对研究结果的影响。例如,在研究设计阶段采用客观的结局指标、严格的试验设计,研究实施阶段严格执行研究方法,资料分析阶段采用恰当的分析策略,如针对已知的混杂因素进行分层分析、对基线资料不均衡或样本量不够大的研究采用多因素分析等。在实验流行病学中,安慰剂对照、随机化分组和盲法被认为是降低偏倚最有效地策略[3]。
然而,观察性筛查队列研究中,以累计死亡率或生存率作为主要结局指标通常无法反映出筛查试验的真实效果,领先时间和病程长短偏倚可能导致筛查效果被夸大或歪曲。此外,由于肿瘤的诊断时间与瘤体大小、筛查方案的灵敏度和特异度以及医师经验等因素密切相关,即使采用完全随机对照筛查研究也无法完全避免领先时间和病程长短偏倚对研究结果的影响。因此,如何在考虑领先时间和病程长短偏倚的基础上准确地估计筛查的真实效果是当前流行病学研究的一个难点。本文在观察性筛查队列研究中,对领先时间和病程长短偏倚的识别和校正进行方法学阐述和案例分析。
领先时间偏倚,是指由于领先时间的存在而导致受试者生存获益被夸大的现象[2]。在筛查研究中,领先时间指受试者由筛查发现到常规临床诊断之间的时间,其主要发生在筛查试验诊断的患者中(图1)。例如,某位肿瘤患者的瘤体形成时间(肿瘤的诊断标准为瘤体直径>3 mm)为2006年,临床诊断时间为2012年,最后死亡时间为2016年,其生存时间为4年。倘若该患者在2010年参与了筛查并诊断为肿瘤患者,但其最终死亡时间仍为2016年。此时,我们可能会认为该患者的生存时间由于筛查试验而延长为6年。但是,此6年的生存时间并非筛查的临床获益,而是由领先时间产生的偏倚(图2)。筛查试验的意义就是在临床前期实现早期诊断、早期治疗,以延长患者预后的生存时间。因此合理、恰当地评价筛查的效果就显得尤为重要。


t0:发病时间,t:筛查诊断时间,t1:症状诊断时间


通常,在观察性筛查队列研究中生存时间的计算可以分为两类,分别为从受试者入组开始到患者死亡所经历的时间和从患者肿瘤确诊开始到患者死亡所经历的时间。前者将筛查试验视为一种干预性措施,评价其对患者肿瘤相关死亡风险的影响,而忽略筛查时间对患者预后生存的影响,此时患者的临床获益可以完全归功于筛查试验;后者考虑了筛查时间对患者预后生存的影响,此时患者的临床获益则有可能同时来源于领先时间和筛查试验。因此,比较两种生存时间可以作为识别领先时间偏倚的手段之一。
鉴于领先时间可以视为由于筛查试验而导致筛查诊断患者的生存时间人为延长,通过在筛查诊断患者中减去领先时间或在非筛查诊断患者中添加领先时间均可以有效的降低领先时间对筛查效果的影响。因此,目前针对领先时间偏倚的校正主要集中在对领先时间的估计。例如,利用肿瘤相关标识物、影像学或细胞生物学中肿瘤的倍增时间或临床前期与临床诊断时肿瘤相关标识物的增殖速率来估计肿瘤临床可检测期的长短,在此基础上利用参数模型(如指数增长模型)估计领先时间的大小,校正领先时间偏倚[4]。常见的领先时间估计方法如下:
在临床前滞留期(可检测期),有效的筛查可以检测出肿瘤的存在。假设肿瘤细胞在临床前滞留期呈指数增长,领先时间也呈指数增长。通过肿瘤细胞倍增时间td,得到肿瘤细胞的增长速率τ=ln(2)/td。v0为肿瘤在t=0时刻的体积,则肿瘤的增长速度为v(t)= v0eτt。vp和vm分别为筛查可诊断和临床可诊断时肿瘤的体积。此时在细胞水平上,临床前滞留时间ts定义为肿瘤细胞增殖到临床可诊断所经历的时间,则为
。考虑到临床前滞留期ts服从指数分布,1/ts可用来描述肿瘤由临床前滞留期转化为临床期的转移概率λ。基于指数分布的无记忆性特点,转移概率λ可用于估计领先时间E的长短,E=(1-eλt)/λ。
基于该转移概率,Toyoda等[5]提出了校正项目(correction term, CT)的概念,通过在观测生存时间的基础上增加校正项目用于估计校正后的生存时间,进而评价筛查的效果。Toyoda等选取1995年1月至2015年6月在某医疗机构被诊断为初始(非复发)肝细胞癌(hepatocellular carcinoma,HCC)患者3 899例,其中255例患者诊断前已发现肝结节且至少进行了两次肝结节的测量。将肝结节直径达到5 mm起至死亡或最后一次随访定义为调整生存时间。首先,估计255例患者的肿瘤体积倍增时间(tumor volume doubling time, TVDT),即HCC体积加倍所需的持续时间。设st为时间t的HCC大小,时间参数t1和t2分别为第一和第二测量日期。通常,t1是检测到肝结节的日期,t2是HCC诊断的日期,由此估计TVDT=log2/c,式中常数c是估计的参数,
。两时间间隔平均136 d,TVDT为141.9 d。在估计每个受试者的TVDT后,估计合并的TVDT(包括常见TVDT、病因特异性TVDT和肝功能特异性TVDT)以确认基于HCC疾病病因和肝功能的TVDT的异质性。肝功能的TVDT在患者间差别较大。此案例中仅有255例患者可直接计算出TVDT,其他病例的TVDT依据三种TVDT估计得到。
其次,使用TVDT计算生存时间的
,筛查和未筛查患者的调整生存时间=生存时间+CT。使用普通CT(CT1)估计调整生存时间1,使用HCC病因特异性CT(CT2)估计调整生存时间2,使用肝功能特异性CT(CT3)估计调整生存时间3。对于每位患者,将所有三个调整的生存时间用于生存分析,进而估算领先时间偏倚。监测组和非监测组的领先时间偏倚分别为4.86、2.72年;调整偏倚后,监测组和非监测组的随访时间分别为7.18、5.65年。
非齐次泊松过程是以简单的时间连续状态离散的随机过程,该过程假设累计随机事件发生次数为最基本的独立增量,即每一个时间段内结局时间的发生次数是相互独立的。此时,肿瘤的发病率转换为某段时间内肿瘤患者的由临床前期到临床期的转移率,该转移率可以通过非齐次泊松过程进行拟合转化为新发肿瘤患者的诊断日期,即连续两名肿瘤患者之间的时间间隔服从指数分布。其中,最常见的两种拟合过程为指数增长过程和对数线性增长过程。以2017年1—6月某肿瘤筛查点新发21例胃癌病例为例,其具体发病时间见表1。

基于指数和对数线性非齐次泊松过程对21例胃癌新发病例的发病及领先时间估计(d)
基于指数和对数线性非齐次泊松过程对21例胃癌新发病例的发病及领先时间估计(d)
| 序号 | 发病时间 | 生存时间 | 基于指数模型估计领先时间 | 基于对数线性模型估计领先时间 |
|---|---|---|---|---|
| 1 | 5.70 | 174.30 | 5.70 | 5.52 |
| 2 | 38.39 | 141.61 | 27.13 | 24.01 |
| 3 | 60.14 | 119.86 | 18.15 | 19.90 |
| 4 | 90.47 | 89.53 | 7.57 | 9.51 |
| 5 | 95.61 | 84.39 | 6.69 | 8.31 |
| 6 | 98.83 | 81.17 | 6.21 | 7.64 |
| 7 | 102.42 | 77.58 | 5.73 | 6.95 |
| 8 | 105.61 | 74.39 | 5.35 | 6.39 |
| 9 | 109.39 | 70.61 | 4.94 | 5.78 |
| 10 | 113.45 | 66.55 | 4.56 | 5.20 |
| 11 | 118.94 | 61.06 | 4.10 | 4.50 |
| 12 | 121.41 | 58.59 | 3.91 | 4.22 |
| 13 | 133.67 | 46.33 | 3.15 | 3.06 |
| 14 | 134.63 | 45.37 | 3.10 | 2.98 |
| 15 | 134.95 | 45.05 | 3.09 | 2.95 |
| 16 | 145.16 | 34.84 | 2.62 | 2.26 |
| 17 | 146.25 | 33.75 | 2.58 | 2.19 |
| 18 | 146.70 | 33.30 | 2.56 | 2.17 |
| 19 | 147.26 | 32.74 | 2.54 | 2.14 |
| 20 | 148.15 | 31.85 | 2.50 | 2.09 |
| 21 | 152.40 | 27.60 | 2.35 | 1.87 |
假设该21例胃癌新发病例数服从非齐次泊松过程,分别拟合指数和对数线性泊松过程(图3),得到胃癌由临床前期到临床期的转移概率λ(t):指数模型:λ(t)=
;对数线性模型:λ(t)=e0.03t-4.63。假设随访截止日期为第180天且所有患者均存活,在此基础上估计每个时间点胃癌的转化率,进而结合Duffy等[6]提出的指数模型估计该时间段内领先时间的大小。如第七例患者的生存时间为t=102.42 d,利用指数模型计算λ(102.42)=0.175,通过公式
,可得出对应领先时间为5.73 d;再利用对数线性模型计算λ(102.42)=0.144,其对应领先时间为6.95 d,详见表1。在未校正领先时间偏倚之前,该筛查人群的中位生存时间为61.1(95%CI:45.1~84.4)d;分别经指数和对数线性模型校正领先时间偏倚后,该筛查人群的中位生存时间分别为57.0(95%CI:42.0~77.7)d、56.6(95%CI:42.1~76.1)d。


在流行病学研究中,常常出现病程较长的疾病预后较病程短的疾病更好的现象[2]。原因在于病程长的疾病临床前滞留期时间相对较长,使该部分患者更容易被检测出并得到及时的治疗,进而延长其预后生存时间。当在该受试人群中评价筛查试验的效果时,筛查组的部分患者由于病程长或疾病进展缓慢而导致临床获益增加,进而夸大筛查的效果,详见图4。与领先时间偏倚相比,病程长短偏倚的识别更为困难。鉴于筛查试验更倾向于检测出病程较长或进展缓慢的受试者,如良性肿瘤患者,因此根据受试人群中良性和恶性肿瘤患者的检出比例可以定性的判断病程长短偏倚的存在。


筛查研究中,科学地试验设计和严格地受试者纳入和排除标准有助于降低病程长短偏倚的出现。但是,由于肿瘤的异质性的存在,针对病程长短偏倚的校正目前主要集中在统计分析阶段。具体根据受试人群的初筛结果进行分层,再估计不同层受试人群的累计死亡率,进而利用加权的策略校正病程长短偏倚对研究结果的影响[7]。Duffy等[6]提出的加权法进行部分校正是最简单、常用的方法。例如,在某项筛查研究中,根据病理活检的结果将受试人群分为恶性和良性肿瘤两大类。前者肿瘤进展速度快、病程短,后者肿瘤进展速度慢、病程长。假设在该受试人群中,恶性和良性肿瘤患者的比例分别为q和1-q,且筛查试验对恶性和良性肿瘤患者中的检出率分别为ps和ps/θ,其中θ <1且 ps/θ<1。假设筛查组患者肿瘤的死亡风险是非筛查组的φ倍(φ=RR),筛查组中恶性肿瘤的死亡风险是良性肿瘤的θ倍,且非筛查组中恶性肿瘤的死亡率为p,则在该人群中肿瘤相关死亡率p1的加权法估计值为Pr(肿瘤相关死亡|筛查检出病例)=
。此时非筛查检出病例包括两部分:筛查组中筛检试验漏诊后因出现临床症状被检出的患者和非筛查组中因临床症状检出的患者。因此,仍利用加权的方法估计该患者人群肿瘤相关的死亡率p2,记为Pr(肿瘤相关死亡|症状检出病例)=
,在此基础上利用相对死亡风险直接估计筛查试验的效果,记为
=
,当q和θ均小于1时,RR≤φ,提示病程长短偏倚可能会夸大筛查试验的效果。此外,在该受试人群中肿瘤患者的整体检出率p3为:Pr(筛查试验检出率)=p3=qps+(1-q)ps/θ。因此,给定p1,p2,p3,θ和q的值,可以估计校正病程长短偏倚后的筛查效果
值:
。在实际筛查研究中,可以估计出p1,p2和p3的值。此外,探索性的模拟θ和q的取值可以得到校正病程长短偏倚后相对死亡风险的取值区间。
Duffy等收集了1988—2001年50~69岁和2002—2004年50~74岁英格兰中西部地区女性,共10 100例筛查乳腺癌和15 862例症状乳腺癌患者(6 009例为多次筛查间隔期症状检出乳腺癌,9 853例为未参加筛查症状检出乳腺癌),p3为0.39。诊断后十年内分别有4 620例和819例患者死亡,得到p1=0.12,p2=0.35,RR=0.34。由于实际研究中无法确定肿瘤患者中恶性肿瘤的发生比例的取值,Duffy选择θ和q的取值范围均为0.5~0.9,然后估计校正病程长短偏倚后
值的中位数及其波动范围,即
=0.51(0.49~0.59)。
本研究在既往研究的基础上介绍了肿瘤筛查研究中领先时间偏倚和病程长短偏倚的识别与校正方法,旨在为筛查效果的准确评价提供思路和方法。
领先时间偏倚校正方法有基于肿瘤细胞倍增时间和基于非齐次泊松过程的领先时间估计。前者基于肿瘤细胞倍增时间,得到肿瘤增长速率,依照体积变化求得临床前滞留时间,最终估算领先时间。该方法多在有肿瘤细胞研究基础时使用,且需要尽可能明确相关肿瘤细胞在患者体内的生长状况。后者假设区间内肿瘤的发病时间服从非齐次泊松过程且肿瘤细胞的增殖过程满足指数分布,在此基础上利用新发病率的发病时间可以估计疾病的转化风险,进而计算领先时间的长短。该方法适用于有明确发病时间或能明确推算出发病时间的病例,对发病时间难以得到或估算不准确的病例估计误差相对较大。病程长短偏倚一般使用加权法进行部分校正。良好的筛查队列研究能够提供较好的数据来源,使得筛查诊断患者的肿瘤死亡率,肿瘤症状诊断患者中肿瘤死亡率和肿瘤患者的整体检出率的值能反映真实情况,以进一步得到校正病程长短偏倚后的筛查效果。有依据的根据肿瘤特点选取肿瘤患者中恶性肿瘤的发生比例的取值范围,以便得到估计校正病程长短偏倚后相对死亡风险的取值区间。
领先时间偏倚和病程长短偏倚在实际研究中通常无法直接观察,导致偏倚的估计与校正过程依赖于多个前提假设。例如,肿瘤细胞的生长满足指数分布;瘤体的最小可检测体积已知且固定不变;肿瘤筛查试验灵敏度和特异度不随瘤体的变化而发生剧烈改变等等。因此,在使用上述方法校正偏倚时,需要明确阐明不同方法的前提假设,以确保研究结果的可重复性。此外,不同分析方法估计结果可能不同,因此利用数值模拟的方法对筛查试验进行模拟有助于研究者选择恰当的方法和参数,进而更加准确地校正领先时间偏倚和病程长短偏倚对筛查效果的影响。
所有作者均声明不存在利益冲突





















