
在临床随访研究中,风险比(HR)是衡量组间差异最常用的指标,但由于HR是两组间的风险率之比,含义较抽象,无法对患者的生存情况做出直观的解释,并且在使用过程中需满足比例风险假定。而此时,限制平均生存时间(RMST)可以作为一种相对有效的指标或统计量,本文介绍基于RMST的统计分析方法,包括RMST及其差值的估计、假设检验以及回归分析,并通过两个实例说明了RMST在数据分析中的应用。结果显示RMST可作为有效的分析工具,其结果易于解释,并且当比例风险假定失效时,在组间差异的比较上相对于HR更有效。因此,在疾病疗效评价和预后分析的过程中,建议RMST应随HR同时给出,两者相互配合、相互补充,共同反映数据的特征。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
在临床随访研究中,风险比(hazard ratio,HR)是衡量组间差异最常用的指标。但由于HR是两组间的风险率之比,其含义较抽象,因此无法对患者的生存情况做出直观的解释[1,2,3]。同时,在HR的使用过程中需满足比例风险(proportional hazards,PH)假定,即HR不随时间发生变化,而在长时间的随访过程中常常出现比例风险假定失效的问题,此时继续使用HR作为评价指标将不再合理[4,5]。因此,有研究者建议使用其他统计量或指标来避免比例风险假定的前提条件,如中位生存时间和平均生存时间等[6]。然而,当删失率较高(如>50%)时,中位生存时间无法得到;同时,由于随访中删失的存在和随访时间的限制,导致无法获得t趋于无穷大时的随访数据,因此严格的平均生存时间也难以获得。为解决上述问题,Irwin[7]提出将平均生存时间的积分上限由无穷大限制到某一固定的时间点t*,定义为限制平均生存时间(restricted mean survival time,RMST),即到某一特定时间点t*患者的平均生存时间,或t*年的预期寿命[8]。例如在随访研究中可得出如下类似结论,"从入组时刻起,患者1年内的平均生存时间为9个月"或是"与传统疗法相比,接受新型治疗的患者五年预期寿命将提高3个月"。本文将介绍RMST的估计以及相应的统计推断方法,并结合实例进行分析说明。
假设T为生存时间,对于某个限制时间点t*(t*>0),使得Pr(T≥t*)>0,限制生存时间(restricted survival time)为X=min(T,t*),X的期望即为RMST,通常用μ(t*)来表示:


可以看出,μ(t*)在数值上等价于t=0到t=t*时生存曲线S(t)下的面积,当t*→∞时,μ(t*)即为平均生存时间。X对应的方差为


通常μ(t*)可根据Kaplan-Meier法进行计算


其中
是Kaplan-Meier估计下的生存率。设t(1)<t(2)<…<t(D)是D个观察到的发生兴趣事件的时间,d(i)是t(i)时刻发生兴趣事件的人数,n(i)是t(i)时刻的风险集人数,可以得到近似方差为:


对应的标准误为:


RMST的双侧1-α置信区间估计为:


其中Z1-α/2是标准正态分布的100(1-α/2)百分位数。
假设有两组数据,如试验组和对照组,根据公式(3)和(5)可分别计算每组RMST的估计值及其标准误
,
和
,
则组间差值
,对应的标准误为
。相应的假设检验为:H0:=μ1-μ0=0,H1:≠0。当H0成立时,在大样本情况下,检验统计量
近似服从标准正态分布。组间差值的双侧1-α置信区间估计为:


其中Z1-α/2是标准正态分布的100(1-α/2)百分位数。
在疾病的预后分析中,可以使用"伪观测"(或"伪值")来评估协变量对RMST的影响[9],也就是将RMST的伪值作为广义线性模型(GLMs)的因变量对协变量的效应进行建模[10]。伪值的定义:设生存时间T1,T2,T3,…,Tn独立同分布,θ是兴趣参数RMST,根据全部样本可以计算得到θ的无偏(或近似无偏)估计
。在舍弃第i个观测值之后,根据剩余的(n-1)个样本用同样的方式可以计算出θ的一个估计值
,称之为θ基于Tj(j≠i)的"留一法(leave-one-out)"估计,则第i个伪值可定义为:


假设存在协变量Z1,Z2,…,Zm,在计算出伪值后,对于给定的协变量Zi可相应建立起θ的回归模型进行估计和预测:


其中g(·)是一个连接函数,本文中所使用的是恒等函数(identity link function),同时加入截距β0。可通过标准的广义估计方程求解系数β:


Vi是
的方差,并根据Sandwich法计算出β的方差。
例1.单因素分析。在一项评价肾功能不全患者初次发生导管口感染时间的研究中[11],共收集119名患者的数据,其中43人进行外科放置导管,76人进行皮下放置导管。终点事件为患者初次发生通道口感染,导尿管失效或试验结束时终点事件尚未发生为右删失,2组的删失率分别为65.1%和85.5%。Cox模型得出HR=0.542(95%CI:0.249~1.182,P=0.124),说明这两种治疗方法的疗效差异无统计学意义,经Grambsch-Therneau检验发现两组风险率不满足比例风险假定(χ2=8.700,P=0.003),同时2条生存曲线在第8个月左右相交(图1),而在交叉点之后两组可能会存在疗效上的差异,因此Cox模型的结果可能没有反映真实情况。


在RMST的分析中,选择2个不同的t*,其中第8个月为2条生存曲线的近似交叉点所对应的时间,27.5个月时则为两组最大观察时间(the last observed time)的最小值,这里的观察时间指的是发生终点事件或右删失的时间。表1给出了不同t*的分析结果,可以看出,在治疗短期t*=8个月时,外科放置导管的疗效略优于皮下放置导管,但检验结果显示两组的短期疗效差异无统计学意义(Z=1.080,P=0.280);而对于治疗的整体效果,在给定t*=27.5个月时,可以得到进行皮下放置导管的患者在未来27.5个月时的平均生存时间约为22.9个月时,而进行外科放置导管的患者平均生存时间约为18.5个月时,即进行皮下放置导管相比于外科放置导管将患者未来27.5个月时的平均生存时间提高了约4.3个月时,组间差异有统计学意义(Z=2.048,P=0.041)。

基于HR和RMST对肾透析患者疗效的单因素分析
基于HR和RMST对肾透析患者疗效的单因素分析
| 模型 | t* | 皮下放置(95%CI) | 外科放置(95%CI) | HR/RMSTd(95%CI) | 统计量 | P值 |
|---|---|---|---|---|---|---|
| HR(Cox模型) | - | - | - | 0.542a(0.249~1.182) | 1.539 | 0.124 |
| RMST | 8 | 7.108(6.582~7.634) | 7.486(7.046~7.925) | -0.378b(-1.063~0.308) | 1.080 | 0.280 |
| 27.5 | 22.865(20.281~25.448) | 18.527(15.275~21.778) | 4.338b(0.185~8.491) | 2.048 | 0.041 |
注:aHR的分析结果;bRMSTd为两组RMST的差值
例2.多因素分析。数据来源于北部中心肿瘤治疗协助组(North Central Cancer Treatment Group,NCCTG)提供的关于晚期肺癌患者生存的数据[12],共包含228名患者的信息,删除存在未知变量的数据,最终有227名患者纳入分析,终点事件为患者死亡,其余为右删失。将性别(男性赋值为1,女性为0)、年龄(<65岁为1,≥65岁为0)以及Karnofsky评分(<80分为1,≥80分为0)作为自变量,应用伪值回归模型分析该数据,以探讨晚期肺癌患者预后的影响因素。
分析发现,若将t*设置为最长随访时间2.8年,不同性别对RMST的影响差异有统计学意义(Z=3.035,P=0.002),男性晚期肺癌患者在未来2.8年里平均比女性患者少活约0.34年,而患者的年龄对其预后的影响差异无统计学意义(Z=1.444,P=0.149)(表2)。Karnofsky评分对其预后的影响差异有统计学意义(Z=2.090,P=0.037),评分≥80分患者(即能够进行正常活动)的RMST相比于其余患者将延长约0.26年,尽管HR也能够得出类似的结论,但由于检验发现比例风险假定失效(χ2=7.060,P=0.008),此时该变量对患者预后的影响可能随时间发生变化,HR并不是一个恒定的值,在实际解释中相对复杂。

基于Cox回归模型和RMST回归模型对晚期肺癌患者预后的多因素分析
基于Cox回归模型和RMST回归模型对晚期肺癌患者预后的多因素分析
| 变量(样本量) | Cox比例风险模型 | RMST回归模型 | ||||||
|---|---|---|---|---|---|---|---|---|
| HR值(95%CI) | Z值 | P值 | P值a | β值(95%CI) | Z值 | P值 | ||
| 截距 | 1.221(1.004~1.438) | 11.033 | <0.001 | |||||
| 性别 | ||||||||
| 男(137) | 1.670(1.203~2.318) | 3.061 | 0.002 | 0.119 | -0.338(-0.556~-0.120) | 3.035 | 0.002 | |
| 女(90) | 1.000 | |||||||
| 年龄组(岁) | ||||||||
| <65(127) | 0.815(0.590~1.124) | 1.248 | 0.212 | 0.663 | 0.148(-0.053~0.349) | 1.444 | 0.149 | |
| ≥65(100) | 1.000 | |||||||
| Karnofsky评分 | ||||||||
| <80(57) | 1.439(1.013~2.044) | 2.033 | 0.042 | 0.008 | -0.261(-0.505~-0.016) | 2.090 | 0.037 | |
| ≥80(170) | 1.000 | |||||||
注:aGrambsch-Therneau风险率成比例假设检验的P值
本文介绍了RMST的定义、估计、假设检验和回归分析方法,并将该指标与HR进行了比较。实例1和2都表明,相较于HR,RMST在临床上更直观和易解释。这是因为RMST差值衡量了某t*时处理因素对生存时间的影响,是一个相对的效应度量,同时每组RMST的值又是对生存时间的绝对度量。而HR只是一个相对指标,既不反映生存时间也不反映生存率,即使不同处理对生存时间的绝对影响很小,HR也可以非常大,因此它需要伴随其他统计量/指标共同给出,如中位生存时间、特定时间点的生存率等。在很多情况下,RMST的差值可能看起来"很小",但它比HR更具现实性和临床意义。
在实例1中,基于RMST检验法在不满足比例风险假定的情况下比Cox模型更易发现组间差异,这是因为HR作为评价指标时,只有在满足比例风险假定的情况下对应的统计方法才有更好的性能,否则会降低、甚至产生错误的结论[13]。而RMST不需要任何前提假定,通过直接对生存函数进行积分求得,在数值上等价于从0到t*时生存曲线S(t)下的面积,考虑的是t*前的整个生存分布而非单一时间点的生存率,相比于中位生存时间等指标来说利用了更多的信息。同时,基于RMST的检验法除了使用两组RMST的差值外,还可以对相应的比值进行检验,如设置RMST的比值为试验组与对照组的RMST之比,该值>1说明试验组疗效优于对照组,反之则认为对照组优于试验组。实例1中当给定t*为27.5个月时,计算出外科放置与皮下放置这两组RMST的比值以及相应的可信区间为1.234(95%CI:1.002~1.521,P=0.048),在临床上可解释为:平均来说,进行外科放置导管的患者在未来27.5个月时的生存时间比进行皮下放置导管的患者多23.4%。
但在使用RMST的过程中也需要注意下列问题。t*应在试验设计阶段给定,并合理选择具有临床意义且接近研究随访的结束时间,这样可以使试验更加完整且包含大多数的生存结局。这也是RMST的优势之一,RMST将时间的维度纳入到分析结果中[13],根据研究目的可以选择不同的t*来检验各时期的处理效果。实例1中,当使用单一的HR无法反映出处理效应随时间的变化时,选择一个较小的t*可以分别得到处理组在短期和长期的疗效差异,如给定t*为8个月时,除了给出前8个月的RMST外,还可以计算出8个月后两组的RMST之差为4.716个月,从而区分该时刻前期和后期的治疗差异。但是,当风险集人数较少时,Kaplan-Meier生存估计会不稳定[8],通过直接对Kaplan-Meier生存曲线进行积分计算得出的RMST可能会存在误差,此时可以考虑采用更为稳健的估计方法例如灵活参数模型[14]等。
综上所述,虽然基于HR的统计分析方法(如log-rank检验和Cox比例风险回归模型等)在比例风险假定不成立的情况下检验效能会有所下降,且在临床解释上存在一定的问题,但在成比例的情况下检验效能仍为最佳[2,15]。因此,在疾病疗效评价和预后分析的过程中,建议RMST随HR同时给出,两者相互配合、补充,共同反映数据的特征。
所有作者均声明不存在利益冲突





















