继续教育园地
中断时间序列设计及其分析方法
中华预防医学杂志, 2019,53(8) : 858-864. DOI: 10.3760/cma.j.issn.0253-9624.2019.08.012
摘要

中断时间序列(ITS)设计是针对时间序列的结果变量,通过检验干预前后斜率改变量和干预点即刻水平改变量,对干预措施的有效性进行评价的设计方法。ITS的特点是在有效地控制干预前已存在的上升或下降趋势后,更准确地估计干预效应。本文以某综合医院专家挂号费减半对门诊量影响为例,阐述单组ITS的设计原理和统计方法,使用分段线性回归拟合模型,并对结果进行解释。同时,阐述先后存在两种干预的效果评价ITS模型和干预后不同时间点效果评价ITS模型的设计原理、模型拟合方法和结果解释。公共卫生监测数据大多都有时间趋势,为了准确估计干预措施的有效性,需要考虑干预前序列已经存在的上升或下降趋势。ITS通过斜率改变量和即刻水平改变量两个指标评价干预效果,丰富了传统的干预评价模式,在干预效果评价中必有广泛的应用。

引用本文: 于石成, 王琦琦, 毛凡, 等.  中断时间序列设计及其分析方法 [J] . 中华预防医学杂志, 2019, 53(8) : 858-864. DOI: 10.3760/cma.j.issn.0253-9624.2019.08.012.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权归中华医学会所有。

未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。

很多公共卫生事件在干预前已存在下降或上升趋势,如传染性疾病发病率、医院患者感染率、临床路径实施前的住院费用等,在干预效果评价中,这种上升或下降的趋势必须予以考虑。中断时间序列(interrupted time series, ITS)是控制干预前回归趋势对序列的影响,通过比较和检验序列在干预点上干预前后结果变量的即刻水平改变和干预前后两段回归线斜率改变,进而评价干预措施的有效性[1,2,3]。本文结合实例详细讲述单组ITS设计原理、分析思路、模型拟合方法及结果解释;阐述先后存在两种干预措施的情况下,以及在一个干预措施下评价多个时间点干预效果的ITS设计、分析方法和结果的解释;最后,本文讨论非线性ITS情形、干预效果迟滞性问题、采用自回归积分滑动平均模型(autoregressive integrated moving average model,ARIMA)处理序列一阶自相关和非平稳性序列问题,以及将ITS置于多水平模型下,控制聚集效应的ITS应用。

一、ITS设计与分析

图1为单组ITS设计原理图,横坐标为时间,纵坐标为结果变量的测量值,可为事件数、测量值均数、构成比或率;垂直线为干预时间,干预实施后,时间序列被中断,ITS分析可检验干预是如何影响序列的。ITS要求收集时间间隔相等的观察点数据,对于观察点多少,ITS没有固定限制,因为统计把握度依赖数据点分布、变异大小、效应强度和混杂效应的大小;模拟研究显示很少数据点或期望效应小的ITS分析,其结果解释应慎重[4]。据经验,ITS要收集40~50个数据点,或至少20个点在干预前、20个点在干预后,并且干预前后的观察点呈线性或近似线性。如果只有几个观察点,不适合用ITS分析,可改为重复测量方差分析、多重t检验、广义估计方程(generalized estimation equation, GEE)、Poisson回归或面板数据模型。

点击查看大图
图1
单组中断时间序列设计原理图
点击查看大图

方程1为干预前回归方程,方程2为干预后回归方程;β1为方程1的斜率;β2为即刻水平改变量,即方程2在第1个干预点的预测值与方程1延伸至第1个干预点的预测值之差;β3为干预后与干预前回归方程的斜率之差

图1
单组中断时间序列设计原理图

对于干预前后数据点呈线性或近似线性的序列,ITS分析采用分段线性回归(segmented linear regression,SLR),分段的含义是"事件"或"干预"将序列分为干预前和干预后两段,拟合线性回归模型[5],模型如下:Yt=β01×time2×intervention3×posttimet,式中time是时间计数变量,从第1个观察点开始一直计数到最后一个观察点,time=0,1,2,……,n-1,其中n为观察点的个数;intervention为干预指示变量,干预前观察点取值为0,干预后观察点取值为1;posttime为干预后时间计数变量,干预前的观察点posttime取值为0,干预后第一个观察点posttime取值为0,第二个观察点posttime取值为1,依此类推。Ɛtt时刻的残差,表示没有被回归模型解释的变异。

拟合线性回归模型,最小二乘法得到参数β1、β2和β3。β1为长期趋势,这里具体为干预前(第一段回归方程)的斜率;β2为第二段回归方程在第一个干预点的预测值与干预前线性方程延伸至第一个干预点的预测值之差,称为即刻水平改变量;β3为斜率改变量或趋势改变量,即干预后斜率与干预前斜率之差。

二、ITS应用实例

某市综合医院2015年1月至2017年12月期间共36个月专家门诊量的月统计结果见表1,2016年4月(第15个观察点)该院进行专家挂号费减半试点。试探讨试点前后专家门诊量的变化情况。

点击查看表格
表1

2015—2017年某市综合医院的专家门诊量

表1

2015—2017年某市综合医院的专家门诊量

年份月份门诊量时间变量干预干预前时间变量干预后时间变量
201515 3610000
201524 5251010
201534 6202020
201544 7093030
201554 6324040
201564 7435050
201575 1186060
201585 2457070
201594 8578080
2015104 0759090
2015113 983100100
2015123 953110110
201614 602120120
201625 418130130
201636 302140140
201645 750151150
201655 773161151
201665 900171152
201676 922181153
201687 064191154
201696 160201155
2016107 008211156
2016118 202221157
2016128 022231158
201716 059241159
201726 1892511510
201736 8522611511
201745 9912711512
201756 1152811513
201765 8072911514
201775 8033011515
201786 6073111516
201797 0943211517
2017106 6993311518
2017116 6143411519
2017125 7723511520

本研究假设2016年4月医院专家挂号费减半后,专家门诊量可能上升。以时间计数变量为横坐标,门诊量为纵坐标,绘制线图(图2)。图1可见,2016年4月专家挂号费减半后,前后两段门诊量变化趋势近似呈线性,可用SLR分析干预前后的趋势改变和即刻水平改变。

点击查看大图
图2
2015—2017年某市综合医院专家门诊量变化情况
点击查看大图
图2
2015—2017年某市综合医院专家门诊量变化情况

采用表1的数据,拟合线性回归模型,SAS语句为:

PROC REG;

MODEL amount=time intervention posttime;

RUN;

得到公式(1):amount=4677.358+18.882×time+1579.933×intervention-23.396×posttime,其中,amount是门诊量,time是时间计数变量(编码为0~35),intervention为干预指示变量(干预前=0,干预后=1),posttime为干预后时间计数变量(干预前=0,干预后=0~20);回归方程截距为4 677.358,干预前斜率为18.882,即刻水平改变量为1 579.933,斜率的改变量为-23.396。模型拟合优度R2=0.167,R2调整=0.581,德宾-沃森检验(Durbin-Watson,DW)值=1.233,说明模型拟合优度尚可,但序列存在一阶自相关[6]。通常情况下,DW=2或接近2提示序列无一阶自相关,ρ=0;DW=0提示序列存在完全一阶自相关,ρ=1;也可绘制序列与残差散点图判断序列自相关,如果残差呈随机分布,则序列无自相关。因此,这里先不对结果进行解释,对结果校正后再解释。

序列存在一阶自相关,最小二乘估计不能使用,改用广义最小二乘估计(generalized least square estimator, GLSE),用Prais-Winsten法实现,Stata提供了该方法,语句为:

tsset time

prais amount time i.intervention posttime

第一个语句安装时间序列模块,第二个语句用Prais-Winsten法拟合线性回归模型,其中i.intervention中的i指示intervention为哑变量(设0为参考组),结果如下:amount=4 586.979+73.683×time+364.541×intervention-50.585×posttime,模型拟合优度检验R2=0.344,R2adj=0.282,DW=1.613,序列一阶自相关有所改善。其中,干预前斜率为73.683,在干预前每月有74次专家门诊量增加(P=0.282),当计算干预效应时,它用来平衡干预前已存在的趋势。斜率改变量为-50.585,即干预后斜率减去干预前斜率(P=0.573),负值表明干预后斜率变小(上升缓慢),斜率改变量测量了由干预引起的斜率改变,表示干预的长期效果。进一步可计算干预后斜率=-50.585+73.683=23.098,表明干预后每月有23次专家门诊量增加。在没有一阶自相关校正情况下,干预后的斜率为-23.396+18.882=-4.514,可见校正的重要性。即刻水平改变量为364.541,干预后线性回归方程在第一个干预点的预测值与干预前线性趋势在第15个观察点的预测值的差值(P=0.577),表示干预的直接或短期效果。

三、ITS应用的扩展
(一)拟合干预后斜率的ITS模型

在上述实例中计算出干预后斜率,但并没有对其进行检验,可以拟合带干预后斜率的线性回归模型,线性回归方程如下:Yt=γ01×pretime2×intervention3×posttimet,式中Yt为专家门诊量;pretime为干预前时间计数变量,干预前编码为0~14,干预后编码全部为15;intervention为干预指示变量(干预前=0,干预后=1);posttime为干预后时间计数变量(干预前=0,干预后=0~20),详见表1。γ0为截距项,γ1为干预前斜率,γ2为即刻水平改变量,γ3为干预后斜率。斜率改变量为γ31,或β3=γ31

将实例数据,按上述方程拟合线性回归,得到公式(2):

amount=4677.358+18.882×pretime+1579.933×intervention-4.514×posttime,模型拟合优度检验R2=0.617,R2adj=0.581,DW=1.233。干预前斜率为18.882,即刻水平改变量为1579.933,干预后斜率为-4.514,斜率改变量为-4.514-(+18.882)=-23.396,结果与公式(1)拟合的结果一致。注意结果没有校正一阶自相关,需用Stata校正一阶自相关。

(二)拟合先后存在两种干预措施的ITS模型

干预实施一段时间后停止,又实施了一个新的干预措施,如在上例中,专家挂号费减半措施实施半年后停止,2016年10月开始(第21个观察点)实施专家挂号费全免措施。在这种情况下,可拟合依次的两种干预措施的ITS模型:Yt=β01×time2intervention3posttime4intervention5secondtimet,式中Timeinterventionposttime与公式(1)的含义与解释相同;intervention2是第二个干预指示变量,0为干预前,1为干预后;secondtime为第二次干预时间计数变量,第二次干预前的secondtime编码取值为0,第二次干预的第一个观察点secondtime取值为0,第二个观察点secondtime取值为1,依此类推。Ɛtt时刻的残差,表示结果变量没有被模型解释的变异。

用最小二乘法拟合线性回归模型,得到参数β1、β2、β3、β4和β5。β1、β2和β3的解释同前;β4为第二次干预的即刻水平改变量;β5为第二次干预前后的斜率改变量。读者可用上例的数据自行验证。

(三)拟合干预后不同时间点干预效应的ITS模型

在干预措施实施的情况下,有时要评价不同时间点的干预效果,数据及编码见表2pre3、pre6、pre12和pre18代表在评价第3个月、6个月、12个月和18个月效果时干预前干预时间计数变量,post3、post 6、post 12和post18代表在评价第3个月、6个月、12个月和18个月效果时干预后干预时间计数变量。干预后第3个月、6个月、12个月和18个月分别在第17、20、26和32个观察点,也即2016年6月、2016年9月、2017年3月和2017年9月。编码规则:pre3、pre6、pre12和pre18在干预前的编码为0~14,pre3、pre6、pre12和pre18在干预后的编码分别是17、20、26和32。干预前,post3、post 6、post12和post18的编码全部为0。干预后,post3的第17个观察点(2016年6月)为0,往下第18~35个观察点post3的编码为1~18,往上第16和15个观察点编码为-1和-2;post6的第20个观察点(2016年9月)为0,往下第21~35个观察点post6的编码为1~15,往上第19、18、17、16和15个观察点编码分别为-1、-2、-3、-4和-5;post12和post18的编码类推。

点击查看表格
表2

2015—2017年某市综合医院的专家门诊量及干预情况

表2

2015—2017年某市综合医院的专家门诊量及干预情况

年份月份门诊量时间变量干预pre3post3pre6post6pre12post12pre18post18
201515 3610000000000
201524 5251010101010
201534 6202020202020
201544 7093030303030
201554 6324040404040
201564 7435050505050
201575 1186060606060
201585 2457070707070
201594 8578080808080
2015104 0759090909090
2015113 983100100100100100
2015123 953110110110110110
201614 602120120120120120
201625418130130130130130
201636 302140140140140140
201645 75015117-220-526-1132-17
201655 77316117-120-426-1032-16
201665 90017117020-326-932-15
201676 92218117120-226-832-14
201687 06419117220-126-732-13
201696 16020117320026-632-12
2016107 00821117420126-532-11
2016118 20222117520226-432-10
2016128 02223117620326-332-9
201716 05924117720426-232-8
201726 18925117820526-132-7
201736 85226117920626032-6
201745 991271171020726132-5
201756 115281171120826232-4
201765 807291171220926332-3
201775 8033011713201026432-2
201786 6073111714201126532-1
201797 09432117152012266320
2017106 69933117162013267321
2017116 61434117172014268322
2017125 77235117182015269323

注:pre3、6、12、18分别为干预前第3、6、12、18个月的斜率;post3、6、12、18分别为干预后第3、6、12、18个月的斜率

采用分段线性回归方法,拟合斜率改变量和即刻水平改变量模型,拟合方程见下面的公式(3)~公式(6):

点击查看大图
点击查看大图

Time是时间计数变量,其系数表示干预前斜率;intervention为干预指示变量,其系数为即刻水平改变量,表示干预的直接效果;post3、post6、post12和post18的编码见前,其系数为斜率改变量,表示干预第3个月、6个月、12个月和18个月的干预效果。Ɛtt时刻的残差,表示没有被回归模型解释的变异。解释同公式(1)一致。这里还可计算干预后斜率=斜率改变量+干预前斜率。

上面计算的干预后斜率没有进行假设检验,可以仿公式(2),拟合带干预后斜率的线性回归模型,方程如下面的公式(7)~公式(10):

点击查看大图
点击查看大图
点击查看大图
点击查看大图

上式中,Yt是结果变量,本例为专家门诊量(人次/月);γ0为截距项;pre3、pre6、pre12和pre18系数分别表示在评价第3个月、6个月、12个月和18个月干预效果时干预前斜率;post3、post6、post12和post18系数分别表示在评价第3个月、6个月、12个月和18个月干预效果时干预后斜率;intervention为干预指示变量,其系数为即刻水平改变量,表示干预的直接效果。Ɛtt时刻的残差,表示没有被回归模型解释的变异。解释同公式(2)一致。这里还可计算斜率改变量=干预后斜率-干预前斜率。

四、讨论

中断时间序列分析是通过控制序列在干预前已有的上升或下降趋势,检验斜率改变量和即刻水平改变量的统计学意义,从而评价干预效果,其在公共卫生项目评价和真实世界数据分析中有着广泛的应用[7,8,9]。实际上,通常有两种形式的干预:一次性点干预和持续性干预。一次性点干预是给予一次性干预后即停止,如某天的高温、一次性防癌讲座、广告宣传、室内甲醛处理和促销活动;持续性干预是在一段时间内持续给予干预措施后,评价干预效果。在使用ITS分析数据前,先确定干预是一次性点干预还是持续性干预,其各自拟合的模型编码和解释不同,本文探讨的是持续性干预。另外,对干预效果有影响的协变量可纳入模型,常规的混杂因素如年龄性别分布或社会经济状况对ITS分析影响很小,因为这些变量在很长时间内保持不变;但时变混杂因素能够对ITS产生影响,如季节性、传染性疾病暴发和气象事件等,这些变量应放入模型进行控制,进一步阐述在控制混杂因素的情况下干预措施的独立作用[4]

本文根据数据特点拟合分段线性回归模型,结果变量为某一时点的汇总数据而非个体数据,如每月的发病数、均数、率或构成比,同时,控制的协变量也要用汇总数据,但是很多情况下这类数据可能缺少或不完全。对率或构成比,一般不要小于5%~10%或大于90%~95%;对计数资料,数值不要接近0;如果这些情况发生,需改用Poisson回归或负二项回归[10],否则可能得出错误的结论。对于二分类结果变量,可用logit模型。对于结果变量与时间不呈线性关系,可将结果变量进行线性变换,在线性框架下拟合模型。对于非平稳序列可进行差分使序列平稳,对于具有季节性的结果变量可使用季节差分消除季节趋势。拟合更复杂的非线性趋势ITS模型,读者可进一步参考文献[11,12,13]

ITS拟合的是线性回归模型,因此也要检验模型是否满足线性、独立、正态和方差齐的条件,尤其要关注残差正态性假设。由于ITS拟合分段线性模型,线性回归模型的诊断需要分段进行。线性指连续或等级自变量与连续的结果变量呈线性关系,可绘制散点图判断;独立指结果变量取值之间相互独立,即残差相互独立,不存在自相关,主要由专业知识判断;正态性指自变量的任何一个线性组合,结果变量均服从正态分布,即要求残差服从正态分布,检验可绘制标准化残差的直方图;方差齐指在自变量X的取值范围内,X取任何值,结果变量都有相同的方差,即标准化残差的大小不随变量取值的改变而改变,在0附近上下随机波动,判断方法绘制结果变量预测值与标准化残差之间的散点图。在有些情况下,干预存在滞后效应,干预的效果不能立刻显现,有个"过渡期",之后干预效果才完全显现。在分析时,可以去掉"过渡期"的观察点,或将"过渡期"作为单独的一段,拟合线性回归,但这需要足够的数据点。样本点的增加可提高统计分析效率,干预前样本点的增加还可减少成熟效应对干预效果的影响[14]。另外一种处理方法是找干预措施引起的直接改变而非最终变化,如禁烟令实施的直接结果是吸烟率或二手烟暴露率降低,尽管禁烟的最终目的是降低肺癌的发生率或死亡率,ITS可分析吸烟率在禁烟令实施前后的变化情况[10]

另外,在公共卫生实践中,干预措施通常是全覆盖,无法得知不实施干预措施的情况,此时,可以将干预前的趋势用第一段方程预测,观察在没有干预的情况下序列趋势。如果有平行对照组或配对对照,可以拟合带对照组的ITS,可提高ITS设计的内部有效性[15]。本文例子使用Stata提供的Prais-Winsten法校正序列一阶自相关,ARIMA模型取ρ=1也可校正一阶自相关。通常情况下,ITS都需校正序列一阶自相关,长序列还要检验二阶或更高阶自相关,忽略自相关可能导致高估干预效果。如果数据是多中心或有层次结构,可以尝试将ITS置于多水平模型之下,在控制聚集效应后探讨干预措施的效果[4]

利益冲突

利益冲突 所有作者均声明不存在利益冲突

【选择题】(单选)

1.就准试验设计而言,下面哪个表述正确:

A.受试对象随机化分组,研究者可确定实施的干预措施

B.受试对象随机化分组,研究者不能确定实施的干预措施

C.受试对象非随机化分组,研究者可确定实施的干预措施

D.受试对象非随机化分组,研究者不能确定实施的干预措施

2.根据经验估计ITS的样本含量,一般要有多少观察点或数据点:

A.要收集40~50个数据点,或至少20个点在干预前、20个点在干预后

B.要收集20个数据点,干预前后各半

C.没有数据点的要求,越多越好

D.对数据点无要求,正态分布就可以

3.ITS分析实际上是拟合线性回归模型,就模型应用条件而言,下面哪个表述正确:

A.线性回归模型的诊断要分段进行,模型要满足线性、独立、正态和方差齐

B.结果变量取值之间相互独立,即残差相互独立,不存在自相关

C.自变量的任何一个线性组合,结果变量均服从正态分布,即要求残差服从正态分布

D. X取任何值,结果变量都有相同的方差,即标准化残差的大小不随变量取值的改变而改变,在0附近上下随机波动

4.德宾-沃森检验(Durbin-Watson,DW)可判断序列是否存在自相关,下面哪个表述不正确:A. DW=2或接近2提示序列无一阶自相关,即ρ=0

B. DW=0提示序列存在完全一阶自相关,即ρ=1

C.绘制序列与残差散点图判断序列自相关,如果残差呈随机分布,则序列无自相关

D.DW=4或接近4提示序列无一阶自相关,即ρ=0

5.ITS是控制干预前回归趋势对序列的影响来评价干预措施的有效性,下面哪个表述正确:

A. ITS通过比较和检验序列在干预点上干预前后结果变量的即刻水平改变

B. ITS通过比较和检验序列干预前后结果变量两段斜率改变

C. ITS通过比较和检验序列在干预点上结果变量的即刻水平改变和干预前后斜率改变

D. ITS通过比较和检验序列在干预前后的结果变量平均值

参考文献
[1]
HartmannDP, GottmanJM, JonesRR, et al. Interrupted time-series analysis and its application to behavioral data[J]. J Appl Behav Anal, 1980,13(4):543-559.
[2]
WagnerAK, SoumeraiSB, ZhangF, et al. Segmented regression analysis of interrupted time series studies in medication use research[J]. J Clin Pharm Ther, 2002,27(4):299-309.
[3]
BiglanA, AryD, WagenaarAC. The value of interrupted time-series experiments for community intervention research[J]. Prev Sci, 2000,1(1):31-49.
[4]
BernalJL, CumminsS, GasparriniA. Interrupted time series regression for the evaluation of public health interventions: a tutorial[J]. Int J Epidemiol, 2017,46(1):348-355. DOI: 10.1093/ije/dyw098.
[5]
李晓松卫生统计学[M].8版北京:人民卫生出版社2017: 249-261.
[6]
BrockwellPJ and DavisRA. Model building and forecasting with arima processes[M]. New York: Springer,1987:265-319.
[7]
RamsayCR, MatoweL, GrilliR, et al. Interrupted time series design in health technology assessment: lessons from two systematic reviews of behaviour change strategies[J]. Int J Technol Assess Health Care, 2003,19(4):613-623.
[8]
EnglandE. How interrupted time series analysis can evaluate guideline implementation[J].Pharmac J, 2005,275:344-347.
[9]
AlshamsanR, LeeJT, MajeedA, et al. Effect of a UK pay-for-performance program on ethnic disparities in diabetes outcomes: interrupted time series analysis[J]. Ann Fam Med, 2012,10(3):228-234. DOI: 10.1370/afm.1335.
[10]
Stallings-SmithS, ZekaA, GoodmanP, et al. Reductions in cardiovascular, cerebrovascular, and respiratory mortality following the national irish smoking ban: interrupted time-series analysis[J]. PLoS One, 2013,8(4):e62063. DOI: 10.1371/journal.pone.0062063.
[11]
GrundyC, SteinbachR, EdwardsP, et al. Effect of 20 mph traffic speed zones on road injuries in London, 1986-2006: controlled interrupted time series analysis[J]. BMJ,2009,10(339):b4469. DOI: 10.1136/bmj.b4469.
[12]
BhaskaranK, GasparriniA, HajatS, et al. Time series regression studies in environmental epidemiology[J]. Int J Epidemiol, 2013,42(4):1187-1195. DOI: 10.1093/ije/dyt092.
[13]
GasparriniA, GoriniG, BarchielliA. On the relationship between smoking bans and incidence of acute myocardial infarction[J]. Eur J Epidemiol, 2009,24(10):597-602. DOI: 10.1007/s10654-009-9377-0.
[14]
GottmanJM. The analysis of change[M]. New Jersey: Lawrence Erlbaum Associates,1995.
[15]
LindenA, ArborA. Conducting interrupted time-series analysis for single-and multiple-group comparisons[J]. Stata J, 2015, 15(2):480-500.
 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词