
2型糖尿病(T2DM)的患病率不断上升。2021年成年糖尿病患者人数最多的10个国家中,有6个是亚洲国家。可靠的T2DM发病风险预测模型能够识别有患T2DM风险的个体,并可为开展针对性的预防干预工作提供决策依据。
系统分析、评价亚洲T2DM发病风险预测模型,以期为T2DM的防治提供参考。
于2021年4月,计算机检索PubMed、EmBase、the Cochrane Library获取有关亚洲T2DM发病风险预测模型的研究,检索时限均为建库至2021-04-01。由2名研究者独立筛选文献、提取资料后,应用预测模型研究偏倚风险评估工具(PROBAST)评价纳入文献的偏倚风险和适用性。采用描述性分析法对模型的基本特征及纳入研究的偏倚风险与适用性评价结果进行总结、分析。
共纳入31项亚洲T2DM发病风险预测模型研究,其中17项为前瞻性队列研究,14项为回顾性队列研究。纳入研究多采用Cox回归、Logistic回归构建模型;5项研究仅对模型进行了外部验证,22项研究仅对模型进行了内部验证,4项研究采用内部验证与外部验证相结合的方法对模型进行了验证。模型的受试者工作特征曲线下面积为0.62~0.92,包含预测因子数量为3~24个。纳入研究均存在较高的偏倚风险,主要原因为对连续变量的处理不合理、对缺失数据的处理不合理、忽略了模型的过度拟合问题等。
纳入的模型具有良好的预测效能,可帮助医务人员早期识别T2DM发病高风险人群。未来,应对数据建模及统计分析方法进行改进,开发性能优良、偏倚风险低的预测模型,注重对模型进行外部验证和重新校准。
本刊2022年版权归中国全科医学杂志社所有
未经编辑部许可,不得任意转载和摘编
本刊所发表作品仅为作者观点,并不代表编委会和编辑部意见
如有印装质量问题请向本刊发行部调换
2型糖尿病(T2DM)是患病人数最多的糖尿病类型,随着病程进展容易引起各种并发症,是导致失明、肾功能衰竭、心脏病发作、卒中和死亡的主要原因[1]。国际糖尿病联盟发布的第九版"全球糖尿病地图"数据显示,2019年全球约有5.37亿成人糖尿病患者,糖尿病患病率达10.5%,其中约90%为T2DM[2]。过去十年,亚洲人群糖尿病患病率大幅上升,中国和印度是全球糖尿病患者人数最多的两个国家,亚洲糖尿病的患病总人数占世界糖尿病患病人数的55%[2,3]。研究结果显示,有超过50%的糖尿病患者未得到及时诊断和治疗,T2DM的诊断延迟不仅会使个体医疗保健支出大幅度增长、疾病负担加重,还可能增加其出现严重并发症,甚至死亡的风险[4,5]。基于T2DM发病风险预测模型的预测结果,医务人员可早期发现未得到诊断的T2DM患者,以及T2DM高危人群,并通过采取针对性、个体化的预防/干预策略,降低T2DM发病概率/减缓病情进展。在过去的几十年里,国内外研究者开发了多种基于亚洲人群的预测模型来预测其T2DM发病风险,然而研究者对模型的构建策略报告不够明确,大多数预测模型使用受限,预测效果仍有待深入验证。本研究通过系统性地分析、评价亚洲T2DM发病风险预测模型的开发过程和效能,旨在为T2DM发病风险预测模型的选择和深度开发提供依据与参考。本研究已在PROSPERO登记注册并审核通过,注册号为CRD42021244563。
纳入标准:(1)研究对象为亚洲人群且基线时无糖尿病;(2)研究内容为T2DM发病风险预测模型(不包括诊断模型),并且研究描述了模型的建立、验证和评价过程;(3)研究类型为队列研究;(4)英文文献。排除标准:(1)细胞、分子及基因水平研究;(2)观察对象为儿童/青少年/特定患病人群(如肥胖、高血压患者)的研究;(3)预测结果包括T2DM,但不限于T2DM(如心血管疾病)的研究;(4)未采用回归法(如神经网络或决策树)构建预测模型的研究;(5)对既往开发的模型进行验证的研究;(6)国际会议摘要、二次研究;(7)模型包含的预测因子数<2;(8)重复发表的文献。
于2021年4月,计算机检索PubMed、EmBase、the Cochrane Library获取有关亚洲T2DM发病风险预测模型的研究,检索时限均为建库至2021-04-01。此外,追溯纳入文献的参考文献,以补充获取相关文献。检索词包括:type 2 diabetes mellitus、ketosis-resistant diabetes mellitus、non-insulin-dependent diabetes mellitus、stable diabetes mellitus、NIDDM、slow-onset diabetes mellitus、adult-onset diabetes mellitus、prediction model、risk stratification model、risk factor score、risk score、risk assessment、algorithm。以the Cochrane Library为例,具体检索策略请扫描本文二维码获取。
2名研究者独立筛选文献、提取资料并交叉核对,若存在分歧,则征求第3方意见。文献筛选时,首先阅读文题和摘要(初筛),在排除明显不相关的文献后,进一步通读全文根据纳入和排除标准以最终确定是否纳入(复筛)。基于预测模型研究偏倚风险及适用性评估的要素和资料提取内容制订标准化表格[6]。资料提取内容主要包括第一作者、发表年份、国家(地区)、研究类型、研究对象年龄、样本来源、样本量(不包含缺失数据)、发生结局事件的患者数、随访时长、观察终点、连续变量处理方法、缺失数据数量及处理方法、建模方法、变量选择方法、验模方法、受试者工作特征曲线下面积(AUC)、拟合优度、过度拟合情况、模型包含的预测因子、模型呈现形式、局限性(模型/研究)。
由2名研究者独立采用预测模型偏倚风险评估工具(PROBAST)对纳入文献的偏倚风险和适用性进行严格评估,若存在分歧,则征求第3方意见。PROBAST由MOONS等[7]、WOLFF等[8]于2019年推出,包含研究对象(2个问题)、预测因子(3个问题)、结果(6个问题)和数据分析(9个问题)4个领域。每个领域的评估结果分为"低""高""不清楚"3个等级。每个问题采用"是/可能是""可能不是/不是"或"没有信息"进行回答。若4个领域的偏倚风险评估结果均为"低",则整体偏倚风险被判断为"低";若有≥1个领域的偏倚风险评估结果为"高",则整体偏倚风险为"高";若有领域的偏倚风险评估结果为"不清楚",而其他领域的偏倚风险评估结果均为"低",则认为整体偏倚风险为"不清楚"。此外,对于模型构建研究,即使所有领域的偏倚风险评估结果均为"低",若模型未经过外部验证,则整体偏倚风险仍为"高"。PROBAST主要从前3个领域对适用性进行评价,适用性评价方法与偏倚风险评价方法相似。
采用描述性分析法对模型的基本特征及纳入研究的偏倚风险与适用性评价结果进行总结、分析。
通过检索得到相关文献12 550篇,经过逐层筛选,最终纳入研究31项[9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39]。文献筛选流程见图1。


注:T2DM=2型糖尿病
纳入的31项研究主要来源于中国(n=15)、日本(n=6)和韩国(n=4);17项[9,10,11,14,15,16,17,18,20,21,26,28,30,34,35,37,38]为前瞻性队列研究,14项[12,13,19,22,23,24,25,27,29,31,32,33,36,39]为回顾性队列研究;样本量(不包含缺失数据)为1 851~366 009,发生结局事件的患者数为144~38 718例。30项[9,10,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39]研究将空腹血糖(FBG)≥7.0 mmol/L作为观察终点,12项[18,19,20,22,25,30,31,33,35,36,37,38]研究将糖化血红蛋白(HbA1c)≥6.5%作为观察终点,13项[9,11,14,15,16,17,19,25,29,31,34,36,38]研究将餐后2 h血糖(2 h-PG)≥11.1 mmol/L作为观察终点,3项[22,33,36]研究将随机血糖≥11.0 mmol/L作为观察终点,见表1。

纳入的亚洲T2DM发病风险预测模型研究的基本信息
Basic characteristics of included studies on risk prediction models for T2DM in Asian adults
纳入的亚洲T2DM发病风险预测模型研究的基本信息
Basic characteristics of included studies on risk prediction models for T2DM in Asian adults
| 第一作者 | 发表年份(年) | 国家(地区) | 研究类型 | 研究对象年龄(岁) | 样本来源 | 样本量(不包含缺失数据) | 发生结局事件的患者数(例) | 随访时长(年) | 观察终点a |
|---|---|---|---|---|---|---|---|---|---|
| AEKPLAKORN等[9] | 2006 | 泰国 | 前瞻性队列研究 | 35~55 | 泰国发电局 | D:2 677V:2 420 | D:361V:125 | 12 | ①③④⑤ |
| CHIEN等[10] | 2009 | 中国 | 前瞻性队列研究 | ≥35 | 台北县金山乡(排除有心血管疾病或癌症病史者) | 2 960 | 548 | 10 | ①④ |
| GAO等[11] | 2009 | 毛里求斯 | 前瞻性队列研究 | 20~65 | 居住在毛里求斯的10个人口群(均为印度人) | 3 094 | 511 | 11 | ③ |
| SUN等[12] | 2009 | 中国 | 回顾性队列研究 | 35~74 | 台北、桃园、台中和高雄县4家健康体检中心 | 73 961 | 3 612 | 3.15 | ①④ |
| CHUANG等[13] | 2011 | 中国 | 回顾性队列研究 | ≥35 | 台北、桃园、台中和高雄县4家健康体检中心 | 24 899 | 1 261 | 5.61±3.33 | ①④ |
| BOZORGMANESH等[14] | 2011 | 伊朗 | 前瞻性队列研究 | ≥20 | 德黑兰血脂和血糖研究 | 3 242 | 231 | 6 | ①③④ |
| LIU等[15] | 2011 | 中国 | 前瞻性队列研究 | 40~90 | 北京市某医院筛查中心 | 1 851 | 352 | 10 | ①③④⑤ |
| ONAT等[16] | 2011 | 土耳其 | 前瞻性队列研究 | ≥28 | 土耳其成人风险因素研究 | 2 261 | 212 | 7.6 | ①③④ |
| DOI等[17] | 2012 | 日本 | 前瞻性队列研究 | 40~79 | 福冈县久山町 | D:1 935V:1 147 | D:286V:89 | 14 | ①③④ |
| HEIANZA等[18] | 2012 | 日本 | 前瞻性队列研究 | 40~75 | 虎之门医院附属健康管理中心 | D:7 654V:1 437 | D:289V:57 | 5 | ①②⑤ |
| LIM等[19] | 2012 | 韩国 | 回顾性队列研究 | 40~69 | 韩国基因组和流行病学研究数据 | 1 912 | 924 | 4 | ①②③④ |
| YE等[20] | 2014 | 中国 | 前瞻性队列研究 | 50~70 | 北京市和上海市的城乡社区 | 6 342 | 436 | 6 | ①②④⑤ |
| XU等[21] | 2014 | 中国 | 前瞻性队列研究 | ≥50 | 广州尊老康乐协会 | 16 043 | 1 063 | 4.1 | ①④⑤ |
| NANRI等[22] | 2015 | 日本 | 回顾性队列研究 | ≥30 | 12家公司 | D:37 416V:12 466 | D:1 122V:565 | 5 | ①②④⑥ |
| WANG等[23] | 2016 | 中国 | 回顾性队列研究 | ≥18 | 唐山市开滦社区 | D:49 325V:24 662 | 4 7262 327 | 5.35±1.59 | ①④⑤ |
| LIU等[24] | 2016 | 中国 | 回顾性队列研究 | 55~96 | 北京市社区 | 1 857 | 144 | 20 | ①④⑤ |
| MIYAKOSHI等[25] | 2016 | 日本 | 回顾性队列研究 | — | 相泽医院健康中心 | 4 159 | 279 | 4.9 | ①②③ |
| ZHANG等[26] | 2016 | 中国 | 前瞻性队列研究 | ≥18 | 农村 | 14 134 | 729 | 6 | ①④ |
| CHEN等[27] | 2017 | 中国 | 回顾性队列研究 | ≥18 | 浙江省德清县农村 | D:28 251V:3 043 | 387191 | 4.2 | ①④⑤ |
| ZHANG等[28] | 2017 | 中国 | 前瞻性队列研究 | ≥18 | 河南省洛阳市农村 | 15 768 | 702 | 6 | ①④⑤ |
| WEN等[29] | 2017 | 中国 | 回顾性队列研究 | ≥30 | 河北省邯郸市永年区的社区 | 4 132 | 218 | 6 | ①③④⑤ |
| YATSUYA等[30] | 2018 | 日本 | 前瞻性队列研究 | 35~64 | 爱知县政府 | 3 540 | 342 | 12.2 | ①②④⑤ |
| HA等[31] | 2018 | 韩国 | 回顾性队列研究 | — | 韩国国民健康保险数据库、韩国基因组和流行病学研究数据 | D:359 349V:6 660 | D:37 678V:1 040 | 10.8 | ①②③⑤ |
| HAN等[32] | 2018 | 中国 | 回顾性队列研究 | — | 东风汽车集团有限公司 | 17 690 | 1 390 | 5 | ①④⑤ |
| HU等[33] | 2018 | 日本 | 回顾性队列研究 | 30~59 | 12家公司(排除癌症、心血管疾病患者) | 46 198 | 3 385 | 8 | ①②④⑥ |
| WANG等[34] | 2019 | 中国 | 前瞻性队列研究 | — | 于武汉联合医院接受年度健康体检的居民(排除癌症、心血管疾病和卒中患者) | D:5 557V:1 870 | D:595V:206 | 3 | ①③④ |
| GUNTHER等[35] | 2020 | 新加坡 | 前瞻性队列研究 | — | 新加坡前瞻性研究计划 | 3 313 | 314 | 8.4 | ①②⑤ |
| SHAO等[36] | 2020 | 中国 | 回顾性队列研究 | 20~80 | 中国健康与营养调查项目(排除妊娠者和心血管疾病患者) | 6 023 | 349 | 10 | ①②③⑥ |
| ASGARI等[37] | 2021 | 伊朗 | 前瞻性队列研究 | ≥20 | 德黑兰城区人口 | D:5 291V:3 147 | 214 | 12 | ①②④ |
| OH等[38] | 2021 | 韩国 | 前瞻性队列研究 | 40~69 | 韩国基因组和流行病学研究数据 | 5 673 | 1 291 | 10 | ①②③ |
| RHEE等[39] | 2021 | 韩国 | 回顾性队列研究 | — | 韩国国民健康保险数据库 | 335 302 | 29 173 | 10.4 | ① |
注:—表示无特殊要求;D=建模队列,V=验证队列,T2DM=2型糖尿病;①表示空腹血糖(FBG)≥7.0 mmol/L,②表示糖化血红蛋白(HbA1c)≥6.5%,③表示餐后2 h血糖(2 h-PG)≥11.1 mmol/L,④表示接受降糖治疗,⑤表示自我报告糖尿病,⑥表示随机血糖≥11.1 mmol/L;a表示满足以下任一标准,即可诊断T2DM
3项[26,34,37]研究保持了连续变量的连续性,2项[18,31]研究保持了部分连续变量的连续性,26项[9,10,11,12,13,14,15,16,17,19,20,21,22,23,24,25,27,28,29,30,32,33,35,36,38,39]研究将全部连续变量转化为分类变量。数据缺失及其处理方法方面,3项[14,19,38]研究存在着较为严重的数据缺失现象(缺失率>30%),RHEE等[39]采用多重插补法处理缺失值,ASGARI等[37]使用单一插补法对缺失数据进行填补,22项[9,10,11,14,17,18,19,20,21,22,23,24,27,28,29,30,32,33,34,35,36,38]研究采用了完整个案分析法。纳入研究多采用Cox回归、Logistic回归建立模型。WANG等[34]在采用Logistic回归建立模型的同时,建立了矩阵多项式模型;LIU等[24]通过建立亚分布风险模型,避免数据竞争;ASGARI等[37]在采用Cox回归建立静态预测模型的同时,建立了基于混合效应模型和Cox模型的纵向和生存数据联合模型。20项[10,12,13,14,16,17,18,19,22,23,25,27,29,30,31,32,33,34,35,39]研究报告在筛选变量时采用了逐步选择法,7项[9,15,19,21,24,28,38]研究采用了单因素分析,SHAO等[36]则基于LASSO算法进行变量筛选。4项[11,16,31,34]研究建立了基于性别的T2DM发病风险差异化预测模型。模型验证方面,5项[9,15,17,18,31]研究仅对模型进行了外部验证,22项[10,11,12,13,14,16,19,20,21,23,24,25,26,27,28,29,30,32,33,35,38,39]研究仅对模型进行了内部验证,4项[22,34,36,37]研究采用内部验证与外部验证相结合的方法对模型进行了验证。纳入模型的AUC为0.62~0.92,提示模型预测性能较好。15项[10,14,19,20,21,23,24,26,27,30,32,34,36,37,38]研究考虑了模型的过度拟合情况,并对其进行了校准,见表2。

亚洲T2MD发病风险预测模型建立和验证的基本特征
Basic characteristics of development and validation included risk prediction models for T2DM in Asian adults
亚洲T2MD发病风险预测模型建立和验证的基本特征
Basic characteristics of development and validation included risk prediction models for T2DM in Asian adults
| 第一作者 | 连续变量处理方法 | 缺失数据 | 建模方法 | 变量选择方法 | 验模方法 | AUC(95%CI) | 拟合优度 | 过度拟合情况 | |
|---|---|---|---|---|---|---|---|---|---|
| 数量 | 处理方法 | ||||||||
| AEKPLAKORN等[9] | 转化为分类变量 | D:587V:459 | 完整个案分析 | Logistic回归 | 单因素分析、多因素分析 | 外部验证 | 模型1:0.74(0.71,0.78),0.75(0.71,0.80)。模型2:0.76(0.72,0.79)。模型3:0.78(0.75,0.81)。模型4:0.79(0.75,0.82)。模型5:0.79(0.76,0.82) | H-L拟合优度检验 | — |
| CHIEN等[10] | 转化为分类变量 | — | 完整个案分析 | Cox回归 | 向前逐步选择法 | 内部验证 | 模型1:0.70(0.68,0.73)。模型2:0.65(0.62,0.67) | H-L拟合优度检验 | 交叉验证、自举法 |
| GAO等[11] | 转化为分类变量 | — | 完整个案分析 | Cox回归 | — | 内部验证a | 模型1:男,0.62(0.56,0.68);女,0.64(0.59,0.69)。模型2:男,0.70(0.64,0.75);女,0.71(0.66,0.76)。模型3:男,0.71(0.66,0.77);女,0.71(0.66,0.76) | — | — |
| SUN等[12] | 转化为分类变量 | — | — | Cox回归 | 逐步选择法 | 内部验证a | 模型1:0.751(0.730,0.773)。模型2:0.848(0.828,0.867)。模型3:0.853(0.834,0.872)。模型4:0.838(0.818,0.858)。模型5:0.843(0.824,0.863) | H-L拟合优度检验 | — |
| CHUANG等[13] | 转化为分类变量 | — | — | Cox回归 | 逐步选择法 | 内部验证a | 模型1:0.71(0.70,0.73)。模型2:0.75(0.73,0.78)。模型3:0.72(0.71,0.74)。模型4:0.76(0.73,0.79)。模型5:0.82(0.81,0.83)。模型6:0.84(0.81,0.86) | — | — |
| BOZORGMANESH等[14] | 转化为分类变量 | 1 776 | 完整个案分析 | Logistic回归 | 向前逐步选择法 | 内部验证 | 模型1:0.75(0.72,0.78)。模型2:0.85(0.82,0.87)。模型3:0.85(0.82,0.87) | H-L拟合优度检验 | 自举法 |
| LIU等[15] | 转化为分类变量 | — | — | Logistic回归 | 单因素分析、多因素分析 | 外部验证 | 模型1:0.68(0.65,0.72)。模型2:0.71(0.68,0.75)。模型3:0.72(0.69,0.76) | — | — |
| ONAT等[16] | 转化为分类变量 | — | — | Cox回归 | 向后逐步选择法 | 内部验证a | 男:0.78(0.74,0.83)。女:0.77(0.73,0.82) | — | — |
| DOI等[17] | 转化为分类变量 | D:194V:144 | 完整个案分析 | Cox回归 | 向后逐步选择法 | 外部验证 | 模型1:0.70(0.67,0.73),0.69(0.63,0.75)。模型2:0.78(0.74,0.80),0.78(0.73,0.83) | H-L拟合优度检验 | — |
| HEIANZA等[18] | 部分转化为分类变量 | D:137V:15 | 完整个案分析 | Logistic回归 | 向前逐步选择法 | 外部验证 | 模型1:0.71(0.68,0.74),0.73(0.67,0.78)。模型2:0.84(0.82,0.86),0.87(0.83,0.90)。模型3:0.84(0.82,0.86),0.88(0.84,0.92)。模型4:0.89(0.87,0.90),0.91(0.88,0.95) | H-L拟合优度检验 | — |
| LIM等[19] | 转化为分类变量 | 966 | 完整个案分析 | Logistic回归 | 文献回顾、单因素分析、向后逐步选择 | 内部验证 | 模型1:0.65(0.62,0.68)。模型2:0.75(0.72,0.77)。模型3:0.77(0.74,0.79) | H-L拟合优度检验 | 交叉验证 |
| YE等[20] | 转化为分类变量 | 2 523 | 完整个案分析 | Logistic回归 | 多因素分析 | 内部验证 | 0.71(0.69,0.74) | H-L拟合优度检验 | 自举法、交叉验证 |
| XU等[21] | 转化为分类变量 | — | 完整个案分析 | Logistic回归 | 单因素分析、多因素分析 | 内部验证 | 0.78(0.76,0.80) | 校准图 | 交叉验证 |
| NANRI等[22] | 转化为分类变量 | 2 031 | 完整个案分析 | Logistic回归 | 向后逐步选择法 | 内部验证a、外部验证 | 模型1:0.717(0.703,0.731),0.734(0.715,0.753)。模型2:0.843(0.832,0.853),0.835(0.820,0.851)。模型3:0.827(0.816,0.838),0.819(0.803,0.835)。模型4:0.893(0.883,0.902),0.882(0.868,0.895) | H-L拟合优度检验、校准图 | — |
| WANG等[23] | 转化为分类变量 | 8 766 | 完整个案分析 | Cox回归 | 逐步选择法 | 内部验证 | 模型1:0.66(0.65,0.68)。模型2:0.77(0.76,0.78) | 校准图 | 交叉验证 |
| LIU等[24] | 转化为分类变量 | — | 完整个案分析 | 亚分布风险模型 | 单因素分析、多因素分析 | 内部验证 | 0.74(0.70,0.78) | 校准图 | 自举法 |
| MIYAKOSHI等[25] | 转化为分类变量 | — | — | Cox回归 | 向后逐步选择法 | 内部验证a | 模型1:0.68(0.63,0.72)。模型2:0.75(0.70,0.78)。模型3:0.80(0.76,0.84) | H-L拟合优度检验、校准图 | — |
| ZHANG等[26] | 保持连续性 | 4 032 | — | Cox回归 | 文献回顾 | 内部验证 | 0.77(0.76,0.78) | H-L拟合优度检验 | 交叉验证 |
| CHEN等[27] | 转化为分类变量 | D:1 899V:1 205 | 完整个案分析 | Cox回归 | 逐步选择法 | 内部验证 | 模型1:0.72(0.69,0.75)。模型2:0.77(0.74,0.80) | H-L拟合优度检验 | 自举法 |
| ZHANG等[28] | 转化为分类变量 | 2 932 | 完整个案分析 | Cox回归 | 单因素分析、多因素分析 | 内部验证a | 模型1:0.67(0.66,0.68)。模型2:0.66(0.65,0.67)。模型3:0.68(0.67,0.69)。模型4:0.79(0.78,0.80) | 校准图 | — |
| WEN等[29] | 转化为分类变量 | 1 014 | 完整个案分析 | Logistic回归 | 文献回顾、逐步选择法 | 内部验证a | 0.72(0.67,0.76) | H-L拟合优度检验 | — |
| YATSUYA等[30] | 转化为分类变量 | 341 | 完整个案分析 | Cox回归 | 向后逐步选择法 | 内部验证 | 0.77(C指数) | H-L拟合优度检验、校准图 | 交叉验证 |
| HA等[31] | 部分转化为分类变量 | — | — | Cox回归 | 文献回顾、逐步选择法 | 外部验证 | 模型(男):0.71(0.70,0.73),0.63(0.53,0.73)。模型(女):0.76(0.75,0.78),0.66(0.55,0.76) | 校准图 | — |
| HAN等[32] | 转化为分类变量 | 3 326 | 完整个案分析 | Cox回归 | 逐步选择法 | 内部验证 | 0.75(0.74,0.76) | — | 交叉验证 |
| HU等[33] | 转化为分类变量 | 1 892 | 完整个案分析 | Cox回归 | 向后逐步选择法 | 内部验证a | 模型1:0.73(0.72,0.74)。模型2:0.89(0.89,0.90) | 校准图 | — |
| WANG等[34] | 保持连续性 | D:913V:385 | 完整个案分析 | Logistic回归、矩阵多项式 | 逐步选择法 | 内部验证、外部验证 | 模型1:女,0.86(0.84,0.89)、0.84(0.80,0.89);男,0.75 (0.73,0.78)、0.75(0.72,0.80)。模型2:女,0.86(0.84,0.89)、0.86(0.82,0.90);男,0.78(0.76,0.80)、0.77(0.73,0.91)。模型3:女,0.86(0.84,0.89)、0.84(0.80,0.89);男,0.75(0.73,0.77)、0.76(0.72,0.79) | 校准图 | 自举法 |
| GUNTHER等[35]b | 转化为分类变量 | 126 | 完整个案分析 | Cox回归 | 向后逐步选择法 | 内部验证a | 0.84(0.82,0.87) | — | — |
| SHAO等[36] | 转化为分类变量 | — | 完整个案分析 | Logistic回归 | LASSO回归 | 内部验证、外部验证 | 模型1:0.79(0.76,0.82),0.82(0.78,0.86) 。模型2:0.81(0.78,0.83),0.82(0.78,0.87)。模型3:0.91(0.88,0.93),0.92(0.88,0.95) 。模型4:0.88(0.85,0.91),0.86(0.81,0.91) | 校准图 | 自举法 |
| ASGARI等[37] | 保持连续性 | — | 单一插补 | Cox回归、基于混合效应模型和Cox模型的纵向和生存数据联合模型 | 文献回顾 | 内部验证、外部验证 | 模型1:0.85(0.82,0.89)。模型2:0.85(0.84,0.86)。模型3:0.84(0.83,0.85) | H-L拟合优度检验、校准图 | 自举法 |
| OH等[38] | 转化为分类变量 | 3 059 | 完整个案分析 | Logistic回归 | 单因素分析、多因素分析 | 内部验证 | 模型1:0.66(0.63,0.72)。模型2:0.69(0.66,0.72)。模型3:0.75(0.72,0.78) | — | 交叉验证 |
| RHEE等[39] | 转化为分类变量 | — | 多重插补 | Cox回归 | 逐步选择法 | 内部验证a | 0.84(0.83,0.85) | H-L拟合优度检验 | — |
注:AUC=受试者工作特征曲线下面积;—表示未提及;a表示将数据集随机拆分为两个子集,一个子集用于建模,另一个子集用于内部验证;b表示作者共建立了15个模型,本研究仅选择最具有代表性和创新性的1个模型呈现
模型包含的预测因子数量为3~24个,预测因子可主要分为人口学因素、体格检查指标、实验室检查指标三类。其中人口学因素以年龄、性别和糖尿病家族史较为常见,体格检查指标以体质指数(BMI)和腰围较为常见,而实验室指标以FBG、HbA1c和三酰甘油(TG)较为常见。模型呈现形式主要以风险评分和风险计算公式为主,3项[23,34,36]研究采用列线图的方式呈现模型,见表3。

亚洲T2MD发病风险预测模型的预测因子、呈现形式及其局限性
Predictors,presentation and limitations of included risk prediction models for T2DM in Asian adults
亚洲T2MD发病风险预测模型的预测因子、呈现形式及其局限性
Predictors,presentation and limitations of included risk prediction models for T2DM in Asian adults
| 第一作者 | 模型包含的预测因子 | 模型呈现形式 | 局限性(模型/研究) |
|---|---|---|---|
| AEKPLAKORN等[9] | 模型1(5个):年龄、BMI、腰围、高血压、FHDM。模型2(6个):模型1中的因子+FBG 。模型3(6个):模型1中的因子+IGT。模型4(7个):模型3中的因子+TG。模型5(8个):模型4中的因子+HDL-C | 根据各因子回归系数的大小给其分配分值,计算个体的发病风险总分 | — |
| CHIEN等[10] | 模型1(6个):年龄、FBG、BMI、TG、白细胞计数、HDL-C。模型2(5个):年龄、性别、BMI、FHDM、降压药物治疗 | 基于各因子的回归系数及其参考值得出各因子的分值,计算个体的发病风险总分 | 研究对象年龄较大;糖尿病诊断方法单一 |
| GAO等[11] | 模型1(3个):BMI、腰围、FHDM。模型2(4个):模型1中的因子+FBG。模型3(5个):模型1中的因子+收缩压、TG | 根据各因子回归系数、基础风险率,计算个体发病概率 | 预测能力中等;缺乏外部验证 |
| SUN等[12] | 模型1(8个):受教育程度、年龄、FHDM、吸烟、运动、高血压、BMI、腰围。模型2(9个):年龄、性别、受教育程度、吸烟、BMI、腰围、FHDM、高血压、FBG。模型3(13个):模型2中的因子+TG、HDL-C、ALT、eGFR。模型4(7个):性别、种族、FHDM、FBG、收缩压、腰围、身高。模型5(8个):年龄、种族、FBG、收缩压、腰围、身高、HDL-C、TG | 根据各因子的回归系数,得出发病风险得分的计算公式 | 基线时未进行葡萄糖耐量试验;无来自社区的样本;未证实其在年轻人T2DM发病风险预测中的应用效果 |
| CHUANG等[13] | 模型1(6个):年龄、性别、饮酒习惯、受教育程度、BMI、腰围。模型2(7个):模型1中的因子+FHDM。模型3(7个):模型1中的因子+高血压。模型4(8个):模型3中的因子+FHDM。模型5(9个):模型3中的因子+TG、FBG。模型6(10个):模型5中的因子+FHDM | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 未将葡萄糖耐量试验纳入T2DM诊断标准,可能会造成漏诊 |
| BOZORGMANESH等[14] | 模型1(5个):年龄、收缩压、FHMD、腰臀比、腰高比。模型2(6个):收缩压、FHMD、腰臀比、腰高比、TG/HDL-C、FBG。模型3(7个):收缩压、FHMD、腰臀比、腰高比、TG/HDL-C、FBG、2 h-PG | 基于各因子的回归系数及其参考值得出各因子的分值,计算个体的发病风险总分 | 缺少外部验证 |
| LIU等[15] | 模型1(4个):年龄、高血压、FHDM、BMI。模型2(5个):模型1中的因子+FBG。模型3(6个):年龄、高血压、高血糖、FHDM、BMI、FBG | 以取整后的OR作为各因子的分值,计算个体的发病风险总分 | 未证实其在年轻人T2DM发病风险预测中的应用效果 |
| ONAT等[16] | 7个:FHDM、体育活动、年龄、腰围、FBG、C反应蛋白、HDL-C | 根据各因子的回归系数、HR对其进行赋分,计算个体的发病风险总分 | — |
| DOI等[17] | 模型1(8个):年龄、性别、FHDM、腹围、BMI、高血压、定期运动、经常吸烟。模型2(9个):模型1中的因子+FBG | 以取整后的回归系数作为各因子的分值,计算个体的发病风险总分 | 预测能力一般;存在自我报告偏倚;预测短期内T2DM发病风险的能力有待考量 |
| HEIANZA等[18] | 模型1(5个):年龄、性别、FHDM、吸烟、BMI。模型2(6个):模型1中的因子+FBG。模型3(6个):模型1中的因子+HbA1c。模型4(7个):模型1中的因子+FBG+HbA1c | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 研究对象主要为男性,在其他人群T2DM发病风险预测中的应用效果有待进一步研究 |
| LIM等[19] | 模型1(5个):年龄、FHDM、当前吸烟情况、BMI、高血压。模型2(8个):模型1中的因子+FBG、HDL-C、TG。模型3(9个):模型2中的因子+HbA1c | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 模型可能只适用于临床环境或流行病学研究 |
| YE等[20] | 6个:性别、BMI、FBG、HbA1c、高血压、C反应蛋白 | 基于各因子的回归系数及其参考值得出各因子的分值,计算个体的发病风险总分 | 未进行外部验证 |
| XU等[21] | 7个:年龄、性别、FHDM、BMI、FBG、HDL、TG | 基于各因子的回归系数及其参考值得出各因子的分值,计算个体的发病风险总分 | 将FBG作为判断基线时糖尿病患病情况的指标,可能造成糖尿病患病率被低估;数据缺失率约38%;在其他民族/年轻人T2DM发病风险预测中的应用效果有待进一步研究 |
| NANRI等[22] | 模型1(6个):年龄、性别、BMI、腰围、高血压、吸烟情况。模型2(7个):模型1中的因子+FBG。模型3(7个):模型1中的因子+HbA1c。模型4(8个):模型1中的因子+ FBG、HbA1c | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 可能存在选择偏倚 |
| WANG等[23] | 模型1(7个):年龄、性别、BMI、FHDM、受教育程度、血压、静息心率。模型2(10个):模型1中的因子+FBG、TG、调脂药物使用情况 | 列线图,读取各因子的值对应的得分,将所有因子的得分相加 | 预测能力有限;在其他人群T2DM发病风险预测中的应用效果有待进一步研究 |
| LIU等[24] | 5个:年龄、BMI、FBG、自评健康状况、体育活动 | — | 样本量较少 |
| MIYAKOSHI等[25] | 模型1(5个):性别、FHDM、年龄、收缩压、BMI。模型2(7个):性别、FHDM、年龄、收缩压、FPG、HbA1c、TG。模型3(11个):吸烟状况、体育活动、年龄、收缩压、BMI、性别、FPG、2 h-PG、HbA1c、HDL-C、TG | 以取整后的HR作为各因子的分值,计算个体的发病风险总分 | 回顾性研究;未进行外部验证 |
| ZHANG等[26] | 4个:年龄、BMI、TG、FBG | 将各因子的回归系数×100后取整,以此作为各因子的分值,计算个体的发病风险总分 | 数据缺失率较高,可能导致偏倚;在其他人群T2DM发病风险预测中的应用效果有待进一步研究 |
| CHEN等[27] | 模型1(6个):年龄、超重、肥胖、FHDM、饮食以肉类为主、高血压。模型2(7个):模型1中的因子+FBG | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 失访人数较多;在不同环境中的预测能力需进一步测试 |
| ZHANG等[28] | 模型1(7个):年龄、吸烟、饮茶频率、体育活动水平、FHDM、BMI、高血压。模型2(7个):年龄、吸烟、饮茶频率、体育活动水平、FHDM、腰高比、高血压。模型3(8个):模型1中的因子+腰高比。模型4(10个):模型3中的因子+TG、FBG | 将各因子的回归系数×10,以此作为各因子的分值,计算个体的发病风险总分 | 未进行外部验证 |
| WEN等[29] | 4个:年龄、BMI、腰围、FHDM | 基于各因子的回归系数及其参考值得出各因子的分值,计算个体的发病风险总分 | 缺失数据较多,可能导致偏倚 |
| YATSUYA等[30] | 6个:年龄、BMI、吸烟状况、FHDM、TG、FBG | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 样本皆为男性且其职业以公务员为主,在其他人群T2DM发病风险预测中的应用效果有待进一步验证 |
| HA等[31] | 11个:年龄、FHDM、吸烟状况、体育活动水平、抗高血压治疗、他汀类药物使用、BMI、收缩压、总胆固醇、FBG为共性因子,γ-谷氨酰转移酶(只限女性)、酒精摄入(只限男性)为性别特异性因子 | 根据各因子的回归系数,得出发病风险的计算公式 | 外部验证队列的校准图显示,T2DM发病风险被低估 |
| HAN等[32] | 6个:BMI、FBG、高血压、高脂血症、当前吸烟状况、FHDM | 将各因子的回归系数×10,以此作为各因子的分值,计算个体的发病风险总分 | 未限制研究人群年龄,未进行外部验证 |
| HU等[33] | 模型1(6个):年龄、性别、腹部肥胖、BMI、吸烟状况、高血压。模型2(8个):模型1中的因子+血脂异常、FBG | 根据各因子回归系数、基础风险率,计算个体发病概率 | 样本来源受到限制,主要为大公司职员;模型无法区分糖尿病的类型 |
| WANG等[34] | 模型1(6个):年龄、BMI、FBG、HDL-C、LDL-C、TG。模型2:男(5个),年龄、TG、FBG、LDL-C、BMI;女(6个),年龄、TG、FBG、HDL-C、LDL-C、BMI。模型3(8个):年龄、BMI、FBG、收缩压、舒张压、HDL-C、LDL-C、TG | 列线图,读取各因子的值对应的得分,将所有因子的得分相加 | — |
| GUNTHER等[35] | 17个:年龄、性别、种族、身高、腰围、FHDM、收缩压、FBG、TG、HDL-C、C8-DC、C16-OH、异亮氨酸/亮氨酸、鸟氨酸、脯氨酸、丝氨酸、丙氨酸/甘氨酸 | — | 未进行外部验证 |
| SHAO等[36] | 模型1(8个):年龄、性别、民族、高血压、吸烟、饮酒、腰围、BMI。模型2(17个):模型1中的因子+受教育程度、软饮料和茶摄入、体育活动、能量摄入、碳水化合物摄入、脂肪摄入、蛋白质摄入、三头肌皮褶厚度、睡眠时间。模型3(24个):模型2中的因子+LDL-C、HDL-C、TC、TG、胰岛素、FBG、HbA1c 。模型4(7个):LDL-C、HDL-C、TC、TG、胰岛素、FBG、HbA1c | 列线图,读取各因子的值对应的得分,将所有因子的得分相加 | 当预测概率<0.20时,T2DM发病风险可能会被低估 |
| ASGARI等[37] | 模型1(6个):年龄、身高、收缩压、TG、HDL-C、FHDM。模型2(7个):模型1中的因子+FBG。模型3(7个):模型1中的因子+腰围 | 根据各因子的回归系数,得出发病风险得分的计算公式 | 使用中间日期来定义事件日期 |
| OH等[38] | 模型1(6个):年龄、居住地、吸烟、高血压、FHDM、腰围。模型2(7个):模型1中的因子+FBG;模型3(7个):模型1中的因子+HbA1c | 根据各因子的回归系数对其进行赋分,计算个体的发病风险总分 | 模型需进一步被验证 |
| RHEE等[39] | 17个:年龄、性别、BMI、收缩压、舒张压、FBG、TC、HbA1c、天冬氨酸氨基转移酶、丙氨酸氨基转移酶、γ-谷氨酰转移酶、蛋白尿、吸烟、饮酒、锻炼、个人史、家族史 | — | — |
注:—表示未提及;LDL-C=低密度脂蛋白胆固醇,FHDM=糖尿病家族史,IGT=糖耐量异常,TG=三酰甘油,HDL-C=高密度脂蛋白胆固醇,BMI=体质指数,ALT=谷氨酸氨基转移酶,OR=比值比,HR=风险比,eGFR=估算的肾小球滤过率,C8-DC=辛二酰肉碱,C16-OH=棕榈羟酰基肉碱,TC=总胆固醇
纳入研究均存在较高的偏倚风险。
4项[10,33,34,36]研究将特定人群,如心血管疾病、癌症、卒中患者、妊娠者排除在研究对象之外,这可能会对T2DM发病率的准确性造成不利影响,故此4项研究在该领域的偏倚风险评估结果为"高",其余研究均为"低",见表4。

纳入文献偏倚风险及适用性评价结果
Results of the assessment of risk of bias and applicability of included studies on the risk prediction model of T2DM
纳入文献偏倚风险及适用性评价结果
Results of the assessment of risk of bias and applicability of included studies on the risk prediction model of T2DM
| 第一作者 | 研究对象领域偏倚风险 | 预测因子领域偏倚风险 | 结果领域偏倚风险 | 数据分析领域偏倚风险 | 总体偏倚风险 | 适用性 | |||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ① | ② | 风险评价 | ③ | ④ | ⑤ | 风险评价 | ⑥ | ⑦ | ⑧ | ⑨ | ⑩ | ⑪ | 风险评价 | ⑫ | ⑬ | ⑭ | ⑮ | ⑯ | ⑰ | ⑱ | ⑲ | ⑳ | 风险评价 | 研究对象领域 | 预测因子领域 | 结果领域 | 总体评价 | ||
| AEKPLAKORN等[9] | Y | Y | L | PY | PY | Y | L | Y | Y | Y | Y | PY | Y | L | Y | N | Y | Y | N | — | Y | — | Y | H | H | L | L | L | L |
| CHIEN等[10] | Y | N | H | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | N | PN | N | Y | — | N | PY | Y | H | H | L | L | L | L |
| GAO等[11] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | — | Y | N | Y | — | N | — | Y | H | H | L | L | L | L |
| SUN等[12] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | N | Y | N | — | — | N | — | Y | H | H | L | L | L | L |
| CHUANG等[13] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | Y | — | N | — | Y | H | H | L | L | L | L |
| BOZORGMANESH等[14] | Y | Y | L | Y | Y | Y | L | Y | Y | PY | Y | Y | Y | L | Y | N | N | PY | Y | — | Y | PY | Y | H | H | L | L | L | L |
| LIU等[15] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | N | — | N | — | Y | H | H | L | L | L | L |
| ONAT等[16] | Y | Y | L | Y | Y | Y | L | Y | Y | PN | Y | Y | Y | H | Y | N | Y | — | Y | — | N | — | Y | H | H | L | L | L | L |
| DOI等[17] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | N | Y | N | Y | — | Y | — | Y | H | H | L | L | L | L |
| HEIANZA等[18] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | N | N | N | Y | — | N | — | N | H | H | L | L | L | L |
| LIM等[19] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | N | — | N | PY | Y | H | H | L | L | L | L |
| YE等[20] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | PY | Y | Y | Y | — | N | Y | — | H | H | L | L | L | L |
| XU等[21] | Y | Y | L | N | Y | Y | H | Y | Y | Y | Y | PY | Y | L | Y | N | Y | — | N | — | Y | PY | Y | H | H | L | L | L | L |
| NANRI等[22] | Y | Y | L | N | Y | Y | H | PY | Y | Y | N | PY | Y | H | Y | N | N | N | Y | — | Y | — | — | H | H | L | L | L | L |
| WANG等[23] | Y | Y | L | — | Y | Y | U | Y | Y | Y | Y | PY | Y | L | Y | Y | — | — | Y | — | Y | Y | Y | U | Ha | L | L | L | L |
| LIU等[24] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | N | Y | Y | N | Y | N | Y | — | H | H | L | L | L | L |
| MIYAKOSHI等[25] | Y | Y | L | PY | PY | Y | L | Y | Y | Y | N | PY | Y | L | Y | Y | N | — | Y | — | Y | — | Y | H | H | L | L | L | L |
| ZHANG等[26] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | Y | — | N | PY | Y | H | H | L | L | L | L |
| CHEN等[27] | Y | Y | L | PY | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | PY | N | Y | — | PN | Y | Y | U | Ha | L | L | L | L |
| ZHANG等[28] | Y | Y | L | Y | Y | Y | L | Y | Y | N | Y | Y | — | H | Y | Y | Y | N | N | — | Y | — | Y | H | H | L | L | L | L |
| WEN等[29] | Y | Y | L | PY | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | N | N | Y | — | Y | — | Y | H | H | L | L | L | L |
| YATSUYA等[30] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | N | PY | Y | H | Y | Y | N | N | Y | — | Y | PY | Y | H | H | L | L | L | L |
| HA等[31] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | Y | — | Y | — | Y | H | H | L | L | L | L |
| HAN等[32] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | Y | — | N | PY | Y | H | H | L | L | L | L |
| HU等[33] | Y | N | H | Y | Y | Y | L | PY | Y | Y | N | PY | Y | H | Y | Y | Y | N | Y | — | Y | — | N | H | H | L | L | L | L |
| WANG等[34] | Y | N | H | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | N | Y | — | N | PY | Y | H | H | L | L | L | L |
| GUNTHER等[35] | PY | Y | L | Y | Y | Y | L | Y | Y | Y | Y | Y | Y | L | N | Y | N | N | Y | — | N | — | Y | H | H | L | L | L | L |
| SHAO等[36] | Y | N | H | Y | Y | Y | L | PY | Y | Y | Y | PY | Y | L | Y | Y | N | N | Y | — | Y | PY | Y | H | H | L | L | L | L |
| ASGARI等[37] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | Y | Y | L | Y | — | N | Y | Y | PY | Y | Y | Y | H | H | L | L | L | L |
| OH等[38] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | N | PY | Y | H | Y | Y | Y | N | N | — | N | PY | Y | H | H | L | L | L | L |
| RHEE等[39] | Y | Y | L | Y | Y | Y | L | Y | Y | Y | Y | PY | Y | L | Y | Y | Y | Y | Y | — | Y | — | Y | U | H | L | L | L | L |
注:Y=是,N=否,PY=可能是,PN=可能否,U=不清楚,H=高,L=低;—表示没有信息;①表示是否使用了适当的数据源?②表示所有研究对象的纳入和排除是否合适?③表示所有研究对象的预测因子是否以类似的方式定义和评估?④表示预测因子的评估是否在不了解结果数据的情况下进行的?⑤表示在使用模型时是否所有预测因子都可用?⑥表示结果是否被适当的确定?⑦表示是否使用了预先指定或标准的结果定义?⑧表示预测因子是否被排除在结果定义之外?⑨表示结果的定义和确定方式是否相似?⑩表示是否在不知道预测因子信息的情况下确定结果?⑪表示预测因子评估和结果确定之间的时间间隔是否合适?⑫表示结果事件数量是否合理?⑬表示连续变量和分类变量是否得到适当的处理?⑭表示所有登记的参与者是否都包括在分析中?⑮表示丢失数据的研究对象是否得到适当的处理?⑯表示是否避免了基于单变量分析的预测因子选择?⑰表示是否考虑了数据的复杂性(如数据删失、竞争风险、对照抽样)?⑱表示是否适当地评估了模型性能指标?⑲表示是否考虑了模型过拟合和模型性能中的偏差?⑳表示最终模型中的预测因子及其分配的权重是否与多变量分析的结果相符? a表示有领域的偏倚风险评估结果为"不清楚",而其他领域的偏倚风险评估结果均为"低",但模型未经过外部验证,故总体偏倚风险仍为"高"
XU等[21]和NANRI等[22]的研究为多中心研究,但各中心对预测因子采用的测量方法有差异;WANG等[23]的研究则未报告预测因子测量相关信息。2项[21,22]研究在该领域的偏倚风险评估结果为"高",1项[23]研究为"不清楚",其余研究均为"低",见表4。
2项[16,28]研究中,FBG既是T2DM的诊断标准,亦是模型中的预测因子,但此2项研究均未明确基于FBG的模型适用条件。NANRI等[22]、YATSUYA等[30]、HU等[33]的研究中,接受降糖治疗的定义及结局变量的测量方法在各中心间有所不同。OH等[38]的研究中,对于葡萄糖耐量试验和HbA1c数据缺失的个案,仅凭借FBG诊断T2DM,这可能会导致诊断性偏倚。上述6项[16,22,28,30,33,38]研究在该领域的偏倚风险评估结果为"高",其余研究均为"低",见表4。
除3项[23,27,29]研究在该领域的偏倚风险评估结果为"不清楚",其余研究均为"高"。10项[9,10,12,14,16,17,18,21,22,24]研究在转化连续变量的过程中未检验连续变量间是否存在非线性关系或未对分类变量进行标准的定义,故在相应问题上被评价为"否"。10项[10,14,18,22,25,29,30,35,36,37]研究未将所有的研究对象纳入分析(研究数据多来源于数据库,或为登记数据),这可能会导致结果出现偏差。采用完整个案分析法处理缺失数据的研究中,4项[9,14,20,24]研究对剔除样本与纳入分析样本的基本特征进行了组间比较分析,发现差异无统计学意义,该处理方法相对合理;而其余研究在采用完整个案分析法处理缺失数据后,在不确定数据缺失是否完全随机的情况下,并未对剔除样本的特征进行分析,可引起偏倚。仅1项[24]研究明确表示考虑了数据竞争问题,在相应问题上被评价为"是"。16项[10,11,12,13,15,16,18,19,24,26,27,32,34,35,38]研究由于未报告模型的校准度,或仅以H-L拟合优度检验的统计量值和P值反映模型的校准度而未能提供校准图等因素,在相应问题上被评价为"否/可能否",见表4。
纳入模型总体及在各领域上的适用性较好,见表4。
本研究系统检索了亚洲T2DM发病风险预测模型相关研究,经过逐层筛选,最终纳入了31项研究。纳入模型的AUC为0.62~0.92,其中12项[12,13,14,18,22,25,33,34,35,36,37,39]研究开发的40个模型的AUC>0.8,2项[18,36]研究中的2个模型的AUC>0.9,提示模型预测性能较好。所有纳入的研究均存在高偏倚风险,主要原因为对连续变量的处理不合理、对缺失数据的处理不合理、存在乐观偏差、忽略了模型的过度拟合问题、未规范地对模型进行评价及缺乏外部验证等。
T2DM发病风险预测模型包含的预测因子以年龄、性别、糖尿病家族史、BMI、腰围、FBG、HbA1c和血脂指标为多见。一方面提示临床医务工作者应重视上述指标对T2DM发病的预警作用,加强对其的评估;另一方面也说明T2DM发病风险预测模型存在较为严重的同质化问题。探索新的、个性化预测因子可能有助于突破现有发展"瓶颈",提升模型的预测性能,提高个体化治疗水平[40,41,42]。流行病学研究结果表明,心理因素、饮食习惯、贫困、受教育程度、职业压力水平、睡眠障碍与T2DM发病高风险相关[43,44]。但由于上述部分指标缺乏统一的评估标准且主观性较强,少有研究者将其列为候选预测因子或将其纳入预测模型。下一步,可探究上述因子对模型预测性能提升的影响。同时考虑到T2DM发病率具有性别与年龄差异[45,46],故也可深入开发基于性别、年龄的T2DM发病风险差异化预测模型。
PROBAST是由Cochrane协助组推荐的预测模型研究偏倚风险评估工具。研究均于该工具发布前实施、模型开发过程中应注意的细节问题较多可能是导致偏倚风险较高的原因之一。未来,研究者可按照PROBAST开展T2DM发病风险预测模型的开发与验证工作,并严格遵循多变量预测模型报告规范,进而尽可能地减少研究中存在的偏倚。
本研究中,83.9%(26/31)的研究对连续变量进行了分类处理,但此方法可能导致重要信息丢失、变量间的关系被破坏及模型预测能力的下降[47]。有研究者认为,对于连续变量,宜保持其连续性,若连续变量间存在非线性关系,可运用分段多项式函数(如样条函数)处理数据[48]。除了未报告缺失数据处理方法的研究外,91.7%(22/24)的研究采用完整个案分析法处理缺失数据,该方法虽简单易用,但可能会消减数据特征、降低数据和研究的效力[49]。多重插补、单一插补法的运用能有效降低数据缺失对统计分析、模型稳定性造成的不利影响,提高研究精度和结果可靠性,是合适的数据缺失处理方法[50]。
模型的不确定性和参数的不确定性可导致模型的过度拟合,连续变量的离散化处理、基于单因素分析的变量筛选方法等可使模型出现乐观偏差的可能性增高,而两者(模型的过度拟合、模型出现乐观偏差)均可致使预测模型的泛化能力下降[51]。本文纳入的研究中,48.4%(15/31)的研究考虑了模型的过度拟合问题,这也提示研究人员对模型过度拟合问题及其存在的乐观偏差重视程度不够。随机将数据集拆分为两个子集并将其中一个子集用于内部验证,已经被证实为一个不太恰当的测量乐观偏差的方法[52,53]。今后,在开发T2DM发病风险预测模型时,可使用自举法、交叉验证法等对模型拟合进行校验,校验时须重复整套建模流程,包括变量转换、缺失值处理、变量筛选和模型拟合,否则可能无法衡量模型存在的实际乐观偏差水平[54]。此外,开发动态预测模型也可能是解决模型过度拟合的有效方法,如ASGARI等[37]通过使用纵向数据(即重复测量数据,如FBG)和事件发生时间数据进行联合建模,使开发的T2DM发病风险预测模型具备了动态性。联合模型的原则是先定义两个子模型,即混合效应模型和Cox模型,然后使用其共同的潜在结构将其链接起来。下一步,研究者可深入开发基于混合效应模型和Cox模型的纵向和生存数据联合模型,尽量做到将纵向数据与事件发生时间数据联合起来进行分析,进而使参数估计的偏差进一步减小,提高统计推断的效率。
本研究发现,29.0%(9/31)的研究对模型进行了外部验证(其中4项研究采用内部验证与外部验证相结合的方法对模型进行了验证),大部分模型仍处于内部验证阶段,这使得现有模型的转化率较低且偏倚风险较高。外部验证和重新校准有助于增强模型的泛化能力,与开发新模型相比,具有更高的成本效益。医务工作者可基于本研究结果选取高质量的T2DM发病风险预测模型并对其进行外部验证(大样本、多中心数据)后,将其应用于临床;或通过开展多中心、跨国预测模型构建研究,提高T2DM发病风险预测模型的临床应用率、转化率。也可基于电子病历系统构建自动化的T2DM发病风险预测工具;或将传统预测工具与计算机技术相结合,如基于网络的交互式列线图,使模型可以与电子病历系统相结合的同时,也可借由网页在移动设备、个人计算机上呈现,进而:(1)同时满足医务人员和社区糖尿病患者对T2DM发病风险预测工具的使用需求;(2)使模型在得到复杂算法支撑的同时,减少人工计算的工作量;(3)使模型更易于理解,用户使用模型的积极性得以提高。
本文存在一定的局限性。首先,受限于文献纳入与排除标准,本研究纳入的文献可能不够全面,存在一定的选择偏倚;其次,由于纳入文献在研究对象及方法上存在明显的异质性,本研究未对纳入研究进行定量分析。
本文无利益冲突。





















