
随着人口老龄化及寿命延长,慢性病的多病共存日益普遍。疾病种类多且病情复杂,为老年人健康管理提出挑战。共病模式作为研究的必要问题,国内研究相对缺乏。
研究中国老年人常见慢性病的多病共存模式,帮助政策制定者、研究人员和临床医生更好地了解多病共存现状。
选取中国健康养老追踪调查(CHARLS)2018年数据中60岁及以上被访者,选择人口特征学部分数据及健康状况的14种慢性病数据。采用关联规则、聚类分析、主成分分析、潜在类别分析4种方法对中国老年人的共病模式进行探索,并对比不同方法所得结果。
最终共纳入10 800例被访者数据。4种方法所得模式有所差异,但存在一致性的共病模式:(1)高血压、糖尿病或血糖升高、血脂异常;(2)慢性肺部疾患和哮喘;(3)关节炎或风湿病、胃部疾病或消化系统疾病;(4)中风、与记忆相关的疾病。
不同方法得到的一致性的共病模式所包含的慢性病病因关系关联明显;4种方法得到的共病模式存在差异的原因是包含的病因关系复杂,且方法的原理不同。
本刊2023年版权归中国全科医学杂志社所有
未经编辑部许可,不得任意转载和摘编
本刊所发表作品仅为作者观点,并不代表编委会和编辑部意见
如有印装质量问题请向本刊发行部调换
WHO对于多病共存(multimorbidity)的定义为:一个人同时患有两种或多种疾病[1]。城镇化及老龄化使老年人疾病谱发生了显著变化,越来越多的人同时患有多种疾病。多病共存涉及疾病的病因关系多样,疾病类型没有限定,并不明确哪一种疾病为索引疾病[2]。国内外多病共存模式研究常用的方法有:多病个数统计[3]、聚类分析[4]、因子分析[5]及相关分析[6]。研究数据来源为:调查数据、临床数据或医疗数据,涉及疾病有些是常见疾病,有些是罕见疾病。孙至佳等[7]选取2次中国慢性病前瞻性研究数据,采用个数统计及系统聚类对10个地区被访者的共病模式进行分析;刘贝贝等[8]选取中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)数据采用关联规则探索常见慢性病的共病组合模式;OLAYA等[9]采用潜在类别分析(LCA)区分"Edad con Salud"调查被访者共病模式并进行预后分析,涉及疾病包含常见慢性病及白内障。既往研究选取数据、疾病及使用方法不同,得到的共存模式研究结果各异,可信度较低,很少有对同一数据采取多种方法,并对比结果来确保研究成果的可靠性。
本研究旨在采用多种方法探索中国老年人常见慢性病的多病共存模式,并分析不同方法所得结果的差异性与一致性。选取CHARLS 2018年的数据,应用4种方法探索多病模式,避免了不同数据导致结果无法比较的问题,通过比较不同方法所得结果的一致性,从而得出稳定的多病模式。
CHARLS旨在收集代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究[10,11,12]。选择经过数据清洗的Harmonized_CHARLS_D版本,从中筛选2018年的数据进行分析,选取人口特征学部分数据及健康状况的14种慢性病数据。
由于Harmonized_CHARLS_D版本经过数据清洗,质量较高。为了保证研究数据与总体的一致性,仅筛选年龄60岁及以上的被访者,不删除缺失值,最终得到10 800份被访者数据。14种慢性病数据的缺失值较少,通过众数填补。人口特征学数据未参与模式分析故不做处理,在描述时以缺失值展示。
CHARLS数据选取的14种慢性病为:高血压,糖尿病或血糖升高(包括糖耐量异常和空腹血糖升高),癌症等恶性肿瘤(不包括轻度皮肤癌),慢性肺部疾患如慢性支气管炎或肺气肿、肺心病(不包括肿瘤或癌,后简称慢性肺部疾患),心脏病(如心肌梗死、冠心病、心绞痛、充血性心力衰竭和其他心脏疾病),中风,情感及精神方面问题,关节炎或风湿病,血脂异常(高血脂或低血脂),肝脏疾病(除脂肪肝、肿瘤或癌外),肾脏疾病(不包括肿瘤或癌),胃部疾病或消化系统疾病(不包括肿瘤或癌),哮喘,与记忆相关的疾病(如老年痴呆症、脑萎缩、帕金森症)。
人口特征学数据包括:性别(男、女),年龄,家庭居住地类型(城市、农村),被访者户口类型(城市户口、农村户口),受教育程度(小学以下、小学及初中学历、高中及职业培训、大专及以上)及婚姻状况(已婚、分居或离婚、丧偶、未婚)。
数据处理及所用方法通过R语言编程实现,运用多个R语言包完成4种分析。数据的一般情况包含被访者人群的概况统计,14种慢性病的发病率、共病率、平均共病种数,以此了解被访者人群的特征及14种慢性病的发病情况。
采用关联规则发现常见两病及三病组合,支持度为疾病组合的观察发病率,提升度为独立性判断指标,在两病组合中与观察发病率/期望发病率相同。设置关联规则前项集与后项集的例数,支持度最小值可以得到观察发病率较高的组合。计算组合预期发病率并结合提升度判断疾病的独立性。
聚类分析根据某些数量特征将观察对象分类,根据聚类对象的不同,可以分为个案聚类和变量聚类。反映个案或者变量间性质远近的统计量称为距离,有多种计算方法。将被访者的14种慢性病数据处理为01形式,即被访者患有此疾病时为1,未患有此疾病时为0。处理完成的14种慢性病数据可以看成一个n×p的01矩阵,其中n是被访者的例数(10 800),p为慢性病种数(14)。被访者的聚类是个案聚类,依据14种慢性病的发病情况计算得到的n×n距离矩阵进行分类。对14种慢性病的系统聚类通过慢性病在被访者中的共现情况,得到一个p×p距离矩阵并由此分类。本研究对被访者采用k-medoids算法,对14种慢性病采用系统聚类以区分多病共存模式。
01数据距离的选择取决于正匹配(同为1)和负匹配(同为0)的相对权重,而相对权重又取决于正匹配和负匹配的相对重要性。本研究采用01数据常用的Jaccard距离和Yule's Q距离,Yule's Q是一种能体现两种慢性病负匹配及未匹配时信息的相似度计算方法,较好地反映01数据所有相关信息[13],Jaccard距离仅突出正匹配[14]。共病模式中侧重于慢性病正匹配,即共同发病,并且被访者中存在健康者(全0数据),Yule's Q在1个数据为全0时无法计算。对比两个距离计算方法的效果,并考虑其临床意义后,最终采用Yule's Q距离进行慢性病的系统聚类分析;采用Jaccard距离进行被访者的k-medoids聚类。系统聚类的分类个数通过谱系图结合临床意义确定,聚类方法为类平均法;被访者的k-medoids聚类个数通过factoextra包中的fviz_nbclust函数确定。
每个变量在不同程度上反映了某些信息并存在有一定的相关性。变量太多会增加计算量及分析问题的复杂性,主成分分析通过恰当的数学变换,使新变量为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物。本研究采用最大方差旋转的主成分分析方法,使用方差贡献度确定主成分个数并将14个多病化简为少数疾病组合,以载荷系数绝对值>0.36选择主成分包含的慢性病。
LCA根据被访者在14种慢性病的患病情况对其分类。与聚类分析类似,LCA通过个体间相似性区分类别,但不定义类别之间的距离,也不选择分类方法,根据个体所有变量的观测变量概率进行分类。遍历所有的分类,比较指标得到最优分类个数。常用于判别最优模型的指标是:Likelihood-ratio,G2 statistic,Bayesian Information Criterion(BIC)等,采用R语言的poLCA包进行LCA分析,最终类别判定指标为BIC值。
最终得到10 800例60岁及以上的被访者,被访者中女性稍多(51.3%),居住在农村的被访者较多(60.3%),农村户口被访者较高(74.0%)。被访者受教育程度普遍较低,90.7%的被访者未接受高中及以上教育,由于CHARLS访谈以家庭为单位进行,已婚被访者较多(77.9%),这与国内人口总体特征一致[15]。86.2%的被访者患有1种及以上的慢性病,49.0%的被访者患有2~4种慢性病(表1)。

研究对象的慢性病种数及基本特征
Number and basic characteristics of chronic diseases of research subjects
研究对象的慢性病种数及基本特征
Number and basic characteristics of chronic diseases of research subjects
| 人群 | 例数 | 多病种数 | 2018年年龄 | 家庭居住地类型〔例(%)〕 | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 无慢性病〔例(%)〕 | 1种慢性病〔例(%)〕 | 2种慢性病〔例(%)〕 | 3种慢性病〔例(%)〕 | 4种慢性病〔例(%)〕 | ≥5种慢性病 | 年龄( ±s,岁) | 年龄〔M(P25,P75),岁〕 | 城市 | 农村 | ||
| 性别 | |||||||||||
| 男 | 5 261 | 826(15.7) | 1 181(22.4) | 1 082(20.6) | 868(16.5) | 564(10.7) | 740(14.1) | 69.1±7.0 | 68.0(60.0,118.0) | 2 056(39.1) | 3 205(60.9) |
| 女 | 5 539 | 660(11.9) | 1 077(19.4) | 1 164(21.0) | 960(17.3) | 660(11.9) | 1 018(18.5) | 69.2±7.2 | 68.0(60.0,108.0) | 2 234(40.3) | 3 305(59.7) |
| 总体 | 10 800 | 1 486(13.8) | 2 258(20.9) | 2 246(20.8) | 1 828(16.9) | 1 224(11.3) | 1 758(16.3) | 69.2±7.2 | 68.0(60.0,118.0) | 4 290(39.7) | 6 510(60.3) |
| 组别 | 被访者户口类型〔例(%)〕 | 受教育程度〔例(%)〕 | 婚姻状况〔例(%)〕 | |||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 城市户口 | 农村户口 | 缺失值 | 小学以下、小学及初中 | 高中及职业培训 | 大专及以上 | 已婚 | 分居或离婚 | 丧偶 | 未婚 | |
| 性别 | ||||||||||
| 男 | 1 401(26.6) | 3 755(71.4) | 105(2.0) | 4 565(86.8) | 578(11.0) | 118(2.2) | 4 530(86.1) | 73(1.4) | 592(11.3) | 66(1.2) |
| 女 | 1 179(21.3) | 4 234(76.4) | 126(2.3) | 5 234(94.5) | 263 (4.7) | 42(0.8) | 3 883(70.1) | 54(1.0) | 1 597(28.8) | 5(0.1) |
| 总体 | 2 580(23.9) | 7 989(74.0) | 231(2.1) | 9 799(90.7) | 841 (7.8) | 160(1.5) | 8 413(77.9) | 127(1.2) | 2 189(20.3) | 71(0.6) |
14种慢性病共病率均高于85%(表2),发病率较高的是高血压(47.14%,5 091/10 800),平均共病种数较多的是情感及精神方面问题(4.16种)及与记忆相关的疾病(4.17种)。中风、肝脏疾病及肾脏疾病的发病率较低,但平均共病个数较高。

慢性病发病率及共病率
Incidence and co-morbidity of chronic diseases
慢性病发病率及共病率
Incidence and co-morbidity of chronic diseases
| 慢性病 | 发病率〔例(%)〕 | 共病率〔例(%)〕 | 平均共病种数( ±s,种) |
|---|---|---|---|
| 高血压 | 5 091(47.14) | 4 458(87.57) | 2.56±1.92 |
| 糖尿病或血糖升高 | 1 656(15.33) | 1 578(95.29) | 3.41±2.06 |
| 癌症等恶性肿瘤 | 279 (2.58) | 249(89.25) | 3.09±2.44 |
| 慢性肺部疾患 | 2 121(19.64) | 1 983(93.49) | 3.34±2.09 |
| 心脏病 | 2 684(24.85) | 2 580(96.13) | 3.46±1.98 |
| 中风 | 1 093(10.12) | 1 047(95.79) | 3.51±2.07 |
| 情感及精神方面问题 | 398 (3.69) | 377(94.72) | 4.16±2.56 |
| 关节炎或风湿病 | 4 808(44.52) | 4 159(86.50) | 2.53±1.96 |
| 血脂异常 | 2 644(24.48) | 2 531(95.73) | 3.37±1.97 |
| 肝脏疾病 | 779 (7.21) | 745(95.64) | 3.87±2.29 |
| 肾脏疾病 | 1 245(11.53) | 1 200(96.39) | 3.84±2.21 |
| 胃部疾病或消化系统疾病 | 3 403(31.51) | 3 069(90.19) | 2.85±2.02 |
| 哮喘 | 855 (7.92) | 845(98.83) | 4.04±2.15 |
| 与记忆相关的疾病 | 656 (6.07) | 633(96.49) | 4.17±2.35 |
表3展示了支持度>10%的所有两病组合,表4展示了支持度>5%的三病组合。仅从支持度考虑,关联规则得到的共病组合仅是共同发生,例如:关节炎或风湿病与高血压在老年人群中共同发病率较高,但病因相对独立,故观察发病率/期望发病率接近于1。血脂异常与心脏病共同发病率高,结合观察发病率与期望发病率的比值发现关联,两者病因有关。

两病的关联规则分析
Analysis of association rules for two chronic diseases
两病的关联规则分析
Analysis of association rules for two chronic diseases
| 前项集 | 后项集 | 例数 | 观察发病率(支持度)(%) | 期望发病率(%) | χ2值 | P值 | 观察发病率/期望发病率 |
|---|---|---|---|---|---|---|---|
| 关节炎或风湿病 | 高血压 | 2 428 | 22.48 | 20.99 | 39.03 | <0.001 | 1.07 |
| 胃部疾病或消化系统疾病 | 关节炎或风湿病 | 2 056 | 19.04 | 14.03 | 507.53 | <0.001 | 1.36 |
| 血脂异常 | 高血压 | 1 812 | 16.78 | 11.54 | 641.94 | <0.001 | 1.45 |
| 心脏病 | 高血压 | 1 752 | 16.22 | 11.71 | 470.52 | <0.001 | 1.38 |
| 胃部疾病或消化系统疾病 | 高血压 | 1 613 | 14.94 | 14.85 | 0.12 | 0.729 | 1.01 |
| 心脏病 | 关节炎或风湿病 | 1 428 | 13.22 | 11.06 | 108.62 | <0.001 | 1.20 |
| 血脂异常 | 关节炎或风湿病 | 1 320 | 12.22 | 10.90 | 41.13 | <0.001 | 1.12 |
| 慢性肺部疾患 | 关节炎或风湿病 | 1 204 | 11.15 | 8.74 | 159.66 | <0.001 | 1.28 |
| 心脏病 | 胃部疾病或消化系统疾病 | 1 179 | 10.92 | 7.83 | 254.43 | <0.001 | 1.39 |
| 血脂异常 | 心脏病 | 1 168 | 10.81 | 6.08 | 698.65 | <0.001 | 1.78 |
| 糖尿病或血糖升高 | 高血压 | 1 144 | 10.59 | 7.23 | 376.91 | <0.001 | 1.47 |
| 慢性肺部疾患 | 高血压 | 1 103 | 10.21 | 9.26 | 24.83 | <0.001 | 1.10 |

三病组合的关联规则分析
Analysis of association rules for triple disease combinations
三病组合的关联规则分析
Analysis of association rules for triple disease combinations
| 前项集 | 后项集 | 例数 | 观察发病率(支持度)(%) | 期望发病率(%) | 观察发病率/期望发病率 | 提升度 |
|---|---|---|---|---|---|---|
| 关节炎或风湿病,胃部疾病或消化系统疾病 | 高血压 | 1 011 | 9.40 | 6.60 | 1.42 | 1.42 |
| 心脏病,关节炎或风湿病 | 高血压 | 940 | 8.70 | 5.20 | 1.67 | 1.67 |
| 关节炎或风湿病,血脂异常 | 高血压 | 914 | 8.50 | 5.10 | 1.67 | 1.65 |
| 心脏病,血脂异常 | 高血压 | 895 | 8.30 | 2.90 | 2.86 | 2.89 |
| 心脏病,胃部疾病或消化系统疾病 | 关节炎或风湿病 | 798 | 7.40 | 3.50 | 2.11 | 2.12 |
| 心脏病,胃部疾病或消化系统疾病 | 高血压 | 734 | 6.80 | 3.70 | 1.84 | 1.84 |
| 糖尿病或血糖升高,血脂异常 | 高血压 | 692 | 6.40 | 1.80 | 3.56 | 3.62 |
| 血脂异常,胃部疾病或消化系统疾病 | 高血压 | 677 | 6.30 | 3.60 | 1.75 | 1.72 |
| 慢性肺部疾患 | 高血压 | 670 | 6.20 | 4.10 | 1.51 | 1.51 |
| 慢性肺部疾患 | 关节炎或风湿病 | 665 | 6.20 | 2.80 | 2.21 | 2.24 |
| 心脏病,血脂异常 | 关节炎或风湿病 | 653 | 6.00 | 2.70 | 2.22 | 2.23 |
| 血脂异常,胃部疾病或消化系统疾病 | 关节炎或风湿病 | 648 | 6.00 | 3.40 | 1.76 | 1.75 |
| 糖尿病或血糖升高,关节炎或风湿病 | 高血压 | 566 | 5.20 | 3.20 | 1.63 | 1.63 |
| 心脏病,血脂异常 | 胃部疾病或消化系统疾病 | 547 | 5.10 | 1.90 | 2.68 | 2.64 |
三病组合选取观察发病率与期望发病率的比值及提升度来判断疾病间的联系。(1)心脏病,血脂异常及高血压;(2)糖尿病或血糖升高,血脂异常及高血压;两个病组的观察发病率/期望发病率高,提升度较高,在病因学关系及致病因素上存在关联。
通过分析14种常见慢性病系统聚类的谱系图(图1),通过距离接近程度将慢性病分为6类,以不同颜色区分。Yule'S Q距离体现了慢性病在人员中的发病信息,距离较近慢性病即在被访者中共同发病率较高,发病因素多有所关联,如哮喘与慢性肺部疾患同为呼吸系统疾病,血脂异常、糖尿病或血糖升高、中风与高血压同为血管循环系统疾病,与记忆相关的疾病、情感及精神方面问题为精神心理疾病,胃部疾病或消化系统疾病与关节炎或风湿病同为代谢系统疾病。心脏病与与记忆相关的疾病、情感及精神方面问题为精神心理疾病距离接近,三者可以聚为一类,癌症等恶性肿瘤独立于其他疾病,单独为一类。


被访者的聚类使用簇内平方误差和确定最佳的簇数为4个,聚类后每个被访者有1个分类,对4个分类的患病情况及疾病个数统计如表5。由于k-medoids聚类选取Jaccard距离,侧重于体现同时发病信息。分类1包含了所有的无慢性病及患有1~2种共病率较低的慢性病的被访者,相对健康。分类2中呼吸系统疾病、胃部疾病或消化系统疾病的发病率远高于总体,关节炎或风湿病发病率略高于总体,系统聚类中呼吸系统疾病为一类,与其他疾病相对独立。胃部疾病或消化系统疾病、关节炎或风湿病发病也独立于其他疾病,这4种慢性病组合随机共存的患者多在分类2中。分类3中3~5种共病被访者占比较高,其中心脏病、血脂异常的发病率远高于总体,而高血压、中风等疾病的发病率略高于总体。常见的3~5种共病多为心血管疾病(高血压、糖尿病或血糖升高、血脂异常、心脏病),可以推测分类3为包含这几个疾病的共病组合。分类4中被访者均患有高血压,但是平均共病种数为1.82种,并且除高血压之外的慢性病发病率均低于总体,可以推测分类4包含仅患有高血压的被访者及高血压与非心血管疾病组合的患者。

多病被访者的k-medoids聚类分析结果(分组被访者的发病率)
Results of k-medoids clustering analysis of respondentswith multimorbidity
多病被访者的k-medoids聚类分析结果(分组被访者的发病率)
Results of k-medoids clustering analysis of respondentswith multimorbidity
| 分类 | 例数 | 高血压〔例(%)〕 | 糖尿病或血糖升高〔例(%)〕 | 癌症等恶性肿瘤〔例(%)〕 | 慢性肺部疾患〔例(%)〕 | 心脏病〔例(%)〕 | 中风〔例(%)〕 | 情感及精神方面问题〔例(%)〕 | 关节炎或风湿病〔例(%)〕 | 血脂异常〔例(%)〕 |
|---|---|---|---|---|---|---|---|---|---|---|
| 分类1 | 3 259 | 505 (15.50) | 57 (1.75) | 73(2.24) | 0 | 75 (2.30) | 154 (4.73) | 62(1.90) | 1 532(47.00) | 87 (2.67) |
| 分类2 | 2 016 | 264 (13.10) | 46 (2.28) | 47(2.33) | 1 161(57.59) | 222(11.01) | 104 (5.16) | 77(3.82) | 1 139(56.50) | 92 (4.56) |
| 分类3 | 3 861 | 2 656 (68.79) | 1 425(36.91) | 124(3.21) | 803(20.80) | 2 197(56.90) | 664(17.20) | 232(6.01) | 2 135(55.30) | 2 259(58.51) |
| 分类4 | 1 664 | 1 664(100.00) | 128 (7.69) | 35(2.10) | 156 (9.38) | 191(11.48) | 170(10.22) | 27(1.62) | 0 | 206(12.38) |
| 总体 | 10 800 | 5 091 (47.14) | 1 656(15.33) | 279(2.58) | 2 121(19.64) | 2 684(24.85) | 1 093(10.12) | 398(3.69) | 4 808(44.52) | 2 644(24.48) |
| 分类 | 肝脏疾病〔例(%)〕 | 肾脏疾病〔例(%)〕 | 胃部疾病或消化系统疾病〔例(%)〕 | 哮喘〔例(%)〕 | 与记忆相关的疾病〔例(%)〕 | 无慢性病〔例(%)〕 | 1种慢性病〔例(%)〕 | 2种慢性病〔例(%)〕 | 3种慢性病〔例(%)〕 | 4种慢性病〔例(%)〕 |
|---|---|---|---|---|---|---|---|---|---|---|
| 分类1 | 99 (3.04) | 178 (5.46) | 0 | 44 (1.35) | 80 (2.45) | 1 486(45.60) | 858(26.33) | 688(21.11) | 195 (5.98) | 32 (0.98) |
| 分类2 | 172 (8.53) | 242(12.00) | 1 407(69.80) | 333(16.52) | 81 (4.02) | 0 | 472(23.41) | 582(28.87) | 443(21.97) | 261(12.95) |
| 分类3 | 440(11.40) | 741(19.19) | 1 819(47.11) | 425(11.01) | 432(11.19) | 0 | 295 (7.64) | 261 (6.76) | 890(23.05) | 915(23.70) |
| 分类4 | 66 (3.97) | 86 (5.17) | 180(10.82) | 55 (3.31) | 63 (3.79) | 0 | 633(38.04) | 715(42.97) | 300(18.03) | 16 (0.96) |
| 总体 | 779 (7.21) | 1 245(11.53) | 3 403(31.51) | 855 (7.92) | 656 (6.07) | 1 486(13.76) | 2 258(20.91) | 2 246(20.96) | 1 828(16.93) | 1 224(11.33) |
| 分类 | 5种慢性病〔例(%)〕 | 6种慢性病〔例(%)〕 | 7种慢性病〔例(%)〕 | 8种慢性病〔例(%)〕 | 9种慢性病〔例(%)〕 | 10种慢性病〔例(%)〕 | 11种慢性病〔例(%)〕 | 12种慢性病〔例(%)〕 | 13种慢性病〔例(%)〕 | 平均慢性病种数( ±s,种) |
|---|---|---|---|---|---|---|---|---|---|---|
| 分类1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.90±0.99 |
| 分类2 | 194 (9.62) | 50 (2.48) | 10(0.50) | 1(0.05) | 2(0.10) | 0 | 1(0.05) | 0 | 0 | 2.67±1.42 |
| 分类3 | 617(15.98) | 426(11.03) | 247(6.40) | 117(3.03) | 56(1.45) | 22(0.57) | 8(0.21) | 4(0.10) | 3(0.08) | 4.24±1.90 |
| 分类4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1.82±0.75 |
| 总体 | 811 (7.51) | 476 (4.41) | 257(2.38) | 118(1.09) | 58(0.54) | 22(0.20) | 9(0.08) | 4(0.04) | 3(0.03) | 2.57±1.99 |
通过碎石图(图2)确定主成分个数为5个,设定载荷系数>0.36得到各主成分不重叠的代表慢性病,同一主成分的代表疾病关联性较强。第一主成分包含高血压,糖尿病或血糖升高,心脏病,血脂异常;第二主成分包含慢性肺部疾患与哮喘,第三主成分包含关节炎或风湿病,胃部疾病或消化系统疾病;第四主成分包含中风,情感及精神方面问题,与记忆相关的疾病;第五主成分包含癌症等恶性肿瘤,肝脏疾病,肾脏疾病,主成分分类见表6。

主成分分类表
Classification table of principal component
主成分分类表
Classification table of principal component
| 分类 | 慢性病 | RC1 | RC2 | RC3 | RC4 | RC5 |
|---|---|---|---|---|---|---|
| 分类1 | 高血压 | 0.66 | ||||
| 糖尿病或血糖升高 | 0.63 | |||||
| 心脏病 | 0.47 | |||||
| 血脂异常 | 0.69 | |||||
| 分类2 | 关节炎或风湿病 | 0.68 | ||||
| 胃部疾病或消化系统疾病 | 0.72 | |||||
| 分类3 | 慢性肺部疾患 | 0.82 | ||||
| 哮喘 | 0.85 | |||||
| 分类4 | 中风 | 0.45 | ||||
| 情感及精神方面问题 | 0.67 | |||||
| 与记忆相关的疾病 | 0.74 | |||||
| 分类5 | 癌症等恶性肿瘤 | 0.78 | ||||
| 肝脏疾病 | 0.50 | |||||
| 肾脏疾病 | 0.42 |


通过最小的BIC指标确定最优的分类个数为5个,分析潜在类别的条件概率分布图(图3)及各类别与慢性病及慢性病个数的交叉表(表7)。分类5为相对健康组,包含了所有的无慢性病及只有1种慢性病的被访者、大部分两病的被访者,14种慢性病的发病率均低于总体。分类1为代谢系统疾病组,关节炎或风湿病、胃部疾病或消化系统疾病的发病率高;分类2为血管循环疾病(高血压、糖尿病或血糖升高、心脏病、血脂异常)组;分类3为多病组,有5种以上的慢性病,人数较少,多个慢性病的发病率高于总体;分类4为呼吸系统疾病组,呼吸系统疾病(慢性肺部疾患如慢性支气管炎或肺气肿、肺心病、哮喘)的患病率较高。

潜在类别分析分类与慢性病交叉表
Cross table of latent classes with chronic diseases
潜在类别分析分类与慢性病交叉表
Cross table of latent classes with chronic diseases
| 分类 | 例数 | 高血压〔例(%)〕 | 糖尿病或血糖升高〔例(%)〕 | 癌症等恶性肿瘤〔例(%)〕 | 慢性肺部疾患〔例(%)〕 | 心脏病〔例(%)〕 | 中风〔例(%)〕 | 情感及精神方面问题〔例(%)〕 | 关节炎或风湿病〔例(%)〕 | 血脂异常〔例(%)〕 |
|---|---|---|---|---|---|---|---|---|---|---|
| 分类1 | 1 266 | 501(39.57) | 82(6.48) | 42(3.32) | 409(32.31) | 400(31.59) | 94 (7.42) | 74 (5.84) | 1 111(87.76) | 221(17.46) |
| 分类2 | 2 728 | 2 389(87.57) | 1 090(39.96) | 73(2.67) | 275(10.08) | 1 287(47.18) | 694(25.44) | 77 (2.82) | 1 059(38.82) | 1 623(59.49) |
| 分类3 | 559 | 446(79.78) | 240(42.93) | 32(5.72) | 361(64.58) | 497(88.91) | 163(29.16) | 139(24.86) | 445(79.61) | 437(78.18) |
| 分类4 | 618 | 304(49.19) | 63(10.19) | 12(1.94) | 589(95.31) | 259(41.91) | 33 (5.34) | 22 (3.56) | 335(54.21) | 111(17.96) |
| 分类5 | 5 629 | 1 451(25.78) | 181 (3.21) | 120(2.13) | 487 (8.65) | 241 (4.28) | 109 (1.94) | 86 (1.53) | 1 858(33.01) | 252 (4.48) |
| 总体 | 10 800 | 5 091(47.14) | 1 656(15.33) | 279(2.58) | 2 121(19.64) | 2 684(24.85) | 1 093(10.12) | 398 (3.69) | 4 808(44.52) | 2 644(24.48) |
| 分类 | 肝脏疾病〔例(%)〕 | 肾脏疾病〔例(%)〕 | 胃部疾病或消化系统疾病〔例(%)〕 | 哮喘〔例(%)〕 | 与记忆相关的疾病〔例(%)〕 | 0种慢性病〔例(%)〕 | 1种慢性病〔例(%)〕 | 2种慢性病〔例(%)〕 | 3种慢性病〔例(%)〕 | 4种慢性病〔例(%)〕 |
|---|---|---|---|---|---|---|---|---|---|---|
| 分类1 | 288(22.75) | 346(27.33) | 1 182(93.36) | 29 (2.29) | 71 (5.61) | 0 | 0 | 9 (0.71) | 561(44.31) | 402(31.75) |
| 分类2 | 133 (4.87) | 284(10.41) | 575(21.08) | 49 (1.80) | 270 (9.90) | 0 | 0 | 525(19.24) | 896(32.84) | 650(23.83) |
| 分类3 | 204(36.49) | 328(58.67) | 429(76.74) | 199(35.60) | 198(35.42) | 0 | 0 | 0 | 0 | 0 |
| 分类4 | 30 (4.85) | 60 (9.71) | 212(34.30) | 546(88.35) | 35 (5.66) | 0 | 0 | 51 (8.25) | 150(24.27) | 169(27.35) |
| 分类5 | 124 (2.20) | 227 (4.03) | 1 005(17.85) | 32 (0.56) | 82 (1.46) | 1 486(26.40) | 2 258(40.11) | 1 661(29.51) | 221 (3.93) | 3 (0.05) |
| 总体 | 779 (7.21) | 1 245(11.53) | 3 403(31.51) | 855 (7.92) | 656 (6.07) | 1 486(13.76) | 2 258(20.91) | 2 246(20.80) | 1 828(16.93) | 1 224(11.33) |
| 分类 | 5种慢性病〔例(%)〕 | 6种慢性病〔例(%)〕 | 7种慢性病〔例(%)〕 | 8种慢性病〔例(%)〕 | 9种慢性病〔例(%)〕 | 10种慢性病〔例(%)〕 | 11种慢性病〔例(%)〕 | 12种慢性病〔例(%)〕 | 13种慢性病〔例(%)〕 | 平均慢性病种数( ±s,种) |
|---|---|---|---|---|---|---|---|---|---|---|
| 分类1 | 224(17.69) | 69 (5.45) | 1 (0.08) | 0 | 0 | 0 | 0 | 0 | 0 | 3.83±0.92 |
| 分类2 | 437(16.02) | 186 (6.82) | 33 (1.21) | 1 (0.04) | 0 | 0 | 0 | 0 | 0 | 3.62±1.23 |
| 分类3 | 18 (3.22) | 132(23.61) | 196(35.06) | 117(20.93) | 58(10.38) | 22(3.94) | 9(1.61) | 4(0.72) | 3(0.54) | 7.37±1.36 |
| 分类4 | 132(21.36) | 89(14.40) | 27 (4.37) | 0 | 0 | 0 | 0 | 0 | 0 | 4.22±1.31 |
| 分类5 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1.11±0.84 |
| 总体 | 811 (7.51) | 476 (4.41) | 257 (2.38) | 118 (1.09) | 58 (0.54) | 22(0.20) | 9(0.08) | 4(0.04) | 3(0.03) | 2.57±1.99 |


共病概念说法不一,本研究特指"Multimorbidity",为"同一个体共存的急性病或慢性病"[2],强调共存,病因学关系上有可能相关也可能独立。本研究得到的有一致性的几种共病模式是:(1)高血压、糖尿病或血糖升高血脂异常;(2)慢性肺部疾患、哮喘;(3)关节炎或风湿病、胃部疾病或消化系统疾病;(4)中风、与记忆相关的疾病。不同方法得到组合有所差异,例如心脏病在主成分分析及潜在类别分析中与模式(1)关系紧密,但在系统聚类中关联较远。恶性肿瘤在多个方法中均独立于其他疾病,情感及精神方面问题发病率较低,这两者在某些方法中与其他疾病有一些关联,但是没有明显及稳定的共病组合。肾脏疾病、肝脏疾病虽然多种分类中有所体现,但两者的病因学关系相对独立。
不同方法的原理不同。关联规则通过控制前项集及后项集的个数,得到指定数量的疾病组合,提升度判断独立性以区分共存类型,但是支持度仅体现共病观察发病率。系统聚类及主成分分析,侧重于慢性病共现的关联性,结果能较为清晰的体现病因关联;k-medoids及LCA侧重于通过人群反映共病组合,两者的目的均是将个体分类。k-medoids聚类基于距离按空间位置进行分类,分类结果与所选距离算法有关;LCA相对客观,是注重于个体在类别显变量上的不同反应模式对个体进行分类、识别群体异质性的一种统计方法[16]。两种方法通过人群发病率得到共病组合。
各方法所得结果的差异性可以解释。例如关联规则所得的两病组合:高血压与关节炎或风湿病,观察发病率较高,但系统聚类、被访者k-medoids聚类、主成分分析中均未被分为一类。这是由于高血压与关节炎或风湿病在病因学关系上独立,仅是随机共存的概率较高。关联规则中以高血压为后项集得到的另外几个两病组合(血脂异常与高血压、心脏病与高血压、糖尿病或血糖升高与高血压),观察发病率与期望发病率的比值>1,病因学关系上并不独立,致病因素相关,在其他几种方法中也被分为一类。胃部疾病或消化系统疾病、关节炎或风湿病这一共病组合,观察发病率与期望发病率的比值>1,这一共病组合在其他方法中也出现。关联规则方法简单直接但单纯关注发病率会忽略一些关联紧密而发病率较低的共病模式。慢性肺部疾患如慢性支气管炎或肺气肿、肺心病与哮喘,由于哮喘的发病率较低,共病率在人群中不高,但是其他几种方法均能体现此组合。
本研究结论与国内同类研究有差异也有一致。刘贝贝等[8]研究选取了同样的数据及方法,但删除了数据缺失的被访者,年龄的选取范围为45岁以上,得到发病率明显较低。本研究保留缺失数据,得到结论更接近CHARLS被访者总体及国内60岁及以上人群特征。数据差异但结论一致,与高血压组合的疾病较多,血管循环系统两病组合提升度较高。黎艳娜等[17]的研究也采用了2018年的CHARLS数据(数据版本不同,导致数据量有轻微差别),通过共现网络图得到了两病及三病组合,本研究数据及结论与其一致。孙至佳等[7]的研究基于中国慢性病前瞻性研究(China Kadoorie Biobank,CKB)数据,以Yule's Q距离进行系统聚类,得到基线调查数据中,糖尿病、冠心病、中风及高血压聚为一类的结论,本研究结果与之一致。但是第2次重复调查中,结论有所区别,本研究恶性肿瘤与其他慢性病的关系也与其不同。
同类研究结果的不一致在于疾病有所不同,也由于调查人员与被访者的认知及对疾病的理解不同,访谈数据存在一定的误差。本研究中多个方法均显示恶性肿瘤与其他疾病并没有明显的共病特性,而孙至佳等[7]的研究中恶性肿瘤与其他疾病的关联更紧密,这个差异可能是由于恶性肿瘤的定义不同以及被访者人群不同。
本研究的独特之处在于数据总量在国内同类研究中相对较大,使用一系列方法进行多病分类,并尝试新算法。除了系统聚类采用谱系图与临床结合的方法判别分类个数,被访者k-medoids聚类采用了体现数据特性的方法进行个数判断,主成分分析采用碎石图确定个数,LCA采用遍指标法历法选择分类数,减少了主观判断。国内共病模式相关分析方法少,以慢性病距离算法为例,国外多采用Jaccard以及Yule's Q距离,国内较少采用。后两种算法更能体现01数据包含的信息。
本研究尝试通过对比结果来说明方法的适用性,得到的一致共病组合病因关联明显。主成分和系统聚类对慢性病分类,而k-medoids及LCA对人群分类,可以进一步关联患者特征深入分析。聚类分析依赖于距离的计算方法,而LCA用的潜变量来解释外显指标之间的关联,被潜变量解释后的外显指标间实现局部独立性,更加客观,保证了多病模式分类的稳定性。多病研究需要根据研究目的进行选择模式分析方法,或者使用多种方法得到具有一致性的稳定分类。
本研究的不足之处在于为了保证数据客观性及样本数量,通过众数填充多病缺失数据,会影响发病率的准确度,导致发病率低于总体。保留了缺失的被访者人口特征学数据并没有进行处理,虽然分类到被访者个人,但未结合人群的各种特征进一步研究,未分析危险因素及预后,内容不够贴近临床。
潘晔,刘志辉,胡倩倩,等.中国老年人慢性病多病共存模式的研究[J].中国全科医学,2023,26(29):3608-3615. DOI:10.12114/j.issn.1007-9572.2023.0186. [www.chinagp.net]
PAN Y,LIU Z H,HU Q Q,et al. Patterns of coexistence of multiple chronic conditions among Chinese elderly[J]. Chinese General Practice,2023,26(29):3608-3615.
本文无利益冲突。

±s,岁)
±s,种)
±s,种)
±s,种)



















