
骨质疏松症(osteoporosis, OP)已成为影响人类健康的常见慢性病,严重危害老年人群的生命健康。我国面临着骨质疏松症发病率高,筛查率、诊断率、治疗率"三低"的防治困境,其症结在于缺乏便捷、有效的骨质疏松症筛查方法。OP的诊断"金标准"DXA技术存在诸如设备昂贵、辐射、社区拥有率低等缺陷,故无法用于OP的广泛筛查。我国指南推荐的OP筛查工具包括国际骨质疏松基金会(International Osteoporosis Foundation, IOF)一分钟测试题、亚洲人骨质疏松自我筛查工具(osteoporosis self-assessment tool for Asians, OSTA)、骨折风险预测工具(fracture risk assessment tool, FRAX®)、骨定量超声技术(quantitative ultrasound, QUS)等。近年来,新型超声骨密度仪、数字X线成像(digital X-ray radiogrammetry, DXR)和机会性定量计算机断层摄像(opportunistic quantitative computed tomography, opportunistic QCT)技术在OP筛查领域展现出潜力。本文将对上述筛查工具的应用及研究进展作逐一综述,以期提升OP的筛查率,助力OP"广知晓、早诊断、早治疗"的三级防控机制。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
骨质疏松症(osteoporosis, OP)是一种以骨量下降和骨微结构破坏为特征的代谢性骨病,可导致骨脆性增加,最终导致骨质疏松性骨折(osteoporotic fracture, OF)的发生[1]。OP已成为影响人类健康的常见慢性病之一,严重危害老年人群的生命健康。2018年10月,我国卫健委发布的OP流行病学调查结果显示,我国骨量减少及骨质疏松症患者数量已达到3亿以上,65岁以上人群OP患病率达32.0%,其中女性为51.6%[2]。OP最严重的并发症是OF,其中髋部骨折又被称为"人生的最后一次骨折",患者骨折后1年内死亡率可达20%~30%,总体致残率可达50%[3,4]。
随着OP发病机制的日渐明确,其已成为"可防可治"的疾病,其中早期诊断是该疾病的防治关键。研究证实,早期进行OP筛查可使髋部骨折的发生率下降28%,并使脆性骨折相关医疗费用下降超过40%,具有较好的成本效益[5]。然而,我国依旧面临着OP筛查率、诊断率、治疗率"三低"的防治困境。在已发生OF的患者中,OP诊断率仅为57%,在这些患者中能接受规范抗骨质疏松药物治疗的不到25%,能长期坚持规范抗骨质疏松药物治疗的患者则更少[6]。调查显示,20岁以上人群OP相关知识知晓率仅为11.7%。40~49岁OP患者的患病知晓率为0.9%,50岁以上患者的患病知晓率为7.0%[2]。造成以上局面的一个关键原因是各基层和社区目前缺乏便捷、有效的OP筛查方法。
目前,诊断OP的"金标准"为骨密度T值≤-2.5,需使用双能X线吸收检测仪(dual energy X-ray absorptiometry, DXA)进行检查。然而,DXA存在一定的局限性。在原理上,DXA通过将骨骼的三维立体结构投影到二维平面,从而计算其面积骨密度(areal bone mineral density, aBMD),故无法评估骨质量和骨小梁微结构,且测量结果易受骨骼周围结构(如骨赘、钙化韧带、脂肪厚度等)的影响[7]。同时,根据国际骨质疏松基金会的亚洲审计机构统计,亚洲每百万人口中诊断性DXA骨密度仪的数量不到0.35台[8]。DXA骨密度仪成本高、体积大、涉及电离辐射、需要由专业技术人员进行操作,且大多分布在三甲医院,故其无法在社区或初级医院得到推广,无法用于OP的广泛筛查[9]。目前我国指南推荐的OP筛查手段包括国际骨质疏松基金会(International Osteoporosis Foundation, IOF)骨质疏松风险一分钟测试题、亚洲人骨质疏松自我筛查工具(osteoporosis self-assessment tool for Asians, OSTA)、骨折风险预测工具(fracture risk assessment tool, FRAX®)、骨定量超声技术(quantitative ultrasound, QUS)[10];近年来,数字X线成像(digital X-ray radiogrammetry, DXR)技术与机会性定量计算机断层摄像(quantitative computed tomography, QCT)技术[11]亦在OP的筛查中展现出潜力而备受关注。本文将对以上OP筛查工具的应用现状及新进展进行综述。
IOF骨质疏松风险一分钟测试题共包含19个问题,涵盖年龄、体重指数(BMI)、脆性骨折史、髋部骨折家族史等不可控因素,与吸烟史、饮酒史、每日运动量等生活方式。只要有1个问题回答为"是"即为阳性,提示受试者存在OP风险,需要定期进行骨密度检查或FRAX风险评估。我国人群的小样本研究显示[12,13],身高下降3 cm、脆性骨折史、髋部骨折家族史、腹泻史是测试题中较为可靠的OP风险预测因子。IOF骨质疏松风险一分钟测试题在基层社区中筛查OP有一定潜在应用前景,在我国目前的指南中,该测试题仅推荐用于初步筛查疾病风险而非OP的诊断[14]。
OSTA是用于评价亚洲绝经后妇女骨质疏松风险的工具,由1项纳入8个亚洲国家绝经后妇女的研究[15]中诊断效能最优的2项指标——年龄和体重计算得到,具体计算方法为:OSTA评分=[体重(kg)-年龄(岁)]×0.2。指南推荐OSTA评分≤-1即提示受试者为OP中高风险人群,需要定期进行DXA骨密度检查。部分学者发现OSTA评分结合其他工具联合评估时,效果更好。Zha等[16]的研究显示,OSTA评分联合QUS-T值在老年男性中筛查OP,其诊断特异度可高达92.9%,但敏感度较低。本课题组研究发现通过联用OSTA评分与QUS-T值筛查绝经后骨质疏松症,其诊断敏感度可高达89%(特异度为74%)[17]。综上,OSTA评分联合其他评估工具形成"多模式"筛查,综合评定的效果更好。
FRAX®工具是由世界卫生组织推荐的一款用于评估脆性骨折风险的算法[18]。该算法基于股骨颈部位的DXA骨密度,并结合了年龄、脆性骨折史、烟酒史、髋部骨折家族史、类风湿关节炎病史和糖皮质激素使用情况等脆性骨折临床危险因素(clinical risk factor, CRF),可用于预测未来10年髋部骨折(hip fracture, HF)及主要骨质疏松性骨折(major osteoporotic fracture, MOF)的风险,帮助临床医生制定评估和治疗OP的策略。2020年AACE指南将"骨量降低合并FRAX®高骨折风险"也纳入了绝经后骨质疏松症的诊断标准,强调了FRAX®工具在OP诊断筛查中的重要作用,表明该工具的临床应用已不再局限于脆性骨折风险评估。我国指南推荐具有1个或多个脆性骨折临床危险因素,既往未发生骨折,DXA骨密度提示低骨量且尚未接受有效抗骨质疏松治疗的人群,可运用FRAX®工具进行脆性骨折风险评估,治疗干预的阈值与美国国家骨质疏松基金会(National Osteoporosis Foundation, NOF)所设定的"固定阈值"相同,即"10年内发生MOF概率≥20%、发生HF≥3%"[14]。
然而,NOF阈值在中国人群中的适用性一直备受争议。众所周知,FRAX®工具的建立是基于来自欧洲、北美、亚洲、澳大利亚等多个大样本前瞻性研究和meta分析,故NOF阈值的预测效能并非放之四海而皆准。英国国家骨质疏松症指南组织(National Osteoporosis Guideline Group,NOGG)已根据实际国情研究设立FRAX®工具的"年龄依赖性阈值"[19]。美国、日本、瑞士等国家也均已推出本国人群适用的FRAX®干预阈值[20]。近年来,中国学者也在不断研究探索适用于中国人群的干预阈值,如1项来自中国台湾人群的大样本前瞻性研究建议将"MOF≥9.5%、HF≥4.0%"作为中国台湾人群的干预阈值[21]。在应用FRAX®工具时,除了考虑临床危险因素外,尽可能结合当地的骨质疏松流行病学情况校准FRAX®算法,才能让评估结果更可靠。
FRAX®工具还存在一定的局限性,如未纳入其他部位骨密度、骨转换生化指标、跌倒史等与脆性骨折密切相关的临床危险因素;没有明确既往脆性骨折的次数和部位对未来再发骨折的影响;没有明确糖皮质激素使用的种类与剂量对脆性骨折风险的影响;没有明确患有2型糖尿病对脆性骨折风险的影响。因此,建议临床医生在实际应用FRAX®工具时进行相应的调整[19],或者联合其他评估工具使用,以提升其临床应用价值。
QUS是通过测量超声波在不同密度、成分、结构的介质中的传播情况来对骨骼的健康状况进行评估,其常规测量的变量包括声速(speed of sound, SOS)和宽带超声衰减(broadband ultrasonic attenuation, BUA)以及由两者计算得到的刚度指数(stiffness index, SI)和定量超声指数(quantitative ultrasound index, QUI)。与DXA相比,QUS具有其独特的优势[22],包括较低的运营成本、仪器体积较小便于携带、不需要专业的技术人员或特定的检查房间、完全不涉及电离辐射等,更适合基层及社区医院进行OP广泛筛查。QUS有望在基层和社区填补DXA缺乏的现状,但是基于不同超声技术的测量原理、测量部位等不尽相同,故临床上无法对其结果进行直接比较,这也限制了QUS用于诊断OP的国际共识的制定[23]。
传统的QUS使用的是将超声原始信号(RF信号)经过简易转化处理得到的参数,如SOS、BUA、SI、QUI等,以及相应的T值,并参考超声骨密度数据库制定相应的诊断分类。传统QUS与"金标准"DXA相关性较差(r=0.22~0.30),对OP的诊断效能不尽如人意(敏感度67.2%、特异度64.9%)[24],但在预测脆性骨折风险方面颇具潜力。一项前瞻性研究的meta分析显示,QUS的4个常用变量(SOS、BUA、SI、QUI)均与各部位的脆性骨折风险相关,且在预测脆性骨折的能力无性别差异[25]。本课题组通过一项meta分析发现桡骨SOS值每下降1 SD,总体骨折和髋部骨折风险升高(OR=1.21、1.55),且在女性群体中,脆性骨折风险升高更为明显(OR=1.32、1.66)[8]。
为了提高QUS诊断效能,学者们不断进行探索、改进。多数学者从超声传输原理上进行改进,如骨皮质脉冲回声技术、射频回波多谱(REMS)技术,均取得较为满意的效果,一定程度上提高了QUS诊断OP的敏感度、特异度。一项大样本多中心研究发现,以髋部骨密度为标准,骨皮质脉冲回声技术对OP的敏感度为84.7%~93.7%,特异度为81.6%~82.0%,并可以使需要行DXA检查的患者减少到32%[26]。一项来自欧洲4个国家的大样本多中心研究显示,以腰椎和股骨颈的骨密度为标准,REMS诊断OP的敏感度、特异度分别高达90.4%~90.9%、95.1%~95.5%[27]。上述新技术均是有前景的OP筛查技术,未来仍需更多研究来对其在不同人群中的广泛适用性进行探讨。
目前市面上主流的超声骨密度仪多采用简化的"理想固体模型"进行骨密度评估,其忽视或丢失了大量的声场和组织相互作用的信息,因此仍存在一定的改进空间。超声射频(radio frequency)信号,是未经处理的原始数据的标准形式(在转换为B型超声图像前),其包含超声波与检测组织相互作用的全部信息。超声射频信号在其他疾病超声诊断中应用已有报道,如乳腺肿瘤、前列腺癌等疾病的诊断等,2019年有学者首次报道[28]了骨超声射频信号的研究,提示腰椎射频信号与腰椎及髋部骨密度相关性强(r=0.95~0.97)。然而,该研究使用传统的图像分析方法,只提取了腰椎或髋部的射频信号,而目前主流QUS均用于外周骨(桡骨或跟骨)。超声射频信号数据因其信号较杂,数据较多,数据特征不明显,一般数学模型较难分析。近5年来出现用人工智能方法分析超声射频信号的报道,人工智能方法对数据的潜在特征不需要先验知识,可识别数据间复杂的线性或非线性关系,可选的算法模型较多,是目前处理骨超声射频信号较为理想的方法。本课题组利用桡骨超声骨密度仪采集了274例非骨折、非优势侧桡骨远端1/3的射频信号,以DXA骨密度结果作为标签,充分利用人工智能算法,在国内外首次构建了基于桡骨超声射频信号的多通道卷曲神经网络(MCNN)骨质疏松症诊断方法,该方法可将传统超声骨密度仪的灵敏度和特异度分别提高至80.86%、84.23%[29]。在此基础上,本课题组还构建了脆性骨折风险预测方法,基于桡骨超声射频信号的多通道残差神经网络模型(MResNet)的鉴别脆性骨折风险能力与腰椎骨密度相仿,较传统SOS参数有显著提高。基于上述研究基础,本课题组研发了具有自主知识产权的新型便携式人工智能超声骨密度仪,该设备有望成为新一代OP筛查的工具。
X线检查与"金标准"DXA技术在原理上具有一定的相似之处,即都是利用X线穿过不同密度与厚度的组织后的衰减情况对被测组织的密度进行估计、成像。目前DXR为主流X线检查技术,部分学者开始探索X线检查在OP筛查中的作用。
该技术研究重点放在了骨关节X线片中的骨皮质厚度[11]。一项来自美国人群的大样本前瞻性研究通过测量第2至第4掌骨中段的骨皮质厚度、骨干宽度等指标估算掌骨的骨密度值(DXR-BMD),并对5 278名绝经后女性进行长达10年的随访,证实DXR-BMD识别脆性骨折的能力与FRAX®工具及股骨颈骨密度相似,且以股骨颈骨密度为标准,DXR-BMD对骨质疏松症的诊断效能AUC为0.76[30]。除了掌骨外,部分学者还探讨了其他部位的骨皮质厚度与骨质疏松症之间的关系。一项来自我国的小样本研究显示,桡骨远端皮质厚度(distal radius cortical thickness, DRCT)诊断OP的敏感度为83.3%,特异度72.7%[31]。另一项我国人群小样本研究发现,股骨近端小转子下方10 cm处的髓腔骨质比值(canal bone ratio,CBR)对股骨近端低骨量人群有较好的诊断价值(AUC=0.821)[32]。
近年来,人工智能(artificial intelligence,AI)领域高速发展,以深度学习(deep learning,DL)为代表的AI技术开始广泛应用于医学影像的分析与诊断。一项来自我国台湾地区人群的大样本研究证实,结合DL的髋部/脊柱X线片对骨质疏松症的诊断效能优异(AUC=0.92~0.97);且以FRAX®工具的NOF阈值为标准,其对脆性骨折亦有极好的预测作用(AUC=0.97)[33]。值得一提的是,Jang等[34]通过对13 026张胸片进行DL算法及Grad-CAM热力图分析,证实了胸片中的骨质信息可很好地应用于OP的诊断(AUC=0.88~0.91)。无独有偶,Wang等[35]亦通过对13 719张胸片进行DL算法分析,开发了一款可在胸片上自动选择DOI的人工智能OP诊断模型,其与腰椎骨密度具有极强的相关性(r=0.894),对OP的诊断效能亦优异(AUC=0.968)。以上研究初步揭示了胸片在OP机会性筛查中的应用潜力,尤其是考虑到胸片极为广泛的临床适用范围。未来仍需更多前瞻性多中心研究对结合DL的胸部X线检查在OP诊断及脆性骨折风险评估中的应用价值进行验证。
CT检查不仅能从图像上以不同的灰度来显示组织器官的密度高低,还可以对这种密度差异进行量化评估(即CT值,单位为亨氏单位)。QCT是在常规CT的基础上,通过特定的软件和已知密度的校准体模(一般是由羟基磷灰石制成的固体模型),将腰椎或髋部的CT值转化为体积骨密度(volumetric bone mineral density, vBMD),从而精确测量骨密度并对OP进行诊断[36]。然而,临床上常规CT检查往往无需将校准体模与受检者进行同步扫描,故传统的专用QCT诊断技术无法广泛应用于OP的机会性筛查。近年来,部分学者研究开发了无需同步扫描体模的机会性QCT,有效地解决了上述难题。由于QCT软件可以与常规CT的操作系统相互兼容,故对于配置有CT设备的社区基层医院而言,机会性QCT的广泛应用可以在基层和社区较好地填补DXA缺乏的现状。
临床上常规CT检查不需要将校准体模与受检者进行同步扫描,故传统QCT技术无法广泛应用于OP筛查。而AC-QCT是通过对校准体模进行单独的质量控制扫描并推导出校准算法,从而对未进行体模同步扫描的常规CT结果进行校准,计算出vBMD。由于受检者进行检查与体模质控扫描可能并非在同一时空进行,故恒定校准对CT设备稳定扫描要求较高[37]。Brown等[38]的研究证实,AC-QCT对髋部及脊柱的骨密度测量值与传统QCT相当。Wang等[39]的研究同样肯定了AC-QCT在测量脊柱骨密度方面的良好表现。
近年来,有学者研发了无体模校准QCT。PL-QCT是通过将受检者体内的组织(如肌肉、脂肪等)、水、空气的CT值作为校准的参照指标来进行vBMD的计算。PL-QCT使得扫描与校准可以同时进行,有效规避了AC-QCT对设备扫描稳定性的严格要求。然而,该技术同样存在一些局限性。首先,PL-QCT需要手动选择自身参照组织的感兴趣区域(ROI),该过程将不可避免地引入人为误差;其次,PL-QCT对同一被测骨的vBMD测量结果,还会因选择不同受检者的组织或同一受检者的不同类型组织为校准参照指标而出现差异。为了克服以上技术短板,本课题组采用自动选择ROI的PL-QCT新系统,其与腰椎骨密度具有极强的相关性(r=0.99),对OP的诊断效能与传统AC-QCT相当[40]。
我国OP的筛查防治工作仍非常艰巨。OSTA评分、FRAX®工具等问卷式筛查方法操作相对简单,无需操作特殊的检查仪器,适合初步筛查或联合其他评估工具形成"多模式"筛查OP风险。传统定量超声技术的诊断效能仍较低,利用人工智能分析超声原始射频信号的新型超声骨密度设备为QUS在OP筛查中的应用提供了新的选择。基于X线成像技术和高精度自动化的PL-QCT技术的OP筛查也有望成为具有较好临床应用前景的新兴技术。
所有作者均声明不存在利益冲突





















