
探讨网络自动骨龄评估软件BoneXpert对中国(上海)儿童及青少年的适用性。
回顾性收集2010年1月至2013年12月因左手外伤在上海市儿童医院拍摄左手腕部X线片患儿的影像学资料。选择其中可用于人工骨龄评估的434张X线片,男童264张,女童170张。由自动骨龄评估软件BoneXpert评估骨龄。1周后简单随机法随机抽取40张X线片重新评估。
在434张X线片中,共有7张被BoneXpert评估软件拒绝,接受率为98.4%。每张评估时间约为14.5 s。2次抽样评估结果完全一致。在男女共26组中有8组(32%)骨龄评估结果与实际年龄间差异有统计学意义(P<0.05),分别为男童7、8、9、11岁组及女童2、3、9、11岁组,但差异均值均在1 s左右。若按各年龄组骨龄评估结果与实际年龄间差异的均值进行相应调整,可将上述各组骨龄评估值分别上调0.57、0.79、0.93、-0.38岁及-0.22、0.30、0.37、0.59岁。
BoneXpert软件对左手腕X线片接受度高,诊断迅捷,评估过程100%自动化,完全消除了人工评估过程中的主观差异性。在大部分年龄段均适用于我国儿童,对少部分年龄段评估结果进行微调后可广泛应用于临床。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
骨龄测定对于判断儿童生长发育及疾病的诊治有至关重要的作用[1,2,3],目前常用的有2种方法,一是图谱法,如国际著名的Greulich-Pyle(GP)图谱和国内的中国人手腕骨发育标准(CHN)图谱法[4,5,6,7];二是Tanner Whitehouse(TW)计分法[8]。图谱法直观简洁,但是人为误差大。而TW计分法相对准确,但繁杂费时,不适合门诊量较大的我国儿童医院。因为以上方法均存在着无法避免的人为读片的主观误差,所以临床迫切需要可靠、客观的骨龄测定。随着计算机图像识别技术的发展,骨龄的自动评估逐渐成为可能。BoneXpert为丹麦开发的一款自动骨龄评估软件,已在多个国家使用并得到验证[9,10,11,12,13,14],而我国尚无类似成熟产品。本研究目的为验证这种完全自动化且客观的骨龄评估软件对中国健康儿童骨龄评估的可靠性,及在影像归档及通信系统(PACS)环境中运行的便捷性。
本研究样本选自2010年1月至2013年12月因左手外伤在上海市儿童医院影像科拍摄左手腕部X线片的患儿。左手腕正位片均采用Philips数字X光机拍摄,摄片时除包括左手诸骨外,还包括尺桡骨远端3~4 cm。由于BoneXpert骨龄评估软件最适用范围为2.5~17.0岁的男童及2.0~15.0岁的女童,因此本研究选择介于这一年龄段的儿童。通过查询就医记录及打电话询问儿童健康状况,排除各种脏器疾病、身体发育异常者、服用过影响骨骼发育药物者及体校的儿童。另外,排除质量较差的X线片,保留骨折或软组织肿胀但手腕部诸骨显示较清晰、不影响骨龄测评的X线片。最终入选434例样本。其中男童264例,女童170例。本研究征得患儿及家属知情同意,并签署知情同意书;且获医院伦理委员会批准同意。
本研究采用的是自动骨龄评估软件BoneXpert 2.0版(Vi-siana,Denmark,http://www.BoneXpert.com)。在取得BoneXpert软件所有者Thodberg教授授权后,在科室PACS系统中安装了该软件。使用时只需将待评估的X线片(DICOM格式)传入该软件,其可自动获取PACS中待评估对象的性别、年龄、出生日期、摄片日期等信息,10~20 s便可在同一界面中给出另一张有骨龄评估结果的X线片,右上角显示了最终骨龄评估结果,见图1。


BoneXpert软件评估骨龄过程共分3步:第1步,以始于1998年的一种有效的图像处理技术即主动外观模型(AAM)为基础,选取1、3、5指骨,1~5掌骨及尺桡骨共15块骨头,通过识别每块骨头的形状、密度及主要成分的质地重建骨头的边缘。在这过程中可以同时评判骨头形态是否正常,不正常的骨头及摆放位置不正的图片将被自动拒绝;第2步,分别评估除2、4掌骨外其余13块骨头的成熟程度,即固有骨龄(2、4掌骨仅用于评估骨骼健康指数,即BHI),若评估结果与所有骨头平均值相差大于2.4岁,该骨头将不被接受,且最终接受骨头少于8块,那么将无法评估出该样本骨龄;第3步,将固有骨龄转化为GP骨龄及TW3骨龄,GP骨龄即为所有骨头骨龄的平均值,而TW3骨龄则是尺桡骨分别占20%比例,其余各骨平分剩余百分比。由于在日常工作中并未使用TW3骨龄评分法,因此在本研究暂时没有涉及TW3骨龄这一内容。此外,在初次评估后1周,简单随机法随机抽取40张X线片,重新用BoneXpert软件进行评估,并用秒表同时记录评估过程单位耗时。
采用SPSS 17.0软件进行分析。对BoneXpert软件评估结果分年龄段进行描述性分析,结果用
±s表示,并与实际年龄之间进行配对t检验,对部分不满足配对t检验要求的年龄段采取秩和检验,P<0.05为差异有统计学意义。BoneXpert评估结果与实际年龄之间的差异用均值的曲线图反映。
本研究中共用BoneXpert软件评估434张X线片,其中有7张被拒绝,重新调阅图片后发现这是由于选用的均为左手外伤儿童的图片,这7张图片手腕部摆放位置偏斜较大造成的。但是在这种情况下,BoneXpert的识别率仍然有98.4%。
简单随机法随机抽取40张X线片再次进行评估,结果与初次评估结果完全相同,即BoneXpert软件精确度为100%。评估过程平均单位耗时为14.5 s。
以每个年龄为一组进行配对t检验,结果见表1。可见在男女共26组中8组(32%)骨龄评估结果与实际年龄间差异有统计学意义(P<0.05),分别为男童7、8、9、11岁组及女童2、3、9、11岁组,但差异均值都在1s左右,评估结果与实际年龄之间的差异见图2。

BoneXpert骨龄评估结果与日历年龄比较结果(
±s)
Comparison of BoneXpert bone age and calender age(
±s)
BoneXpert骨龄评估结果与日历年龄比较结果(
±s)
Comparison of BoneXpert bone age and calender age(
±s)
| 年龄(岁) | 例数 | 实际年龄(岁) | BoneXpert骨龄(岁) | t/Z值 | ||||
|---|---|---|---|---|---|---|---|---|
| 男 | 女 | 男 | 女 | 男 | 女 | 男 | 女 | |
| 2.50~2.99 | 10 | 19 | 2.77±0.12 | 2.56±0.29 | 2.85±0.48 | 2.77±0.33 | 0.55 | 3.26a |
| 3.00~3.99 | 18 | 17 | 3.48±0.30 | 3.53±0.31 | 3.68±0.68 | 3.23±0.47 | 1.24 | -3.84a |
| 4.00~4.99 | 28 | 24 | 4.53±0.29 | 4.40±0.29 | 4.70±0.58 | 4.22±0.79 | 1.51 | -1.25 |
| 5.00~5.99 | 28 | 24 | 5.43±0.26 | 5.42±0.33 | 5.35±0.76 | 5.53±0.74 | -0.66 | 1.00 |
| 6.00~6.99 | 18 | 19 | 6.43±0.27 | 6.51±0.33 | 6.25±0.68 | 6.67±0.68 | -1.63 | 1.47 |
| 7.00~7.99 | 16 | 6 | 7.38±0.24 | 7.38±0.35 | 6.81±0.60 | 7.39±0.51 | -3.89a | 0.02 |
| 8.00~8.99 | 21 | 11 | 8.42±0.26 | 8.43±0.32 | 7.63±0.85 | 8.63±0.98 | -5.04a | 0.78 |
| 9.00~9.99 | 15 | 10 | 9.51±0.32 | 9.34±0.28 | 8.58±0.89 | 8.97±0.59 | -4.13a | -2.58a |
| 10.00~10.99 | 14 | 11 | 10.54±0.30 | 10.63±0.29 | 10.22±1.48 | 10.25±0.97 | -0.91 | -1.36 |
| 11.00~11.99 | 35 | 18 | 11.53±0.28 | 11.54±0.34 | 11.91±1.06 | 10.95±0.51 | 2.30a | -3.12a |
| 12.00~12.99 | 28 | 8 | 12.40±0.27 | 12.61±0.30 | 12.74±0.87 | 11.75±1.55 | 1.99 | -1.54 |
| 13.00~13.99 | 24 | 13.48±0.32 | 13.31±1.15 | -0.17 | ||||
| 14.00~14.99 | 5 | 14.50±0.34 | 14.47±0.95 | -0.08 | ||||
注:aP<0.05;其中男童13.00~13.99岁组、女童11.00~11.99组及12.00~12.99组采用秩和检验,其余组均使用配对t检验 aP<0.05;except boys aged 13.00-13.99 years and girls aged 11.00-11.99 years and 12.00-12.99 years usedWilcoxon signed rank test,the others all used paired t test


本研究根据骨龄评估结果与实际年龄差异的平均值进行调整。如BoneXpert软件对于男童7岁组评估结果与实际年龄差异的平均值为-0.57岁,那么在实际临床工作中可将7岁组BoneXpert评估结果相应上调0.57岁。表2即为BoneXpert软件骨龄评估结果调整方案。

BoneXpert软件评估结果调整方法(岁)
Modifications of BoneXpert bone age(year)
BoneXpert软件评估结果调整方法(岁)
Modifications of BoneXpert bone age(year)
| 年龄 | 7.00~7.99(男) | 8.00~8.99(男) | 9.00~9.99(男) | 11.00~11.99(男) | 2.00~2.99(女) | 3.00~3.99(女) | 9.00~9.99(女) | 11.00~11.99(女) |
|---|---|---|---|---|---|---|---|---|
| 调整 | 0.57 | 0.79 | 0.93 | -0.38 | -0.22 | 0.30 | 0.37 | 0.59 |
骨龄的准确评估对于诊断性早熟、发育迟缓等内分泌疾病有很高的临床价值。目前在世界范围内常用的图谱法和TW计分法均是人为的主观评判方法,存在着不可避免的人为读片误差。不同的工作经验及对骨龄图谱的不同认识可使骨龄评估结果变的不一致。目前随着门诊量的不断增加,临床工作中花费在骨龄评估中的单位时间越来越少,且多次评估往往由不同的医师进行,这限制了骨龄诊断的准确性。同样一张左手腕部X线片,不同医院的放射科医师往往因为评判依据的不同而给出不同的结果。同一家医院放射科内部及同一个放射科医师在不同时间评估结果也经常不统一。另外,放射科医师与内分泌科医师之间也会有分歧[15]。而且由于主观误差的存在,即使评估结果一致也不一定是准确的。
Tanner教授在骨龄经典论著TW3法[8]中就曾提出计算机骨龄评估将比人工骨龄评估更准确的观点,并且在1992年创建了计算机骨龄评估系统,以后也有学者相继提出不同的计算机骨龄评估系统,但均未在临床中得到广泛应用。这些方法均局限于自动化重建骨骼边缘的能力不足,只能使骨龄评估过程部分自动化。而BoneXpert软件克服了以上问题,可以完全自动化的评估骨龄[9]。该软件已经在欧洲多个国家及日本得到了广泛验证并开始应用于临床中[10,11,12,13,14],然而,在国内尚没有放射科医师对此进行研究。
BoneXpert骨龄评估软件是由丹麦学者以高加索儿童为样本研制的自动骨龄评估软件,彻底解决了主观误差这一问题,同一张片子在任何时候反复测量只会得出同一个骨龄,即其精确度为100%,同一个儿童当日重新摄片,其差异也只有0.18岁或更小(投照角度和手的摆放位置不同)[9]。因此这种计算机骨龄自动评估软件可以认为是客观的测评。既然这种自动测评系统消除了人为的误差,那么其应用于中国儿童的准确性就取决于系统本身即其数据库与中国儿童手腕骨骼发育的一致性程度。
本研究结果显示其对7、8、9岁组男童及3、9、11岁组女童的骨龄评估结果较实际年龄略延迟,对11岁组男童及2岁组女童评估结果略提前,这种差异的存在应该是由于BoneXpert采用样本均为高加索儿童,其生长发育规律与我国儿童存在一定差异导致的。因为上述差异均在1 s左右,所以并不影响临床的运用。但为了使骨龄评估结果更加准确,本研究建议在临床使用过程中进行一定的微调。这与先前我国体育工作者对该软件的研究结果是相似的[16]。但其采用20世纪90年代初期样本,距今已过去20年,期间我国社会心理及儿童营养水准已经发生了很大的变化。因此本研究基于近4年的数据对BoneXpert软件骨龄评估结果进行相应调整,以更适用于当前的临床工作。
除了消除主观误差之外,与国际上最著名,也是我国广泛使用的GP骨龄图谱相比,BoneXpert软件的结果还有3个优势:(1)BoneXpert可直接给出7.58岁(7岁7个月)或8.33岁(8岁4个月)这样渐进式的骨龄值,而GP图谱标准片的间隔较大且不恒定(3~14个月)。无疑BoneXpert要比人工按照标准片评估更精确,其评估结果连续且可精确到小数点后2位,这样大大方便了短期(如3个月等)随访患者前后骨龄变化的比较。(2)虽然GP图谱也罗列了每块骨头的骨龄值,但实际临床应用中,几乎不可能花费大量的时间评估每一块骨的骨龄,只是通过大体观察标准片,给出一个粗略的整体骨龄值。而BoneXpert除了给出一个整体骨龄值,同时还罗列了每一块骨的骨龄值。这非常有利于影像科和内分泌科医师对骨龄进行更为细致的观察,并据此早期发现骨骼发育的异常。(3)BoneXpert软件评估骨龄过程完全自动化。只需点一下按钮,将X线片传入软件中,大约15 s后即可得到评估结果,这与人工图谱法及TW法相比,工作效率是一个质的飞跃,因此非常适用于有着较大门诊量的我国各地的儿童医院。
当然,本研究尚有以下局限性,首先本研究采用样本均为生活在上海的儿童,期望以后可在全国范围内开展多中心BoneXpert软件适用性研究。另外,本骨龄软件未将腕骨计算在内。其基于TW计分法中的RUS(radius,ulna and short finger bones)系列只选择分析了13块骨头,这是因为RUS系列本身有着较高的可行度,在2001年出版的TW3中[8],作者就建议仅仅使用RUS骨龄便可。其次,腕骨发育差异较大,难以连贯的评估,对骨龄的准确评估参考价值很小。此外,腕骨的计算机识别仍然较为困难,关于这一点也有学者正在努力解决[17]。
BoneXpert骨龄评估软件是计算机技术不断发展的产物,其完全消除了主观因素的影响,可以给出客观的骨龄评估结果,使得不同地区的医院可以使用同一个评判标准评估骨龄。对我国儿童手腕部X线片,BoneXpert软件接受度高,诊断迅捷,评估过程完全自动化,在大部分年龄段均适用于我国儿童,对少部分年龄段评估结果进行微调后可广泛应用于临床中。随着国内计算机技术的进步,期望建立我国自己的自动骨龄评估软件,这样可以使全国范围内有统一的骨龄评测标准,对正确评估儿童生长发育状况具有重要意义;同时,也可使临床工作更加高效、便捷,其前景值得期待。





















