
利用临床"大数据",探讨甲状腺激素水平的影响因素,并探讨适合的参考区间数据分组方案。分析不同分组下激素水平的人群分布特征。
回顾性研究。调取2013年9月1日至2016年8月31日北京协和医院共107 107例含甲状腺功能检测数据的健康体检者信息。探讨不同性别、年龄组促甲状腺素(TSH)、游离甲状腺素(FT4)、游离三碘甲状腺原氨酸(FT3)的数据分布及差异的显著性;按照国家气象局季节划分标准,将研究期划分为四季,分析TSH随季节变化的趋势。根据差异显著性进行性别、年龄及季节分组,研究数据分布与制造商推荐参考区间的关系。
男性、女性TSH水平分别为1.779(0.578~4.758)、2.023(0.420~5.343)mU/L,女性TSH水平高于男性(Z=-37.600,P<0.001)。男性、女性FT4水平分别为0.127(0.098~0.162)、0.117(0.091~0.151)μg/L,FT3水平分别为3.33(2.47~3.74)、3.01(2.35~3.57)ng/L,女性FT4、FT3水平低于男性(Z=-94.000、-154.600,均P<0.001)。进一步按照年龄分组,男性以≥65岁为高龄组,女性以≥50岁为高龄组,男性、女性高龄组TSH分别为1.818(0.528~5.240)、2.111(0.348~5.735)mU/L,低龄组分别为1.778( 0.582~4.696)、1.991( 0.427~5.316)mU/L,高龄组TSH水平均较低龄组高(Z=-2.269、-10.400,均P<0.05),数据分布较低龄组宽。春、夏、秋3个季节TSH整体分布为1.869( 0.510~5.042)mU/L,冬季为1.978( 0.527~5.250 )mU/L,差异有统计学意义(Z=-15.000,P<0.001)。
性别、年龄明显影响TSH、FT4、FT3水平;女性、高龄人群的TSH数据分布更宽,而FT4、FT3数据分布整体较低;季节明显影响TSH水平,冬季出现峰值。初步评估的P2.5~P97.5数据分布与制造商推荐的参考区间差异较大。各实验室应在适宜分组的前提下建立甲状腺激素的参考区间。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
促甲状腺素(TSH)、游离甲状腺素(FT4)是公认的评估甲状腺功能的关键指标[1],其参考区间的设定对于诊断甲状腺功能异常,尤其是亚临床甲状腺功能异常至关重要[2]。大量研究表明[3,4,5,6],性别、年龄、季节等因素可能影响TSH水平,宜建立适于不同地区、不同性别、不同年龄的人群参考区间。目前,国内临床实验室使用的甲状腺功能参考区间多直接引自进口试剂说明书,虽有研究建议分性别建立参考区间[6],但未在临床实验室中使用,也未进入相关行业指南。本研究拟尝试利用北京协和医院体检人群数据库中长达3年超过10万个受试者的30余万个数据探讨甲状腺功能相关指标的可能影响因素及程度,并尝试在较严格的统计学处理的前提下,初步建立适宜的人群分组;并将不同分组的数据分布与制造商提供的参考区间进行比较,为进一步完善甲状腺激素参考区间的建立提供一定的数据支持。研究也尝试性分析美国临床及实验室标准化委员会(CLSI)C28-A3方案[7]中提及的间接抽样技术在利用临床大数据建立参考区间中的可行性。
通过实验室信息系统(LIS)调取2013年9月1日至2016年8月31日北京协和医院健康体检人群(≥18岁)中检测甲状腺功能的受试者共107 107例,采集受试者基本信息(ID号、姓名、年龄、性别、既往史),样本采集时间及甲状腺功能三项检测结果,去隐私化处理后,进行相关数据分析。本研究经中国医学科学院北京协和医院伦理委员会批准(批准文号:S-K441)。循环剔除±4s以外数据,直至所有数据均落在±4s以内,TSH、FT4、游离三碘甲状腺原氨酸(FT3)3个项目的循环剔除次数分别为7、6、5次;最终TSH入组数据为104 895例(男51 044例、女53 851例),FT4入组数据为106 336例(男51 458例、女54 878例),FT3入组数据为106 335例(男51 438例、女54 897例)。
TSH、FT4、FT3的检测均采用西门子ADVIA Centaur XP全自动化学发光免疫分析仪及配套的TSH试剂及校准品(共计12个批次),FT4 、FT3试剂(共计18个批次)及校准品(6个批次)均在有效期内使用,且使用期内,未接到制造商的任何产品变更告知。采用伯乐公司Lyphochek® Immunoassay Plus Control三水平质控品,共计4个批次,均在有效期内使用。
所有样本采集、运输及处理均按照北京协和医院检验科《检验样本采集和运输指南(医护版)》(PUMCHL-L-2-Q25b-04)相关程序执行,样本采样时间在上午7∶30~10∶30之间,采样后1 h内完成离心,溶血、脂血均按照不合格样本处理。
仪器每年按计划定期校准及预防性维护,并完成日常维护保养,所有可能影响检验结果的故障修复后,均经过验证;按实验室标准操作规程(SOP)进行项目校准及试剂批号更换后验证,合格后方可使用,从而保证结果的长期稳定性。每批次(<24 h)样本检测三水平(高、中、低)质控品,质控合格后方可开展临床样本检测,如遇失控,处理合格后方开始临床检测;每月分析质控图,保证质控结果稳定。3年间参加卫生部临检中心及美国病理家协会(CAP)室间质评,结果均合格,保证结果准确可信。
研究中季节划分依据国家气象局标准,即连续5 d平均温度高于22 ℃,进入夏季;连续5 d平均温度低于10 ℃,进入冬季;温度介于10~22 ℃之间为春、秋两季。所有研究数据按照上述标准划分为4个季节。
采用Excel 2010、SPSS 20.0、Medcalc 15.0、Graphpad Prism 5进行统计学分析及制图。采用Kolmogorov-Smirnov(K-S)检验数据正态性,由于参考区间多定义为数据分布的第2.5百分位数(P2.5)和第97.5百分位数(P97.5),故非正态分布数据用M(P2.5~P97.5)表示。按照性别、年龄、季节进行数据分组,采用秩和检验进行多组间比较,若有差异,用Bonferroni检验进行两两比较,无差异的邻近组进行合并后进一步分析。将P2.5和P97.5分别作为参考区间上、下限。计算所有入组数据的每日移动中位数(moving median)(以8 d为单位)[5],并绘制TSH随季节变化的趋势图。P<0.05为差异有统计学意义。
K-S正态性检验显示,TSH、FT4、FT3数据均呈非正态分布。女性TSH水平显著高于男性,且数据分布较男性宽[2.023(0.420~5.343)比1.779(0.578~4.758)mU/L,P<0.001]。女性FT4、FT3水平显著低于男性[0.117(0.091~0.151)比0.127(0.098~0.162)μg/L;3.01(2.35~3.57)比3.33(2.47~3.74)ng/L,均P<0.001](图1)。


注:A图:促甲状腺素(TSH)分布情况;B图:游离甲状腺素(FT4)分布情况;C图:游离三碘甲状腺原氨酸(FT3)分布情况。3条线由下到上分别代表P2.5、M及P97.5,不同性别组间比较,aP<0.001
按照年龄分组、采用Bonferroni方法进行两两比较,结果显示18~29岁、30~39岁及40~49岁3组间TSH水平差异无统计学意义(P>0.05),但与50~64岁、≥65岁组间差异均有统计学意义(均P<0.05),将无差异邻近组进行合并,结果显示随着年龄增加,TSH水平增加。将不同性别受试者按照年龄进一步分组统计显示,男性65岁前各年龄组TSH水平差异均无统计学意义,女性50岁之前3个年龄组和50岁之后2个年龄组TSH水平差异均无统计学意义(均P>0.05),并组后结果显示,无论男性还是女性,高龄组TSH水平较低龄组高(均P<0.05),且P2.5~P97.5数据分布较低龄组宽。随着年龄的增加,FT4、FT3总体水平均呈现降低趋势,但女性50~64岁组的FT4、FT3水平均出现微小反弹,65岁以后维持在相对稳定水平。采用两两比较分析,FT4、FT3各年龄组间虽然差异均有统计学意义(均P< 0.001),但邻近组P2.5~P97.5的差异非常小,不影响临床判定,故年龄不宜作为FT4、FT3参考区间分组依据(表1,表2,表3)。

不同性别及不同年龄人群的促甲状腺素水平分布(mU/L)
不同性别及不同年龄人群的促甲状腺素水平分布(mU/L)
| 年龄组(岁) | 男 | 女 | 总体 | |||
|---|---|---|---|---|---|---|
| 例数 | M(P2.5~P97.5) | 例数 | M(P2.5~P97.5) | 例数 | M(P2.5~P97.5) | |
| 18~29 | 4 282 | 1.855(0.669~4.645) | 7 048 | 1.989(0.580~5.183)a | 11 330 | 1.933(0.620~5.010) |
| 30~39 | 12 581 | 1.798(0.636~4.494) | 15 092 | 1.928(0.414~4.974)a | 27 673 | 1.867(0.542~4.786) |
| 40~49 | 16 168 | 1.760(0.552~4.643) | 14 653 | 2.062(0.410~5.343)a | 30 821 | 1.895(0.502~5.029) |
| 50~64 | 14 765 | 1.752(0.548~4.905) | 13 782 | 2.114(0.372~5.618)a | 28 547 | 1.910(0.479~5.352) |
| ≥65 | 3 248 | 1.818(0.528~5.240) | 3 276 | 2.098(0.348~5.735)a | 6 524 | 1.937(0.433~5.446) |
| 总体 | 51 044 | 1.779(0.578~4.758) | 53 851 | 2.023(0.420~5.343)a | 104 895 | 1.897(0.513~5.112) |
注:与同一年龄组男性促甲状腺素水平比较,aP<0.001

不同性别及不同年龄人群的游离甲状腺素水平分布(μg/L)
不同性别及不同年龄人群的游离甲状腺素水平分布(μg/L)
| 年龄组(岁) | 男 | 女 | 总体 | |||
|---|---|---|---|---|---|---|
| 例数 | M(P2.5~P97.5) | 例数 | M(P2.5~P97.5) | 例数 | M(P2.5~P97.5) | |
| 18~29 | 4 203 | 0.131(0.103~0.165) | 7 009 | 0.119(0.094~0.150)a | 11 212 | 0.123(0.096~0.159) |
| 30~39 | 12 653 | 0.129(0.102~0.163) | 15 250 | 0.118(0.091~0.151)a | 27 903 | 0.123(0.094~0.158) |
| 40~49 | 16 310 | 0.127(0.099~0.163) | 14 949 | 0.116(0.090~0.150)a | 31 259 | 0.122(0.093~0.159) |
| 50~64 | 14 953 | 0.124(0.096~0.159) | 14 237 | 0.117(0.090~0.152)a | 29 190 | 0.123(0.097~0.157) |
| ≥65 | 3 339 | 0.120(0.092~0.156) | 3 433 | 0.117(0.089~0.155)a | 6 772 | 0.119(0.090~0.155) |
| 总体 | 51 458 | 0.127(0.098~0.162) | 54 878 | 0.117(0.091~0.151)a | 106 336 | 0.122(0.093~0.158) |
注:与同一年龄组男性游离甲状腺素水平比较,aP<0.001

不同性别及不同年龄人群的游离三碘甲状腺原氨酸水平分布(ng/L)
不同性别及不同年龄人群的游离三碘甲状腺原氨酸水平分布(ng/L)
| 年龄组(岁) | 男 | 女 | 总体 | |||
|---|---|---|---|---|---|---|
| 例数 | M(P2.5~P97.5) | 例数 | M(P2.5~P97.5) | 例数 | M(P2.5~P97.5) | |
| 18~29 | 4 206 | 3.45(2.86~4.16) | 7 013 | 3.06(2.44~3.73)a | 11 220 | 3.20(2.52~4.00) |
| 30~39 | 12 639 | 3.41(2.85~4.08) | 15 250 | 3.03(2.49~3.67)a | 27 890 | 3.19(2.52~3.96) |
| 40~49 | 16 229 | 3.35(2.79~4.01) | 14 946 | 2.98(2.45~3.60)a | 31 246 | 3.17(2.52~3.91) |
| 50~64 | 12 149 | 3.27(2.69~3.90) | 11 108 | 3.02(2.47~3.64)a | 23 258 | 3.15(2.55~3.82) |
| ≥65 | 6 145 | 3.09(2.47~3.74) | 6 580 | 2.94(2.35~3.57)a | 12 725 | 3.06(2.44~3.71) |
| 总体 | 51 438 | 3.33(2.72~4.01) | 54 897 | 3.01(2.46~3.65)a | 106 336 | 3.16(2.53~3.77) |
注:与同一年龄组男性游离三碘甲状腺原氨酸水平比较,aP<0.001
TSH随季节变化趋势见图2及图3,TSH在冬季出现峰值,且冬季数据离散程度[以四分位数间距(IQR)表示]大于夏季。按照季节分类,春、夏、秋3个季节的TSH水平差异均无统计学意义(均P>0.05),而3个季节与冬季比较差异均有统计学意义(均P<0.001),因此将TSH按照是否进入冬季分类,未进入冬季的人群TSH水平分布为1.869(0.510~5.042)mU/L(n=77 296),进入冬季的人群TSH水平分布为1.978(0.527~5.250 )mU/L(n=27 599)。




注:与春季、夏季、秋季比较,aP<0.001
根据上述分组数据结果的差异分析,并结合临床应用中的意义,分析基于"大数据"的TSH、FT4、FT3不同分组人群分布,此分布是基于CLSI(C28-A3)间接抽样法获得的相对健康人群获得,作为粗略估计的参考区间与制造商参考区间比较(表4)。男性以64岁,女性以50岁划分,建立性别、年龄个性化的TSH"粗略"参考区间;按照是否进入冬季,建立TSH季节特异性参考区间;FT4、FT3建立不同性别粗略参考区间。制造商基于表观健康成人人群(TSH:229例,FT4:388例,FT3:594例)建立3个项目参考区间,未区别性别、年龄、季节等,本研究初步建立的粗略参考区间与之存在较大差异。

TSH、FT4、FT3分组人群分布及制造商推荐参考区间比较
TSH、FT4、FT3分组人群分布及制造商推荐参考区间比较
| 组别 | TSH(mU/L) | FT4(μg/L) | FT3(ng/L) | ||
|---|---|---|---|---|---|
| 按性别&年龄分组 | |||||
| 男: | 18~64岁 | 0.583~4.696 | 0.098~0.162 | 2.72~4.01 | |
| ≥65岁 | 0.528~5.240 | -a | -a | ||
| 女: | 18~49岁 | 0.456~5.157 | 0.091~0.151 | 2.46~3.65 | |
| ≥50岁 | 0.366~5.642 | -a | -a | ||
| 全部 | 0.513~5.112 | 0.093~0.158 | 2.53~3.77 | ||
| 按季节分组 | |||||
| 春季、夏季、秋季 | 0.510~5.042 | -b | -b | ||
| 冬季 | 0.527~5.250 | -b | -b | ||
| 制造商推荐参考值 | 0.550~4.780 | 0.089~0.176 | 2.30~4.20 | ||
注:TSH:促甲状腺素;FT4:游离甲状腺素;FT3:游离三碘甲状腺原氨酸;"-a"表示FT4、FT3无需按年龄分组;"-b"表示FT4、FT3无需按季节分组
应用"大数据"进行科学研究,最重要的基础是检测结果的准确性和可靠性。本实验室采用的西门子促甲状腺素检测方法可溯源至世界卫生组织(WHO)第三代人促甲状腺素(IRP 81/565),FT4、FT3方法可溯源至《美国药典》的内部标准品。本研究回顾了采集数据期内3年间的所有室内质控、室间质评及试剂更换批号确认记录,均合格在控。所有标本均按照本实验室SOP完成分析前处理,标本均为新鲜血清。
目前国内临床实验室使用的主流化学发光或电化学发光甲状腺相关激素检测平台的参考区间均未提供分性别、年龄的特定参考区间,但早有国内外学者提示了TSH等的性别差异,Park等[4]纳入7 016名表观健康人的研究结果显示女性TSH水平明显高于男性,而既往有研究纳入5 348名社区人群的研究也证实了国人的相同趋势[6] 。本研究对超过10万名健康体检者的调查数据也呈现了性别间非常显著的差异,这与性激素在甲状腺激素分泌调节中发挥作用有关。而进一步的研究显示,女性绝经年龄后的TSH水平进一步明显升高。更有趣的是,FT4和FT3在随年龄不断降低的过程中,在50~64岁这个年龄段均出现了小的反弹,这些发生在绝经年龄的现象证实,失去雌激素保护后的女性,除性激素发生了改变,其下丘脑-垂体-甲状腺轴的调节也发生明显变化,所以不应该仅关注孕期这一特殊生理期的甲状腺激素参考区间,同样也应关注绝经的影响,建立特异的参考区间。
Kutluturk等[8]纳入1 095名18岁以上甲状腺超声及FT4正常人群检测TSH的结果,除显示女性TSH水平高于男性外,还明确指出其P2.5低于男性,P97.5高于男性,这也与我们的结果高度一致,意味着女性应有更宽的参考区间,这突破了既往参考区间研究中仅关注不同分组水平高、低差异的定式。而我们的研究还进一步提示这一参考区间变宽的情况在绝经年龄后的妇女更为明显,而老年男性也在一定程度上表现了参考区间变宽的现象,这提示无论女性,还是男性,在老龄化逐渐失去功能的情况下,下丘脑-垂体-甲状腺轴的敏感性会逐渐降低并呈现更大差异,进而造成TSH个体间的差异会更加明显,所以应该寻找适宜的年龄界点,设定适合老年人群的甲状腺功能参考区间。
De Grande等[5]采用多中心"大数据"研究揭示TSH的变化具有季节周期节律性,冬季TSH出现高峰,夏季处于低谷期。但是一些研究表明季节性不影响TSH浓度,可能由于不同季节间的节律变化幅度小于昼夜节律变化[3]。本研究3年的结果呈现了多个连续的随季节变化的波峰波谷,进一步证明了低温刺激可能造成的TSH变化规律,而冬季相对离散的数据分布也有可能是不同工作或生活习惯带来的室外低温停留时间差异造成的。但是我们的研究也提示,较性别、年龄带来的参考区间差异,冬季TSH的P97.5较夏季仅相差约0.2 mU/L,对临床判定影响较小,且如何根据气象部门的预报切换系统中的参考区间,也相对较困难,故可以不给出季节特异的参考区间。但是对于更加寒冷的北方地区或国家,仍应高度重视这一结果波动的临床解读。另外,本研究发现FT4和FT3的结果无显著季节间差异。
本研究仅探讨了性别、年龄和季节的影响,一方面是因为这部分数据较容易采集,另一方面也是这几个因素可以通过实验室信息系统自动实现参考区间的匹配,实用性更大;而民族、昼夜节律、体质指数(BMI)、生育状态、碘摄入等作为并非必要的患者基本信息,实现参考区间个性化较困难。
本研究探讨甲状腺激素的分布特点是期待最终可以支持其参考区间的建立。目前,CLSI与国际临床化学联合会(IFCC)共同发布的EP28-A3是目前全球范围参考区间建立、验证的权威指南,新版文件仍然将基于前期明确纳入、排除标准的直接抽样法作为选择参考个体的首选方法,但也关注到了众多利用临床数据的参考区间研究[9,10],首次提及利用间接抽样技术从现有的临床数据中获得相对健康人群的参考区间,虽较粗略,但在利用跨年度、跨季节的大数据过程中值得借鉴,对于弥补直接抽样的局限性(如季节、数量、经济等)有一定意义。本研究所使用的是健康体检人群,是间接抽样技术中第二位推荐使用的数据,其"健康"的可能性较高。但研究得到的粗略参考区间在与制造商推荐的参考区间比较中存在较明显的差异,故也亟待设计更为科学的直接抽样法的验证。有趣的是,本研究中总人群的FT4和FT3粗略参考区间都较制造商推荐参考区间窄,这是否提示我们在统计过程中的数据剔除过于严格呢?
通过本研究结果,我们建议TSH应选择男性65岁、女性50岁为界点,建立特异的性别年龄参考区间;根据地区温度特点可建立冬季参考区间。FT4、FT3可考虑建立不同性别参考区间,而年龄和季节影响相对较小。我们的研究存在一定的局限性,数据仅来自北京地区一家医院,人群居住地、职业等相对范围较窄。但是利用可靠的"大数据"进行尝试性的探索,将为临床实验室参考区间的建立与验证提供更多的数据支持,为尽快摆脱参考区间多来自国外人群的现状作出努力[11]。





















