
随着我国老龄化进程的加深、加快,老年人轻度认知障碍(MCI)的发病率逐年升高,而早期诊断筛查MCI对于降低痴呆的发病率具有重要的社会意义。本文收集和综合分析了国内外临床实践中常用的MCI筛查评估量表(老年人认知功能减退知情者调查问卷,剑桥神经心理测试自动化成套量表,蒙特利尔认知评估量表,画钟试验、钟表读数试验、钟表设置试验,美国阿尔茨海默病联合登记协作组织的评估条目,8条目痴呆筛查问卷,Addenbrooke认知评估量表,全科医生认知功能评估量表),结合各量表的优缺点,提出将用时短且高效的8条目痴呆筛查问卷、老年人认知功能减退知情者调查问卷与灵敏且全面的Addenbrooke认知评估量表联合使用的量表组合策略,该策略可以很好地弥补各量表的不足,适用于我国社区老年人MCI的早期筛查、识别。
本刊2022年版权归中国全科医学杂志社所有
未经编辑部许可,不得任意转载和摘编
本刊所发表作品仅为作者观点,并不代表编委会和编辑部意见
如有印装质量问题请向本刊发行部调换
轻度认知障碍(mild cognitive impairment,MCI)通常被认为是阿尔茨海默病(Alzheimer's disease,AD)的临床前期,是介于正常衰老和AD之间的过渡阶段[1]。与年龄和教育程度相匹配的健康老年人相比,MCI患者在记忆、言语、视觉空间技能、注意力和执行功能等方面出现一种或多种认知域的轻度进行性损害,但日常生活能力基本不受影响,且未达到AD的诊断标准[2]。随着全球老龄化程度的加深、加快,MCI的发病率逐年升高,最新研究显示我国60岁以上人群MCI患者人数已超过3 800万,居世界首位[3]。MCI具有较高的AD转化率,早期诊断筛查MCI对于降低AD发病率具有重要意义[4]。然而,MCI在社区实践中未被充分认识和诊断,很大程度是因为缺乏临床可用的简便、快捷、准确率高且受试对象易接受的筛查工具。筛查测试在认知障碍诊断中起着至关重要的作用。目前国内外临床中常用于筛查和识别MCI的量表有数十种,但由于不同的量表侧重的认知评估领域、完成测试所需的时间等不同,导致识别MCI的灵敏度和特异度有较大的差异。理想的MCI筛查方案应同时具备简明、耗时短、易执行、对突出的认知损害领域有针对性,以及不受年龄、受教育程度、文化背景、语言等混杂因素影响的特点[5],目前还没有任何一种量表能准确、全面地识别MCI,因此临床实践中需要几种高效量表的搭配使用。本文总结和分析临床上常用的MCI筛查评估量表,并结合量表的优缺点,制定适用于我国社区老年人早期筛查识别MCI的临床使用策略,希望为基层全科医生进行MCI筛查提供参考。
若不及时对MCI患者进行干预和治疗,其未来患AD或其他痴呆的风险远高于健康者。但是,当前我国社区老年人MCI筛查还存在以下问题:(1)MCI患病率高,但是患者及其家属对MCI认知不足,导致就诊率低。患者及其家属缺乏对认知障碍疾病的了解,难以分辨MCI所表现出的症状与常规的认知老化之间的区别[6],多数是在发展成AD后出现走失、不认识亲人等严重的认知障碍后才前往医院就诊,错过了最佳干预时机。(2)社区筛查时拒访率高。目前我国现行的MCI评估方法测试内容冗长、过程繁琐、专业性过强,每人耗时>2 h,费时费力,社区老年人易出现不耐烦、不愿意接受检查等情况。(3)基层医疗卫生机构缺乏MCI筛查的经验。承担MCI筛查的主体应该是基层医疗卫生机构,然而目前对MCI的重视程度不够,导致我国的基层全科医生相关专业培训不够完善,多数缺乏认知障碍筛查诊断的基本技能。(4)专业人才匮乏。我国目前只有神经内科、老年医学科、康复科和精神卫生中心的老年精神科有专业人员从事认知障碍的相关临床工作,而且总数相对较少,很难抽调到足够的专业人员开展大范围MCI筛查工作。(5)筛查诊断的流程和方案容易存在缺陷,导致检出率低、漏诊率高。MCI是一种异质性疾病,患病的原因很多,受损的认知域和严重程度会存在差异,因此在社区筛查中如果检测的认知域不全面,就容易出现漏诊。评估工具的选择与实施过程也会影响检出率,比如工具的信效度不够高或评估员没有经过专业的认知筛查训练,可能会影响最终结果和对结果的解释[7]。
目前,国内外临床上常用的MCI筛查评估量表包括老年人认知功能减退知情者调查问卷(IQCODE)、剑桥神经心理测试自动化成套量表(CANTAB)、蒙特利尔认知评估量表(MoCA)、8条目痴呆筛查问卷(AD8)、画钟试验(CDT)、钟表读数试验(CRT)、钟表设置试验(CST)、美国阿尔茨海默病联合登记协作组织(CERAD)的评估条目、Addenbrooke认知评估量表(ACE)和全科医生认知功能评估量表(GPCOG)。
IQCODE是一个可靠的、经验证的、基于知情者提供信息的测量工具,已被不同文化和语言背景的临床研究人员广泛使用[8]。该问卷主要评估认知域的短期和长期记忆、时间和地点定向力、计算能力、学习能力及执行功能,分别涵盖了记忆的两个方面(获取新信息和检索现有知识)和智力的两个方面(语言和表现),以访问知情者的形式评估患者目前日常生活中的认知功能水平与10年前相比的变化情况。JORM于1989年建立IQCODE最初版(包括26个问题),1994年删除了信度和效度较差的检查条目后形成了目前国际上常用的缩减版(包括16个问题)[9],通常在10 min以内即可完成,不仅能区分认知障碍的不同阶段,如痴呆、MCI,还能很好地将MCI患者与健康人群区分出来,而且得分几乎不受年龄、性别、受教育程度的影响[10]。然而,由于样本量大小的不同,不同的研究使用IQCODE识别MCI的灵敏度和特异度差异很大。我国学者研究显示,IQCODE识别MCI的灵敏度和特异度分别为97.9%和71.4%,识别的精确度优于简易精神状态检查量表(mini-mental state examination,MMSE)[9]。而国外一项小样本量研究显示,IQCODE识别MCI的灵敏度仅有46.1%[11]。除了样本量较小之外,造成上述差异的原因还可能是该问卷易受知情者的主观期望和对患者病情熟悉程度等因素的影响,不能直接反映受试者当前的认知功能状态[12]。另据一项元分析研究显示,IQCODE识别卒中后认知障碍患病风险的灵敏度为75%,特异度为46%[13]。因此,作为一种延迟验证工具,IQCODE有潜在的局限性,不适合单独用于MCI筛查,建议临床实践中结合其他评估量表使用,以提高其评估的灵敏度和特异度。
CANTAB是剑桥大学于1986年开发的一种计算机化的学习和延迟回忆测试工具,被认为是目前国际上认知功能测量工具中最有效、最灵敏的触屏测试,其结果受教育程度影响较小[14]。该量表主要评估认知域的处理速度、语言能力和工作记忆[15]。情景记忆(识别和回忆)部分包含3种视觉情景记忆测试,即模式识别记忆(PRM)、样本延迟匹配(DMS)和配对联想学习(PAL)。针对性地识别遗忘型MCI(aMCI)受到损害的视觉识别记忆和视觉空间的PAL,从而能够明显区分aMCI者和健康人群[16]。其中,PAL是延迟反应的一种形式,可检查受试者建立视空间关联的能力,并被认为是专门探测内侧颞叶(如海马)功能的指标,可用于识别MCI[15]。另有研究发现,PAL识别aMCI的灵敏度和特异度很高,分别达到了96.9%和80.8%[17]。然而也有研究发现,由于CANTAB的6个子测试中有5个评估的是单独的认知功能,从而导致该量表可能缺乏在健康人群中测量离散认知功能的灵敏度,或者可能测量传统神经心理学成套量表中不包括的其他认知域[15]。另外,由于样本量小、研究缺乏可复制性等问题,很难就CANTAB在MCI的筛查、认知受损程度和诊断等方面的临床应用提出较好的建议[17]。因此,作为一种自动化的认知功能评估测试,CANTAB仅对aMCI有较高的灵敏度和特异度,对其他类型的MCI识别度相对不足,用于早期MCI筛查有局限性,且缺乏足够的国内临床应用数据支持,仍需进一步的临床研究。
MoCA研制于2004年,作为目前临床上常用的筛查MCI的工具之一,已经被翻译成35种语言版本[18]。该量表由12道题组成,满分为30分,以26分为分界值,完成全部测试通常需要10 min以上。该量表设计了8个认知域,包括短期记忆、视觉空间技能、执行功能、注意力、工作记忆、语言、计算和定向力、抽象思维,包含画钟试验、复制立方体、交替连线测试,能更全面地评估执行力、视觉空间技能。虽然MoCA被认为是一个相对全面的认知功能测试工具,但是其题目难度较高,导致受试者的年龄、受教育程度对得分有明显影响[19],而且测试者需要事先进行严格的操作培训来掌握提问技巧和评定标准,有一定的局限性,难以大范围地应用于社区筛查[20]。国外研究发现,MoCA识别MCI的灵敏度为90%,明显优于MMSE的18%,且特异度达到87%[21]。国内有研究证实,MoCA识别MCI的灵敏度(92.4%)优于MMSE(24.2%)[22]。另有研究发现,MoCA筛查MCI的灵敏度为67%~100%,特异度为50%~95%,虽然能在MMSE得分在参考范围的人群中检测出部分MCI,但是灵敏度和特异度的数值在不同情况下波动较大[10]。另外,MoCA的题目中出现"犀牛""教堂"等西方词汇,可能会影响中国老年人的测试评分,最好进行本土化改善。因此,作为一个知名且应用广泛的认知功能测试量表,MoCA受年龄和受教育程度影响较大,在不同情况下灵敏度和特异度不稳定,不适合单独使用,建议临床实践中结合其他评估量表使用。
CDT、CRT及CST是目前临床上常用的一系列时钟测试。其中CDT自1989年起开始使用,要求患者按照指令画出时钟,是一种主要针对执行功能检查的单项测验,涉及视空间、执行功能等认知域,评价听觉语言技能、注意力集中和结构性失用,受文化特征、受教育程度、经济状况等影响较小[23]。CRT可以检测患者视空间能力的损害,要求受试者认读时钟上显示的时间。CST则要求受试者按照给予的时间将时钟指针放置到正确的位置。时钟测试是一系列简单易操作的筛查工具,测试时间短(1~5 min),评分方法简单,具有较好的重测信度。然而,时钟系列测试检测MCI的灵敏度均较低。美国的一项荟萃分析结果显示,CDT识别MCI的灵敏度为67.0%~97.9%,特异度为69.0%~94.2%,范围均较广,最佳诊断分界点尚未统一,缺乏社区筛查应用的有利证据支持[24]。另有研究发现,16分制CDT(CDT-16)的灵敏度为40.69%,4分制CDT(CDT-4)的灵敏度为30.49%,CDT-16的灵敏度高于CDT-4,主要表现在MCI患者对于钟表画图的整体概念缺乏、作图无计划性,提示观念缺乏导致的语义记忆障碍[25]。可见,时钟系列测试对于AD的早期诊断均有一定价值,尤其是将受试者的钟表盘面及指针(分针和时针)错误进行单独分析时,说明CDT、CRT及CST能够较好地区分健康人群与早期AD患者。但是,这三种测试对MCI的特异度和灵敏度均较低,所以不适用于单独MCI筛查,建议联合其他认知评估量表以组成各种成套认知功能评估工具,如CERAD的评估条目、MoCA和GPCOG等。
CERAD的评估条目子测试包括动物命名、波士顿命名测验(Boston Naming Test,BNT)、MMSE、构造试验、单词列表学习等量表,评估的认知域较全面,但是耗时较长(约45 min)。一项在欧洲进行的前瞻性研究中,对223名健康老年人和224名MCI患者的基线临床数据进行了分析,得出CERAD检测MCI具有81.5%的灵敏度和75.4%的特异度,受年龄、性别、受教育程度影响较大[26]。KARRASCH等[27]的研究发现,CERAD子测试中,除了单词列表学习测试对MCI比较灵敏,其他子测试筛查MCI的灵敏度或特异度的数值均有波动,导致该评估条目的界限值对MCI的灵敏度较低。我国一项小样本量研究发现中文版CERAD识别MCI的灵敏度和特异度分别为52%和90%,且测试结果的信度和效度较高,但年龄对测试结果有明显影响[28]。因此,CERAD作为一个主要针对AD的评估条目,不适合单独应用于MCI的早期筛查,建议将单词列表学习测试单独提出与其他测试工具组合使用,可以在保证对MCI筛查的灵敏度和特异度的同时,缩短测试时间。
AD8是2005年美国华盛顿大学开发的一个仅有8个"是/否"问题的简短工具,2~3 min即可完成[29],大约每分钟测试1个认知域,可快速地评估记忆、定向力和判断力,可用于超早期痴呆的筛查[30],且测试结果不受年龄、性别、受教育程度及文化背景的影响。研究发现,AD8筛查MCI的灵敏度为72%~91%,特异度为67%~78%[31]。国外小样本量研究显示,AD8识别MCI的灵敏度为100%,并且比IQCODE的灵敏度和特异度更高,更适用于MCI的识别筛查[11,32]。此外,AD8与AD的生物标志物(如淀粉样蛋白成像、脑脊液tau蛋白和淀粉样蛋白β-42)高度相关,这些生物标志物现在被认为是AD和MCI早期诊断的标志,并已被纳入修订的痴呆诊断标准[33-35]。国外一项针对老年门诊的研究发现,AD8识别MCI的灵敏度和特异度分别为81.67%和93.59%,被证明是一种快速、简单、灵敏,而且可靠、有效的检测MCI的筛查方法[36]。我国另一项研究发现AD8具有简短易操作、灵敏度高、形式灵活等特点,且对受教育程度要求低,可以通过电话询问等方式获得信息,更适用于对认知功能改变的动态观察,目前已被广泛应用于大样本量的认知筛查[37]。然而对于受教育程度较高的受试者,该量表存在假阴性风险[38]。AD8测试时间短且易于被老年人理解、掌握并进行操作,使其在社区和全科医学等非专科医疗机构的广泛应用方面具有较大潜力。因此,在临床试验、社区和初级卫生中心调查和流行病学研究中,AD8都是一个非常合适的简便、灵敏的MCI筛查工具[38]。
ACE最初在2000年由剑桥大学HODGES团队编制,可用于早期痴呆的检测,同时在预测MCI向痴呆转化方面具有优势。目前被广泛应用的由澳大利亚神经科学学院编制的第三版ACE量表(ACE-Ⅲ)共含21项认知测试,评估的认知域有注意、定向、记忆、语言语词流利性、视觉记忆和视空间能力,共21项认知测试,总分100分,需耗时15~20 min,最终评分越高,表示认知功能越好[39]。LI等[40]研究发现,中文版ACE-Ⅲ诊断MCI的灵敏度为75%,特异度为89%。王变荣等[39]通过前期工作发现,截断值为85分时,中文版ACE-Ⅲ诊断MCI灵敏度为97.3%,特异度为90.7%。多项研究表明,受试者年龄与ACE-Ⅲ评分呈负相关,受教育年限与ACE-Ⅲ评分呈正相关,所以ACE-Ⅲ尤其适合用于受教育年限高者的认知筛查[41-44]。因为AD早期记忆损害最灵敏[45],且ACE-Ⅲ对主观认知功能下降的诊断具有较高的准确性[46],所以ACE-Ⅲ对于MCI非常灵敏,在诊断MCI准确性较高的同时,可用于预测受试者中易发展成AD的MCI患者。因此,ACE-Ⅲ作为一个高效的认知评估量表,对MCI有高灵敏度和高特异度,评估的认知域较全,测试时间较短,但是易受年龄和受教育程度影响,应用于临床筛查MCI时建议与其他量表搭配使用。
GPCOG是2002年由澳大利亚BRODATY等经过临床探索及研究制定的可用于快速筛查认知功能障碍的简易量表,目前已经被翻译成20余种语言版本并广泛应用。该量表是在剑桥认知检查(CAMCOG)、精神评定量表和工具性日常生活评定量表基础上改编制定的,包括患者评估部分和知情者调查部分,总计15分[47]。其中患者评估部分包括9个条目,分别为时间定位、画钟、钟表时间、消息、记忆(姓、名、城市、街道、门牌号),总分为9分。知情者调查部分要求知情者把患者当前的能力与前几年进行比较,问题包括:记忆事情、记忆谈话、找词情况、理财能力、能否独自安排服药、出行是否需要帮助,总分为6分[48]。国内研究发现,GPCOG用于筛查MCI的灵敏度和特异度较高,分别为70.05%和69.52%[48]。另一项小样本量研究收集了48例MCI患者的门诊随访数据,发现MCI患者GPCOG的评分低于健康老年人,而且以总分12分为界,GPCOG识别MCI的灵敏度为91.0%,特异度为90.0%[49]。另有研究发现GPCOG受年龄、受教育程度和语言背景的影响很小[50]。因此,GPCOG是一种适合于全科医生使用的认知功能评价量表,能够快速、客观地对患者的认知功能做出评价,但是会受到知情者评估部分的主观原因影响,因此建议临床应用时结合其他测试工具使用。
为了提出较为合理的量表应用组合策略,现将各种MCI筛查评估量表的灵敏度、特异度及优缺点见表1。

各种MCI筛查评估量表的优缺点比较
Comparison of advantages and disadvantages of various mild cognitive impairment screening and assessment scales
各种MCI筛查评估量表的优缺点比较
Comparison of advantages and disadvantages of various mild cognitive impairment screening and assessment scales
| 测试工具 | 灵敏度(%) | 特异度(%) | 优点 | 缺点 |
|---|---|---|---|---|
| IQCODE | 97.9 | 71.4 | 全面、快速,不受年龄、性别、受教育程度的影响 | 不同的研究使用IQCODE识别MCI的灵敏度和特异度差异很大 |
| CANTAB | 96.9 | 80.8 | 识别aMCI的灵敏度和特异度很高,受试者的受教育程度对结果影响较小 | 对其他类型的MCI识别度相对不足 |
| MoCA | 67~100 | 50~95 | 测试的认知域较全面,临床应用广泛 | 灵敏度和特异度波动范围较大,受试者的年龄、受教育程度对得分有明显影响 |
| 时钟测试(CDT、CRT、CST) | CDT:72.00CRT:49.23CST:60.00 | CDT:85.62CRT:60.04CST:68.97 | 简单易操作,测试时间短,评分方法简单,具有较好的重测信度 | 更适用于识别AD,在进行MCI筛查时,特异度和灵敏度较低 |
| CERAD | 81 | 72 | 评估的认知域较全面,对健康人群和MCI的鉴别有很高的准确性 | 除了单词列表学习测试,其他子测试筛查MCI的灵敏度或特异度不稳定 |
| AD8 | 72~91 | 67~78 | 简短、快速,不受年龄、受教育程度及文化背景的影响 | 单独使用进行筛查的灵敏度不高 |
| ACE-Ⅲ | 97.3 | 90.7 | 高灵敏度和高特异度,涉及认知域较全,耗时短,可以预测易发展成AD的MCI患者 | 容易受年龄、受教育程度影响 |
| GPCOG | 91.0 | 90.0 | 高灵敏度和高特异度 | 会受到知情者评估部分的主观原因影响 |
注:MCI=轻度认知障碍,aMCI=遗忘型MCI,AD=阿尔茨海默病,IQCODE=老年人认知功能减退知情者调查问卷,CANTAB=剑桥神经心理测试自动化成套量表,MoCA=蒙特利尔认知评估量表,CDT=画钟试验,CRT=钟表读数试验,CST=钟表设置试验,CERAD=美国阿尔茨海默病联合登记协作组织的评估条目,AD8=8条目痴呆筛查问卷,ACE-Ⅲ=第三版Addenbrooke认知评估量表,GPCOG=全科医生认知功能评估量表
由于我国老年人的早期MCI筛查多在体检中心和社区等场所大范围进行,为了避免漏诊的情况,理想的MCI筛查方案需要在能够最大限度地筛选出符合MCI诊断标准的患者的同时,具有良好的实施性。由于评估时需要覆盖尽可能多的认知域(如短期/长期记忆、视空间、注意、执行功能、语言功能、理解等),临床大规模人群筛查时需要选择不同量表或多项量表联合应用,而且多项量表联合应用时尤其应注意各项量表之间的平衡,如评估项目内容符合当地社区老年人实际、评估项目互补而非重复、量表之间适度间隔避免记忆的印记效应等。另外,为了避免老年人因测试时间过长而产生疲劳和厌烦的心理,应优先考虑用时短且高效的MCI评估工具。在上述所列的各种MCI筛查评估量表中,通过对比不同评估量表每分钟测试的认知域数量,RAZAVI等[11]研究发现AD8可以每分钟测试1个认知域,是兼具高效与高灵敏度的筛查量表。计算时间效率仅次于AD8的是IQCODE,每分钟可测试0.6个认知域[51],也可用于早期MCI筛查。由于这两个量表在临床应用时均有局限性,IQCODE识别MCI的灵敏度和特异度不稳定,AD8单独使用的灵敏度不高,所以都需要与其他测试工具搭配使用。
近些年,ACE-Ⅲ版本发布后,其在MCI筛查中的优势逐渐被人们所注意。ACE-Ⅲ拥有高达97.3%的灵敏度和90.3%的特异度的同时,测试时间仅需15~20 min,而且在诊断MCI准确性较高的同时,可用于预测受试者中易发展成AD的MCI患者,是目前适用于早期筛查MCI的评估量表之一。由于该量表易受年龄、受教育程度的影响,而IQCODE和AD8受这两个因素影响较小,所以ACE-Ⅲ、IQCODE和AD8的搭配组合模式是目前最推荐对我国老年人进行MCI早期筛查的量表使用策略。
综上,由于MCI的病情呈进行性发展,且认知域受损存在个体差异,所以使用单一的认知功能评估工具常存在灵敏度或特异度不高等问题,很难准确地捕捉到MCI,会产生较大的误差,也难以评估其疾病进展程度,无法在社区广泛开展。认知领域测试、灵敏度、特异度和时间效率被认为是选择MCI筛查工具时的关键参数,本文整理和总结了每种评估量表的灵敏度、特异度和优缺点,提出了将短时高效的AD8、IQCODE与灵敏全面的ACE-Ⅲ联合使用的量表组合策略,该策略可以很好地弥补彼此的不足。此外,由于目前国内采用的评估工具多是对国外量表进行翻译、修订后使用,而且许多国外临床上常用的评估量表在国内没有大范围投入临床应用,甚至相关研究、文献也很少,因此需要对引进的评估工具进行信效度的实践验证分析,建立常模和对照,在此基础上调整不适合的测试内容后推广使用。最重要的是结合我国人群的语言、文化背景、受教育程度等背景开发适合国人使用的MCI筛查评估工具,并建立国人常模和数据库。
(参考文献15~51请扫描本文二维码获取)
本文无利益冲突。





















