
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
痴呆是以认知损害为特征的临床综合征,阿尔茨海默病(AD)是最常见的痴呆原因,占60%~80%。我国痴呆患病率为7.2%,高于6.2%的全球平均水平,患病总数1 500万,占全球1/4,其中AD超1 000万,等于全球发达国家痴呆人数总和,且患病率随年龄而增长,65岁以下为4%,65~74岁为15%,75~84岁为44%,超过85岁达58%,防治形势非常严峻[1]。
认知测试至今仍然是痴呆诊断的首选方法,而简短的认知测试是病人体格检查的一部分而非诊断痴呆或发现病例。然而,简短认知测试在痴呆诊断中的作用常常被误解、有些简短认知测试的诊断阈值尚无共识、其诊断性能存在的语言文化差异常常被忽视,导致痴呆诊断率低和误诊率较高。我国痴呆诊断率只有26.9%,老年人中73.8%的痴呆患者被漏诊,93%的痴呆患者未被发现[2,3]。因此,建立简短认知测试的临床应用指南以提高痴呆的诊断率和准确性,是亟待解决的重大科学问题。然而,至今为止,国内外尚无此类指南。为此,中国老年保健协会老年痴呆及相关疾病专业委员会指南工作组(Alzheimer′s Disease Chinese Working Group on Guidelines, ADCWG),从2015年开始修订先前出版的《中国痴呆诊疗指南》[4],并补充制定了一个简短认知测试的分类使用指南,旨在理清简短认知测试在痴呆诊断中的作用,提高痴呆的诊断率和准确性。
本指南的证据收集主要使用了美国国立医学图书馆数据库(PubMed)等检索工具,采取主题词和自由词结合方式进行全字段检索,检索时间从建库至2016年6月,检索词涉及简短认知测试的英文名称、用途和性能,如Mini-mental state examination(MMSE),screening,diagnostic,validity or performance,utility等。
在文献检索基础上,根据纳入标准和排除标准进行文献筛选;再根据欧洲神经病学会联盟(EFNS)2004年发布的神经系统疾病管理指南的编制指南[5]中关于诊断性证据水平分级标准确定证据级别(Ⅰ、Ⅱ、Ⅲ、Ⅳ);最后根据证据水平,给出推荐强度(A、B、C、D)(表1)。对于尚缺乏证据的重要临床问题,则根据经验,将推荐意见表述为"专家共识"。

证据水平和推荐强度标准
证据水平和推荐强度标准
| 证据水平 | 标准 | 推荐强度 | 标准 |
|---|---|---|---|
| Ⅰ类 | 在广泛可疑人群进行的前瞻性研究(要求使用"金标准"定义病例,采用了盲法评估,能够进行诊断精确性评估) | A级 | (肯定有帮助/可预测、无帮助/不可预测)至少一个Ⅰ类研究或两个结果一致的Ⅱ类研究 |
| Ⅱ类 | 在非广泛可疑人群进行的前瞻性研究,或样本量较大的回顾性研究(要求使用"金标准"定义病例,采用了盲法评估,能够进行诊断精确性评估) | B级 | (很可能有帮助/可预测、无帮助/不可预测)至少一个Ⅱ类研究或大量的Ⅲ类研究 |
| Ⅲ类 | 回顾性研究(病例组或是对照组样本不大,要求采用盲法评估) | C级 | (可能有帮助/可预测、无帮助/不可预测)至少两个Ⅲ类研究 |
| Ⅳ类 | 非盲法评估的任何设计,或专家观点,或无对照组的描述性病例系列 | D级 | (不确定有帮助/可预测、无帮助/不可预测)至少一个Ⅳ类研究 |
本指南由ADCWG的执行小组完成初稿,经咨询小组修改,通过共识会议达成一致意见。
简短认知测试包括多领域测试和单领域测试,多领域测试主要评估综合认知功能,单领域测试涉及记忆、执行、视空间、语言及处理速度等主要认知评估。它们各自的主要证据描述及推荐意见如下:
MMSE是迄今为止应用最广泛的简短认知测试[6,7,8,9],也是临床试验中最常用的痴呆筛查、认知分级和终点结局的评估工具[10,11,12,13,14],几乎所有单领域测试的诊断性能或效度研究都以此为参照标准[15]。
一项荟萃分析[7]纳入自1989年至2014年9月关于MMSE的研究102项,来自美英加等30个国家的36 080例受试者中有痴呆患者10 263例。MMSE最常用的痴呆诊断界值(截断分数)为23和24分(44.4%),其次是25~26分(20%)。合并数据显示,MMSE对痴呆具有较好的诊断性能,敏感度为0.81(95% CI: 0.78~0.84),特异度为0.89(95% CI:0.87~0.91),受试者工作特征曲线(ROC)显示诊断优势比为35.4,曲线下面积(AUC)为92%(95% CI:0.90~0.94)(Ⅰ类证据)。不过,由于所纳入的研究异质性较大,它们的诊断效度存在较大差异,MMSE的敏感度波动在0.25~1.00之间,特异度在0.54~1.00之间。但该研究没有对不同的诊断界值、诊断标准以及教育水平进行亚组分析,可能会对结果有一定影响。
MMSE对AD有较好的诊断性能,但受教育水平的影响。使用MMSE的传统界值(≤23分),分辨痴呆(n=307,AD占66%)、轻度认知损害(MCI)(n=176)及正常认知(NC)(n=658)的敏感度和特异度分别为69%和99%;而根据教育水平调整分数后(大学≤26分、中学以下≤23分、文盲≤22分),敏感度显著提高(82%),而特异度未变(99%),阳性预测值(PPV)为91%,阴性预测值(NPV)为96%[6](Ⅰ类证据)。在受过高等教育(≥16年)的老年人中,使用<27分诊断界值,分辨AD、MCI与NC的敏感度和特异性获得最佳平衡,分别为89%和91%,平均正确分类率达90%[16](Ⅰ类证据),尤其在NC与痴呆、MCI与痴呆分类上有可接受的准确性[17](Ⅰ类证据)。因此,美国国家阿尔茨海默病协调中心(NACC)研究小组认为将认知损害(MCI和AD)界值调到27分(敏感度0.69,特异度0.91)或28分(敏感度0.78,特异度0.78)可能更合适[16]。
MMSE对血管性痴呆(VaD)也有较好的诊断性能。一项荟萃分析[8,9]纳入了17项与VaD有关的MMSE诊断准确性研究,其中12项以MMSE<25分作为卒中后认知损害(多领域损害和痴呆)诊断界值,共纳入1 639例患者,30%有认知损害。合并数据显示:MMSE的敏感度为0.71(95% CI:0.60~0.80),特异性为0.85(95% CI:0.80~0.89),阳性似然比为4.73(95% CI:3.63~6.17),阴性似然比为0.34(95% CI:0.25~0.47)。5项以MMSE<27分作为卒中后认知损害(多领域损害和痴呆)诊断界值,共纳入445例患者,44%有认知损害。合并数据显示:MMSE的敏感度为0.88(95% CI:0.82~0.92),特异性为0.62(95% CI:0.50~0.73),阳性似然比为2.33(95% CI:1.72~3.17),阴性似然比为0.19(95% CI:0.13~0.29)(Ⅰ类证据)。可见,随着MMSE界值的变化,敏感度和特异性也随之变化,但无论界值<25分还是<27分,都具有可接受的诊断性能。
MMSE的诊断性能也受语言及年龄的影响。采用一个界值27分筛查MCI和AD,英文版的敏感度(0.80)低于西班牙语版(0.92),而英文版的特异性(0.95)高于西班牙语版(0.78)[18](Ⅰ类证据)。国际运动障碍学会(MDS)推荐帕金森病痴呆(PDD)诊断以MMSE作为认知损害检测工具,认为界值<26分可能更适用于80岁以下且至少10年正规教育的人群[19](Ⅰ类证据)。
可见,MMSE是最常用的简短认知测试,最常用的痴呆诊断界值为23和24分,在受过高等教育的老年人中,需调高到≤26分[6,7,16]。临床上,通常根据教育水平调整诊断界值,如大学≤26分、中学≤24分、小学≤23分、文盲≤22分,提示痴呆[6,16]。可根据MMSE得分进行痴呆分级[17],以21~26分为轻度痴呆,11~20分为中度痴呆[8,9,10,11,12,13,14,15],0~10分为重度痴呆[10,11,14]。15~26分为轻中度痴呆[9,10,12,13,14],<15分为中重度痴呆[11,14]。AD痴呆分界值与其他原因痴呆如VaD、PDD基本相同[9,10,11,12,13,18,19]。
MoCA是为筛查MCI而开发的一个简短认知测试。采用≤25分检测MCI,MoCA的敏感度和特异度分别为90%和87%,MMSE的敏感度和特异度分别为78%和100%[20](Ⅰ类证据)。相关研究显示,MoCA≤25分区分MCI与NC的效度分别为84%和79%,分类准确性为0.80,与MMSE≤26分(分别为0.71和0.85)具有可比性[21](Ⅱ类证据),故认为MoCA是MCI和血管性MCI(VaMCI)筛查测试的最佳替代[8,9],但未见用于临床试验中痴呆筛查、认知分级和结局评估的报道[10,11,12,13,14]。
然而,大量的研究发现MoCA筛查认知损害的敏感度高但特异度较低。MoCA ≤25分筛查血管性认知损害(VCI)(含痴呆和MCI)的敏感度和特异度分别为0.89和0.69[22](Ⅱ类证据)、0.88和0.64[23](Ⅰ类证据)或0.91和0.76[24](Ⅱ类证据)。4项研究的合并数据显示[9],MoCA≤25分从326例卒中患者中筛查VCI的阳性率为40%,敏感度为0.95(95% CI:0.89~0.98)而特异度仅为0.45(95% CI:0.34~0.57)(Ⅰ类证据)。另外6项研究的合并数据显示[8],MoCA≤25分从726例卒中患者筛查VCI的阳性率为39%,敏感度为0.84(95% CI:0.76~0.89),特异度为0.78(95% CI:0.69~0.84)(Ⅰ类证据)。与VCI相似,MoCA的最佳分界值<24分检测遗忘型MCI(aMCI)和多领域MCI(mdMCI)的敏感度分别为100%和83.3%,但特异度只有50.0%和52.0%;采用推荐分界值<26分检测aMCI和mdMCI的敏感度分别为100%和83.3%,特异度仅为29.2%和29.6%[25](Ⅱ类证据)。
为此,美国NACC研究小组曾建议将MoCA诊断界值调低到≤21分,以改善其性能[26]。遗憾的是,≤21分筛查VaMCI的诊断效度更加失衡,敏感度和特异度分别为0.94和0.42,PPV为0.77,NPV为0.76[27](Ⅰ类证据)。6项研究的合并数据显示[9],采用≤21分界值筛查卒中后痴呆和mdMCI的敏感度为0.95(95% CI: 0.89~0.98),特异度只有0.45(95% CI:0.34~0.57)。将MoCA用于区别帕金森病MCI(PD-MCI)与PD-NC,最佳界值≤25分,敏感度为0.84,特异度仅为0.27;当降到≤20分时,区分PDD与PD-NC的敏感度升至0.94,但特异度仍较低,为0.68[19](Ⅰ类证据)。可见,无论界值是≤25分还是≤21分,都存在诊断效度失衡或严重失衡的问题。我国使用北京版(MoCA-BJ)≤25分区别MCI与NC,敏感度和特异度分别为0.90和0.31;当降到≤21分时,虽然获得了敏感度(0.69)和特异度(0.64)相对平衡,但分辨力不足(AUC=0.67)[28](Ⅰ类证据)。
MoCA的诊断性能也受教育和语言的影响[29,30,31,32,33]。以17/18分为界值区分MCI和NC的分辨力因教育程度而各不相同,小学组AUC为0.76,中学组为0.87,大学组为0.92,三组之间差异有统计学意义(P<0.001)[29](Ⅰ类证据)。采取教育水平调整分数,可以改善诊断性能,但教育调整分数各不相同。如在教育平均9.8~14.4年人群中,汉语版MoCA预测痴呆的最佳界值是23.5分,敏感度和特异度分别为78%和94%,AUC为0.89。将小学组的界值调为20.5分,敏感度和特异度提高到89%和100%,AUC为0.97;大学组为22.5分,敏感度和特异度提高到92%和100%,AUC为0.84[30](Ⅰ类证据)。采取教育年限分数加分方式,同样可以改善MoCA诊断性能。如忽略教育因素时,西班牙语版MoCA18分达到预测痴呆的最佳性能,敏感度和特异度分别为0.91和0.81,AUC=0.93;将受教育≤5年者加4分,即MoCA20分可获得最佳性能,敏感度增加至0.96,而特异度仍为0.81,AUC=0.94[31](Ⅱ类证据)。另有将受教育≤6年韩国人者加1分[32](Ⅱ类证据)或≤12年意大利人者加1分[33](Ⅱ类证据),都能改善MoCA筛查MCI的性能。此外,语言但非性别对MoCA诊断性能也有显著性影响[29,33]。
总之,MoCA是一个检测MCI的敏感筛查测试,但特异度低。MoCA的诊断性能受教育水平及语言的影响,尚缺乏定义认知损害的最佳界值及教育调整分数共识。
法国专家以神经心理学套表为参照标准,比较MoCA和MMSE筛查急性卒中后认知损害的诊断准确性,结果显示:采用MoCA原始分数≤19分的敏感度为0.92,但特异度为0.42;MMSE原始分数≤24分,敏感度为0.70,但特异度0.94。采用MoCA调整分数(即年龄和教育调整界值)≤20分,敏感度降为0.67,特异度升为0.90;MMSE调整分数(即教育调整界值)≤24分,敏感度和特异度与原始分数基本相同。其结论并非MoCA筛查认知损害比MMSE敏感,而是MoCA高敏感度与低特异度有关;两种筛查测试对急性卒中后认知损害都有中等的敏感度,都适用于卒中后认知损害的诊断[27](Ⅱ类证据),无论是用于VaD[21](Ⅰ类证据)还是VaMCI[26](Ⅱ类证据)筛查。然而,随着研究报道增多,两种筛查测试显现出各自的优势和劣势(表2)。

MMSE和MoCA在认知障碍诊断中的优势和劣势
MMSE和MoCA在认知障碍诊断中的优势和劣势
| 分界值 | 优势 | 劣势 | 使用建议 | 使用举例 |
|---|---|---|---|---|
| MMSE(24~29分)痴呆≤24~26分MCI=27~29分 | 对mdMCI和痴呆有可接受的敏感度和特异度;在NC与痴呆、MCI与痴呆分类上有中等的准确性;有针对不同认知水平的筛查常模和教育调整分数 | 对单领域损害相对不敏感;有天花板效应 | 更适用于mdMCI和痴呆的诊断 | 评估多领域认知问题患者 |
| MoCA(18~25分)痴呆≤18~21MCI=22~25 | 对aMCI和单领域损害有较高的敏感度;在NC与MCI分类上有中等的准确性 | 对naMCI和mdMCI相对不敏感;特异度过低会增加假阳性;筛查MCI和痴呆的最佳界值和教育调整分数共识尚未建立 | 更适用于aMCI和单领域损害的筛查 | 评估单领域认知问题患者 |
注:aMCI:遗忘型轻度认知损害;dmMCI:多领域型轻度认知损害;naMCI:非遗忘型轻度认知损害;MCI:轻度认知损害;MMSE:简易精神状态检查;MoCA:蒙特利尔认知评估;NC:正常认知
一项荟萃分析[8]比较了MMSE和MoCA在诊断性能上的差异,其中21项研究报道了MMSE,合并数据显示筛查MCI的敏感度为0.62(95% CI:0.52~0.71),特异度为0.87(95% CI:0.80~0.92);9项研究报道了MoCA,合并数据显示筛查MCI的敏感度为0.89(95% CI:0.84~0.92),特异度为0.75(95% CI:0.62~0.85)(Ⅰ类证据)。即使在筛查VaMCI各自最佳界值下,MoCA≥25分敏感度(0.92)也高于MMSE≥27分(0.82),但特异度(0.67)低于MMSE(0.76)(Ⅰ类证据)。MoCA在MCI与NC分类上较MMSE有微弱的优势(P=0.07),MMSE在NC与痴呆、MCI与痴呆分类上有可接受的准确性[17](Ⅰ类证据),但有天花板效应[21,26,27,34](Ⅱ类证据)。
如MoCA最佳界值<24分筛查心血管病患者aMCI的敏感度为100%,mdMCI为83.3%,特异度分别为50.0%和52.0%;使用推荐界值<26分,aMCI的敏感度为100%,mdMCI为83.3%,特异度分别只有29.2%和29.6%[35,36](Ⅱ类证据)。又如MoCA <25分可检测到所有卒中后aMCI病例(100%),但12例非遗忘型MCI(naMCI)和mdMCI中漏检了9例(25%),提示对naMCI和mdMCI不敏感,检测较重的认知损害时,则失去了敏感优势[21,37](Ⅱ类证据)。与此同时,MMSE<29分检测到了所有mdMCI病例(100%),但14例单领域MCI中漏检了10例(29%),提示对单领域损害不敏感[26](Ⅱ类证据)。
大量研究显示MoCA筛查MCI性能优于MMSE,但分界值均不相同[29,31,32,33,34,38,39]。采用MoCA23/24分筛查MCI的敏感度(92%)和特异度(78%)可获得最佳平衡,高于MMSE 29/30分(P<0.001)[40](Ⅰ类证据)。采用相同分界值筛查AD痴呆的敏感度(98.1%)和特异度(79.6%)也可获得最佳平衡,也高于MMSE 27/28分(P<0.001)[38](Ⅱ类证据)。采用MoCA教育调整分数19~24分,检测VaMCI的敏感度(76.7%)和特异度(81.4%)可获得相对平衡,仍然高于MMSE 26~28分(P<0.001)[41](Ⅱ类证据)。可见MoCA筛查MCI的最佳阈值从19分到24分不等,其诊断性能的稳定性难免被质疑。与之相反,MMSE几乎是所有以认知为主要治疗目标临床试验的痴呆筛查工具和65%的痴呆分级工具以及几乎所有单领域认知测试研究的参照标准[10,11,12,13,14,15]。
美国NACC研究小组曾以AD注册联盟标准化神经心理学成套量表(CERAD-NB)、基于信息的功能障碍评估和痴呆严重程度评定量表(DSRS)为参照标准,计算出的每个量表诊断准确性和最佳阈值,并据此提出了MoCA分数转化为MMSE的标准,即:MoCA筛查认知损害的常用阈值在18~25分之间,类似于MMSE 24~29分水平。其中,MCI的最佳阈值:MoCA在22~25分之间,类似于MMSE 27~29分水平。在更严格的MCI标准下(界值低于常模1.5或2.0 SD),MoCA最佳阈值应在22~26分之间及以下水平,类似于MMSE在25~29分水平。痴呆的最佳阈值:MoCA应为<22分,类似于MMSE<25分水平[18](Ⅰ类证据)。尽管MoCA最佳界值与MMSE之间有4~6分之差,但分数转化后的诊断效度仍具可比性,如MoCA筛查MCI的最佳界值<25分,敏感度和特异度分别为77%和83%,几乎等同于MMSE的最佳界值<29分的水平,敏感度和特异度分别为77%和81%[26](Ⅰ类证据)。
ACE是为检测和鉴别AD和FTD而设计的一个简短认知测试[42],被认为是痴呆筛查测试的最佳替代[7]。2项研究的合并数据显示[8],ACE修订版(ACE-R)(<88/100分)筛查VaMCI表现了较高的敏感度(0.96,95% CI:0.90~1.0)和中等的特异度(0.70,95% CI:0.59~0.80),与MoCA[<26/30分的敏感度(0.84)和特异度(0.78)]和MMSE[<27/30分的敏感度(0.71)和特异度(0.85)]具有可比性(Ⅰ类证据)。
ACE可为AD与FTD的鉴别提供简单的客观指标[42,43,44]。当VLOM[(词语流畅性+语言)/(定向+记忆)]比<2.2时,提示患者很可能为FTD(敏感度58%,特异度97%);当VLOM比>3.2时,提示很可能为AD(敏感度75%,特异度84%)[42](Ⅰ类证据)。在日文版(ACE-RJ)分界值为88分时,检测痴呆有较高的敏感度(91%~100%),包括AD(96%)和FTD(91%),且无论对何种严重程度的痴呆均有较好的诊断性能,并能正确诊断82%的MCI患者(CDR<1)、98%的轻度痴呆患者(CDR=1),以及100%的中重度痴呆患者(CDR>1),但特异度相对较低(43%~82%)[43](Ⅱ类证据)。最新报道,ACE-Ⅲ 88分筛查早发型痴呆有最佳效度,敏感度为91.5%,特异度为96.4%, AUC分别为96.8% (AD)、90.9%(原发性进行性失语和后皮质萎缩)、83.3%(行为变异额颞叶痴呆)[44](Ⅱ类证据)。
ACE/ACE-R定义认知损害的最佳界值尚无共识,界值越高,则敏感度越高,特异度相对低[45,46,47]。如ACE-R界值88分时,筛查痴呆的敏感度为0.94~1.00,特异度为0.48~0.89;ACE-R界值82分时,筛查痴呆的敏感度为0.84~0.96,特异度为0.72~1.00,效度趋于平衡[45](Ⅰ类证据)。在老年记忆门诊患者(75~85岁)中,ACE-Ⅲ 81分检测痴呆的准确性较高,AUC为0.91,88分的敏感度(0.97)高于81分(0.79)的,但特异度(0.50)低于81分(0.96)的。比较而言,最佳分界值为82分,敏感度(0.82)和特异度(0.77)相对平衡[46](Ⅱ类证据)。用于PD人群筛查时,则出现了相反的趋势,即界值越高,则敏感度越低[47,48,49]。如ACE-R 93分筛查PD-MCI[MMSE为(28.6±1.6)分]只显示了中等水平的效度(敏感度和特异度分别为0.60和0.64)[47](Ⅱ类证据);ACE-R<89分筛查PD-MCI也只有中等水平的效度(敏感度和特异度分别为0.69和0.84,PPV和NPV分别为0.54和0.91)[48](Ⅱ类证据);ACE-R 83分筛查PDD的敏感度和特异度分别为0.92和0.91[49](Ⅱ类证据)。
ACE/ACE-R的诊断性能受教育的影响[45,48,50,51,52,53,54,55,56,57]。在忽略年龄因素的情况下,ACE-R界值为88分时,筛查痴呆综合征的敏感度较好(0.94~1.00),但特异度偏低(0.48~0.89)[45](Ⅰ类证据);在受过高等教育的VaD人群中,ACE-R界值为88分时的敏感度和特异度均达到100%[50](Ⅱ类证据)。在受教育年限较长的人群(>10年)中,ACE-Ⅲ/ACE-R筛查痴呆的表现较MMSE更好,但在相对低教育人群(≤10年)中,与MMSE效能相似[51,52,53,54,55,56](Ⅱ类证据)。另一项研究显示[48],ACE-R的诊断准确性与教育有关,在受教育年限较高(15~22年)的人群中,ACE-R检测PD-MCI的AUC为0.94,而受教育年限较低(9~11年)者只有0.73(Ⅱ类证据)。
此外,ACE/ACE-R筛查MCI的敏感度类于MoCA[26,43]。ACE-RJ 83分筛查MCI的AUC为0.952,而MMSE为0.868,但在检测痴呆时两者的AUC无明显差异(1.00比0.99)[43](Ⅱ类证据)。以修订的MCI标准为金标准,结合NINDS-CSN统一标准神经心理学成套量表,ACE-R检测MCI(包括单领域损害)具有很好的敏感度和特异度,分界值在92~94之间获得最佳效度(ACE<92,敏感度=72%,特异度=79%;ACE-R<94,敏感度=83%,特异度=73%),类似于MoCA<25分的最佳效度(敏感度=77%,特异度=83%),两者具有较强的相关性(r2=0.76, P=0.000 1),且检测aMCI都优于非遗忘型单领域损害。与此同时,MMSE <29分获得了71%的敏感度(14例中有10例漏检)[26](Ⅱ类证据)。因此,ACE/ACE-R更适用于aMCI和单领域损害以及轻度痴呆的筛查。
TYM是新设计的一个通过患者填写、用时很短、且对轻度AD敏感的认知测试[57](Ⅰ类证据)。最近的研究显示[58,59,60,61,62],TYM分数与其他神经心理学评价量表显著相关,包括MMSE、ACE-R、MoCA、CDT、额叶评估量表(FAB)、临床痴呆评定(CDR)、工具性日常生活活动量表(IADL)、日常生活活动问卷-技术(ADLQ-T)、辉瑞功能活动问卷(PFAQ)、认知改变(AD8)等(Ⅱ类证据)。
TYM筛查痴呆有较好的性能。TYM≤30/50分检测痴呆的效度与MMSE和ACE-R相当[63](Ⅰ类证据),法语版(F-TYM)≤ 30.9分筛查痴呆较MMSE更敏感,但特异度不及MMSE。TYM的敏感度为0.82~0.93,特异度为0.71~0.76;MMSE的敏感度为0.70~0.88,特异度为0.83~0.90[60](Ⅱ类证据)。TYM诊断MCI的性能较差,最佳界值≤36/50的敏感度为0.41,特异度为0.80,PPV为0.43,NPV为0.79[63](Ⅰ类证据);TYM区分MCI和NC的AUC仅为0.691,分界值≤44/50分的敏感度和特异度分别为0.74和0.60[59](Ⅱ类证据),但预测MCI能力(AUC=0.862)都优于ADAS-cog(AUC=0.791)和MMSE(AUC=0.731)(P<0.05)[61](Ⅱ类证据)。因此,TYM可用于痴呆筛查但不适用于区分MCI与NC[59,60,61,63]。
关于TYM的影响因素目前尚无一致的结论,主要集中在年龄和教育上。TYM与年龄相关(P=0.004)。2项研究显示TYM分数与年龄(r=-0.36, P=0.000 1)和教育(r=0.45, P=0.000 1)均相关,使用年龄和教育相关的分界值(26/50~45/50),TYM检测AD的敏感度优于MMSE(0.82比0.70),但特异度较低(0.71比0.90)[59,62](Ⅱ类证据)。然而,另有2项研究显示TYM分数与年龄[64,65]和教育[60]并不相关(Ⅱ类证据)。
1.简短的多领域测试如MMSE、MoCA、ACE和TYM等,耗时较短,易于操作,主要评估综合认知功能(Ⅰ类证据,A级推荐),可用于痴呆的筛查、诊断、鉴别以及严重程度判断(图1)(专家共识),对提高痴呆诊断率和准确性具有重要意义。


注:AD阿尔茨海默病;VaD:血管性痴呆
2. MMSE是痴呆临床诊断中最常用的简短认知测试,也是最常用的认知损害筛查测试、程度分级和次要结局(Ⅰ类证据、A级推荐)。多以MMSE≤24分为检测痴呆的最佳阈值,在受过高等教育的老年人中需调高到≤26分。临床上,通常根据教育水平调整诊断界值,大学≤26分、中学≤24分、小学≤23分、文盲≤22分,提示痴呆(Ⅰ类证据、A级推荐);并根据MMSE得分进行痴呆程度判定,多以21~26分为轻度痴呆,11~20分为中度痴呆,0~10分为重度痴呆;15~26分为轻中度痴呆,<15分为中重度痴呆(Ⅰ类证据、A级推荐)。以MMSE 27~29分为检测MCI的最佳阈值,也需考虑教育和年龄的影响(Ⅰ类证据、A级推荐)。
3 .MoCA是为筛查MCI而开发的一个简短认知测试,敏感度高,但特异度低(Ⅰ类证据、A级推荐)。至今为止,MoCA检测认知损害的最佳阈值和教育调整分数共识尚未建立(Ⅰ类证据、A级推荐),常用的认知损害分界值为18~25分,等同于MMSE 24~29分(Ⅰ类证据、B级推荐),可参照MMSE最佳阈值进行分数转化,以MoCA≤18~21分类似于MMSE ≤24~26分水平,提示痴呆(Ⅰ类证据、B级推荐);以MoCA在22~25分类似于MMSE 27~29分水平,提示MCI(Ⅰ类证据、B级推荐),但MoCA在痴呆程度分级和认知损害预测上尚缺乏支持证据(专家共识)。
4. MMSE和MoCA两种简短认知测试在结构上有类似或相同之处,不宜同时使用,以免相互提示,影响成绩,但可根据各自优势,分类使用(专家共识)。MMSE对mdMCI和痴呆有可接受的敏感度和特异度(Ⅰ类证据、A级推荐),但对单领域损害相对不敏感(Ⅱ类证据、A级推荐),在NC与痴呆、MCI与痴呆分类上有中等的准确性(Ⅰ类证据、A级推荐),更适用于mdMCI和痴呆的诊断(Ⅰ类证据、A级推荐)。MoCA对aMCI和单领域损害较敏感,但特异度低(Ⅰ类证据、A级推荐),对naMCI和mdMCI相对不敏感(Ⅱ类证据、A级推荐),在MCI与NC分类上有中等的准确性(Ⅰ类证据、B级推荐),更适用于aMCI和单领域损害的筛查(Ⅰ类证据、A级推荐)。
5. ACE/ACE-R检测认知损害的最佳阈值尚无共识,从83分、88分到93分不等(Ⅰ类证据、A级推荐),检测MCI的敏感度类似于MoCA,检测痴呆的敏感度类似于MMSE,但特异度偏低(Ⅰ类证据、A级推荐),检测aMCI优于非遗忘型单领域损害(Ⅱ类证据、A级推荐),更适用于aMCI和单领域损害以及轻度痴呆的筛查(Ⅱ类证据、A级推荐),对FTD和PD-MCI不敏感(Ⅱ类证据、B级推荐),诊断性能受教育水平的影响(Ⅱ类证据、A级推荐)。
6. TYM分界值≤30/50分检测痴呆的效度与MMSE和ACE-R相当(Ⅱ类证据、B级推荐),但诊断MCI的性能较差,更适用于痴呆的筛查而非MCI(Ⅱ类证据、C级推荐),其影响因素尚不明确(Ⅱ类证据、C级推荐)。
情景记忆损害是AD的核心特征,也是典型AD诊断的重要依据。常用的情景记忆测试主要是词语学习测试和故事回忆测试的自由回忆和延迟回忆。
包括霍普金斯词语学习测试(Hopkins verbal learning test, HVLT)[66,67,68]、加利福尼亚词语学习测试(California verbal learning test,CVLT)[69]、雷氏听觉词语学习测试(Rey auditory verbal learning tTest,RAVLT)[70]等。
3项研究报道了HVLT的痴呆筛查性能[66,67,68]。HVLT曾被推荐为轻度痴呆的筛查工具,18/19分的敏感度和特异度分别0.96和0.80,而MMSE 25/26分的敏感度和特异度分别为0.88和0.93[66](Ⅱ类证据)。HVLT修订版(HVLT-R)在分界值为1SD时,其区分AD和NC的敏感度为0.95,特异度为0.83,PPV为0.84,NPV为0.94;区分VaD和NC的敏感度为0.85,特异度为0.76,PPV为0.76,NPV为0.85。分界值为2SD时,其区分AD/VaD的特异度均增加(0.98~1.00),但敏感度降低(0.53~0.67)。这提示其可作为有效的痴呆筛查工具,但并不能区分痴呆的原因(如AD和VaD)[67](Ⅱ类证据)。
3项研究报道了HVLT用于MCI筛查的性能不如痴呆。如汉语版HVLT≤15.5分区分痴呆与NC可获得最佳平衡的敏感度和特异度分别为0.95和0.93,≤21.5分区分MCI与NC的敏感度和特异度分别只有0.69和0.71[68](Ⅰ类证据)。虽然,HVLT-R筛查MCI自由回忆的分界值为15分时AUC为0.84,但敏感度和特异度分别为0.85和0.65;延迟回忆的分界值为4分时AUC为0.899,敏感度和特异度分别为0.88和0.70,且年龄影响得分[71](Ⅰ类证据)。
常用的有韦氏记忆量表-Ⅲ(Wechsler memory scale-Ⅲ,WMS-Ⅲ)的逻辑记忆故事A(logical memory story,LM-A)和成人记忆和信息处理套表(adult memory and information processing battery,AMIPB)的故事延迟回忆(delayed story recall, DSR)[72,73]。
4项研究报道了DSR检测AD和MCI的性能[72,73,74,75]。日文版DSR界值5/6分时,区分AD和NC的敏感度和特异度均为100%[72](Ⅱ类证据),中文版DSR界值10.5分时,获得区分AD和NC的最佳敏感度(0.98)和特异度(0.94),PPV为0.72,NPV为0.99,AUC为0.99,与MMSE得分有显著相关性(r=0.575,P=0.000),比获得相同敏感度和特异度的英文版低2.4分,且随年龄增加而降低,与教育水平呈显著相关性[73,74](Ⅰ类证据)。AD和DLB在情景记忆和语义记忆上表现相似,但AD患者的故事回忆[包括延迟回忆和即刻回忆(ISR)]表现更差,分别为AD组4%、DLB组28%、NC组78%[75](Ⅱ类证据)。
在诊断效度上,DSR区分MCI与NC比ISR更为敏感[73,76]。中文版DSR≤15.5分区分MCI和NC有较高的敏感度(0.90)和特异度(0.80),PPV为0.57,NPV为0.96,AUC为0.908,而ISR并无有效的效度[73](Ⅰ类证据),尤其是印度版单词表延迟回忆(t=7.11, P<0.001)较语义记忆和执行功能更好地区分MCI和NC(AUC=0.96),DSR(t=5.05, P<0.001)也能较好区分MCI和NC(AUC=0.84)[76](Ⅱ类证据),且故事保留百分率能预测27.4%MCI患者在24.5个月内进展为痴呆(p<0.001)[73](Ⅰ类证据)。
MCI进展型比稳定型的延迟回忆(单词和故事)得分更低(P<0.000 1)[77](Ⅱ类证据)。CVLT-Ⅱ区分MCI和NC的敏感度为0.90,特异度为0.84,增加WMS-Ⅲ的LM-A测试后,能增加CVLT-Ⅱ区分MCI和NC的分类精度,敏感度提高到0.92,特异度提高到0.95。CVLT-Ⅱ长时延长和WMS-Ⅲ的LM-A结合测试也能较好的预测在4年内MCI向AD的进展(准确分类为0.88)[69](Ⅱ类证据)。此外,自由和线索选择性回忆测试(free and cued selective recall reminding test,FCSRT)区分MCI转化为遗忘型AD早期阶段与MCI未转化者的敏感度和特异度分别为0.80和0.90[78](Ⅰ类证据),分类线索回忆(CCR)区分极轻的AD与NC的敏感度和特异度分别为0.88和0.89[79](Ⅱ类证据)。
执行功能障碍是额颞叶变性(FTLD)和VaD的典型表现,也常见于早发型AD。连线测试(trail making test,TMT)[80]、Stroop试验[81]、威斯康辛卡片分类测试(wisconsin card sorting Test, WCST)[82]有助于检测皮质下或额叶损伤。
TMT包括A、B两个子表。TMT-A主要测试"视空间能力"和"书写运动速度",TMT-B主要测试"处理速度"和"认知灵活度"[80](Ⅱ类证据)。
研究显示[83],NC组TMT-A错误率0~2之间,NC、MCI、AD组间无显著差异;TMT-B错误率0~6之间,NC与MCI和AD之间差异有统计学意义(P<0.001),虽MCI与AD之间无显著差异。TMT-A完成时间秒数,分别为NC(≤35.7 s)<MCI(48.1 s)<AD(67.1 s),三者之间差异有统计学意义(P<0.001)。TMT-B完成时间秒数,分别为NC(≤81.5 s)<MCI(136.0 s)<AD(190.8 s),三者之间差异有统计学意义(P<0.001)。TMT-A和TMT-B错误率和完成时间均分别与年龄或教育有关(Ⅰ类证据)。
采取TMT-B"错误次数和完成时间受损(z≤-1.0)"区分MCI/AD与NC的敏感度相对较好(0.72),但特异度相对欠佳(0.67),区分AD与MCI的表现相似(分别为0.81和0.67),区分MCI与NC的效度较低(分别为0.69和0.67)[83](Ⅰ类证据)。
TMT-A和TMT-B分别与WCST错误(%)、CVLT、受控口头词语联想测试(controlled oral word association test,COWAT)和数字广度测试(Digit Span)显著相关[84](Ⅱ类证据);TMT-B错误率也与MMSE、COWAT 、波士顿命名测试(Boston naming test,BNT)、动物命名测试(animal naming test,ANT)以及视空间能力(block design test,BDT)显著相关[85,86](Ⅰ类证据)[87](Ⅱ类证据)。
Stroop测试是一个常用的执行能力测试,由于其花费时间较短,尤其适用于在老年人和在神经心理学测试中容易感到疲劳的人群。
2项研究报道,Stroop测试能区分AD与NC,AD患者较NC的测试错误更多(P≤0.05)[81](Ⅱ类证据);年轻成人(3.9%)较老年成人(11.5%)的测试错误率低,而老年成人较轻度AD患者(20.3%)测试错误率低[88](Ⅱ类证据)。Stroop测试的不一致错误率较其他18项认知测试能更好地区分非常轻度AD和NC。但2项研究均未报道Stroop测试的诊断性能。
Stroop测试与受教育显著相关(P=0.001)[89](Ⅱ类证据),受教育<12年的患者表现差于≥12年人群(P<0.05)。年龄与Stroop测试完成时间有关(P<0.001),但年龄和性别均与Stoop测试分数无显著相关性(P=0.29~0.78)[81](Ⅱ类证据)。
痴呆患者(AD和PDD)的WCST-64版得分显著低于PD非痴呆者,对PDD患者的轻度执行损害也较敏感[82](Ⅱ类证据),也适用于检测卒中后认知损害,但得分受认知损害程度的影响(P<0.001)[90](Ⅱ类证据)。
虽有研究认为WCST-64版可以用来区分额叶和非额叶脑损伤[91](Ⅱ类证据),特异度较好(0.99),但敏感度不足(0.46),且无论采用通用的标准还是新的分界值,都不能区分患者的额叶和非额叶损伤,以及左半球和右半球脑损伤[92](Ⅱ类证据)。WCST可以用来区分精神病伴认知损害患者与正常人群,但不能区分阴性症状的精神分裂患者和阳性症状伴抑郁的精神分裂患者。只有阴性症状的严重程度会显著影响WCST的表现[93](Ⅱ类证据)。
WCST-128传统版与年龄显著相关,随着年龄增长,受试者出现更多的错误以及做出更多的持续应答,而WCST-64传统版与年龄并无显著相关性,WCST-54生态版区分认知损害与无损害老年人较两个传统版有优势[94](Ⅱ类证据)。
视空间功能减退在AD早期,甚至MCI阶段即出现,常用的测试量表有画钟试验(clock drawing test,CDT)[95]、雷-奥复杂图形测试(Rey-Osterreith complex figure test,ROCFC)[96]等。
广泛用于执行功能和视空间结构能力的筛查工具当属CDT,受试者在空白纸上画一个钟表图形,反映执行功能;受试者复制一个钟表图形,反映视空间结构能力。早前报道CDT对检测痴呆的敏感度为0.86,特异度为0.72[95](Ⅱ类证据)。一项纳入20项研究的系统分析的合并数据显示,CDT检测痴呆的敏感度和特异度均为0.85,且与其他认知测试如MMSE高度相关(r≥0.5)[97](Ⅱ类证据),但其他报道CDT筛查AD的特异度偏低,最佳分界值≤7分的敏感度为0.88,特异度只有0.63;分界值≤6分的敏感度为0.83,特异度为0.72[98](Ⅰ类证据)。
然而,CDT区别极轻AD与NC的敏感度只有0.67,特异度为0.97[99](Ⅱ类证据)。一项纳入9项研究的系统分析的合并数据显示,CDT筛查MCI研究,其敏感度在0.50~0.80之间,特异度在0.65~0.90范围,其中仅一项研究的诊断准确性较理想(敏感度≥0.80,特异度≥0.60),但不能预测MCI的进展[100](Ⅰ类证据)。另一项研究探讨了CDT的6种计分方法筛查MCI的准确性,结果显示AUC为0.64~0.69,不同计分方法之间的诊断准确性无明显差异(所有P>0.05),提示CDT的任何一种计分方法都不适用于筛查AD早期阶段和MCI[101](Ⅰ类证据)。
画钟测试用于鉴别AD与其他原因痴呆尚无一致性结论。早年发现,10分计分法CDT[102]的画钟分数和复制时钟分数均能显著区分痴呆(AD和VaD)与NC(P<0.001),且VaD的复制分数显著低于AD(P<0.018)[103](Ⅱ类证据)。最近的研究显示,4分计分法CDT分界值为4分时,区分痴呆与NC的敏感度为1.00,特异度为0.70,AUC为0.85。在分界值为3分时,区分AD和VaD的敏感度为0.55~0.69,特异度为0.22~0.33,AUC为0.34~0.48[104](Ⅰ类证据)。在调整了年龄、教育和痴呆程度等因素后,画钟分数部分仍能区分AD患者与AD合并血管患者(VCG)(AD:8.1±0.48,VCG:5.5±0.60,P=0.002),但在复制时钟部分,两组间差异并不显著(AD:10.3±0.57,VCG:8.6±0.71,P=0.074)[105](Ⅱ类证据)。此外,PDD的CDT画钟分数显著差于AD患者(P<0.05~0.001)[106,107](Ⅱ类证据),但与VaD之间无显著差异(P>0.05)[106](Ⅱ类证据)。其他4项研究显示[108,109,110,111],PDD与AD患者的CDT画钟分数并无显著差异,但FTD患者分数始终显著高于AD患者(Ⅱ类证据)。正如最新的系统分析所指出的,CDT画钟分数可用于AD与FTD的鉴别,但区分AD与VaD、DLB和PDD的价值有限,CDT错误类型的定性分析在痴呆类型的鉴别诊断中可能是一种有用的辅助手段[112](Ⅰ类证据)。
CDT测试成绩与教育水平相关,>6年教育人群中诊断准确性高于≤6年人群(P<0.001)[105](Ⅱ类证据),但与语言无关(P>0.05)[113](Ⅰ类证据);CDT检测很可能痴呆的敏感度和特异度比MMSE差,但在教育水平较低(<9年)的非英语患者中,敏感度高于MMSE[113](Ⅰ类证据);也与谵妄的存在或严重程度无明显相关性(P>0.05)[114](Ⅰ类证据)。
VFT可用于区分不同程度的认知损害和不同病因的认知损害[117],且不同机构之间的测试结果高度一致[118]。
VFT得分从高到低依次为NC>MCI/VaMCI> AD/VaD(P<0.05),且AD患者的VFT"亚类"和"转换"分数均优于VaD患者(分别P<0.05),MCI患者的VFT分数也优于VaMCI患者,但差异无统计学意义(分别P=0.094、0.881)[117](Ⅰ类证据)。此外,PD患者的VFT分数显著低于NC(P<0.01),其中,伴有执行能力损害的PD患者得分显著低于不伴有执行损害的PD患者(P<0.01)。VFT界值14分时检测PD认知损害的敏感度和特异度分别为0.73和0.82,AUC为0.85[119](Ⅱ类证据)。VFT对多发性硬化(MS)的测试-复测可信度较好(r=0.85),内部一致性也好(r=0.90)[120](Ⅱ类证据)。VFT得分与WCST的类别总数、TMT-B完成时间显著相关(分别P<0.001),但与数字倒背测试(DBT)无关[119]。VFT还可检测神经心理学结果的真实性和可信度,检测不努力完成测试患者的特异度可达到91.4%,但敏感度不高,为42.2%~55.2%[121](Ⅰ类证据)。
VFT得分与受教育程度和智商有中等相关性(均P<0.01),稳定性好,延长测试时间并不增加其效度[122](Ⅰ类证据)。当调整了AD和aMCI患者的年龄、性别和认知状态等因素后,受教育年限与分类流畅性任务(CFT)分数显著相关,但与非单词流畅性测试(WFT)无相关性[123](Ⅰ类证据)。
BNT有60项、30项和15项等版本[124,125],其中30项和15项性能相同,均可用于要求独立进行命名测试以及不能使用60项版情况下的重复评估[125]。BNT的得分与语言有关,英语人群的BNT得分(46.0±6.6)显著优于西班牙语人群(32.0±8.8)(P<0.01)[126](Ⅱ类证据)。西班牙语12项版(SV-BNT-12)(11.00±1.16)分诊断AD的敏感度和特异度分别为85%和94%,类似于与BNT-60,且不受年龄或教育的影响[127](Ⅰ类证据),但另一研究显示SV-BNT测量效度较差,筛查AD的敏感度较低,仅为0.39,特异度为0.89,建议不推荐作为AD的筛查工具[128](Ⅱ类证据)。BNT被用于预测癫痫术后左侧颞叶功能损害,正确预测率为67.3%~68.8%[129](Ⅱ类证据)。
一种语音流畅性或单词流畅性检测工具,如F、S开头的单词,中文以发、大、一等开头的词语,1分钟动物、蔬菜等属于范畴流畅性或分类流畅性。COWAT和RAVLT区别AD与皮质下缺血性血管性痴呆(SIVD)有高度准确性(敏感度为81%,特异度为84%,阳性似然比为5.1),且AD患者的口头词语联想测试好于词语学习再认测试,而SIVD患者正好相反[131](Ⅱ类证据)。
1.单领域测试如HVLT、TMT、CDT和BNT等,分别评估记忆、视空间、执行和语言功能等主要认知领域,为单领域认知损害提供客观证据(Ⅰ类证据、A级推荐)(表3)。

认知障碍诊断中最常用的多领域测试和单领域测试的诊断效度
认知障碍诊断中最常用的多领域测试和单领域测试的诊断效度
| 测试 | 工具 | 敏感度/特异度 | 第一作者,年 | |
|---|---|---|---|---|
| 多领域测试 | 简易精神状态检查(MMSE) | 0.82/0.99 (AD比MCI比NC) | O′Bryant,2008[16] | |
| 蒙特利尔认知评估(MoCA) | 0.90/0.87 (MCI比NC) | Nasreddine,2005[20] | ||
| 安登布鲁克认知检查(ACE) | 0.75/0.84 (AD比FTD) | Mathuranath, 2000[42] | ||
| 测试你的记忆(TYM) | 0.93/0.76 (AD比NC) | Postel-Vinay,2014[60] | ||
| 单领域测试 | 记忆功能 | |||
| 霍普金斯词语学习测试(HVLT) | 0.95/0.93 (AD比NC) | Shi, 2012[68] | ||
| 加利福尼亚词语学习测试(CVLT) | 0.90/0.84(MCI比NC) | Rabin,2009[69] | ||
| 雷氏听觉词语学习测试(RAVLT) | 0.50/0.97(AD比其他痴呆) | Gainotti,1998[70] | ||
| 延迟故事回忆测试(DSR) | 0.98/0.94 (轻度AD比NC)0.90/0.80(MCI比NC) | Shi,2014[73] | ||
| 自由和线索选择性回忆测试(FCSRT) | 0.80/0.90(极轻AD比MCI) | Sarazin,2007[78] | ||
| 分类线索回忆测试(CCR) | 0.88/0.89 (极轻AD比NC) | Vogel,2007[79] | ||
| 执行功能 | ||||
| 连线测试(TMT-B) | 0.69/0.67 (MCI比NC)0.72/0.67(MCI/AD比NC)0.81/0.67(AD比MCI) | Ashendorf, 2008[83] | ||
| 维多利亚Stroop测试(VST) | 有局限性(AD比NC) | Bayard,2011[81] | ||
| 威斯康辛卡片分类测试(WCST) | 非持续错误数0.84;持续错误数0.933;达成的类别数0.813(轻度AD比NC) | Paolo,1996[82] | ||
| 视空间功能 | ||||
| 画钟测试(CDT) | 0.67/0.97 (极轻AD比NC) | Lee,1996[99] | ||
| 雷-奥复杂图形测试(ROCFC) | 0.8/0.90(检测阴性应答偏倚) | Reedy,2013[115] | ||
| 语言功能 | ||||
| 语言流畅测试(VFT) | 0.73/0.82(PD有认知损害比PD无认知损害) | Torralva,2015[119] | ||
| 波士顿命名测验-12项(BNT-12) | 0.85/0.94(AD比NC) | Serrano,2001[127] | ||
| 分级命名测试(GNT) | 1.00/0.78 (MCI比sNC) | Ahmed,2008[130] | ||
| 受控口头词语联想测试(COWAT) | 0.81/0.84(AD比SIVD) | Kohnert,1998[126] | ||
注:AD:阿尔茨海默病;FTD:额颞叶痴呆;MCI:轻度认知损害;NC:正常认知;PD:帕金森病
2.DSR是最敏感的情景记忆测试,可有效区分MCI与NC、痴呆与NC、MCI与痴呆,以及预测MCI的进展(Ⅰ类证据、A级推荐),适用于MCI及痴呆的筛查(Ⅰ类证据、A级推荐),也可用于AD与DLB的鉴别(Ⅱ类证据、C级推荐),筛查性能受语言、年龄、教育的影响(Ⅰ类证据、A级推荐)。
3. HVLT可用于情景记忆测试,是有效的痴呆筛查工具,但对MCI的检测效度逊于痴呆(Ⅰ类证据、A级推荐);延迟回忆分界值可改善其诊断性能(Ⅰ类证据、B级推荐),但得分受语言、年龄影响(Ⅰ类证据、A级推荐)。
4. FCSRT能有效区分遗忘型AD早期阶段与MCI未转化者(Ⅰ类证据、A级推荐),CCR可显著区分极轻的AD与NC(Ⅱ类证据、B级推荐)。
5. TMT-A可用于检测视空间功能损害,完成时间秒数可显著区分NC、MCI、AD(Ⅰ类证据、A级推荐),但错误率的证据尚未建立(Ⅰ类证据、A级推荐)。TMT-B可用于检测执行功能损害,完成时间秒数可显著区分NC、MCI、AD(Ⅰ类证据、A级推荐),错误率也可显著区分NC与MCI和AD,但区分MCI与AD的证据尚未建立(Ⅰ类证据、A级推荐)。TMT-A和TMT-B错误率和完成时间均分别与年龄或教育有关(Ⅰ类证据、A级推荐)。
6.CDT复制钟表部分检测视空间功能,画钟部分检测执行功能,可用于痴呆的筛查(Ⅰ类证据、A级推荐),但对AD早期阶段和MCI不敏感,不能预测MCI的进展,不适用于AD早期和MCI的筛查(Ⅰ类证据、A级推荐);CDT画钟分数可用于AD与FTD的鉴别,但区分AD与VaD、DLB、PDD的价值有限(Ⅰ类证据、B级推荐),测试成绩与教育水平有关(Ⅱ类证据、B级推荐),与语言无关(Ⅰ类证据、A级推荐)。
7.Stroop测试错误率可检测执行功能损害,适用于快速区分AD与NC(Ⅱ类证据、B级推荐),但测试成绩与教育水平有关(Ⅱ类证据、B级推荐),完成时间可能与年龄有关(Ⅱ类证据、C级推荐)。
8. WCST-64版可用于检测痴呆患者的执行功能损害(Ⅱ类证据、B级推荐),且得分与年龄无关,WCST-128版的错误率与年龄显著相关(Ⅱ类证据、B级推荐),WCST-54版检测认知损害可能较两个传统版有优势,但尚需进一步研究证据支持(Ⅱ类证据、C级推荐)。
9.VFT得分可区分NC与MCI/VaMCI、AD/VaD(Ⅰ类证据、B级推荐),也可区分NC与PD认知损害(Ⅱ类证据、B级推荐),可用于痴呆和MCI筛查(Ⅰ类证据、A级推荐),但得分受教育程度影响(Ⅰ类证据、A级推荐)。
10. BNT可用于AD的筛查,且测试成绩不受年龄或教育的影响(Ⅰ类证据、B级推荐),但可能受语言的影响(Ⅱ类证据、C级推荐)。
11.COWAT和RAVLT可能有助于区别AD与SIVD(Ⅱ类证据、C级推荐)。
参加讨论的指南组专家(按姓氏笔划排序):于恩彦(浙江省人民医院精神科);于宝成(解放军白求恩国际和平医院老年医学科);王华丽[北京大学精神卫生研究所(第六医院)];王荫华(北京大学第一医院神经科);王爱民(长沙市第一医院神经科);王铭维(河北医科大学第一医院神经科);王鲁宁(解放军总医院南楼神经科);王新平(天津市环湖医院神经科);田金洲(北京中医药大学东直门医院脑病科);纪勇(天津市环湖医院神经科);杜怡峰(山东省立医院神经科);肖卫忠(北京大学第三医院神经科);时晶(北京中医药大学东直门医院脑病科);何金彩(温州医科大学附属第一医院神经科);况伟宏(四川大学华西医院心理卫生中心);张守字(北京老年医院精神心理科);张新卿(首都医科大学宣武医院神经科);屈秋民(西安交通大学医学院第一附属医院神经科);秦斌(北京医院神经科);晏勇(重庆医科大学附属第一医院神经内科);唐牟尼(广州市脑科医院老年精神科);黄流清(第二军医大学长征医院神经科);解恒革(解放军总医院南楼神经科);樊东升(北京大学第三医院神经科)





















