
近20年,我国临床实践指南的数量快速增长,质量也在稳步提升,但相较于国际组织或机构所制订的指南仍存在一定差距。为进一步了解我国指南最新现状和质量,近期,中华医学会杂志社指南与标准研究中心、WHO指南实施与知识转化合作中心对2020年中华医学会系列杂志发表的指南进行了全面的方法学质量和报告质量评价。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
中华医学会和中华医学会杂志社高度重视系列杂志所刊发指南的水平和质量,以及指南发布后的传播与实施。中华医学会杂志社曾于2016年专门刊发了制订和修订指南的基本方法和程序;2020年10月与WHO指南实施与知识转化合作中心共同成立了中华医学会杂志社指南与标准研究中心,致力于指南质量的提升,并将中国高水平的指南推向国际。在2021年4月17—18日举办的临床实践指南方法学培训班上,发布了中华医学会系列杂志高质量临床实践指南排名前三的名单,分别是:《中国儿童阻塞性睡眠呼吸暂停诊断与治疗指南(2020)》《2020中国系统性红斑狼疮诊疗指南》和《中国高尿酸血症与痛风诊疗指南(2019)》。本文介绍了此次指南评价的核心步骤,并对前三名指南进行了简要分析,以帮助指南制订者更好地了解指南制订的要求,该评价结果也可为医务人员和患者筛选、区分高质量指南提供重要参考。
近20年,我国临床实践指南的数量快速增长,质量也在稳步提升,但相较于国际组织或机构所制订的指南仍存在一定差距。为进一步了解我国指南最新现状和质量,近期,中华医学会杂志社指南与标准研究中心、WHO指南实施与知识转化合作中心对2020年中华医学会系列杂志发表的指南进行了全面的方法学质量和报告质量评价。
整个评价过程尽可能做到科学、严谨和透明,核心步骤如下:
第一,成立有代表性的多学科指南评价工作组。本次评价工作成立了四个专门小组,分别为指导委员会、方法学评价组、临床评价组和质量控制组。其中指导委员会主要起草评价计划、组织成立其他小组和管理协调工作;方法学评价组主要负责指南样本的检索、筛选、信息提取和具体评价;临床评价组主要负责对被纳入指南进行评价;质量控制组主要负责审核、质控指南评价的数据和结果。共邀请到来自28个机构、21个专业的62名人员参与了本次评价工作。所有评价人员均声明了利益关系,填写了利益冲突声明表,且不得评价由本人参与制订的指南。
第二,明确评价样本的来源和方法。本次纳入评价的指南需同时符合以下三个标准:(1)符合美国国家医学院[National Academy of Medicine,NAM;原美国医学科学院(Institute of Medicine,IOM)]1990年对指南的定义(针对特定的临床情况、系统制订的帮助医务人员和患者作出恰当处理决定的指导性建议)或2011年的定义(基于系统评价的证据和平衡了不同干预措施的利弊,在此基础上形成的能够为患者提供最佳保健服务的推荐意见);(2)需为中华医学会系列杂志2020年正式发表的指南;(3)指南第一作者的所属单位在中国或指南第一发布机构在中国。
第三,同时使用国际三大权威指南质量评价工具。为保障评价工作的科学性和全面性,工作组首次同时采用了国际三大权威评价工具,分别为IOM指南评价标准、中国临床指南评价体系(appraisal of guidelines for research and evaluation in China,AGREE-China)和卫生保健实践指南的报告条目(reporting items for practice guidelines in healthcare,RIGHT),分别从方法学质量和报告质量两个维度进行评价。IOM指南评价标准包含8个条目,评价人员根据每个条目是否满足标准选择"是"或"否",指南评价结果以选择"是"的条目比例表示。AGREE-China评价体系包含15个条目,每个条目的分值介于0~5分,评价人员根据评分标准说明对每个条目进行评分,并按照每个条目的评分结果和对应的权重(每个条目权重为×0.5、1或2)计算每部指南的总分(满分为100分)。RIGHT报告清单包含22个主条目和13个亚条目,共计35个条目,每个条目根据指南相关信息完整情况选择"报告"或"未报告",每部指南计算总体报告率。经过指导委员会的讨论和共识,每部指南综合得分计算方法为AGREE-China总分×40%+RIGHT总体报告率×100分×40%+IOM评价结果×100分×20%。
本次评价工作共纳入177部指南。每部指南由2名方法学人员和1名临床人员分别进行独立评价。在经过质量控制组审核数据后,形成指南评价综合得分和排序。其中《中国儿童阻塞性睡眠呼吸暂停诊断与治疗指南(2020)》《2020中国系统性红斑狼疮诊疗指南》和《中国高尿酸血症与痛风诊疗指南(2019)》分别以95.7、85.1和83.8分位列综合得分前三。
方法学质量方面:这三部指南的AGREE-China总分分别为95.0、89.0和83.5分,高于国际指南的平均得分(46.0分)和177部指南的平均得分(32.9分)。IOM评价结果分别为8/8、7/8和6/8。优势主要体现在:(1)指南制订小组由相关的多学科团队组成;(2)明确指出制订指南的背景(必要性和疾病负担等)、目的、使用者和应用对象;(3)有明确的临床问题并可以按照PICO(Population,Intervention,Comparison and Outcome,即人群、干预、对照和结局,)原则进行解构;(4)对证据的检索有明确的数据库或平台、时间范围、检索词等,并尽可能提供了证据的检索策略以及相关的参考文献;(5)对检索到的证据进行综合,针对临床问题形成证据体并采用GRADE证据分级系统进行证据质量评价和分级;(6)有明确的从证据到形成推荐意见的相关方法,如德尔菲法、共识形成会议法等,并在推荐意见的形成过程中考虑了证据以外的其他因素;(7)指南推荐意见的有效性与安全性均有具体疗效数据作为支撑;(8)在指南制订过程中明确了利益冲突;(9)指南整体表达清晰且规范,易于获得、理解和推广。
报告质量方面:三部指南的RIGHT总体报告率分别为94.3%、80.0%和88.6%,高于国际高质量指南代表——WHO指南的平均水平(78.0%),也远高于177部指南的平均水平(33.5%)。优势主要体现在:(1)明确报告推荐意见的执行总结、指南相关术语和缩略语等基本信息;(2)明确报告指南的相关卫生问题、目的、目标人群、使用者、制订工作组等背景信息;(3)指明指南关注卫生问题及其结局的遴选方法;(4)描述指南证据的检索及证据体质量的评价方法;(5)推荐意见清晰,并考虑亚组人群;(6)明确推荐意见强度及相应证据的质量分级。
同时,这三部指南也存在值得改进的方面,主要体现在:(1)在制订推荐意见时未考虑具体卫生经济学问题;(2)未阐明资金在推荐意见的传播和实施过程中所起的作用;(3)未详述指南的具体更新计划;(4)缺少指南制订后的外部评审具体环节。
综上,通过对中华医学会系列杂志发表的指南的方法学和报告质量进行评价,不仅可以帮助指南制订者更好地了解指南制订的要求,发现问题和不足,不断改进;评价结果也可以作为医务人员和患者筛选和区分高质量指南的重要参考。下一步,中华医学会杂志社指南与标准研究中心、WHO指南实施与知识转化合作中心将继续完善评价体系,扩大评价指南的范围,发布更为全面的评价报告,进而推动高质量指南在中国的制订、传播和应用。




















