
评价《中华医学杂志》发表的Meta分析文献的方法学质量和报告质量。
计算机检索及手工检索1998年1月至2014年10月《中华医学杂志》公开发表的Meta分析文献,采用Meta分析方法学质量评价工具(AMSTAR)量表进行方法学质量评价,采用Meta分析优先报告条目(PRISMA)量表进行报告质量评价。
共纳入文献74篇。纳入文献的方法学质量评分为3~10(中位数7)分,高质量者10篇(13.5%),中等质量者61篇(82.4%),低质量者3篇(4.1%),各年AMSTAR得分比较差异无统计学意义(χ2=10.205,P=0.423);其中"是否提供了纳入和排除的研究文献清单"、"是否说明相关利益冲突"、"发表情况是否已考虑在纳入标准中,如灰色文献"及"是否评估了发表偏倚的可能性"符合率较低。报告质量评分为5.5~26(中位数20)分,≤15分有9篇(12.2%),15.5~21分有39篇(52.7%),21.5~27分有26篇(35.1%),各年PRISMA得分比较差异有统计学意义(F=4.301,P=0.000),2010年得分最高。其中结构式摘要、引言目的,方法中的方案和注册、资料提取、资料条目、单个研究存在的偏倚、研究间偏倚、补充分析,结果中的研究筛选、研究内部偏倚风险、研究间偏倚、补充分析,讨论中的研究局限性、结论、资金支持等报告不够全面。
《中华医学杂志》发表的Meta分析文献方法学质量和报告质量总体较高,可为临床决策提供良好的证据,但仍需按照Meta分析的写作要求不断提高。
版权归中华医学会所有。
未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。
Meta分析是将两个或多个相似研究结果进行定量综合分析的方法,包括提出问题、检索相关研究文献、制定文献纳入及排除标准、描述基本信息、定量综合分析等一系列过程[1],是循证医学的最高级别证据,其质量的高低直接影响着临床医师的决策。Meta分析质量评价包括方法学质量评价和报告质量评价两方面[2]。《中华医学杂志》1915年创刊,即将迎来百年诞辰,已成为现今我国科技期刊中刊龄最长、在国内外影响最大的中文综合性医学科技期刊,2001年获国家新闻出版总署推出的"中国期刊方阵"医药卫生期刊首位"双高期刊"(即高知名度,高学术水平期刊)[3]。本研究采用Meta分析方法学质量评价工具(AMSTAR)和Meta分析优先报告条目(PRISMA)量表对《中华医学杂志》1998年1月至2014年10月发表的Meta分析文献的方法学质量和报告质量进行评价,报道如下。
计算机检索万方医学网,以《中华医学杂志》作为检索期刊,以标题"Meta"或"荟萃分析"或"系统评价"为检索词进行检索,检索时间从万方医学网建库至2014年10月,同时辅以手工检索查找涉及Meta分析的最新文献。
纳入《中华医学杂志》1998年1月至2014年10月发表的关于Meta分析的文献,排除方法学介绍、个人观点和以简报形式发表的有关Meta分析的文献及系统综述文献。
采用AMSTAR量表[4]评价方法学质量,该量表共11个条目,每一条目回答"是"者记1分,回答"否"、"不清楚"、"未提及"者记0分,其中得分0~4分为低质量,5~8分为中等质量,9~11分为高质量。采用PRISMA量表[5]评价报告质量,该量表共7个方面27个条目,各条目评为"充分符合"记1分,"部分符合"记0.5分,"不符合"记0分,总分27分,得分≤15分者为有相对严重的信息缺陷,15.5~21分者为报告有一定缺陷,21.5~27分者为报告相对完全。由2名研究者根据纳入和排除标准进行文献筛选,采用EpiData 3.1软件建立数据库并独立录入数据,若遇分歧,通过讨论或参考第三者意见以求一致。提取资料包括研究特征(第一作者单位、收稿日期、发表年份、所属学科、基金支持等),AMSTAR量表的11个条目和PRISMA量表的27个条目。
采用SPSS 18.0软件对数据进行分析,计量资料组间比较采用独立样本t检验、方差分析、秩和检验;计数资料比较采用χ2检验或Fisher确切概率法,P<0.05为差异有统计学意义。
共检出93篇文献,剔除19篇内容不符文献,共纳入74篇文献[6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79]。其中,作者人数3~6名占73%,63篇(85.1%)文献的第一作者来自省级及以上医院;15篇(20.3%)文献内容来自肿瘤科,12篇(16.2%)来自呼吸内科;49篇(66.2%)的作者单位数量为1个;15篇(20.3%)文献有医学院校或者循证医学中心参与;14篇(18.9%)来自北京,13篇(17.6%)来自上海;24篇(32.4%)有省级以上课题资助。1998至2014年《中华医学杂志》发表Meta分析文献数量呈逐渐上升趋势(图1)。


按照AMSTAR的判定标准,纳入文献的方法学质量评分为3~10(中位数7)分,高质量者10篇(13.5%),中等质量者61篇(82.4%),低质量者3篇(4.1%)。1998至2014年各年AMSTAR得分比较差异无统计学意义(χ2=10.205,P=0.423)。其中"是否提供了纳入和排除的研究文献清单"、"是否说明相关利益冲突"、"发表情况是否已考虑在纳入标准中,如灰色文献"及"是否评估了发表偏倚的可能性"符合率较低。按AMSTAR量表公布时间分类,2010年之前与2010年之后发表的Meta分析文献的AMSTAR得分差异无统计学意义(t=0.247,P=0.806)(表1)。

《中华医学杂志》74篇Meta分析文献的方法学质量评价[篇(%)]
《中华医学杂志》74篇Meta分析文献的方法学质量评价[篇(%)]
| 条目 | 2010年前(n=32) | 2010年后(n=42) | 合计(n=74) | χ2值 | P值 |
|---|---|---|---|---|---|
| 1.是否提供前期设计方案 | 31(96.9) | 42(100.0) | 73(98.6) | – | 0.432a |
| 2.纳入研究的选择和数据提取是否具有可重复性 | 30(93.8) | 41(97.6) | 71(95.9) | – | 0.575a |
| 3.是否实施广泛全面的检索 | 28(87.5) | 41(97.6) | 69(93.2) | – | 0.159a |
| 4.发表情况是否已考虑在纳入标准中,如灰色文献 | 10(31.3) | 6(14.3) | 16(21.6) | 3.084 | 0.079 |
| 5.是否提供了纳入和排除的研究文献清单 | 0(0.0) | 0(0.0) | 0(0.0) | – | – |
| 6.是否描述纳入研究的特征 | 28(87.5) | 38(90.5) | 66(89.2) | – | 0.720a |
| 7.是否评价和报道纳入研究的科学性 | 26(81.3) | 32(76.2) | 58(78.4) | 0.274 | 0.600 |
| 8.纳入研究的科学性是否恰当的运用在结论的推导上 | 30(93.8) | 41(97.6) | 71(95.9) | – | 0.575a |
| 9.合成纳入研究结果的方法是否恰当 | 31(96.9) | 41(97.6) | 72(97.3) | – | 0.999a |
| 10.是否评估了发表偏倚的可能性 | 14(43.8) | 22(52.4) | 36(48.6) | 0.542 | 0.462 |
| 11.是否说明相关利益冲突 | 2(6.3) | 1(2.4) | 3(4.1) | – | 0.575a |
注:a Fisher确切概率法
按照PRISMA评分标准,纳入文献的质量评分为5.5~26(中位数20)分,≤15分有9篇(12.2%),15.5~21分有39篇(52.7%),21.5~27分有26篇(35.1%)。1998至2014年各年PRISMA得分比较差异有统计学意义(F=4.301,P=0.000),其中2010年得分最高,为(22.43±3.23)分。其中结构式摘要、引言目的,方法中的方案和注册、资料提取、资料条目、单个研究存在的偏倚、研究间偏倚、补充分析,结果中的研究筛选、研究内部偏倚风险、研究间偏倚、补充分析,讨论中的研究局限性、结论、资金支持等报告不够全面(表2)。

《中华医学杂志》74篇Meta分析文献的报告质量评价[篇(%)]
《中华医学杂志》74篇Meta分析文献的报告质量评价[篇(%)]
| 项目 | 条目 | 充分符合 | 部分符合 | 不符合 |
|---|---|---|---|---|
| 标题 | 题目 | 74(100.0) | 0(0.0) | 0(0.0) |
| 摘要 | 结构式格式 | 38(51.4) | 34(45.9) | 2(2.7) |
| 引言 | 合理性 | 68(91.9) | 5(6.8) | 1(1.3) |
| 目的 | 8(10.8) | 56(75.7) | 10(13.5) | |
| 方法 | 方案和注册 | 0(0.0) | 74(100.0) | 0(0.0) |
| 纳入标准 | 70(94.6) | 4(5.4) | 0(0.0) | |
| 信息来源 | 65(87.8) | 9(12.2) | 0(0.0) | |
| 检索 | 54(73.0) | 16(21.6) | 4(5.4) | |
| 研究选择 | 50(67.6) | 13(17.6) | 11(14.8) | |
| 资料提取 | 42(56.8) | 15(20.2) | 17(23.0) | |
| 资料条目 | 29(39.2) | 12(16.2) | 33(44.6) | |
| 单个研究存在的偏倚 | 48(64.9) | 5(6.8) | 21(28.3) | |
| 效应指标 | 56(75.7) | 5(6.8) | 13(17.5) | |
| 合成结果 | 69(93.2) | 1(1.4) | 4(5.4) | |
| 研究间偏倚 | 39(52.7) | 2(2.7) | 33(44.6) | |
| 补充分析 | 38(51.4) | 4(5.4) | 32(43.2) | |
| 结果 | 研究筛选 | 23(31.1) | 39(52.7) | 12(16.2) |
| 研究特征 | 62(83.8) | 7(9.5) | 5(6.7) | |
| 研究内部偏倚风险 | 45(60.8) | 12(16.2) | 17(23.0) | |
| 单个研究的结果 | 65(87.8) | 5(6.8) | 4(5.4) | |
| 合成结果 | 69(93.2) | 2(2.7) | 3(4.1) | |
| 研究间偏倚 | 36(48.6) | 3(4.1) | 35(47.3) | |
| 补充分析 | 46(62.2) | 2(2.7) | 26(35.1) | |
| 讨论 | 证据总结 | 65(87.8) | 9(12.2) | 0(0.0) |
| 局限性 | 44(59.5) | 20(27.0) | 10(13.5) | |
| 结论 | 8(10.8) | 66(89.2) | 0(0.0) | |
| 资金支持 | 资金 | 4(5.4) | 3(4.1) | 67(90.5) |
偏倚是影响Meta分析质量的主要因素,只有采取必要的措施避免或消除偏倚来源,减小偏倚影响的程度,才能确保研究结果的真实性。方法学质量评价主要就是评估在Meta分析的研究设计、实施过程中如何对偏倚进行控制。自2007年AMSTAR问世以来,得到了国内外学者的广泛应用,成为Meta分析方法学质量研究的推荐工具,具有良好的信度和效度[80]。本研究发现,《中华医学杂志》发表的Meta分析文献方法学质量均较高,且方法学质量与AMSTAR量表公布的时间前后差异无统计学意义(P>0.05),这与李杰等[81]分析《中华流行病学杂志》的方法学质量结果不同,说明《中华医学杂志》的作者具有良好的Meta分析数据处理与写作能力。另外,也说明《中华医学杂志》的编辑具有良好的科研把关能力,能够从众多的稿件中筛选出质量较高的稿件,剔除低质量的稿件,为读者把好质量关。但是,部分文献仍存在方法学质量方面的不足:(1)未提供纳入和排除的研究文献清单。提供纳入和排除文献清单,可让证据使用者判断选择文献的质量。国内期刊由于受到版面的限制而未在文后列出,因此,建议国内的期刊一方面加快数字化出版的步伐,摆脱版面的限制;另一方面,医学编辑或同行评议者在审稿过程中应向作者索取纳入和排除的研究文献清单,或者借鉴国外模式在期刊网络版中提供补充文件的措施[81],以保证选择文献的质量。(2)未说明相关利益冲突。作者应在文献特征部分列出纳入研究的资助来源。这在药物评价的Meta分析中尤为重要,医药公司资助的研究发表阴性结果的百分率较其他团体资助的要低,会对研究的结果产生消极影响,如果说明利益相关冲突,证据的使用者就会考虑是否存在高估研究结果的可能性[82]。本研究无一篇文献列出纳入研究的资助来源。这可能是国内作者对资助者在文章中所起作用的意识较差有关,与国外研究存在差距[81]。(3)纳入标准中未考虑发表情况,如灰色文献、文献语言等。该条目主要是评价发表偏倚和查询偏倚。阴性结果的研究要么不发表,要么只在一些非正规的刊物如会议摘要等上发表,如未纳入这些文献,很容易出现发表偏倚。因此,一方面作者在查阅文献时应对不同国家、不同语种的数据库进行查阅,并且应查阅会议记录等非正式刊物,如可能应与相关课题负责人或文献作者联系获取未发表的数据;另一方面期刊编辑不应随意否定那些设计科学、测量严谨、分析客观、结论正确的阴性结果文献。(4)未评估发表偏倚。发表偏倚可使Meta分析夸大治疗效应或危险因素的关联强度,导致临床个体治疗与卫生决策的失误。作者可通过绘制漏斗图或计算失安全系数来分析发表偏倚的原因,评估发表偏倚的程度。但在绘制漏斗图时应注意研究个数不应少于5个。(5)部分文献未评价和报道纳入研究的科学性。评价文献科学性的方法和工具较多,目前较常用的为Cochrance评价员手册和jadad量表,但无论使用哪种评价方法,都应该评价文献的内部真实性、外部真实性、影响结果解释的因素三方面的内容,评价时应采取多人或盲法评价,遇到分歧时通过讨论或请第三方解决,评价的结果应用文字和图表在文中交代。
报告质量主要反映Meta分析文献中各项指标和要素的全面性和完整度以及与Meta分析报告标准格式的吻合程度。虽然本研究纳入的Meta分析文献方法学质量较高,但仍存在一定不足:(1)结构式摘要报告不完整。结构式摘要应包括研究背景、目的、资料来源、纳入研究标准、研究对象和干预措施、研究评价和综合方法、结果、局限性、结论及注册号。本研究中只有38(51.4%)篇文献相对符合结构式摘要的报告要求,但这些文献对研究背景、纳入标准、研究评价方法和研究的局限性报告也不高。(2)引言过于简单。本研究大部分文献在引言中只简单介绍研究背景,未介绍研究设计类型(PICOS)相关资料。(3)方法部分中的方案和注册报告不完整。开展系统评价前应制定研究方案,并在相关网站上进行注册。这是系统评价区别于传统综述的重要方面,前期制定研究方案不仅可以减少偏倚的产生,而且能够使研究的过程更透明,减少重复评价。(4)方法部分中资料提取过程、资料条目、单个研究存在的偏倚、研究间偏倚、补充分析报告不完整。在方法中应介绍提取资料及获得数据的过程,并定义和列出所有的资料类型(如PICOS,资金来源)。应介绍评价每个研究的偏倚危险的方法,并说明在数据合成过程中如何使用这些方法及说明任何可能影响合成结果的偏倚(如发表偏倚及研究中选择性报告偏倚),如使用Cochrane协作网提供的"偏倚风险评估"工具并做分析。另外,应说明预先计划的补充分析方法(如敏感性分析,亚组分析及Meta回归分析等)。(5)结果部分的研究筛选、研究内部偏倚风险、研究间偏倚、补充分析报告不完整。结果部分应介绍检索、纳入标准、质量评价后的纳入研究的数目,每个阶段给出排除理由,最好能够提供流程图。应按方法部分中的单个研究存在的偏倚评价工具指出每个研究间可能存在的偏倚,并说明对结局影响的评估。研究间偏倚即发表偏倚,应评估是否存在发表偏倚,并绘制漏斗图或者计算失安全系数。(6)讨论部分的研究局限性、结论、资金支持报告不全面。结论应联合其他证据解释结果,给出对未来研究的启示。本研究大部分文献在讨论时过于强调文献的合成结果,未能结合文献质量、研究偏倚、结果真实性展开论述。
综上所述,《中华医学杂志》发表的Meta分析文献具有较高的方法学质量和报告质量,但方法学质量和报告质量仍不够完善,建议研究人员应根据AMSTAR量表和PRISMA量表的要求进行写作,确保高质量研究证据的产生。





















