论著
利用GoPubMed对乳腺癌研究的文献计量学分析
中华妇幼临床医学杂志(电子版), 2017,13(5) : 586-590. DOI: 10.3877/cma.j.issn.1673-5250.2017.05.015
摘要
目的

探讨采用GoPubMed对乳腺癌的相关研究文献进行文献计量学分析的可行性。

方法

采用文献计量学分析方法,选择"breast neoplasms" "breast cancer" "breast carcinoma" "mammary neoplasms"等为检索词,检索2004年1月1日至2016年4月29日被PubMed数据库收录的乳腺癌相关研究文献,共计获得符合本研究纳入、排除标准的文献98 462篇为研究对象。统计学分析其乳腺癌相关研究文献的高频主题词及发表文献的年份、国家、城市和期刊分布情况,以及研究方向,了解乳腺癌研究的现状及其发展趋势。

结果

在2004-2015年,PubMed数据库收录的乳腺癌相关研究的发文量呈逐年上升趋势。本研究在PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,发文量最多的国家为美国和中国,而发文量较大的地区和城市,则集中在北美和欧洲等西方发达国家,我国的北京和上海位列前10位发文量较大的城市之中。乳腺癌相关研究发文量较大的期刊,则主要集中在欧、美国家出版的期刊上,前10位发文量较大的期刊中,亚洲出版的期刊仅有1种。目前有关乳腺癌的研究,主要集中在该病发病年龄、基因突变和蛋白等方面。

结论

采用GoPubMed检索到的乳腺癌相关研究文献,能较好反映乳腺癌研究的现状和发展趋势。本研究对全球乳腺癌相关研究发文量的文献计量学分析结果可见,目前对乳腺癌的研究国家,主要集中在北美和欧洲国家。中国乳腺癌发文量位居世界第2位,主要集中在北京、上海2座城市,其他地区的乳腺癌研究发文量相对较小。

引用本文: 石薇, 郭玲玲, 雷华, 等.  利用GoPubMed对乳腺癌研究的文献计量学分析 [J/OL] . 中华妇幼临床医学杂志(电子版), 2017, 13(5) : 586-590. DOI: 10.3877/cma.j.issn.1673-5250.2017.05.015.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别申明,本刊刊出的所有文章不代表中华医学会和本刊编辑委员会的观点。

本刊为电子杂志,以光盘形式出版。本册应读者需求按需印刷,随光盘免费赠阅。光盘如有质量问题,请向编辑部调换。

乳腺癌是全球女性恶性肿瘤中发病率最高的恶性肿瘤,也是导致女性死亡率最高的恶性肿瘤,占恶性肿瘤导致女性死亡的14%[1]。根据《2011年中国恶性肿瘤发病和死亡分析》的结果显示,在中国女性中,发病率高居第1位的恶性肿瘤为乳腺癌[2]。2011年我国女性中乳腺癌患者为24.9×104例,乳腺癌发病率为37.86/105,近10年该病发病率呈逐年上升趋势[2]。2011年我国乳腺癌导致的死亡病例为6.0×104例,该病导致的患者死亡率为9.21/105[2]。由此可见,临床对于乳腺癌的防治形势仍十分严峻。

GoPubMed是德国Transinsight公司和德国德累斯顿大学合作,利用生物信息学相关知识开发的一个可以对PubMed数据库检索结果进行探索、分析的工具。相对于PubMed数据库,GoPubMed的优点在于对某一方面的研究,可直观得知研究时间、研究者及其所在地域、研究过程、研究动态和各种信息之间的相关性。GoPubMed的数据源与美国国立医学图书馆的PubMed数据库完全一致。GoPubMed本身并无数据库,其利用基因本体(gene ontology)和《医学主题词表》(Medical Subject Heading),对PubMed数据库检索结果进行探索和分析。其原理是将读者检索提问词提交给PubMed数据库,接收PubMed数据库的检索结果,利用基因本体和《医学主题词表》对检索结果进行提炼,利用算法从中提取基因本体术语和医学主题词,自动生成临时基因本体和《医学主题词表》,从而对检索结果进行分类,读者可以根据这些分类快速找到自己需要的文献,不需要对检索获得的所有文献逐一阅读,进而可节省时间。

本研究采用GoPubMed于PubMed数据库,自行检索2004年1月1日至2016年4月29日所有乳腺癌相关研究文献,对最终纳入本研究的文献进行文献计量学分析,旨在探讨采用GoPubMed对乳腺癌的相关研究文献进行文献计量学分析的可行性,为乳腺癌研究者提供新的研究思路。现将研究结果报道如下。

1 对象与方法
1.1 研究对象

选择采用GoPubMed于PubMed数据库,自行检索2004年1月1日至2016年4月29日所有乳腺癌相关研究文献,最终获得符合本研究纳入与排除标准的文献共计98 462篇为研究对象。

1.2 方法
1.2.1 纳入标准与排除标准

本研究乳腺癌相关研究文献的纳入标准:计算机检索获得的符合乳腺癌相关的诊断、治疗、预防和病理学研究的临床研究、临床试验或动物试验的文献;于2004年1月1日至2016年4月29日被PubMed数据库收录的文献。排除标准:排除非本次检索时间范围内的乳腺癌相关研究文献。

1.2.2 文献检索词

为了达到全面检索乳腺癌相关研究文献的目的,本研究采用的检索词包括:"breast neoplasms" "breast cancer" "breast carcinoma" " mammary neoplasms" 。

1.2.3 文献筛选

首先,采用GoPubMed自身功能对PubMed数据库中检索到的乳腺癌相关文献进行初步筛选。然后,由本研究课题组的2位研究者进行文献的第2次筛选。具体操作步骤为,这2位研究者分别独立逐一浏览所检索文献的题目、摘要和关键词,筛选符合本研究纳入、排除标准的研究文献。筛选过程中,若2位研究者意见发生分歧,则均对该文献进行全文阅读,共同确定该文献是否符合本研究纳入标准,若符合纳入标准,则予以纳入,若不符合纳入标准,则予以剔除。

1.3 统计学分析方法

采用GoPubMed统计学功能对PubMed数据库中检索获得的文献进行分析,得出乳腺癌相关研究文献的高频主题词及发表年份、国家、城市和期刊分布,并进行排序。

2 结果

本研究在GoPubMed中输入检索词"breast neoplasms" "breast cancer" "breast carcinoma" "mammary neoplasms"进行检索,检索时间范围为2004年1月1日至2016年4月29日,获得符合本研究纳入及排除标准的乳腺癌相关研究文献共计98 462篇。

2.1 乳腺癌相关研究文献的高频主题词分布

本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,前20个乳腺癌相关研究的高频主题词及其出现频率比较,见表1。其中,"breast neoplasms"主题词出现的频率最高,在90 038篇乳腺癌相关研究文献中均出现。

点击查看表格
表1

98 462篇乳腺癌相关研究文献中,前20个乳腺癌相关研究的高频主题词及其出现频率比较

表1

98 462篇乳腺癌相关研究文献中,前20个乳腺癌相关研究的高频主题词及其出现频率比较

高频主题词词频(次)
breast neoplasms90 038
humans74 011
female66 298
patients44 827
neoplasms38 490
middle aged27 861
adult23 262
evaluation studies as topic22 814
woman22 565
aged20 998
research report19 633
diagnosis17 128
survival16 676
proteins16 377
genes16 143
neoplasm metastasis15 862
carcinoma14 891
tissues14 573
cell line, tumor14 481
animals13 604
2.2 乳腺癌相关研究文献的年份分布

本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,其年份分布情况,见图1。PubMed数据库中,2010年以前的乳腺癌相关研究文献较少,2010年骤增至5 349篇,至2015年则高达19 960篇,并且2010-2015年乳腺癌相关研究发文量呈逐年上升趋势。

点击查看大图
图1
98 462篇乳腺癌相关研究文献的年份分布情况及其发文量比较
点击查看大图
图1
98 462篇乳腺癌相关研究文献的年份分布情况及其发文量比较
2.3 乳腺癌相关研究文献的发表国家、城市分布

本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,发文量前10位的国家,见图2;发表地区的可视化地图,见图3;发文量前10位的城市,见图4。其中,乳腺癌相关研究发文量最大的国家是美国,其次为中国。北美和欧洲等西方发达国家乳腺癌相关研究发文量较大;发文量最大的10座城市中,美国占了5座,包括波士顿、纽约、休斯顿、费城、贝塞斯达,中国进入乳腺癌相关研究发文量前10位的城市为北京和上海2座城市。

点击查看大图
图2
98 462篇乳腺癌相关研究文献中,发文量前10位的国家分布情况及其发文量比较
点击查看大图
图2
98 462篇乳腺癌相关研究文献中,发文量前10位的国家分布情况及其发文量比较
点击查看大图
图3
98 462篇乳腺癌相关研究文献的发表地区可视化地图
点击查看大图

注:黑点代表该地区乳腺癌相关研究发文量,黑点越密集,说明该地区乳腺癌相关研究发文量越大,反之则越小

图3
98 462篇乳腺癌相关研究文献的发表地区可视化地图
点击查看大图
图4
98 462篇乳腺癌研究相关文献中,发文量前10位的城市分布情况及其发文量比较
点击查看大图

注:1表示PLos One,2表示Breast Cancer Research and Treatment,3表示Asian Pacific Journal of Cancer Prevention,4表示BMC Cancer,5表示Oncotarget,6表示Breast Cancer Research,7表示Journal of Clinical Oncology,8表示Breast,9表示Cancer Research,10表示Annals of Surgical Oncology

图4
98 462篇乳腺癌研究相关文献中,发文量前10位的城市分布情况及其发文量比较
2.4 发表乳腺癌相关研究文献的期刊分布

本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,发文量前10位的期刊及其发文量比较,见图5。从该图中可见,发文量最大的期刊是美国出版的PLoS One,其次是荷兰出版的Breast Cancer Research and Treatment和泰国出版的Asian Pacific Journal of Cancer PreventionAsian Pacific Journal of Cancer Prevention,作为亚洲唯一一种进入发文量前10位的期刊,其发文量仅约为前2位期刊的50%,中国出版的期刊无一本进入发文量前10位阵列。

点击查看大图
图5
98 462篇乳腺癌相关研究文献中,发文量前10位的期刊及其发文量比较
点击查看大图
图5
98 462篇乳腺癌相关研究文献中,发文量前10位的期刊及其发文量比较
3 讨论

我国乳腺癌发病率,随着女性年龄的增加而增高[3]。在>30岁女性人群中,乳腺癌发病率随着年龄的增加而快速增高,在55~60岁女性人群中,乳腺癌发病率达到高峰,为90.64/105,>60岁女性人群中,乳腺癌发病率持续处于较高水平[2]。乳腺癌导致的患者病死率,也随着患者年龄增加而增高,在>85岁女性人群中,乳腺癌导致的患者病死率达到高峰[2]。2015年,美国国立综合癌症网络(National Comprehensive Cancer Network,NCCN)公布的《乳腺癌临床诊疗指南(3版)》指出,2014年美国共有235 030例女性被诊断为浸润性乳腺癌,同年40 430例该病患者死于乳腺癌[4] 。过去10年,世界范围内乳腺癌发病率呈逐年上升趋势,而其导致的患者病死率呈逐年下降趋势,这得益于临床对该病的早期诊断及有效治疗[2]。相对其他恶性肿瘤,我国乳腺癌患者的5年总体生存(overall suivival,OS)率可达72.7%[2],相对较高。2011年,美国癌症研究协会公布的资料显示,无组织转移乳腺癌患者的5年OS率为98.3%,10年OS率为76.0%。术中未发现癌细胞转移的乳腺癌患者的5年OS率为96%,术中发现癌细胞转移的乳腺癌患者的5年OS率为21%[2]。由此可见,乳腺癌患者通过临床早期诊断和有效治疗,其5年OS率可达到较高水平,而晚期乳腺癌患者的5年OS率则尚不容乐观。

本研究对2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献的高频主题词进行分析的结果显示,现代医学已经开始关注乳腺癌的相关基因(genes)和蛋白(proteins)水平的研究[5,6,7]涉及乳腺癌相关基因与蛋白的文献分别占本研究的16.40%(16 143/98 462)与16.63%(16 377/98 462)。这些乳腺癌相关研究的结果显示,乳腺癌的发生、发展及预后,是涉及多基因[7,8,9]、多蛋白[10]的复杂生物学过程。2015年,第38届圣安东尼奥乳腺癌大会,即美国乳腺癌大会,提供了包括最新的关于乳腺癌的外科治疗和放射治疗的临床研究,以及辅助治疗和新辅助治疗的临床研究,尤其是内分泌治疗、靶向治疗和免疫治疗。

中国传统医学的研究结果发现,针灸可通过提高机体免疫功能,从而起到预防疾病和抵抗疾病的目的。是否可将针灸应用于预防乳腺癌的发生和癌细胞转移,是传统医学研究值得探索的方向。

本研究对2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究中,前20个乳腺癌相关研究的高频主题词及其出现频率的分析结果显示,目前有关乳腺癌的研究,主要集中在该病发病年龄、疾病诊断[11,12],患者OS期及蛋白水平[10]与基因突变[7,8,9]等的研究方面。

本研究对2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量变化可见,2010年后世界范围内对乳腺癌的认识逐渐增强,对乳腺癌的研究越来越重视,并且不断的获得新的研究成果。尽管如此,乳腺癌发病率却呈逐年上升趋势,并且严重影响患者的生活质量,增加社会和家庭的经济负担。因此,有关乳腺癌的预防、早诊断及早治疗等方面的研究,成为目前研究的热点。

本研究结果显示,2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量最大的国家为美国[13],其次为中国[14]。2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量前10位城市中,美国占了5座,中国为北京和上海2座城市。2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究文献发表地区的可视化地图中可见,北美和欧洲等西方发达国家的乳腺癌相关研究的发文量较大,这与北美和欧洲等西方发达国家乳腺癌发病率高[13],已成为严重影响这些国家女性生命和生活质量的疾病有关。根据美国癌症研究所(National Cancer Institute)的流行病学监测及最终结果(Surveillance Epidemiology and End Results, SEER)数据显示,美国自1975年开展乳腺癌筛查和早期诊断以来,1975-2006年发现的非浸润性乳腺癌发病率从5.8/105上升至32.5/105。由此可见,美国女性浸润性乳腺癌发病率,呈先升后降趋势,但总体而言,乳腺癌导致的患者病死率却呈持续下降趋势[15]。文献报道,亚洲地区乳腺癌发病率虽然低于欧、美国家,但增长速率很快,而且患者发病年龄呈年轻化趋势[16]。在我国,北京、上海、天津、广州等大城市的乳腺癌发病率较高,农村则较低,因此乳腺癌又被授予"城市女性第一杀手"的称号。北京、上海属于发达地区,较西部地区集中了更多的优秀人才、研究机构和更先进的医疗器械,因此,北京、上海地区的乳腺癌相关研究发文量较大。

本研究结果显示,2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量前10位期刊中,只有Asian Pacific Journal of Cancer Prevention为东南亚多国联合主办的国际肿瘤专业期刊,其他均为欧美国家出版的肿瘤专业期刊。这从一定程度上也印证了上述乳腺癌相关研究的地域差别。

综上所述,乳腺癌是全球女性恶性肿瘤中发病率最高的恶性肿瘤,北美和欧洲等西方发达国家该病发病率相对较高,而亚洲国家该病发病率增长速度较快,并且随着女性地位的提升、寿命的延长,乳腺癌越来越受到公众的关注[17]。中国作为人口大国,人口基数大,东部发达地区的乳腺癌发病率较西部欠发达地区高,而且东部地区经济发达,拥有更多资源开展乳腺癌相关研究,这使我国乳腺癌相关研究发文量排名靠前。本研究可从不同的角度揭示乳腺癌的目前研究现状和研究方向,对乳腺癌研究者及研究机构拟定新的研究方向,可提供一定参考。

参考文献
[1]
韩雪谢梦赵佳. 2002-2012年上海市杨浦区女性人群乳腺癌的发病和生存情况分析[J]. 中华疾病控制杂志,2015, 19(7): 708-711.
[2]
陈万青郑荣寿. 中国女性乳腺癌发病死亡和生存状况[J]. 中国肿瘤临床,2015, 42(13): 668-674.
[3]
冯新熠陆苏刘红. 亚洲国家及地区乳腺癌筛查指南的发展和实践[J]. 中国肿瘤临床,2015, 42(8): 451-454.
[4]
史双路潜杨萍. 乳腺癌就诊延误的研究现状[J]. 中华护理杂志,2015, 50(4): 468-471.
[5]
陈颖史春颖杨予川. FGFR2基因多态性与黑龙江地区女性乳腺癌相关性的研究[J]. 哈尔滨医科大学学报,2016, 50(1): 44-45.
[6]
包睿楠张瑞明. 乳腺癌相关生物因子的研究进展[J]. 世界最新医学信息文摘,2016, 16(8): 62-64.
[7]
张雪梅李宏江王达. 自噬相关基因ATG2B、ATG4D、ATG9B在浸润性乳腺癌中的表达及临床意义[J]. 四川大学学报(医学版), 2016, 47(2): 184-188.
[8]
ZhangZ, LiL, CaoS, et al. Gene delivery of TIPE2 inhibits breast cancer development and metastasis via CD8,T and NK cell-mediated antitumor responses[J]. Mol Immunol, 2017, 85: 230-237.
[9]
StratiA, MarkouA, ParisiC, et al. Gene expression profile of circulating tumor cells in breast cancer by RT-qPCR[J]. BMC Cancer, 2011, 11(1): 422.
[10]
TandiaM, MhiriA, PauleB, et al. Correlation between clinical response to sorafenib in hepatocellular carcinoma treatment and polymorphisms of P-glycoprotein (ABCB1) and of breast cancer resistance protein (ABCG2): monocentric study[J]. Cancer Chemother Pharmacol, 2017, 79(4): 759-766.
[11]
ChouYT, WinnAN, RosensteinDL, et al. Assessing disruptions in adherence to antidepressant treatments after breast cancer diagnosis[J]. Pharmacoepidemiol Drug Saf, 2017, 26(6): 676-684.
[12]
Porto-MascarenhasEC, AssadDX, ChardinH, et al. Salivary biomarkers in the diagnosis of breast cancer: a review[J]. Crit Rev Oncol Hematol, 2017, 110: 62-73.
[13]
LiCed. Breast cancer epidemiology[M]. Springer Press: New York, 2010: 331.
[14]
ChenW, SongH, ZhongR, et al. Risk of GWAS-identified genetic variants for breast cancer in a Chinese population: a multiple interaction analysis[J]. Breast Cancer Res Treat, 2013, 142(3): 637-644.
[15]
廖宁王坤吴一龙. NCCN乳腺癌临床指引(2003版)[J]. 循证医学,2003, 3(3): 167-192.
[16]
LiT, Mello-ThomsC, BrennanPC. Descriptive epidemiology of breast cancer in China: incidence, mortality, survival and prevalence[J]. Breast Cancer Res Treat, 2016, 159(3): 395-406.
[17]
周斌刘世伟高国璇. 2016年NCCN乳腺癌临床实践指南(第1版)更新与解读[J]. 中国实用外科杂志,2016, 36(10): 1066-1072.
 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词