
探讨采用GoPubMed对乳腺癌的相关研究文献进行文献计量学分析的可行性。
采用文献计量学分析方法,选择"breast neoplasms" "breast cancer" "breast carcinoma" "mammary neoplasms"等为检索词,检索2004年1月1日至2016年4月29日被PubMed数据库收录的乳腺癌相关研究文献,共计获得符合本研究纳入、排除标准的文献98 462篇为研究对象。统计学分析其乳腺癌相关研究文献的高频主题词及发表文献的年份、国家、城市和期刊分布情况,以及研究方向,了解乳腺癌研究的现状及其发展趋势。
在2004-2015年,PubMed数据库收录的乳腺癌相关研究的发文量呈逐年上升趋势。本研究在PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,发文量最多的国家为美国和中国,而发文量较大的地区和城市,则集中在北美和欧洲等西方发达国家,我国的北京和上海位列前10位发文量较大的城市之中。乳腺癌相关研究发文量较大的期刊,则主要集中在欧、美国家出版的期刊上,前10位发文量较大的期刊中,亚洲出版的期刊仅有1种。目前有关乳腺癌的研究,主要集中在该病发病年龄、基因突变和蛋白等方面。
采用GoPubMed检索到的乳腺癌相关研究文献,能较好反映乳腺癌研究的现状和发展趋势。本研究对全球乳腺癌相关研究发文量的文献计量学分析结果可见,目前对乳腺癌的研究国家,主要集中在北美和欧洲国家。中国乳腺癌发文量位居世界第2位,主要集中在北京、上海2座城市,其他地区的乳腺癌研究发文量相对较小。
版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。
除非特别申明,本刊刊出的所有文章不代表中华医学会和本刊编辑委员会的观点。
本刊为电子杂志,以光盘形式出版。本册应读者需求按需印刷,随光盘免费赠阅。光盘如有质量问题,请向编辑部调换。
乳腺癌是全球女性恶性肿瘤中发病率最高的恶性肿瘤,也是导致女性死亡率最高的恶性肿瘤,占恶性肿瘤导致女性死亡的14%[1]。根据《2011年中国恶性肿瘤发病和死亡分析》的结果显示,在中国女性中,发病率高居第1位的恶性肿瘤为乳腺癌[2]。2011年我国女性中乳腺癌患者为24.9×104例,乳腺癌发病率为37.86/105,近10年该病发病率呈逐年上升趋势[2]。2011年我国乳腺癌导致的死亡病例为6.0×104例,该病导致的患者死亡率为9.21/105[2]。由此可见,临床对于乳腺癌的防治形势仍十分严峻。
GoPubMed是德国Transinsight公司和德国德累斯顿大学合作,利用生物信息学相关知识开发的一个可以对PubMed数据库检索结果进行探索、分析的工具。相对于PubMed数据库,GoPubMed的优点在于对某一方面的研究,可直观得知研究时间、研究者及其所在地域、研究过程、研究动态和各种信息之间的相关性。GoPubMed的数据源与美国国立医学图书馆的PubMed数据库完全一致。GoPubMed本身并无数据库,其利用基因本体(gene ontology)和《医学主题词表》(Medical Subject Heading),对PubMed数据库检索结果进行探索和分析。其原理是将读者检索提问词提交给PubMed数据库,接收PubMed数据库的检索结果,利用基因本体和《医学主题词表》对检索结果进行提炼,利用算法从中提取基因本体术语和医学主题词,自动生成临时基因本体和《医学主题词表》,从而对检索结果进行分类,读者可以根据这些分类快速找到自己需要的文献,不需要对检索获得的所有文献逐一阅读,进而可节省时间。
本研究采用GoPubMed于PubMed数据库,自行检索2004年1月1日至2016年4月29日所有乳腺癌相关研究文献,对最终纳入本研究的文献进行文献计量学分析,旨在探讨采用GoPubMed对乳腺癌的相关研究文献进行文献计量学分析的可行性,为乳腺癌研究者提供新的研究思路。现将研究结果报道如下。
选择采用GoPubMed于PubMed数据库,自行检索2004年1月1日至2016年4月29日所有乳腺癌相关研究文献,最终获得符合本研究纳入与排除标准的文献共计98 462篇为研究对象。
本研究乳腺癌相关研究文献的纳入标准:计算机检索获得的符合乳腺癌相关的诊断、治疗、预防和病理学研究的临床研究、临床试验或动物试验的文献;于2004年1月1日至2016年4月29日被PubMed数据库收录的文献。排除标准:排除非本次检索时间范围内的乳腺癌相关研究文献。
为了达到全面检索乳腺癌相关研究文献的目的,本研究采用的检索词包括:"breast neoplasms" "breast cancer" "breast carcinoma" " mammary neoplasms" 。
首先,采用GoPubMed自身功能对PubMed数据库中检索到的乳腺癌相关文献进行初步筛选。然后,由本研究课题组的2位研究者进行文献的第2次筛选。具体操作步骤为,这2位研究者分别独立逐一浏览所检索文献的题目、摘要和关键词,筛选符合本研究纳入、排除标准的研究文献。筛选过程中,若2位研究者意见发生分歧,则均对该文献进行全文阅读,共同确定该文献是否符合本研究纳入标准,若符合纳入标准,则予以纳入,若不符合纳入标准,则予以剔除。
采用GoPubMed统计学功能对PubMed数据库中检索获得的文献进行分析,得出乳腺癌相关研究文献的高频主题词及发表年份、国家、城市和期刊分布,并进行排序。
本研究在GoPubMed中输入检索词"breast neoplasms" "breast cancer" "breast carcinoma" "mammary neoplasms"进行检索,检索时间范围为2004年1月1日至2016年4月29日,获得符合本研究纳入及排除标准的乳腺癌相关研究文献共计98 462篇。
本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,前20个乳腺癌相关研究的高频主题词及其出现频率比较,见表1。其中,"breast neoplasms"主题词出现的频率最高,在90 038篇乳腺癌相关研究文献中均出现。

98 462篇乳腺癌相关研究文献中,前20个乳腺癌相关研究的高频主题词及其出现频率比较
98 462篇乳腺癌相关研究文献中,前20个乳腺癌相关研究的高频主题词及其出现频率比较
| 高频主题词 | 词频(次) |
|---|---|
| breast neoplasms | 90 038 |
| humans | 74 011 |
| female | 66 298 |
| patients | 44 827 |
| neoplasms | 38 490 |
| middle aged | 27 861 |
| adult | 23 262 |
| evaluation studies as topic | 22 814 |
| woman | 22 565 |
| aged | 20 998 |
| research report | 19 633 |
| diagnosis | 17 128 |
| survival | 16 676 |
| proteins | 16 377 |
| genes | 16 143 |
| neoplasm metastasis | 15 862 |
| carcinoma | 14 891 |
| tissues | 14 573 |
| cell line, tumor | 14 481 |
| animals | 13 604 |
本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,其年份分布情况,见图1。PubMed数据库中,2010年以前的乳腺癌相关研究文献较少,2010年骤增至5 349篇,至2015年则高达19 960篇,并且2010-2015年乳腺癌相关研究发文量呈逐年上升趋势。


本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,发文量前10位的国家,见图2;发表地区的可视化地图,见图3;发文量前10位的城市,见图4。其中,乳腺癌相关研究发文量最大的国家是美国,其次为中国。北美和欧洲等西方发达国家乳腺癌相关研究发文量较大;发文量最大的10座城市中,美国占了5座,包括波士顿、纽约、休斯顿、费城、贝塞斯达,中国进入乳腺癌相关研究发文量前10位的城市为北京和上海2座城市。




注:黑点代表该地区乳腺癌相关研究发文量,黑点越密集,说明该地区乳腺癌相关研究发文量越大,反之则越小


注:1表示PLos One,2表示Breast Cancer Research and Treatment,3表示Asian Pacific Journal of Cancer Prevention,4表示BMC Cancer,5表示Oncotarget,6表示Breast Cancer Research,7表示Journal of Clinical Oncology,8表示Breast,9表示Cancer Research,10表示Annals of Surgical Oncology
本研究检索结果显示,2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献中,发文量前10位的期刊及其发文量比较,见图5。从该图中可见,发文量最大的期刊是美国出版的PLoS One,其次是荷兰出版的Breast Cancer Research and Treatment和泰国出版的Asian Pacific Journal of Cancer Prevention。Asian Pacific Journal of Cancer Prevention,作为亚洲唯一一种进入发文量前10位的期刊,其发文量仅约为前2位期刊的50%,中国出版的期刊无一本进入发文量前10位阵列。


我国乳腺癌发病率,随着女性年龄的增加而增高[3]。在>30岁女性人群中,乳腺癌发病率随着年龄的增加而快速增高,在55~60岁女性人群中,乳腺癌发病率达到高峰,为90.64/105,>60岁女性人群中,乳腺癌发病率持续处于较高水平[2]。乳腺癌导致的患者病死率,也随着患者年龄增加而增高,在>85岁女性人群中,乳腺癌导致的患者病死率达到高峰[2]。2015年,美国国立综合癌症网络(National Comprehensive Cancer Network,NCCN)公布的《乳腺癌临床诊疗指南(3版)》指出,2014年美国共有235 030例女性被诊断为浸润性乳腺癌,同年40 430例该病患者死于乳腺癌[4] 。过去10年,世界范围内乳腺癌发病率呈逐年上升趋势,而其导致的患者病死率呈逐年下降趋势,这得益于临床对该病的早期诊断及有效治疗[2]。相对其他恶性肿瘤,我国乳腺癌患者的5年总体生存(overall suivival,OS)率可达72.7%[2],相对较高。2011年,美国癌症研究协会公布的资料显示,无组织转移乳腺癌患者的5年OS率为98.3%,10年OS率为76.0%。术中未发现癌细胞转移的乳腺癌患者的5年OS率为96%,术中发现癌细胞转移的乳腺癌患者的5年OS率为21%[2]。由此可见,乳腺癌患者通过临床早期诊断和有效治疗,其5年OS率可达到较高水平,而晚期乳腺癌患者的5年OS率则尚不容乐观。
本研究对2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究文献的高频主题词进行分析的结果显示,现代医学已经开始关注乳腺癌的相关基因(genes)和蛋白(proteins)水平的研究[5,6,7]涉及乳腺癌相关基因与蛋白的文献分别占本研究的16.40%(16 143/98 462)与16.63%(16 377/98 462)。这些乳腺癌相关研究的结果显示,乳腺癌的发生、发展及预后,是涉及多基因[7,8,9]、多蛋白[10]的复杂生物学过程。2015年,第38届圣安东尼奥乳腺癌大会,即美国乳腺癌大会,提供了包括最新的关于乳腺癌的外科治疗和放射治疗的临床研究,以及辅助治疗和新辅助治疗的临床研究,尤其是内分泌治疗、靶向治疗和免疫治疗。
中国传统医学的研究结果发现,针灸可通过提高机体免疫功能,从而起到预防疾病和抵抗疾病的目的。是否可将针灸应用于预防乳腺癌的发生和癌细胞转移,是传统医学研究值得探索的方向。
本研究对2014年1月1日至2016年4月29日,PubMed数据库检索到的98 462篇乳腺癌相关研究中,前20个乳腺癌相关研究的高频主题词及其出现频率的分析结果显示,目前有关乳腺癌的研究,主要集中在该病发病年龄、疾病诊断[11,12],患者OS期及蛋白水平[10]与基因突变[7,8,9]等的研究方面。
本研究对2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量变化可见,2010年后世界范围内对乳腺癌的认识逐渐增强,对乳腺癌的研究越来越重视,并且不断的获得新的研究成果。尽管如此,乳腺癌发病率却呈逐年上升趋势,并且严重影响患者的生活质量,增加社会和家庭的经济负担。因此,有关乳腺癌的预防、早诊断及早治疗等方面的研究,成为目前研究的热点。
本研究结果显示,2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量最大的国家为美国[13],其次为中国[14]。2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量前10位城市中,美国占了5座,中国为北京和上海2座城市。2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究文献发表地区的可视化地图中可见,北美和欧洲等西方发达国家的乳腺癌相关研究的发文量较大,这与北美和欧洲等西方发达国家乳腺癌发病率高[13],已成为严重影响这些国家女性生命和生活质量的疾病有关。根据美国癌症研究所(National Cancer Institute)的流行病学监测及最终结果(Surveillance Epidemiology and End Results, SEER)数据显示,美国自1975年开展乳腺癌筛查和早期诊断以来,1975-2006年发现的非浸润性乳腺癌发病率从5.8/105上升至32.5/105。由此可见,美国女性浸润性乳腺癌发病率,呈先升后降趋势,但总体而言,乳腺癌导致的患者病死率却呈持续下降趋势[15]。文献报道,亚洲地区乳腺癌发病率虽然低于欧、美国家,但增长速率很快,而且患者发病年龄呈年轻化趋势[16]。在我国,北京、上海、天津、广州等大城市的乳腺癌发病率较高,农村则较低,因此乳腺癌又被授予"城市女性第一杀手"的称号。北京、上海属于发达地区,较西部地区集中了更多的优秀人才、研究机构和更先进的医疗器械,因此,北京、上海地区的乳腺癌相关研究发文量较大。
本研究结果显示,2014年1月1日至2016年4月29日,PubMed数据库中乳腺癌相关研究发文量前10位期刊中,只有Asian Pacific Journal of Cancer Prevention为东南亚多国联合主办的国际肿瘤专业期刊,其他均为欧美国家出版的肿瘤专业期刊。这从一定程度上也印证了上述乳腺癌相关研究的地域差别。
综上所述,乳腺癌是全球女性恶性肿瘤中发病率最高的恶性肿瘤,北美和欧洲等西方发达国家该病发病率相对较高,而亚洲国家该病发病率增长速度较快,并且随着女性地位的提升、寿命的延长,乳腺癌越来越受到公众的关注[17]。中国作为人口大国,人口基数大,东部发达地区的乳腺癌发病率较西部欠发达地区高,而且东部地区经济发达,拥有更多资源开展乳腺癌相关研究,这使我国乳腺癌相关研究发文量排名靠前。本研究可从不同的角度揭示乳腺癌的目前研究现状和研究方向,对乳腺癌研究者及研究机构拟定新的研究方向,可提供一定参考。
























