结直肠癌是严重威胁我国居民健康的恶性肿瘤之一。有效的风险评估模型能通过评估发病风险、筛选高危人群来引导居民建立健康的生活方式,是预防结直肠癌、降低结直肠癌死亡率的重要手段之一。
构建适用于中国人群结直肠癌个体发病风险的Rothman-Keller模型,评估个体发病风险并划分风险等级。
全面检索中国知网、万方数据知识服务平台、维普网、PubMed、EMBase、OVID数据库中关于结直肠癌危险因素的文献。检索年限为建库至2020-08-31。通过文献综述明确结直肠癌主要危险因素及其与结直肠癌发病风险的定量关系,构建中国人群结直肠癌个体发病风险的Rothman-Keller模型,采用二项分布函数法划分风险等级。
构建的中国人群结直肠癌个体发病风险的Rothman-Keller模型中纳入了结直肠癌家族史、吸烟、饮酒、肥胖、红肉摄入、腌制食品摄入、阑尾炎病史、糖尿病病史、慢性结直肠炎病史、慢性腹泻病史、慢性便秘病史、蔬菜摄入、水果摄入、阿司匹林、体育锻炼等15项危险因素。二项分布函数法模拟10 000例样本点的发病风险后,采用分段斜率比较的方式将女性患结直肠癌的低、高风险界值划分为0.033 7%,男性患结直肠癌的低、高风险界值划分为0.046 3%。
构建的中国人群结直肠癌个体发病风险的Rothman-Keller模型简单易行,有利于促进高危人群参加结肠镜筛查,改变不良生活方式,使直肠癌预防关口前移。






本刊2021年版权归中国全科医学杂志社所有
未经编辑部许可,不得任意转载和摘编
本刊所发表作品仅为作者观点,并不代表编委会和编辑部意见
如有印装质量问题请向本刊发行部调换
结直肠癌是严重威胁我国居民健康的恶性肿瘤之一。全国肿瘤数据显示,2015年结直肠癌的发病率和死亡率分别位居我国恶性肿瘤顺位第3位、第5位,给社会和患者家庭带来了极大的经济负担[1]。早期开展结肠镜筛查可有效降低结直肠癌的发病率和死亡率[2],但结肠镜筛查过程复杂,又易引起肠道受损,所以结肠镜检查的依从性不高[3,4,5]。因此,若能建立简单易行的风险评估模型并筛查出结直肠癌的高危人群,再让高危人群接受结肠镜检查,则将有助于提高结直肠癌的筛查效率。目前,针对中国人群建立的结直肠癌发病风险评估模型有的需要结合结肠镜检查[6],有的需要结合基因位点[7],不适合在大规模人群中进行推广。此外,这些模型中纳入的与结直肠癌相关的行为生活因素较少,也不能直观展示结直肠癌发病风险等级。因此,本研究拟基于Rothman-Keller模型[8]构建针对中国人群结直肠癌的评估模型,并采用二项分布函数法进行风险等级划分,旨在帮助个体了解结直肠癌发病风险、识别风险等级,促进高危人群进行结直肠癌筛查,以及刺激人群养成健康的行为生活方式,达到结直肠癌预防关口前移的目的。
全面检索中国知网、万方数据知识服务平台、维普网、PubMed、EMBase、OVID数据库中关于结直肠癌危险因素的相关文献。中文检索词包括"结直肠癌""结直肠肿瘤""结肠癌""直肠癌""危险因素";英文检索词包括"Colorectal neoplasms""Colorectal cancer""Risk factors""China",将各检索词组合后进行文献检索,另外,手工检索已发表和引文追溯得到的文献作为补充。检索年限为建库至2020-08-31。
(1)研究对象为中国人群;(2)研究类型优先级:Meta分析>队列研究>病例对照研究;(3)样本量较大的调查数据;(4)近10年发表的文章;(5)重大项目获基金支持。
暴露率:优先选择国家卫生健康部门、疾病预防控制部门公开的权威数据,或者既往发表的科研论文提供的数据。
年龄别性别发病率:由于结直肠癌在不同年龄、性别的人群中发病率不同,因此,以《2018中国肿瘤登记年报》[9]中不同年龄组男、女性结直肠癌发病率作为本模型中年龄别性别发病率的数据来源(表1)。

2015年不同年龄组男、女性结直肠癌发病率[9]
Incidence of colorectal cancer among men and women of different age groups in 2015
2015年不同年龄组男、女性结直肠癌发病率[9]
Incidence of colorectal cancer among men and women of different age groups in 2015
年龄组 | 男性年龄别发病率(1/10万) | 女性年龄别发病率(1/10万) | 总体年龄别发病率(1/10万) |
---|---|---|---|
0~岁 | 0.06 | 0.07 | 0.07 |
1~4岁 | 0.01 | <0.01 | 0.01 |
5~9岁 | 0.01 | 0.03 | 0.02 |
10~14岁 | 0.04 | 0.04 | 0.04 |
15~19岁 | 0.19 | 0.16 | 0.17 |
20~24岁 | 0.58 | 0.57 | 0.59 |
25~29岁 | 1.71 | 1.66 | 1.68 |
30~34岁 | 3.35 | 2.55 | 2.99 |
35~39岁 | 5.33 | 4.33 | 4.87 |
40~44岁 | 11.26 | 9.10 | 10.37 |
45~49岁 | 18.67 | 14.24 | 16.59 |
50~54岁 | 33.97 | 25.02 | 29.72 |
55~59岁 | 55.77 | 37.82 | 47.04 |
60~64岁 | 88.96 | 57.44 | 73.50 |
65~69岁 | 122.41 | 75.56 | 99.36 |
70~74岁 | 143.96 | 95.86 | 120.01 |
75~79岁 | 183.75 | 127.07 | 154.64 |
80~84岁 | 203.12 | 145.60 | 172.65 |
85~岁 | 185.32 | 117.51 | 145.77 |
粗率(1/10万) | 32.00 | 23.68 | 28.04 |
中国人口标化率(1/10万) | 20.51 | 14.08 | 17.32 |
纳入因素的选择原则:(1)对结直肠癌发病影响较大、较为公认的因素;(2)所选危险因素有较多的研究支持;(3)不纳入有创性因素,例如基因序列、血液指标;(4)不纳入争论较多的因素,如精神、心理因素。
通过文献综述建立了结直肠癌主要危险因素与发病风险的定量关系,基于Rothman-Keller模型构建出适合中国人群的结直肠癌个体发病风险评估模型,并在建立模型的基础上增加了风险等级划分的内容。
Rothman-Keller模型于1972年由ROTHMAN等[8]学者提出,是用于评估慢性病发病风险的一种方法。
基准发病比例,其中n为暴露因素的种数;i为第i个暴露因素;Pi为暴露于某一危险因素i的个体在全人群中的暴露率,RRi为暴露于某一危险因素i的相对危险度,PAR%为人群归因危险度百分比。疾病的发病率<5%时,可以用比值比(OR)直接估算相对危险度(RR)。
危险分数=基准发病比例×RR。
组合危险分数=(P1-1)+(P2-1)+…+(Pn-1)+q1×q2×…×qn,其中:P为危险分数>1的项,q为危险分数<1的项;把危险分数>1的各项分别减去1后作为相加项,危险分数<1的各项相乘后作为相乘项,最后将相加项和相乘项相加,得到组合危险分数,即个体患某慢性病风险是一般人群的多少倍。
个体绝对风险估计值=年龄别性别发病率×该个体的组合危险分数,反映个体在未来一段时间内发病的概率。
使用Microsoft Excel生成结直肠癌评估模拟数据并采用分段斜率比较的方式划分结直肠癌低、高风险界值。
使用Note Express 3.3软件进行文献整理,Microsoft Excel 2019软件生成二项分布模拟数据,并绘制结直肠癌发病风险界值图。
大量研究结果显示,结直肠癌发病是多因素协同作用的结果,主要包括遗传因素、肠道相关疾病史、饮食因素、生活方式、肥胖、糖尿病、阿司匹林等[10,11,12,13,14,15,16,17,18,19]。本研究共纳入15项危险因素,分别为结直肠癌家族史、吸烟、饮酒、肥胖、红肉摄入、腌制食品摄入、阑尾炎病史、糖尿病病史、慢性结直肠炎病史、慢性腹泻病史、慢性便秘病史、蔬菜摄入、水果摄入、阿司匹林、体育锻炼。
根据各因素的人群暴露率和危险因素的OR值计算基准发病比例和危险分数[20,21,22](表2)。结合个体的实际情况及表中危险分数,计算其组合危险分数,并估算个体发生结直肠癌的相对风险。

各危险因素危险分数表
Scoring of risk factors for colorectal cancer
各危险因素危险分数表
Scoring of risk factors for colorectal cancer
危险因素 | 暴露率 | OR值 | 基准发病比例 | 危险分数 | 危险因素 | 暴露率 | OR值 | 基准发病比例 | 危险分数 | ||
---|---|---|---|---|---|---|---|---|---|---|---|
结直肠癌家族史[20] | 慢性结直肠炎病史[20] | ||||||||||
有 | 0.026 | 2.517 | 0.962 | 2.421 | 有 | 0.016 | 4.358 | 0.949 | 4.136 | ||
无 | 0.974 | 1 | 0.962 | 0.962 | 无 | 0.984 | 1 | 0.949 | 0.949 | ||
吸烟(男)[20] | 慢性腹泻病史[20] | ||||||||||
有 | 0.518 | 1.264 | 0.880 | 1.112 | 有 | 0.014 | 3.983 | 0.960 | 3.823 | ||
无 | 0.482 | 1 | 0.880 | 0.880 | 无 | 0.986 | 1 | 0.960 | 0.960 | ||
吸烟(女) | 慢性便秘病史[20] | ||||||||||
有 | 0.023 | 1.264 | 0.994 | 1.256 | 有 | 0.027 | 2.063 | 0.972 | 2.005 | ||
无 | 0.977 | 1 | 0.994 | 0.994 | 无 | 0.973 | 1 | 0.972 | 0.972 | ||
饮酒(男)[20] | 蔬菜摄入(g/d,男)[20] | ||||||||||
有 | 0.546 | 1.208 | 0.945 | 1.142 | ≥400 | 0.199 | 0.517 | 1.106 | 0.572 | ||
无 | 0.454 | 1 | 0.945 | 0.945 | <400 | 0.801 | 1 | 1.106 | 1.106 | ||
饮酒(女) | 蔬菜摄入(g/d,女) | ||||||||||
有 | 0.133 | 1.208 | 0.996 | 1.203 | ≥400 | 0.204 | 0.517 | 1.109 | 0.573 | ||
无 | 0.867 | 1 | 0.996 | 0.996 | <400 | 0.796 | 1 | 1.109 | 1.109 | ||
肥胖(kg/m2)[18] | 水果摄入(g/d,男)[21] | ||||||||||
BMI≥28 | 0.141 | 1.334 | 0.955 | 1.274 | ≥300 | 0.014 | 0.750 | 1.004 | 0.753 | ||
BMI<28 | 0.859 | 1 | 0.955 | 0.955 | <300 | 0.986 | 1 | 1.004 | 1.003 | ||
红肉摄入(g/d)[21] | 水果摄入(g/d,女) | ||||||||||
≥100 | 0.325 | 1.620 | 0.832 | 1.348 | ≥300 | 0.034 | 0.750 | 1.009 | 0.756 | ||
<100 | 0.675 | 1 | 0.832 | 0.832 | <300 | 0.966 | 1 | 1.009 | 1.009 | ||
腌制食品摄入(次/d)[21] | 阿司匹林[12] | ||||||||||
≥1 | 0.359 | 1.280 | 0.909 | 1.163 | 过去1年中曾服用过阿司匹林 | 0.029 | 0.830 | 1.005 | 0.834 | ||
<1 | 0.641 | 1 | 0.909 | 0.909 | 过去1年中未服用过阿司匹林 | 0.971 | 1 | 1.005 | 1.005 | ||
阑尾炎病史[20] | 体育锻炼[22] | ||||||||||
有 | 0.018 | 2.134 | 0.980 | 2.091 | 每周锻炼≥3次且每次锻炼≥10 min | 0.150 | 0.730 | 1.042 | 0.761 | ||
无 | 0.982 | 1 | 0.980 | 0.980 | 每周锻炼<3次或每次锻炼<10 min | 0.850 | 1 | 1.042 | 1.042 | ||
糖尿病病史[19] | |||||||||||
有 | 0.097 | 1.520 | 0.952 | 1.447 | |||||||
无 | 0.903 | 1 | 0.952 | 0.952 |
注:OR=比值比,BMI=体质指数
根据15项结直肠癌危险因素的暴露率P0,当个体暴露于某一危险因素时P0=1,未暴露于某一因素时P0=0,模拟一组10 000例的随机数据,得到一个由0和1组成的数据集。首先,通过Rothman-Keller模型,计算相对应的结直肠癌发病风险;其次,将发病风险由小到大进行排序,以序号(ID)为横坐标,发病风险(%)为纵坐标绘制出10 000例样本点发病风险的散点图;然后,以500为间隔,对ID进行分组,将曲线划分为20段,比较每段曲线的斜率,取斜率最大者作为界值;最后,经综合分析选取合适的界值。图1选取第7 637位(发病风险为0.033 7%)作为女性结直肠癌低风险和高风险界值;图2选择第7 526位(发病风险为0.046 3%)作为男性结直肠癌低风险和高风险界值。即女性结直肠癌发病风险<0.033 7%,为低风险人群;发病风险≥0.033 7%,为高风险人群(图1)。男性结直肠癌发病风险<0.046 3%为低风险人群;发病风险≥0.046 3%为高风险人群(图2)。




根据上文建立的Rothman-Keller模型,可计算个体患结直肠癌的风险值,具体过程如下。
假设1名男性A,50岁,有慢性结直肠炎病史、便秘,患有糖尿病,父亲为结直肠癌患者,无阑尾炎病史、慢性腹泻病史,该患者日常吸烟、饮酒,体质指数(BMI)=30 kg/m2,每日蔬菜摄入量不足400 g,每日水果摄入量不足300 g,每日红肉摄入量>100 g,长期静态工作,不吃腌制食品摄入,未服用阿司匹林。通过查表2,收集到该名男子危险因素的危险分数分别为4.136、2.005、1.447、2.421、0.980、0.960、1.112、1.142、1.274、1.106、1.003、1.348、1.042、0.909、1.005。根据组合风险分数的计算公式,该患者的组合风险分数=(4.136-1)+(2.005-1)+(1.447-1)+(2.421-1)+(1.112-1)+(1.142-1)+(1.274-1)+(1.106-1)+(1.003-1)+(1.348-1)+(1.042-1)+(1.005-1)+0.98×0.96×0.909=7.897。根据表1可得50~54岁男性结直肠癌发病率为33.97/10万,计算出该名男子患结直肠癌的风险为7.897×33.97/10万×100%=0.268%。根据风险等级界限划分,该名男子患结直肠癌的风险为0.248%>0.046 3%,属于结直肠癌高风险人群。
通过检索中、英文数据库,搜集、整理中国人群结直肠癌发病危险因素相关研究,本研究最终筛选出15项结直肠癌的主要危险因素;根据文献中危险因素的OR值和人群暴露率,本研究建立了基于Rothman-Keller模型——结直肠癌个体发病风险评估模型,并采用二项分布函数的方法划分出结直肠癌发病个体风险等级,其中女性低、高风险界值为0.033 7%,男性低、高风险界值为0.046 3%。
与既往的结直肠癌发病风险评估模型相比,本研究在建立模型的基础上增加了风险等级划分的内容,使用二项分布函数法模拟了10 000例样本点的风险分布,然后用分段斜率比较的方式划分风险等级,同时还绘制了等级界限图;该图具有直观、简便易操作的优点,计算出发病风险后,仅需对比该图,即可初步判断是否为高风险人群。2016年李鹭[23]采用二项分布函数法识别出生缺陷高危人群,通过调查数据验证其划分结果与实际结果相一致;黄艳红[24]通过二项分布函数法构建高血压患者并发脑卒中风险等级的划分标准,验证结果显示预测效果较好,受试者工作特征曲线下面积为0.784〔95%CI(0.718,0.849),P<0.001〕,灵敏度为0.810,特异度为0.758,验证了二项分布函数法在划分疾病发病风险等级时的实用性。因而本研究风险等级划分结果可以用于识别结直肠癌的发病风险等级,促进低风险人群建立健康的生活方式,提高针对高风险人群的筛查效率。
本研究构建的Rothman-Keller模型重点关注行为生活方式对结直肠癌发病的影响。有研究表明,对癌症的危险因素进行干预可有效降低癌症造成的危害,可使40%的癌症患者通过合理的预防措施避免罹患癌症[25]。《中国结直肠癌预防共识意见(2016年,上海)》[26]指出,环境因素是影响结直肠癌发生、发展的重要因素,70%的非遗传性结直肠癌与生活习惯有关,且66%~78%的结直肠癌可以通过健康的生活习惯避免。因此,将模型内容侧重于生活因素可引起被评估者对不良生活行为的重视,刺激其养成健康的生活习惯,从而达到一级预防的目的。
本研究构建的Rothman-Keller模型具有无创、节约成本、数据收集方便的优点。以往针对中国人群建立的模型如Cai模型尽管能较准确地评估结直肠癌发病危险,但由于结合了结肠镜检查,导致该模型很难向普通人群推广[27];李娇元等[7]建立的模型将常见的危险因素与基因单核苷酸多态性相结合,对结直肠癌个体发病风险有一定的评估作用,但存在常见危险因素和遗传因素纳入较少的问题,同样阻碍了该模型的广泛应用。本研究建立的Rothman-Keller结直肠癌发病风险评估模型纳入的危险因素与生活方式密切相关,均可通过问卷获得,可提高评估对象对结直肠癌初筛的依从性和参与度,极大地增强了模型的实用性。同时,该模型也适用于临床工作者或社区医生初步筛选高风险人群,进而开展结肠镜检查,既可提高工作效率,又有利于医疗资源的合理分配。
本研究构建的结直肠癌个体发病风险的Rothman-Keller模型所使用的参数大多来自中国人群的Meta分析结果,与传统的病例对照研究或队列研究[28,29,30]相比,其OR值更能代表我国一般人群的真实情况[31];同时Rothman-Keller模型不涉及复杂计算,利用Microsoft Excel软件即可实现,且参数设置灵活,可根据未来更权威、更大样本调查结果提供的资料及时更新,其核心算法不受影响。
此外,本课题组还开发了评估结直肠癌发病风险的微信公众平台,方便用户结合自身情况评估结直肠癌发病风险,并根据风险值初步判断是否属于高危人群,从而决定是否前往医疗机构进一步接受结肠镜检查,进而减少低危人群因不必要的筛查而造成的资源浪费。在未来,该平台也可作为结直肠癌筛查前的一种自检手段,对增大筛查收益有重要意义。
本研究存在以下不足:第一,模型在评估个体结直肠癌发病风险时选择使用组合危险分数,而忽略了因素间的交互作用;第二,目前,本研究建立的结直肠癌个体发病风险评估模型还缺乏实际病例进行验证,需要应用到前瞻性队列研究中。
综上所述,本研究构建的中国人群结直肠癌个体发病风险的Rothman-Keller模型尽管尚待完善,但其采用简单易行的方法帮助个体了解结直肠癌发病风险、识别风险等级,最终促进高危人群改变不良生活方式,接受结肠镜筛查,使结直肠癌预防关口前移具有较大参考价值。
本文无利益冲突。











