物理·技术·生物
基于SHAP值特征选择的γ通过率分类预测及解释
中华放射肿瘤学杂志, 2023,32(10) : 914-919. DOI: 10.3760/cma.j.cn113030-20230110-00003
摘要
目的

探索SHAP值结合极端梯度提升树(XGBoost)算法的特征选择技术来构建调强放疗γ通过率预测模型的可行性和有效性,并给出相应的模型解释。

方法

回顾性分析2020年11月至2021年11月在湖南省肿瘤医院接受盆腔固定野调强放射治疗的196例肿瘤患者采用基于模体测量方式的调强放疗计划的剂量验证结果,γ通过率标准为3%/2 mm、10%剂量阈值。提取基于剂量文件的影像组学特征并使用SHAP值结合XGBoost算法进行特征筛选后构建预测模型。分别选取特征数量为50、80、110、140个,构建四种机器学习分类模型,计算曲线下面积(AUC)值、召回率及F1分数评估预测模型的分类性能。

结果

基于SHAP值特征选择的110个特征构建的预测模型AUC值为0.81,召回率达到0.93,F1分数为0.82,均优于其他三个模型。

结论

针对盆腔肿瘤调强放疗计划,可以采用SHAP值与XGBoost算法结合以选择用于预测的最佳影像组学特征子集来构建γ通过率的预测模型,并能通过SHAP值给出模型输出解释,可能在理解依赖机器学习模型所做的预测方面提供价值。

引用本文: 陈路桥, 倪千喜, 庞金猛, 等.  基于SHAP值特征选择的γ通过率分类预测及解释 [J] . 中华放射肿瘤学杂志, 2023, 32(10) : 914-919. DOI: 10.3760/cma.j.cn113030-20230110-00003.
参考文献导出:   Endnote    NoteExpress    RefWorks    NoteFirst    医学文献王
扫  描  看  全  文

正文
作者信息
基金 0  关键词  0
English Abstract
评论
阅读 0  评论  0
相关资源
引用 | 论文 | 视频

版权归中华医学会所有。

未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

除非特别声明,本刊刊出的所有文章不代表中华医学会和本刊编委会的观点。

SHAP值是Lundberg等1在2017年提出的解决模型可解释性的方法,与机器学习算法相结合可以为每个特征分配一个特定预测的贡献值,因此SHAP值被提议作为预测模型中特征重要性的唯一度量。除了可以解释任何机器学习模型的输出外,SHAP值还可以作为一种处理高维数据的特征选择机制参与机器学习预测模型的构建2。随着计算机技术的创新和发展,人工智能技术在放疗质量保证(quality assurance,QA)中的应用越来越广泛3, 4。为了提高调强放疗计划实施的效率和安全性,有研究使用计划复杂性参数、剂量组学特征等作为输入建立机器学习预测γ通过率的模型,并取得良好的预测结果5, 6, 7, 8。然而目前尚无结合SHAP值应用的相关报道。因此,本文将使用SHAP值与极端梯度提升树(extreme gradient boosting,XGBoost)算法结合,以选择用于其预测的最佳影像组学特征子集,评估该方法构建γ通过率预测模型的可行性和有效性,并对模型输出提供相应的解释。

 
 
展开/关闭提纲
查看图表详情
回到顶部
放大字体
缩小字体
标签
关键词