目的 探究H3K27M突变型弥漫中线胶质瘤(diffuse midline glioma, DMG)生存预后的影响因素,构建并验证H3K27M突变型DMG预后不良的预测模型。方法 回顾性分析2000-2019年监测、流行病学及预后数据库中H3K27M突变型DMG患者的临床资料,按照7:3的比例随机分为训练集(n=97)和验证集(n=41)。采用极端梯度提升、随机森林、最小绝对收缩和选择算子回归分析和决策树模型筛选变量,分析4种机器学习方法“重叠覆盖”的风险因素,采用多因素Cox回归方法验证结果的独立预测性,并在此基础上构建列线图预测H3K27M突变型DMG患者6、12、18个月生存率。使用受试者工作特征曲线下面积、校准曲线和临床决策曲线评估列线图模型的预测效能、准确性和临床适用性,Kaplan-Meier法绘制预后影响变量的生存曲线。结果 4种机器学习算法各自筛选出不同预后影响因素,经过“重叠覆盖分析”得到5种共同的H3K27M型DMG患者预后影响因素:年龄、肿瘤体积、世界卫生组织分级、肿瘤侧别和放疗。多因素Cox回归分析发现,>60岁(HR=3.018, 95%CI:1.15~7.92,P=0.025),肿瘤体积增大(HR=1.039, 95%CI:1.01~1.06,P=0.004),高级别胶质瘤(HR=2.057, 95%CI:1.21~3.49,P=0.008),中线结构(HR=2.101, 95%CI:1.32~3.34,P=0.002)是H3K27M突变型DMG预后的危险性因素,放疗(HR=0.410, 95%CI:0.23~0.75,P=0.004)是H3K27M突变型DMG的保护性因素。基于5个预后影响因素构建的列线图模型验证结果显示,训练集和验证集6、12、18个月的曲线下面积分别为0.647、0.746、0.625和0.632、0.725、0.725,表明模型预测性能良好,校准曲线显示预测值与理想曲线具有较好一致性,临床决策曲线分析曲线显示列线图模型有良好的临床效能。结论 基于机器学习算法筛选出的预后影响因素构建的列线图模型有可靠的预测效能,可帮助临床医生识别H3K27M突变型DMG患者高危预后因素,制定个体化治疗方案。