本文内容已经过同行评议,以优先出版方式在线发表,可作为有效引用数据。由于优先发表的内容尚未完成规范的编校流程,本刊不保证其数据与印刷版内容的一致性。
汤朝晖,耿智敏,陈晨,等.基于贝叶斯网络的进展期胆囊癌生存预测模型多中心临床研究[J].中华外科杂志,,56(5):-.
写好科技论文的十二要点汤朝晖
{上海交通大医院普通外科}
耿智敏 陈晨
{西安医院肝胆外科}
司书宾 蔡志强
{西北工业大学机电学院}
宋天强
{天津医院肝胆肿瘤科}
巩鹏
{大连医院普通外科}
姜立
{华中科技大学同医院普通外科}
邱应和
{海**医医院胆道一科}
何宇
{陆*医院全*肝胆外科研究所}
翟文龙
{医院肝胆胰外科}
李升平
{中山大学肿瘤防治中心肝胆科}
张英才 杨扬
{医院肝脏外科}
胆囊癌是胆道系统最常见的恶性肿瘤之一,发病率居消化道恶性肿瘤第6位。近年来,全球发病率有上升趋势,尤其以印度、智利和中国为著[1,2]。胆囊癌具有高度的异质性,侵袭性强,发病隐匿,早期诊断困难,治疗效果极差,5年生存率仅为0~12%[3]。目前根治性手术切除仍然是胆囊癌患者的唯一有效治疗手段,但影响患者术后生存的因素较多,包括TNM分期、肝脏浸润、*疸、淋巴清扫范围等,目前各种因素对手术方式及生存影响存在较多争议[4]。因此,建立准确的生存预测模型,明确胆囊癌患者术后预后因素,对于胆囊癌患者的个体化治疗方案选择及外科医师的临床决策支持具有重要的指导意义。
贝叶斯网络起源于20世纪80年代中期对人工智能中不确定性问题的研究,已经成为人工智能的一个重要领域。近年来它的影响不断扩大,成为将概率、统计应用于复杂系统的不确定性推理和数据分析的一种有效工具,也是数据挖掘领域中的研究热点之一[5]。贝叶斯网络在医学方面已广泛应用于生存模型、传染病模型、决策分析、基因网络分析等领域[6,7,8,9,10,11]。我们既往将贝叶斯网络用于建立原发性肝癌和胆囊癌生存预测模型,分析预后因素及优化治疗方案[12,13,14]。在此基础上,我们利用多中心数据,建立进展期胆囊癌生存预测模型,并结合重要度理论,计算分析胆囊癌术后影响因素权重,探讨其对临床指导意义。
资料与方法一、一般资料
采用多中心回顾性横断面描述性研究方法。收集上海交通大医院、西安医院、海**医医院、医院、天津医院、中山大学肿瘤防治中心、陆*医院、大连医院、华中科技大学同医院共9家医院年1月至年12月经根治性手术治疗的进展期胆囊癌患者的临床资料。本研究通过上海交通大医院及西安医院伦理委员会审批(批号:XHEC-D--和-)。患者及家属术前均签署手术知情同意书。
二、纳入标准和排除标准
1.纳入标准:
(1)经根治性手术治疗的进展期(T3~4期)胆囊癌患者(R0和R1切除);(2)病理学检查结果明确诊断为胆囊腺癌;(3)不合并其他恶性肿瘤;(4)术前和术中未进行其他抗肿瘤治疗。
2.排除标准:
(1)病理学检查结果为胆囊腺癌以外其他类型或病理学诊断不明确的患者;(2)T1~2期胆囊癌患者;(3)非原发性胆囊癌患者;(4)合并其他恶性肿瘤患者;(5)合并远处转移(M1期)的患者;(6)未行根治性切除的胆囊癌患者;(7)缺乏明确的阳性淋巴结数目及淋巴结转移位置记录的患者;(8)术后随访资料不全者;(9)术后30d内死亡患者。
三、手术方式
根据影像学检查结果和实验室检查结果进行术前分期及手术评估,术中根据探查结果和快速冰冻病理报告进一步评估患者的肿瘤分期。根据不同分期进行相应手术:对T3N0~1M0期患者行胆囊切除+肝楔形切除(肝脏4b+5段切除)+区域淋巴结清扫术或扩大的淋巴结清扫术,对部分T3N2M0患者行胆囊切除+肝楔形切除(肝脏4b+5段切除)+扩大的淋巴结清扫术,对部分T4N1~2M0患者行扩大根治术,扩大根治术包括在标准根治术基础上联合半肝切除、周围器官切除、肝胰十二指肠切除等手术方式。
四、分析指标及预处理
共选取生存时间、人口学特征(年龄、性别)、临床病理特征[*疸、肝脏浸润、T分期、阳性淋巴结数目(numberofmetastaticlymphnodes,NMLN)、病理学分级、肿瘤形态]及切缘10个指标进行分析。因各中心手术标准及方式差异较大,本研究亦不涉及手术方式对预后的影响,故采用切缘代表手术特征,以上分析指标选取参考了既往单中心的相关研究[4,15]。将连续变量生存时间、NMLN、年龄因素进行离散化处理,生存时间以中位生存时间(mediansurvivaltime,MST)分为两组(≤MST组和MST组),NMLN参照AJCC第8版胆囊癌分期系统分为3组(0枚组、1~3枚组、≥4枚组)[16],按年龄分为3组(50岁组、50~70岁组、70岁组)(表1)。
五、随访方法
采用门诊或电话进行随访,以患者死亡为终点,随访截至年12月31日。
六、贝叶斯网络分析方法
贝叶斯网络采用树增益朴素贝叶斯(treeaugmentedna?veBayes,TAN)算法进行建模,混淆矩阵中可靠性和精确度采用百分比表示,受试者工作特征曲线(receiveroperatingcharacteristiccurve,ROC曲线)采用锁定目标的方式进行绘制。
在建立贝叶斯网络模型时,纳入生存时间、NMLN、T分期、病理分级、切缘、*疸、肝脏浸润、年龄、性别、肿瘤形态10个变量因素,运用BayesiaLab软件的建模功能,基于TAN算法建立以生存时间为目标节点的中位生存时间模型。采用混淆矩阵和ROC曲线和曲线下面积(areaundercurve,AUC)的大小来评价模型的优劣,混淆矩阵的计算值越大,模型的精确度越高;AUC的值越大,模型的精确度也越高。
评价模型精确度后,运用BayesiaLab进行10个变量因素的先验统计分析和以生存时间为目标变量、剩余因素为属性变量的后验分析,后验分析结果结合多态Birnbaum重要度计算,给出各属性变量的重要度排序,重要度计算公式如下:
其中ωi表示属性变量的状态数,S=0表示生存时间小于中位生存时间,Vi表示属性变量的状态。排序结果筛选前四种预后因素建立胆囊癌生存概率预测表,利用贝叶斯网络可以不断改变这四种预后因素的状态,分析出不同状态下患者处于各个生存时间段的概率。
贝叶斯网络建模、混淆矩阵、ROC曲线和生存概率预测分析使用BayesiaLab软件,重要度分析采用多态Birnbaum重要度,数据预处理及重要度计算采用Excel2。正态分布的计量资料以±s表示,计数资料采用百分数表示;使用Kaplan-Meier法绘制生存曲线,生存分析采用Log-rank检验。以P0.05为差异有统计学意义。
结果一、一般资料
本研究共纳入例患者,其中上海交通大医院10例(3.2%),西安医院例(56.0%),天津医院50例(15.8%),大连医院20例(6.3%),华中科技大学同医院18例(5.7%),海**医医院16例(5.1%),陆*医院11例(3.5%),医院10例(3.2%),中山大学肿瘤防治中心4例(1.3%)。男性例,女性例,男女比例为1.0∶1.9。年龄(62.0±10.8)岁(范围:29~88岁)。53例(16.8%)患者术前伴有*疸症状。
二、手术情况
所有患者均接受根治性手术治疗,其中R0切除例(94.3%),R1切除18例(5.7%)。
三、病理学检查结果
病理分化情况:高分化21例(6.7%),中分化例(44.9%),低分化例(47.8%)。T分期:T3期例(90.8%),T4期29例(9.2%)。例(42.7%)伴有肝脏浸润。
四、总体生存情况
至随访结束时,共例患者死亡。总体中位生存时间为23.77个月,1、3、5年累积生存率分别为67.4%、40.8%、32.0%(图1)。
五、贝叶斯网络建模及精确度分析结果
基于BayesiaLab建模功能和TAN算法建立的贝叶斯网络模型见图2,模型为中位生存时间模型,包含了生存时间、NMLN、T分期、病理学分级、切缘、*疸、肝脏浸润、年龄、性别、肿瘤形态10个变量。混淆矩阵见表2,正确预测值的个数:MST≤23.77个月例和MST23.77个月例,错误预测值的个数:MST≤23.77个月42例和MST23.77个月38例。ROC曲线见图3。对于混淆矩阵,其精确度数值为(+)/(++42+38)=0.。
六、预后因素的BayesiaLab分析验证结果
基于贝叶斯网络模型,运用BayesiaLab分析验证功能对胆囊癌预后因素进行先验概率统计、后验分析、重要度分析计算和排序。生存时间的先验概率为0.(MST≤23.77个月)和0.(MST23.77个月)。重要度排序结果表明,NMLN(0.)、切缘(0.)、T分期(0.)和病理学分级(0.)是影响患者术后生存时间的前4位预后因素(表3)。该模型为中位生存时间模型,后验概率表示改变预后因素状态后MST≤23.77个月的概率。
七、生存概率预测(表4)
基于贝叶斯网络模型,结合重要度分析结果,将NMLN、切缘、T分期和病理学分级4个高危因素作为观测变量,可以得出不同状态下患者处于各个生存时间段的概率。如患者的情况如下:NMLN为0、T3期、肿瘤高分化,则R0切除后该患者MST23.77个月的概率为93.3%;如患者的情况如下:NMLN≥4个、T4期、肿瘤低分化,则R0切除后该患者MST23.77个月的概率为1.73%。
在此基础上,我们设计了一种基于NMLN、切缘、T分期及病理学分级的生存预测评分系统:NMLN0、1~3、≥4的赋值分别为0、1、2分;切缘R0赋值为0分,R1为1分;T分期T3赋值为3分,T4为4分;肿瘤高、中、低分化赋值分别为1、2、3分;四项分值相加,分值越小,预后越好(表5,图4)。4~9分患者的中位生存时间(月)分别为:66.8、42.4、26.0、9.0、7.5及2.3,差异有统计学意义(P0.01)。4~6分预后较好,建议手术,即便是R1切除患者也能生存受益;7~8分预后较差,即便R0切除,强烈推荐联合术后辅助治疗;9分及以上预后极差,手术对患者无益。
讨论胆囊癌是胆道系统最常见的恶性肿瘤,恶性程度高,预后差,目前尚无关于胆囊癌预后判断的实用工具。建立肿瘤术后长期预后因素的筛选与预后模型可以为手术疗效、手术病例筛选甚至术后辅助治疗的研究提供参考。对于进展期的胆囊癌患者而言,根治性手术的结果有异质性,受到多种因素影响。因此,建立一种针对个体的、准确的生存预测模型具有重要的临床价值。同时,手术优化选择及预后判断会直接影响胆囊癌患者的生存期和生存质量,具有重要的临床意义和应用前景。因此,基于医疗大数据进行数学建模,利用人工智能等学习方法,将有可能实现胆囊癌个体化治疗方案的优化选择。
贝叶斯网络起源于贝叶斯统计分析理论,由年计算机图灵奖获得者、加州大学洛杉矶分校Pearl于年提出[17]。贝叶斯网络作为一种将概率论与图论相结合用以处理不确定性推理和数据分析的有效工具,既可以通过图论的语言来揭示问题的因果结构,又可按照概率论的原则对问题结构进行分析,从而降低推理计算的复杂度,其已成为人工智能的一个重要研究领域,也是近年来数据挖掘领域中的研究热点之一。重要度用于度量系统单元可靠性变化对系统可靠性的影响程度。在系统设计阶段,重要度计算结果可以帮助设计人员识别系统薄弱环节,为系统的可靠性优化设计提供支撑依据;在系统运行阶段,重要度分析用于合理分配检测和维修资源,从而保证最重要的系统单元正常运行。重要度理论已经在风险分析等领域得到了广泛应用[18]。
我们既往基于贝叶斯网络建立了单中心原发性肝癌及胆囊癌术后生存预测模型,结合重要度理论阐明了影响预后的相关因素,并对进展期胆囊癌的手术方式进行了决策支持,初步证明了贝叶斯网络在胆囊癌生存预测方面的价值。在此基础上,基于多中心胆囊癌大数据进行贝叶斯网络建模,结合重要度理论分析方法,有望实现胆囊癌预后判断及个体化治疗方案的优化选择。
我们通过对国内9家中心例进展期胆囊癌根治性切除术后患者建立贝叶斯网络生存预测模型,模型精确度为74.86%,高于Demichelis等[19]的研究结果(65%),与国内尹玢璨等[20]的研究结果相当(72.87%),略低于我们既往单中心的胆囊癌生存模型准确度(81.15%及84.81%)[13,14],说明该模型具有较高的精确度。
在此模型基础上,我们结合重要度理论及其计算方法,给出了影响进展期胆囊癌根治性切除术后患者生存的预后因素重要度排序,证实了淋巴结转移状态是影响胆囊癌预后的最重要影响因素,肝脏浸润、*疸及肿瘤形态对进展期胆囊癌的预后及手术治疗选择影响较小,与我们既往的研究结果一致[15]。
在病灶局限的进展期胆囊癌中,淋巴转移对预后的影响已超过T分期[21],本研究结果进一步证实了淋巴结转移是影响胆囊癌根治性切除患者预后最重要的影响因素。阳性淋巴结数目,即NMLN是近年来较受重视的淋巴结分期指标,多项研究已证实NMLN为影响根治性切除患者预后的独立预后因素[22,23,24,25],且近年来研究中所得NMLN截点均为4。AJCC第8版胆囊癌分期系统针对N分期做出的更改实际上也是依据NMLN来进行淋巴结转移的评估[16],此外基于NMLN的评估方法所受医疗技术水平差异的影响更小,因此NMLN是更具有临床价值的淋巴结分期评估指标。本研究同时为即将实施的AJCC第8版胆囊癌N分期提供了有力的循证医学证据。
基于贝叶斯网络模型,结合重要度分析结果,我们进一步将重要度排序前4位的NMLN、切缘、T分期和病理分级4个高危因素作为观测变量,分析不同状态下患者处于各个生存时间段的概率,从而可以得出胆囊癌生存概率预测结果,其一方面为手术决策提供指导,另一方面有利于医疗资源的合理分配。对预测生存期较短的患者应放弃无益的手术,或者先行新辅助治疗降期后再行手术治疗。
在此基础上,我们设计一种基于NMLN、切缘、T分期及病理分级的生存预测评分标准,4项分值相加,分值越小,预后越好。4~6分预后较好,建议手术,即便是R1切除患者也能生存受益;7~8分预后较差,即便R0切除,强烈推荐联合术后辅助治疗;9分以上预后极差,手术对患者无益。
综上所述,我们通过回顾性分析国内9家中心例进展期胆囊癌患者资料,建立了贝叶斯网络生存预测模型,模型准确度为74.86%。重要度计算排序结果表明,NMLN(0.)、切缘(0.)、T分期(0.)和病理学分级(0.)是影响患者术后生存时间的前4位预后因素。将NMLN、切缘、T分期和病理学分级4个预后因素作为观测变量,可以预测不同状态下患者处于各个生存时间段的概率,在此基础上提出一种新的生存预测评分标准,实现个体化生存预测和临床决策支持。本研究为贝叶斯网络在胆囊癌领域研究的初步尝试,仍存在诸多缺陷:(1)样本量偏少,仅有例;(2)预后相关因素指标纳入偏少,仅有9项;(3)未考虑术后辅助治疗效果;(4)多中心数据的杂质性。今后有待积累和收集更大样本数据,分析更多影响因素,特别是术前相关因素及分子生物学标志物等,做到更加精准和个体化的预测,为胆囊癌的精准治疗提供依据。
志谢西安医院肝胆外科刘德春、蔡慧强、孟强劳、张瑞、李起参与资料的整理工作,西北工业大学机电学院郭鹏、张震参与数据的分析工作
(参考文献略)
点击“阅读原文”,加入读者俱乐部下载全文题图viaIvanAivazovsky
感谢你在学海无涯的征途上选择了我
———————————————