李起,张健,苏敬博,等.结石相关型胆囊上皮内瘤变的相关因素分析及预测模型建立[J].中华外科杂志,,59(4):-.
结石相关型胆囊上皮内瘤变的相关因素分析及预测模型建立
李起 张健 苏敬博 金哲川 张东 耿智敏
{西安医院肝胆外科}
吴予涵 蔡志强 司书宾
{西北工业大学机电学院工业工程系}
邓元
{西安医院病理科}
胆囊结石是最常见的胆囊良性疾病,我国胆囊结石发病率为6.3%~12.1%,且随着生活水平的提高呈逐年升高趋势[1]。现已证实胆囊结石是胆囊癌的常见危险因素,约85%的胆囊癌患者合并胆囊结石[2,3]。胆囊结石引起胆囊癌的机制尚不清楚,目前认为与结石反复机械性刺激使胆囊黏膜上皮发生炎症或黏膜损伤后形成“损伤-修复-损伤”的恶性循环有关。结石及长期的炎症刺激可促进胆囊黏膜发生炎症——低级别上皮内瘤变——高级别上皮内瘤变的演变,最终发展为胆囊癌[4,5]。因此,胆囊结石与胆囊癌发生密切相关,胆囊上皮内瘤变(gallbladderintraepithelialneoplasia,GBIN)是其癌变过程的中间环节,属于明确的癌前病变,对此类患者及时行胆囊切除有助于预防胆囊癌的发生。
因此,明确GBIN发生的相关因素并建立有效的预测模型,对胆囊癌前病变的识别及胆囊癌的预防具有十分重要的价值。列线图具有准确、直观、可视化及可重复性等特点,有助于医师做出标准化治疗决策,目前已被应用于疾病发生风险预测、肿瘤预后评估及辅助治疗的指导[6,7,8]。贝叶斯网络可将概率和统计应用于复杂系统的不确定性推理和数据分析[9]。我们在既往研究[10,11,12,13]的基础上,进一步探讨GBIN发生的相关因素并建立相关的GBIN发生预测模型。
资料与方法
一、纳入标准和排除标准纳入标准:(1)年龄≥18岁;(2)术前检查结果提示胆囊结石且行胆囊切除术;(3)术后病理学检查结果提示胆囊结石伴慢性胆囊炎或伴GBIN;(4)临床病理学资料完整。排除标准:(1)急性胆囊炎;(2)术前检查或术后病理学检查结果提示合并胆囊息肉;(3)T1期及以上分期的胆囊癌;(4)既往合并其他肿瘤病史。二、一般资料回顾性收集年1月至年12月于西安医院因胆囊结石行胆囊切除术且术后病理学检查结果提示胆囊结石伴胆囊慢性炎或GBIN患者的临床病理学资料。根据纳入和排除标准,本研究共纳入患者,其中胆囊结石伴GBIN例,胆囊结石伴慢性胆囊炎例(按照系统抽样法抽取例/年)。男性例,女性例,男女比例为1.0∶1.8,年龄(51.3±14.5)岁(范围:18~90岁)。本研究通过西安医院伦理委员会审批[批号:伦审科字第(G-40)号]。所有患者及家属术前均签署手术知情同意书。三、分析指标及评价标准纳入研究的变量及分析指标包括人口学特征(性别、年龄),体重指数(bodymassindex,BMI),病史(年),有无腹部症状(腹痛、腹胀及消化不良等),肝炎病史,脂肪肝病史,心血管病史及糖尿病病史,术前超声特征(胆囊大小、胆囊黏膜、胆囊壁厚度、结石大小、结石数量,是否为泥沙结石、颈部结石及充满型结石)。评价标准:BMI分级采用年《中国成人超重和肥胖症预防控制指南》[14]公布的诊断标准;根据指南将超声提示胆囊壁厚≥4mm定义为胆囊壁增厚[15];GBIN病理学诊断标准参考年WHO肿瘤分类消化分册(第4版)[16]。多发结石的大小指术前超声检查提示的结石最大径。四、统计学方法?采用SPSS19.0统计软件进行分析。正态分布的计量资料以x±s表示,偏态分布的计量资料以M(QR)表示。计数资料以例数和百分数表示。单因素分析采用χ2检验,多因素分析采用Logistic回归模型。以P0.05为差异有统计学意义。五、预测模型的建立及验证基于Logistic回归模型筛选的独立相关因素进行模型建立及验证。将原始数据按照7∶3比例随机分为建模组(例)和验证组(例),将建模组数据导入R3.6.0软件及BayesiaLab进行建模,贝叶斯网络采用树增益朴素贝叶斯(treeaugmentedna?veBayes,TAN)算法。采用一致性指数(concordanceindex,C-index)、校准图、受试者工作特征(receiveroperatingcharacteristic,ROC)曲线的曲线下面积(areaundercurve,AUC)、混淆矩阵评估列线图及TAN模型的预测能力。结果
一、手术及术后病理情况入组患者均行胆囊切除术,行腹腔镜手术切除例(92.4%)、开腹手术切除57例(7.6%)。其中单纯行腹腔镜胆囊切除术例(90.3%)、开腹胆囊切除术35例(4.7%)、腹腔镜胆囊切除+胆道探查术16例(2.1%)、开腹胆囊切除+胆道探查术22例(2.9%)。术后病理学检查结果提示胆囊结石伴慢性胆囊炎例(80.0%)、低级别上皮内瘤变例(14.1%)、中级别上皮内瘤变22例(2.9%)、高级别上皮内瘤变22例(2.9%),其中高级别上皮内瘤变中包含5例原位癌(0.7%)。二、影响结石相关型GBIN发生的单因素分析结果(表1)表1 胆囊结石患者发生结石相关型胆囊上皮内瘤变的相关因素的单因素分析[例(%)]单因素分析结果显示,年龄、病史、胆囊大小、胆囊黏膜是否光滑、胆囊壁是否增厚、结石大小及结石数量是结石相关型GBIN发生的相关因素(χ2=19.、8.、9.、9.、8.、15.、9.,P值均0.05)。三、影响结石相关型GBIN发生的多因素分析结果(表2)多因素分析结果显示,年龄(OR=2.23,95%CI:1.50~3.31,P0.01)、胆囊大小(OR=2.11,95%CI:1.17~3.80,P=0.)、胆囊黏膜是否光滑(OR=1.80,95%CI:1.13~2.88,P=0.)、结石大小(OR=2.98,95%CI:1.71~5.21,P0.01)、结石数量(OR=2.14,95%CI:1.34~3.42,P0.01)是结石相关型GBIN发生的独立相关因素。表2 影响结石相关型胆囊上皮内瘤变发生的独立相关因素分析四、结石相关型GBIN发生的预测模型建立及验证(一)结石相关型GBIN发生的预测模型建立基于患者年龄、胆囊大小、胆囊黏膜、结石大小及结石数量等影响结石相关型GBIN发生的独立相关因素分别建立的列线图及TAN预测模型见图1、2。图1 预测结石相关型胆囊上皮内瘤变发生的列线图模型图2 预测结石相关型胆囊上皮内瘤变发生的树增益朴素贝叶斯模型(二)结石相关型GBIN发生的预测模型内部验证列线图预测模型建模组C-index为0.,内部验证组C-index为0.,校准图曲线见图3。图3 预测结石相关型胆囊上皮内瘤变发生的列线图模型的校准图:3A示建模组校准图;3B示验证组校准图验证组列线图和TAN预测模型ROC曲线见图4,建模组AUC分别为70.60%和70.73%,验证组AUC分别为68.14%和67.47%。两种预测模型混淆矩阵见表3。列线图正确预测值个数:非GBIN者例、GBIN者59例;错误预测值个数:非GBIN者例、GBIN者44例,其模型精确度=(+59)/(+59++44)×%=69.96%。TAN预测模型建模组正确预测值个数:非GBIN者例、GBIN者60例;错误预测值个数:非GBIN者例、GBIN者43例,其模型精确度=(+60)/(+60++43)×%=70.72%。同样地,两者模型验证组模型精确度分别为66.96%和67.41%。以上结果表明,两个模型的预测能力接近,预测能力良好。图4 预测结石相关型胆囊上皮内瘤变发生的模型的受试者工作特征(ROC)曲线:4A示列线图模型建模组ROC曲线;4B示树增益朴素贝叶斯(TAN)模型建模组ROC曲线;4C示列线图模型验证组ROC曲线;4D示TAN模型验证组ROC曲线表3 预测结石相关型GBIN发生的模型的混淆矩阵讨论
胆囊癌的发病率居消化道肿瘤第6位,且呈逐年上升趋势[2]。胆囊癌早期诊断困难,发现时多数为中晚期,失去了根治性手术切除的机会,预后极差。如何有效识别胆囊癌前病变,提高早期诊断率,及时行胆囊切除,对于降低胆囊癌的发生率及提高治疗效果具有重要意义。随着对GBIN的深入研究,已发现胆囊癌与GBIN具有共同的形态学和组织化学特征,并了解了“化生-上皮内瘤变-癌”的病理过程[4,17]。结石相关型GBIN在不同国家地区发病率为0.25%~33.8%,而胆囊癌周围组织上皮内瘤变发生率为45%~48%[17,18,19]。明确结石相关型GBIN发生的相关因素对于胆囊癌的预防具有十分重要的价值。本研究结果显示,胆囊结石直径和数目、胆囊大小、黏膜是否光滑及患者年龄是GBIN发生的独立相关因素。胆囊结石直径和数目与胆囊癌的发生及预后密切相关,胆囊结石患者发生胆囊癌的风险是无胆囊结石人群的13.7倍[20,21,22]。有研究者发现,胆囊结石大小直接影响患者胆囊癌的发生风险,随着胆囊结石直径的增大,胆囊癌的发生风险也随之升高[23,24]。本研究中,胆囊结石直径2cm者发生GBIN的风险是直径1cm者的2.98倍,表明结石直径与GBIN发生相关。另外,本研究结果提示,胆囊多发结石患者发生结石相关型GBIN的风险是单发结石者的2.14倍。通过本研究,我们发现胆囊萎缩和增大者发生结石相关型GBIN的风险分别是胆囊大小正常者的1.41倍和2.11倍,而胆囊黏膜毛糙者发生瘤变的风险是胆囊黏膜光滑者的1.80倍。在长期胆囊结石及慢性炎症环境的刺激下,胆囊壁可发生纤维化、钙化,导致胆囊形态发生变化,胆囊黏膜出现不同程度的毛糙增厚[5]。此外,胆囊癌的发生与患者年龄相关,且随着年龄增长呈上升趋势[3,25]。本研究中,年龄≥50岁的胆囊结石患者发生GBIN的风险是50岁者的2.23倍。因此,对于胆囊结石大小2cm、多发且年龄较大者应警惕GBIN的发生。目前已有胆囊癌列线图预测模型的相关报道,Chen等[26]基于年龄、CA19-9及上腹增强CT表现(有无胆囊结石、胆囊黏膜、胆囊壁是否强化)等建立了胆囊癌列线图预测模型,内部验证组AUC为0.91。Zhou等[27]基于年龄、胆囊是否萎缩、结石病史、胆囊黏膜是否完整等建立Ⅰ~Ⅱ期胆囊癌列线图预测模型,内部验证组C-index为0.。GBIN属于胆囊癌前病变,预测其发生可有助于预防胆囊癌的发生,具有十分重要的临床应用价值。本研究中,除外年龄因素外,结石大小和数量、胆囊黏膜情况等变量可通过术前超声检查获取,具有简便可行的优点。基于影响结石相关型GBIN发生的独立相关因素,我们分别建立了列线图及TAN预测模型,列线图建模组和验证组C-index分别为0.和0.,两种模型建模组AUC分别为70.60%和70.73%,验证组AUC分别为68.14%和67.47%,结果表明两种模型的预测能力较为一致。TAN预测模型同样可以根据不同影响因素的组合,预测最终的发生概率,且更为具体。如患者年龄50岁、胆囊增大、胆囊壁毛糙、结石直径2cm及多发结石者,列线图和TAN模型预测结石相关型GBIN发生概率分别为63.00%和62.11%。本研究中TAN预测模型的预测能力较列线图未表现出明显的优势,考虑与纳入患者例数相对较少而未发挥贝叶斯算法的优势有关,另一方面也表明列线图预测能力良好且稳定。本研究是我们首次尝试将列线图及贝叶斯算法共同用于结石相关型GBIN发生的预测及评估,结果虽然显示出了一定的可行性,但仍存在诸多不足及缺陷,如样本量相对较少,未对模型进行外部验证评估等。今后尚需进一步开展多中心、前瞻性、大样本临床研究,纳入更多患者资料,并进行不同算法模型的比较,从而建立更为准确的预测模型,使临床医师可以有效识别结石相关型GBIN以达到预防胆囊癌的目的。参考文献
(在框内滑动手指即可浏览)
[1]刘厚宝,倪小健,沈盛,等.胆囊良性疾病的治疗现状与思考[J].中华消化外科杂志,,19(8):-.DOI:10./cma.j.cn-0714-.
[2]HundalR,ShafferEA.Gallbladdercancer:epidemiologyandout