克罗恩病内镜评分新标准:EASE-CD评分重新定义克罗恩病黏膜愈合

医学论坛网

2周前

ASE-CD的开发并非孤立事件,而是国际学术界系统性改进克罗恩病内镜评估的一部分。

克罗恩病的内镜下黏膜愈合被确立为长期治疗的核心目标。然而,临床实践中广泛应用的两大传统评分系统,克罗恩病内镜严重程度指数(CDEIS)与简化内镜评分(SES-CD),正面临前所未有的挑战。

图片

图源:CMT

这些局限性并非技术细节问题,而是直接影响临床决策质量的系统性缺陷。SES-CD和CDEIS与临床疾病活动的相关性仅为中等水平,这意味着内镜下看似“严重”的病变可能与患者实际症状脱节,反之亦然。更为棘手的是,两个评分系统均受到病变累及肠段数量的强烈影响:一名在多个结肠段散布细小阿弗他溃疡的患者,其总分可能远高于另一名仅在单一回肠段存在深大匐行性溃疡的患者。这种非线性的评分特性使得将总分作为连续变量来定义治疗反应变得极为困难。

在操作层面,狭窄评估的可靠性问题尤为突出。传统评分将能否通过狭窄段作为分级标准,但这一判断高度依赖内镜型号、操作者技术、充气程度等多种可变因素。此外,非溃疡性炎症黏膜(如单纯红斑、水肿)的纳入不仅增加了主观性,还与溃疡相关项目存在显著共线性,导致评分冗余。更为关键的是,现有评分缺乏经过验证的临床意义变化阈值,研究者不得不借用组织学或影像学标准来间接定义内镜反应,这种“借标准”的做法本身就说明了传统工具的不足。

EASE-CD的诞生:

从“面面俱到”到“精准聚焦”

面对上述困境,国际多学科团队开展了一项历时数年的系统性研究,最终开发并验证了一种全新的评估工具——内镜溃疡活动评分(EASE-CD)。该研究成果于2025年发表于《柳叶刀·胃肠病学与肝病学》,代表了克罗恩病内镜评估领域近三十年来的最重大进展。

图片

ASE-CD的开发遵循了现代指数构建的严格方法论框架。研究团队首先通过改良RAND/UCLA适当性研究方法,由15名国际专家就内镜评估的关键要素达成共识,确立了具有表面效度的候选项目。随后,利用两项随机对照试验(阿达木单抗EXTEND试验与瑞莎珠单抗Ⅱ期试验)的中央盲法阅片数据,对候选项目进行信度与反应度检验。只有同时满足组内相关系数(ICC)≥0.41(至少中等信度)和获胜概率(WinP)≥0.56(至少小效应量反应度)的项目才能进入最终模型构建。

这一严苛的筛选过程带来了颠覆性的设计变革。EASE-CD最终仅包含三个核心项目:溃疡存在与大小、深溃疡存在与否,以及溃疡表面积比例。溃疡大小采用0-3分的有序分类:0分为无溃疡,1分为溃疡<5mm,2分为5-20mm,3分为>20mm;深溃疡为二分类变量(0=无,1=有);溃疡表面积则以0-1的连续比例表示。每个项目均在可视化的肠段(回肠、右半结肠、横结肠、左半结肠、直肠)中进行评估,然后取平均值,最终总分转换为0-100分的连续量表。

与传统评分不同,EASE-CD总分与内镜严重程度的视觉模拟评分(VAS)呈强线性相关(Spearman相关系数0.81),且无溃疡即得0分,这与STRIDE-II指南推荐的“无溃疡性内镜愈合”长期治疗目标完全吻合。相比之下,SES-CD的“内镜缓解”定义在文献中竟有0分、≤2分、≤4分、≤4分且单项≤1分等多种版本,这种异质性严重阻碍了跨研究比较。

验证数据说话:

EASE-CD的性能优势

ASE-CD的优越性并非理论推演,而是经过严格的内部与外部验证。在EXTEND试验数据的内部验证中,模型的决定系数(r²)为0.608,经乐观性校正后仍为0.554,校准斜率为0.983,显示出良好的拟合度与校准度。在瑞莎珠单抗试验的外部验证中,校正r²为0.565,校准斜率为0.997,证明了跨研究人群的稳定性。

信度方面,EASE-CD在中央阅片者间展现出实质性信度(ICC 0.798,95%CI:0.711-0.836),显著优于传统评分中狭窄项目的信度(SES-CD狭窄ICC仅0.300)。分项目分析显示,溃疡大小评分的信度接近完美(ICC 0.850),深溃疡评分为实质性(ICC 0.788),即使是最具挑战性的溃疡表面积比例评估,其信度(ICC 0.326)也与CDEIS的溃疡表面积项目相当。

反应度是评估工具能否捕捉治疗变化的关键指标。EASE-CD的获胜概率(WinP)在外部验证中达到0.769(95%CI:0.658-0.851),对应大效应量(Cohen's d>0.8),显著高于传统评分。更为重要的是,EASE-CD的反应度不受基线疾病严重程度影响:无论基线SES-CD≥16分(重度)还是<16分(轻中度),WinP均保持在0.70以上,而传统评分在重度患者中信度明显下降。

研究团队还确立了具有临床操作意义的阈值。EASE-CD下降10分对内镜反应(SES-CD或CDEIS下降≥50%)的特异性为82.4%,敏感性为69.9%;而EASE-CD≤10分对应内镜缓解(SES-CD≤4或CDEIS≤6)的敏感性为83.7%,特异性高达94.5%。这些经过验证的阈值为临床试验终点定义和临床实践目标设定提供了明确依据。

从共识到实践:

评分标准化的国际努力

ASE-CD的开发并非孤立事件,而是国际学术界系统性改进克罗恩病内镜评估的一部分。2023年发表的RAND/UCLA适当性研究为整个领域确立了重要的评分规范共识,这些共识直接影响了EASE-CD的设计原则。

该研究由15名来自北美和欧洲的专家参与,通过两轮改良德尔菲流程,就SES-CD和CDEIS的评分规则进行了详细投票。关键共识包括:所有溃疡均应计入评分,包括阿弗他溃疡、吻合口溃疡和肛管溃疡(计入直肠段);内镜愈合应定义为溃疡的完全消失;狭窄应定义为管腔直径的明确减小,若位于两段肠管交界处则计入远端肠段;而瘢痕和炎性息肉不应计入受累面积评分。这些规则解决了长期存在的评分歧义,如吻合口溃疡是否因“缺血性”疑虑而被排除、狭窄段近端病变如何计分等实际问题。

研究同时识别了仍需探索的领域:深溃疡的最佳定义方法(黏膜下层受累vs可见火山口样改变)、溃疡/受累表面积的准确估算方法(分类vs连续变量)等。这些“不确定”项目恰恰成为EASE-CD后续研究的切入点——EASE-CD最终采用“超越黏膜表面”作为深溃疡定义,并以连续比例表示溃疡表面积,正是对这些研究空白的回应。

技术融合:

超高分辨率内镜

与人工智能的前沿探索

在EASE-CD确立宏观评估新标准的同时,超高分辨率内镜技术正将评估维度推向微观层面。共聚焦激光显微内镜(CLE)通过荧光素钠染色,可实现高达250μm深度的实时在体组织学观察;细胞内镜(EC)则通过接触式光学显微技术,分辨细胞形态与核特征,实现炎症细胞的类型鉴别。

这些技术在克罗恩病管理中展现出多重价值。CLE开发的ENHANCE指数(溃疡性结肠炎)和CDEAS评分(克罗恩病)通过量化隐窝结构、微血管形态和荧光素渗漏,实现了组织学活动的实时评估。更为重要的是,CLE能够评估屏障功能障碍——通过Watson评分(基于细胞脱落和荧光素渗漏分级)或上皮间隙密度,预测疾病复发、住院和手术等重大不良结局。研究显示,每增加1%的间隙密度,重大不良事件风险增加1.1倍,这种预测能力超越了传统内镜评估的范畴。

在肿瘤监测领域,EC结合核染色(甲苯胺蓝)和胞浆染色(结晶紫)的双染色技术,通过评估核质比变化,对溃疡性结肠炎相关异型增生(UCAN)的识别准确率可达88%,优于单纯pit pattern分析。而CLE与染色内镜联合使用,虽能减少活检数量并提高单次活检阳性率,但设备故障率高(可达32%)、无法评估带蒂病变等局限性限制了其常规应用。

人工智能的融入为上述技术注入了新的活力。基于卷积神经网络(CNN)-长短期记忆(LSTM)架构的深度学习模型,已能通过CLE图像自动识别克罗恩病的黏膜愈合状态,敏感性和特异性均超过90%。计算机辅助的EC图像分析可预测溃疡性结肠炎的持续性组织学炎症,敏感性74%、特异性97%。AI不仅能减少阅片时间和学习曲线,还能提供人眼无法量化的客观参数,如精确的溃疡面积测量、隐窝几何形态分析等。

ASE-CD的设计理念与AI应用高度契合。其仅包含三个明确项目的简洁结构,以及溃疡表面积的连续比例测量,为AI算法提供了理想的输入框架。未来,AI辅助的EASE-CD评分有望实现溃疡大小、深度和表面积的自动化精确量化,进一步减少观察者间变异,提升评估效率。

多维整合:

构建理想评估体系的路径

尽管EASE-CD和超高分辨率内镜代表了重大进步,但单一模态的局限性依然存在。内镜的侵入性决定了其无法用于频繁监测,而EASE-CD对非溃疡性炎症(如单纯红斑、水肿)的不敏感性,也意味着其在某些表型(如类似溃疡性结肠炎的浅表炎症型克罗恩病)中的应用受限。

因此,新型评估策略强调多模态整合。肠道超声(GIUS)和磁共振肠造影(MRE)等无创影像技术已被证实能有效预测内镜活动度,可作为内镜的合理替代或补充。血清生物标志物组合(如内镜愈合指数EHI)和粪便钙卫蛋白等则提供了更为便捷的炎症监测手段。理想的未来评估体系将是“分层递进”模式:以无创标志物进行广泛筛查和频繁监测,以超声/MRE进行中段随访,以内镜(EASE-CD评分)进行关键时间点的精确评估,必要时辅以CLE/EC进行微观愈合判断或AI辅助量化。

这一体系的核心目标是服务于“达标治疗”策略——通过客观、可重复、多维度的评估,及时调整治疗方案,最终实现改变克罗恩病自然病程、减少住院和手术、改善患者长期预后的终极目标。EASE-CD的诞生,正是这一体系构建的关键里程碑。

结语

ASE-CD通过聚焦溃疡核心病变、确立验证阈值、实现线性量化,解决了传统评分三十年来未能克服的结构性缺陷。EASE-CD的验证标志着克罗恩病内镜评估从“经验驱动”转向“证据驱动”,其通过以溃疡为核心、以信度与反应度为筛选标准、以线性量化为实现路径的逻辑重构,建立了符合现代临床试验需求的新范式。而其与超高分辨率内镜、人工智能的融合,以及与无创影像、生物标志物的整合,正在勾勒出一个更为精准、高效、多维的疾病评估新时代。

参考文献

[1]MA C, KHANNA R, MAGUIRE BR,et al. Development and validation of a novel Endoscopic ulcer Activity Score for Evaluation of Crohn's Disease (EASE-CD) using data from two randomised controlled trials[J]. Lancet Gastroenterol Hepatol,2025;10(8):746-756.DOI:10.1016/S2468-1253(25)00093-7.

[2]KHANNA R, MA C, HOGAN M,et al. Standardizing scoring conventions for crohn's disease endoscopy: an international RAND/UCLAappropriateness study[J]. Clin Gastroenterol Hepatol,2023;21(11):2938-2950.e6.DOI:10.1016/j.cgh.2023.05.029.

[3]PAL P, RAMCHANDANI M, PATEL R,et al. Role of ultra-high definition endoscopy (endomicroscopy and endocytoscopy) and real-time histologic examination in inflammatory bowel disease: Scoping review[J]. Dig Endosc,2024;36(3):274-289.DOI:10.1111/den.14659.

ldquo;医学论坛网”发布医学领域研究成果和解读,供专业人员科研参考,不作为诊疗标准,使用需根据具体情况评估。

ASE-CD的开发并非孤立事件,而是国际学术界系统性改进克罗恩病内镜评估的一部分。

克罗恩病的内镜下黏膜愈合被确立为长期治疗的核心目标。然而,临床实践中广泛应用的两大传统评分系统,克罗恩病内镜严重程度指数(CDEIS)与简化内镜评分(SES-CD),正面临前所未有的挑战。

图片

图源:CMT

这些局限性并非技术细节问题,而是直接影响临床决策质量的系统性缺陷。SES-CD和CDEIS与临床疾病活动的相关性仅为中等水平,这意味着内镜下看似“严重”的病变可能与患者实际症状脱节,反之亦然。更为棘手的是,两个评分系统均受到病变累及肠段数量的强烈影响:一名在多个结肠段散布细小阿弗他溃疡的患者,其总分可能远高于另一名仅在单一回肠段存在深大匐行性溃疡的患者。这种非线性的评分特性使得将总分作为连续变量来定义治疗反应变得极为困难。

在操作层面,狭窄评估的可靠性问题尤为突出。传统评分将能否通过狭窄段作为分级标准,但这一判断高度依赖内镜型号、操作者技术、充气程度等多种可变因素。此外,非溃疡性炎症黏膜(如单纯红斑、水肿)的纳入不仅增加了主观性,还与溃疡相关项目存在显著共线性,导致评分冗余。更为关键的是,现有评分缺乏经过验证的临床意义变化阈值,研究者不得不借用组织学或影像学标准来间接定义内镜反应,这种“借标准”的做法本身就说明了传统工具的不足。

EASE-CD的诞生:

从“面面俱到”到“精准聚焦”

面对上述困境,国际多学科团队开展了一项历时数年的系统性研究,最终开发并验证了一种全新的评估工具——内镜溃疡活动评分(EASE-CD)。该研究成果于2025年发表于《柳叶刀·胃肠病学与肝病学》,代表了克罗恩病内镜评估领域近三十年来的最重大进展。

图片

ASE-CD的开发遵循了现代指数构建的严格方法论框架。研究团队首先通过改良RAND/UCLA适当性研究方法,由15名国际专家就内镜评估的关键要素达成共识,确立了具有表面效度的候选项目。随后,利用两项随机对照试验(阿达木单抗EXTEND试验与瑞莎珠单抗Ⅱ期试验)的中央盲法阅片数据,对候选项目进行信度与反应度检验。只有同时满足组内相关系数(ICC)≥0.41(至少中等信度)和获胜概率(WinP)≥0.56(至少小效应量反应度)的项目才能进入最终模型构建。

这一严苛的筛选过程带来了颠覆性的设计变革。EASE-CD最终仅包含三个核心项目:溃疡存在与大小、深溃疡存在与否,以及溃疡表面积比例。溃疡大小采用0-3分的有序分类:0分为无溃疡,1分为溃疡<5mm,2分为5-20mm,3分为>20mm;深溃疡为二分类变量(0=无,1=有);溃疡表面积则以0-1的连续比例表示。每个项目均在可视化的肠段(回肠、右半结肠、横结肠、左半结肠、直肠)中进行评估,然后取平均值,最终总分转换为0-100分的连续量表。

与传统评分不同,EASE-CD总分与内镜严重程度的视觉模拟评分(VAS)呈强线性相关(Spearman相关系数0.81),且无溃疡即得0分,这与STRIDE-II指南推荐的“无溃疡性内镜愈合”长期治疗目标完全吻合。相比之下,SES-CD的“内镜缓解”定义在文献中竟有0分、≤2分、≤4分、≤4分且单项≤1分等多种版本,这种异质性严重阻碍了跨研究比较。

验证数据说话:

EASE-CD的性能优势

ASE-CD的优越性并非理论推演,而是经过严格的内部与外部验证。在EXTEND试验数据的内部验证中,模型的决定系数(r²)为0.608,经乐观性校正后仍为0.554,校准斜率为0.983,显示出良好的拟合度与校准度。在瑞莎珠单抗试验的外部验证中,校正r²为0.565,校准斜率为0.997,证明了跨研究人群的稳定性。

信度方面,EASE-CD在中央阅片者间展现出实质性信度(ICC 0.798,95%CI:0.711-0.836),显著优于传统评分中狭窄项目的信度(SES-CD狭窄ICC仅0.300)。分项目分析显示,溃疡大小评分的信度接近完美(ICC 0.850),深溃疡评分为实质性(ICC 0.788),即使是最具挑战性的溃疡表面积比例评估,其信度(ICC 0.326)也与CDEIS的溃疡表面积项目相当。

反应度是评估工具能否捕捉治疗变化的关键指标。EASE-CD的获胜概率(WinP)在外部验证中达到0.769(95%CI:0.658-0.851),对应大效应量(Cohen's d>0.8),显著高于传统评分。更为重要的是,EASE-CD的反应度不受基线疾病严重程度影响:无论基线SES-CD≥16分(重度)还是<16分(轻中度),WinP均保持在0.70以上,而传统评分在重度患者中信度明显下降。

研究团队还确立了具有临床操作意义的阈值。EASE-CD下降10分对内镜反应(SES-CD或CDEIS下降≥50%)的特异性为82.4%,敏感性为69.9%;而EASE-CD≤10分对应内镜缓解(SES-CD≤4或CDEIS≤6)的敏感性为83.7%,特异性高达94.5%。这些经过验证的阈值为临床试验终点定义和临床实践目标设定提供了明确依据。

从共识到实践:

评分标准化的国际努力

ASE-CD的开发并非孤立事件,而是国际学术界系统性改进克罗恩病内镜评估的一部分。2023年发表的RAND/UCLA适当性研究为整个领域确立了重要的评分规范共识,这些共识直接影响了EASE-CD的设计原则。

该研究由15名来自北美和欧洲的专家参与,通过两轮改良德尔菲流程,就SES-CD和CDEIS的评分规则进行了详细投票。关键共识包括:所有溃疡均应计入评分,包括阿弗他溃疡、吻合口溃疡和肛管溃疡(计入直肠段);内镜愈合应定义为溃疡的完全消失;狭窄应定义为管腔直径的明确减小,若位于两段肠管交界处则计入远端肠段;而瘢痕和炎性息肉不应计入受累面积评分。这些规则解决了长期存在的评分歧义,如吻合口溃疡是否因“缺血性”疑虑而被排除、狭窄段近端病变如何计分等实际问题。

研究同时识别了仍需探索的领域:深溃疡的最佳定义方法(黏膜下层受累vs可见火山口样改变)、溃疡/受累表面积的准确估算方法(分类vs连续变量)等。这些“不确定”项目恰恰成为EASE-CD后续研究的切入点——EASE-CD最终采用“超越黏膜表面”作为深溃疡定义,并以连续比例表示溃疡表面积,正是对这些研究空白的回应。

技术融合:

超高分辨率内镜

与人工智能的前沿探索

在EASE-CD确立宏观评估新标准的同时,超高分辨率内镜技术正将评估维度推向微观层面。共聚焦激光显微内镜(CLE)通过荧光素钠染色,可实现高达250μm深度的实时在体组织学观察;细胞内镜(EC)则通过接触式光学显微技术,分辨细胞形态与核特征,实现炎症细胞的类型鉴别。

这些技术在克罗恩病管理中展现出多重价值。CLE开发的ENHANCE指数(溃疡性结肠炎)和CDEAS评分(克罗恩病)通过量化隐窝结构、微血管形态和荧光素渗漏,实现了组织学活动的实时评估。更为重要的是,CLE能够评估屏障功能障碍——通过Watson评分(基于细胞脱落和荧光素渗漏分级)或上皮间隙密度,预测疾病复发、住院和手术等重大不良结局。研究显示,每增加1%的间隙密度,重大不良事件风险增加1.1倍,这种预测能力超越了传统内镜评估的范畴。

在肿瘤监测领域,EC结合核染色(甲苯胺蓝)和胞浆染色(结晶紫)的双染色技术,通过评估核质比变化,对溃疡性结肠炎相关异型增生(UCAN)的识别准确率可达88%,优于单纯pit pattern分析。而CLE与染色内镜联合使用,虽能减少活检数量并提高单次活检阳性率,但设备故障率高(可达32%)、无法评估带蒂病变等局限性限制了其常规应用。

人工智能的融入为上述技术注入了新的活力。基于卷积神经网络(CNN)-长短期记忆(LSTM)架构的深度学习模型,已能通过CLE图像自动识别克罗恩病的黏膜愈合状态,敏感性和特异性均超过90%。计算机辅助的EC图像分析可预测溃疡性结肠炎的持续性组织学炎症,敏感性74%、特异性97%。AI不仅能减少阅片时间和学习曲线,还能提供人眼无法量化的客观参数,如精确的溃疡面积测量、隐窝几何形态分析等。

ASE-CD的设计理念与AI应用高度契合。其仅包含三个明确项目的简洁结构,以及溃疡表面积的连续比例测量,为AI算法提供了理想的输入框架。未来,AI辅助的EASE-CD评分有望实现溃疡大小、深度和表面积的自动化精确量化,进一步减少观察者间变异,提升评估效率。

多维整合:

构建理想评估体系的路径

尽管EASE-CD和超高分辨率内镜代表了重大进步,但单一模态的局限性依然存在。内镜的侵入性决定了其无法用于频繁监测,而EASE-CD对非溃疡性炎症(如单纯红斑、水肿)的不敏感性,也意味着其在某些表型(如类似溃疡性结肠炎的浅表炎症型克罗恩病)中的应用受限。

因此,新型评估策略强调多模态整合。肠道超声(GIUS)和磁共振肠造影(MRE)等无创影像技术已被证实能有效预测内镜活动度,可作为内镜的合理替代或补充。血清生物标志物组合(如内镜愈合指数EHI)和粪便钙卫蛋白等则提供了更为便捷的炎症监测手段。理想的未来评估体系将是“分层递进”模式:以无创标志物进行广泛筛查和频繁监测,以超声/MRE进行中段随访,以内镜(EASE-CD评分)进行关键时间点的精确评估,必要时辅以CLE/EC进行微观愈合判断或AI辅助量化。

这一体系的核心目标是服务于“达标治疗”策略——通过客观、可重复、多维度的评估,及时调整治疗方案,最终实现改变克罗恩病自然病程、减少住院和手术、改善患者长期预后的终极目标。EASE-CD的诞生,正是这一体系构建的关键里程碑。

结语

ASE-CD通过聚焦溃疡核心病变、确立验证阈值、实现线性量化,解决了传统评分三十年来未能克服的结构性缺陷。EASE-CD的验证标志着克罗恩病内镜评估从“经验驱动”转向“证据驱动”,其通过以溃疡为核心、以信度与反应度为筛选标准、以线性量化为实现路径的逻辑重构,建立了符合现代临床试验需求的新范式。而其与超高分辨率内镜、人工智能的融合,以及与无创影像、生物标志物的整合,正在勾勒出一个更为精准、高效、多维的疾病评估新时代。

参考文献

[1]MA C, KHANNA R, MAGUIRE BR,et al. Development and validation of a novel Endoscopic ulcer Activity Score for Evaluation of Crohn's Disease (EASE-CD) using data from two randomised controlled trials[J]. Lancet Gastroenterol Hepatol,2025;10(8):746-756.DOI:10.1016/S2468-1253(25)00093-7.

[2]KHANNA R, MA C, HOGAN M,et al. Standardizing scoring conventions for crohn's disease endoscopy: an international RAND/UCLAappropriateness study[J]. Clin Gastroenterol Hepatol,2023;21(11):2938-2950.e6.DOI:10.1016/j.cgh.2023.05.029.

[3]PAL P, RAMCHANDANI M, PATEL R,et al. Role of ultra-high definition endoscopy (endomicroscopy and endocytoscopy) and real-time histologic examination in inflammatory bowel disease: Scoping review[J]. Dig Endosc,2024;36(3):274-289.DOI:10.1111/den.14659.

ldquo;医学论坛网”发布医学领域研究成果和解读,供专业人员科研参考,不作为诊疗标准,使用需根据具体情况评估。

展开
打开“财经头条”阅读更多精彩资讯
APP内打开