2021中国肺癌高峰论坛访谈录
李瑞娜, 张媛冬, 张华, 杨学宁
广东省人民医院循证医学编辑部、广东省医学科学院、广东省肺癌研究所,广州 510080
关键词: 肺肿瘤; 专家共识
中图分类号:R734.2 文献标识码:A 收稿日期: 2021-06-21
An Interview at 2021 Chinese Lung Cancer Summit Forum
LI Rui-na, ZHANG Yuan-dong, ZHANG Hua, YANG Xue-ning
Authors' address: Editorial Department of The Journal of Evidence-Based Medicine, Guangdong Provincial People's Hospital, Guangdong Academy of Medical Sciences, Guangdong Lung Cancer Institute, Guangzhou 510080, China
Key words: lung neoplasms; specialists'consensus

2021年3月6日, 由中国抗癌协会肺癌专业委员会和广东省临床试验协会/中国胸部肿瘤研究协作组联合主办, 广东省抗癌协会肺癌专业委员会, 广东省人民医院、广东省医学科学院和广东省肺癌研究所承办的第18届肺癌高峰论坛以久别相会的线下形式举行。本次高峰论坛以非小细胞肺癌(non-small cell lung cancer, NSCLC)分子残留病灶(molecular residual disease, MRD)为主题, 中国顶级肿瘤专家及分子检测专家齐聚一堂, 分别从NSCLC的MRD定义、检测标准、临床应用等问题展开热烈的讨论, 呈现了一场精彩的学术盛宴。会议期间, 本刊编辑部记者采访了几位专家。

记者:陆教授, MRD从血液肿瘤延伸至实体肿瘤, 迫切需要的就是定义问题。请问相对血液肿瘤来说, 肺癌MRD的定义、检测的主要方法以及目前关于肺癌MRD的研究现状有何特点?

陆舜教授(上海交通大学附属胸科医院):关于MRD的定义最早出现在血液肿瘤、骨髓瘤中, 指癌症患者经过根治性治疗以后, 仍然残留恶性肿瘤细胞, 也叫微小或可测量残留病灶(minimal/ measurable residual disease), 最初用于血液肿瘤, 现在延伸到实体肿瘤。MRD阳性通常比MRD阴性的患者预后更差, 被认为是biomarker, 阳性结果意味着在根治性治疗以后, 可能预后不好, 但是干预后, 能否改变治疗结局, 目前在实体肿瘤中并不确定。

进一步研究认为MRD需要定量表现出来, 以往在血液肿瘤患者中, 大部分基于骨穿标本进行测量, 而实体肿瘤主要进行血液标本检测。美国食品药品监督管理局(Food and Drug Administration, FDA)已批准二代测序(next generation sequencing, NGS)测量骨髓瘤中的MRD。

实体肿瘤MRD检测的难度较大, 我们需要做一个平衡, panel是要更大, 测更多的基因?还是对有限的基因测得更深?大而深应该是我们的目标。实体肿瘤panel的设计, 难度大于血液肿瘤。TRACERx研究在开发时, 做了个性化的MRD panel, 随着研究的深入, 发现测得更广, 可能测到更多的MRD, 提高阳性率。实体瘤中最常见的MRD测量是对循环肿瘤DNA(circulating tumor DNA, ctDNA)突变丰度的评估, 常见的定量指标包括:ctDNA检测中所有体细胞突变丰度的最大等位基因分数(maximum somatic allele frequency, maxAF/MSAF); ctDNA检测中所有体细胞突变丰度的平均值(mean AF); ctDNA浓度, 指通过突变丰度乘以血浆中游离DNA(circulating-free cell DNA, cfDNA)的浓度计算而来, 单位为ng/mL, 这里的突变丰度以mean AF计算更多见; ctDNA的绝对浓度, 指将ctDNA浓度换算成hGE/mL, 可以得出单位体积中ctDNA的分子数, 又称为绝对定量。TRACERx研究数据的分析, 比较平均主克隆突变丰度和以此计算的浓度与肿瘤体积之间的相关性, 提示浓度或许是更好的定量方式。

在英国启动的TRACERx研究, 希望探索肺癌是否能通过定制化的MRD有效预测肺癌的复发和转移。在2017年的对每个患者做16个定制化基因检测, 肺腺癌阳性率Ⅰ 期只有13%, 但到2020年增加到200个变异数, Ⅰ 期肺腺癌中阳性率提高到33%, 所以增加可测变异数, 可能提高阳性率。

增加可观测事件, 面临着选择定制化panel还是固定panel?定制化panel检测得更深, 固定panel检测得更广, 检测MRD的要求是非常灵敏的方法。未来不仅仅局限于ctDNA, 还会在表观遗传、RNA或者多组学的标志物方面取得突破。

在2019年中国肺癌高峰论坛已经达成共识:液体活检是非侵入性检测治疗反应的有效工具, 在外周血可以通过检测ctDNA, 对根治性手术后放疗后的患者预测复发风险。ctDNA在实体肿瘤如乳腺癌、结直肠癌中的一系列研究都证明对于局限性、相对早期的肿瘤, 术后MRD与复发风险强相关, 而这种预测价值独立于临床病理高危因素, 是独立的预后指标。

在早期肺癌中, 2013年发表在《Radiother Oncol》的研究证明ctDNA在MRD检测预测复发转移早于影像学。随后2017年一篇1 700多个患者的meta分析表明ctDNA浓度与肺癌死亡风险明显相关, 手术或者根治性放化疗后, 短时间检测ctDNA浓度变化, 可能预测患者预后。同年《Cancer Discov》研究发现, MRD检测在影像学进展前5.2个月就可能预测复发风险, 可以有效鉴别局限期肺癌治疗后的MRD, 提早发现复发和转移, 有助于在疾病负担比较早的阶段, 进行个体化的辅助治疗。王俊院士团队在《Clin Cancer Res》发表的DYNAMIC研究手术后不同天数的MRD动态观察, 发现术后3天MRD阳性, 无进展生存期(progression-free survival, PFS)显著最差。TRACERx研究从2017年到2020年预测复发的时间不断往前, 最初用小panel时, ctDNA预警的前置时间为70天(10~346天), 到2020年用大panel时, 预警的前置时间为151天(0~984天), 早于影像学发现复发。2020年TRACERx研究在《Nature》上的前瞻性研究进一步发现, 术后MRD阳性, 患者无复发时间更短, 出现远处转移更多, 预后更差。

发现MRD阳性, 理论上, 对于残存的病灶进行干预, 是通向根治的根本之路, 因为在肿瘤负荷比较小, 肿瘤免疫状态比较好的时候干预, 往往能够根治。TRACERx研究最初做了尝试, 在EGFR突变的患者, 通过MRD-panel发现阳性后, 极早干预, 有临床获益。

局部晚期同步放化疗后的患者, 是不是还叫MRD?同步放化疗总体是一种根治性的手段, 《Nat Cancer》的silico研究证明局部晚期NSCLC的患者可能也存在着MRD的现象, 但是目前仍有争议。

早期患者基于MRD的辅助治疗, 英国癌症研究中心Charles Swanton教授启动了MERMAID1和MERMAID2两项研究, 会在MRD阳性的患者中进行不同的干预, 希望通过这种干预, 能够回答MRD能否改善结局。

总之, 在早期NSCLC无论是根治性手术前后, 都可以检测ctDNA评价预后。目前已经有大量实体肿瘤的研究数据证实, 对于早期肺癌患者术后MRD与复发风险显著相关, 而且这种预测价值独立于临床病理高危因素, 但是对其干预是否影响结局, 目前并没有前瞻性随机对照研究结果。MRD检测可以区分可能受益于辅助治疗的高危人群, 但是区分出来以后, 哪些干预会给患者带来获益, 是化疗、化疗+免疫还是靶向治疗, 是否改变生物学行为, 都需要前瞻性研究来证明。

记者:揣博士, 您能否从检测原理出发, 给大家讲讲MRD检测技术路线的演变逻辑?能否帮大家梳理一下国内外MRD检测策略现状及进展?

揣少坤博士(广州燃石医学检验有限公司):如果我们要做MRD, 它的生物学极限在哪里?技术的边界取决于生物学信号的极限, 目前现有的数据能告知这个极限大概在哪里。我们简单复盘一下MRD技术, 演化路径是什么?背后的逻辑是什么?为什么大家会往这个方向推进这个技术?MRD检测到现在为止已经呈现的、未来在肺癌领域需要验证的价值?

首先, MRD的生物学极限。复盘TRACERx研究中肿瘤大小和ctDNA浓度轴线图, 除了线性关系之外, 最重要是推导出每cm3(直径1.2 cm)的肿瘤病灶相当于每mL血浆里面含有0.19个肿瘤基因组拷贝。翻译为肿瘤检测极限意味着抽取1管血中, 只有不足1个肿瘤基因组拷贝, 而且还被分为170 bp的很多碎片散落在肿瘤血浆里面, 意味着ctDNA丰度大约是0.01%~0.02%。在MRD检测中, 常常见到的中位maxAF分布是0.01%~0.1%, 当我们进行MRD检测时, ctDNA检测敏感性需要达到万分级的数量级。当我们想从晚期进入早期, 从患病期进入到随访期的时候, 敏感性是MRD检测最大的瓶颈, 这带给我们最大的启示是不同的最低检测限的技术得出MRD阴性和阳性结果不具有可比性。当灵敏性不足的检测方法告诉我们是MRD阴性的时候, 有可能只是因为没有触碰到最低检测限。

在单点检测的敏感性极限方面, 我们需要万分级的检测, 现在晚期液体活检技术到底能不能达到万分级?FDA组织的SEQC2研究进行了目前性能最好的液体活检NGS panel的比较, 由FDA对五家液体活检评估公司进行盲测。在这个研究中, 0.5%的线基本上所有的液体活检敏感性都达到, 但是, 到0.1%~0.2%的时候已经出现敏感性的掉落, 这个结果已被《Nat Biotechnol》接收, 这篇文章会展现很多液体活检敏感性、特异性的技术细节。0.5%是现有技术在单点敏感性上稳定性的天花板, 而且在监控效率受限时, 如果继续增加测序深度, 其实对敏感性的帮助非常有限。所以假设一直增加测序深度, 就可以一直不停的增加敏感度是不成立的。

谈到MRD技术路线的演变逻辑, 最开始当人们想做早期MRD检测时, 最天然的解决方案, 就是采用晚期液体活检panel作为现成的解决方案, 这样的解决方案不需要做肿瘤对照, 也不需要做白细胞(white blood cell, WBC)对照, 而且一般是中等到大的panel就可以解决。但是在这个过程中, 遇到了敏感性和特异性瓶颈, 其中一个演变方向, 就是基于现成panel进行特异性和敏感性的提升, 提升特异性比较简单, 只要增加超深度WBC对照, 就可以简单过滤掉克隆性造血(clonal hematopoiesis of indeterminate potential, CHIP)等现象。但是增加敏感性比较复杂, 可能需要增加像唯一标识符(unique molecular identifiers, UMI)及polishing算法这些比较复杂的技术。

在tumor-naï ve这条路线上, 做到极致就是深度测序肿瘤个性化图谱(cancer personalized profiling by deep sequencing, CAPP-seq), 不借助任何来自肿瘤组织信息, 采用所有的对照UMI、测序深度等, 仅仅凭血液检测能够得到最高的敏感性。在Lung-CLiP研究里面, 采用CAPP-seq, 无论在测序深度、UMI、背后的算法, 还是利用基因组信息上, 都几乎用到了极致, 这种情况下, 检测早期的肺癌在Ⅰ 、Ⅱ 、Ⅲ 期的敏感性达到了40%~70%, 应用于早期检测是远远不足的。但是在这个研究中可以看到, 术前的ctDNA定量, 已经开始对预后具有预测功能。这就是tumor-naï ve和tumor-informed的差异, 也就是当一个技术在不参考肿瘤组织信息时, 似乎很难稳定检出血液中的ctDNA, 但是, 一旦有了肿瘤组织的标准答案, 可以相对比较敏感地辨认MRD阳性和阴性的两类人群, 这两类人群除了MRD阳性和阴性之外的额外概念, 就是shedder和non-shedder, 即脱落倾向者与无脱落倾向者。在进行任何治疗前, 同样期别的肿瘤患者, 尤其是Ⅰ 期的患者, 依然有shedder和non-shedder, 而且ctDNA阳性和阴性同为Ⅰ 期的患者, 预后非常不同, 有4倍的风险比。这就提示我们是不是shedder和non-shedder本身, 在生物学上是不同的?是不是这两种患者, 他们后续ctDNA监控里面的受益情况也不一样?事实上TRACERx研究中, shedder可以平均提前151天看到复发, 而non-shedder只有22天, 所以可能这些在早期基线时见不到ctDNA的患者, 后续监控也很难获益。

当我们做tumor-informed方法时, 同样是CAPP-seq, 用到Ⅲ 期为主的人群时, 已经完全够用了, 它对MRD预测效果非常好, 无论是肺癌还是食管癌, 都可以看到很好的阴性预测值(negative predictive value, NPV)和阳性预测值(positive predictive value, PPV)。一个现成的panel, 能覆盖的位点相对比较有限, CAPP-seq这个panel平均每一个肺癌患者中, 能够检出3~4个突变, 供我们辨认是否MRD阳性的只有3~4个位点。所以, 除了单点增加敏感性之外, 是不是可以通过增加更多的潜在的可以监控的阳性位点, 增加整个样本的敏感性呢?这就是另外一条路线, 在这个路线上做到极致的是MRDetect研究, 这个研究通过在ctDNA里面检测全基因组测序(whole genome sequencing, WGS), 只用了35层WGS非常浅的深度, 但是观测了整个基因组, 在整个基因组上寻找肿瘤组织里面已经存在的突变, 所以是tumor-informed的方法, 它的特异性比较好。MRDetect除了呈现比较好的MRD辨认的敏感性和特异性之外, 还引入了新的ctDNA定量算法。目前为止, ctDNA最主要的定量算法, 就是依赖于AF或者用AF反算ctDNA的浓度或者说基因拷贝数的浓度。在TRACERx研究可以看到, 两者定量是相似的, 后者拷贝数浓度和肿瘤负荷关联略好, 而且突变丰度会受到拷贝数变异(copy number variant, CNV)的影响而波动。在MRDetect里面, 用单核苷酸变异(single-nucleotide variant, SNV)/拷贝数变异(copy number alteration, CNA)两种模型反算ctDNA丰度, 给我们提供了一个非常好的新思路, 除了AF之外, 有可能未来我们如果监测足够大的区域, 足够多的位点, 有可能有一个整合的分数来反算ctDNA的丰度。

最后这条路线是我们非常熟悉的Signatera, 既观测足够多的位点, 又在每个位点上有足够的深度。首先用肿瘤对照, 用WES的方法测出这颗肿瘤携带的所有突变, 然后针对这些突变, 定制患者专属的panel, 最大化同步跟踪突变个数, 其他所有跟这颗肿瘤无关的东西不看, 目前在MRD领域, 几乎所有最高级别的证据都来自Signatera。在这个基础上, 如果在单点上又增加了UMI, 就是Archer DX。以上就是整个MRD技术演变的过程, 背后的思路和逻辑还是很清楚的。

Signatera和Archer DX两种方法可以整合起来, 叫做个性化监控(personalized cancer monitoring, PCM), 它最大的挑战在于每一个患者需要定制专属panel, 但是一旦能够做到, 在观测的广度和深度上, 就实现了相对比较完美的结合。PCM路线贡献了MRD价值目前最好的临床证据, 可以看到其他方法学上看不到的细节。首先我们会看到术后30天的节点, 所谓landmark检测节点, 这个节点的单点检测, 可以有效预测预后, 而且在landmark节点的时间截点的选择上, 从3天到1个月、2个月、3个月, 有一定的灵活性。无论landmark选择在哪一个点, 只要在术后3个月之内的单点检测, 基本上跟预后呈现的关联性都比较相似。无论是肠癌还是乳腺癌, 术后单点检测在6~12个月以后开始慢慢出现敏感性, 术后一直去随访的话, 会看到术后监测期任何一点的MRD阳性, 如果用它去区分患者的预后, 会具有更好的灵敏度。所以这启示我们, 任何一个单点检测MRD阳性, 可能可以提前6~9个月看到未来的复发事件, 但是更远的话, 可能会丢失。虽然这不是肺癌产生的证据, 但是很有借鉴意义。PCM方法可能具有最好的准确性, 但是有一个致命的天然缺陷, 就是无法用于新原发肿瘤的监控。在TRACERx研究中, Ⅰ 期采用Signatura, Ⅱ 期采用Archer Dx, 大约12%的患者所谓复发时, 其实是第二原发, 而对于这种患者来说, PCM的方法是无法监控。

所以, 当我们考虑到MRD敏感性时, 阳性位点数量和单点敏感性都需要考虑。不同的方法学产生不同的证据, 目前到底有没有新的更好的方法学?甲基化(methylation)现在已经呈现了早期的迹象, 当它跟突变结合的时候可以增加敏感性。燃石公司跟王俊院士合作的MEDAL研究在仅凭突变检测阴性的患者中, 甲基化可以更加细分出来潜在的中风险患者, 而甲基化阴性患者, 整个NPV是一个完美的状态, 这是未来一个探索的可能性。

MRD检测目前已经呈现的价值体现在基线的时候帮助我们辨认shedder和non-shedder, 在术后的landmark节点预测预后, 非常准确的看到至少未来6~9个月的预测。在后续监控中, 可以预示复发, 基线的shedder可以提前5~6个月, 对于术后监控的获益可能是最好的。

但是, 在肺癌中我们一直还没有验证与药物研究的联动价值, 是不是我们可以寄予很大希望的事情呢?我个人认为是的。因为我们在其他癌种中见到了非常好的先例。在IMvigor010研究肌肉浸润性尿路上皮癌的阿替利珠单抗(atezo)辅助治疗, 术后MRD阳性率39%, 在这个研究里面所有的主要研究终点都失败了, 无论在意向性治疗(intend-to-treat, ITT)人群, 还是ctDNA可评估的人群里面, atezo用药和不用药的生存曲线都完全无法分开。而MRD的引入, 如何拯救了这个研究?首先, 在基线MRD阳性患者, 预后确实更差, 我们忍不住就想问, 是不是只有MRD阳性, 可能从atezo里面获益呢?MRD能否起到富集可以从辅助治疗获益人群的作用?答案:是的。基线MRD阳性, 可以完美辨认获益人群, 只有MRD阳性的患者可以从atezo获益, MRD阴性的患者, 完全没有这个趋势。而对于这些获益人群, 治疗后的MRD, 是不是还能进一步提供个体层面上的获益预测呢?答案:是的。即使治疗获益人群里面, 治疗后再一次进行MRD检测的时候, 依然可以非常清晰分开个体获益和非获益人群。最后, 在整体人群里, 肿瘤突变负荷(tumor mutation burden, TMB)和程序性死亡配体(programmed death ligand-1, PD-L1)都没有呈现相关性。但是当我们只去聚焦MRD阳性的时候, 药效忽然和TMB完全相关, 这也提示我们, 用MRD去富集这种可能获益的人群, 其他的biomarker效力可能就展现出来了。所以我个人认为, 这个研究非常完美地展现了MRD理想的价值三连:富集获益人群、预测治疗疗效和潜在的替代疗效评估的节点。

最后, 关于MRD未来还要回答很多问题, 包括复发期的肿瘤负荷和原发期无法完全对应, 技术灵敏度到达极限的时候, 最佳的cut-off到底是不是0?有意义的是单点的“ 阴性” 还是前后变化的“ 清零” ?Landmark最佳节点, 到底是3天还是3个月?在不同的应用场景下, 我们到底应该关注什么?在我们对标准治疗需要治疗的患者中, 用MRD去找免于治疗的人群, 我们需要非常高的NPV, 反过来去找需要增加治疗的患者时, 我们可能需要非常高的PPV。如果想作为治疗疗效替代性终点, 需要关注MRD阳性和阴性患者之间具有足够显著的风险比。所以在不同的临床应用场景下, 我们要关注的东西是不一样的。

记者:杨教授, 请您从肺癌外科专家的角度, 谈谈可手术早中期肺癌患者MRD研究现状及前景是什么?

杨帆教授(北京大学人民医院):关于可手术患者术后MRD的问题, 我分为三部分来讲述:难点、现状和前景。

先说难点, 难点实际上构成了主要的技术挑战。首先, 不是所有的肺癌都释放ctDNA, 即便在晚期EGFR阳性的NSCLC, 也有30%的患者不存在可被检测的ctDNA。没有ctDNA存在或者肿瘤是non-shedder的情况下, 我们以ctDNA作为媒介, 进行MRD的检测, 它的有效性会被大大削弱。第二, ctDNA的丰度很低, 不是所有坏死的肿瘤细胞DNA都会释放入血, 2020年在《Sci Adv》发表的一篇数学模型的研究, 假设1 cm3的肿瘤有1010个肿瘤细胞, 肿瘤倍增时间181天, 在全身5 000 mL血中抽取15 mL, 计算出来的某一个位点突变的DNA片段存在的平均拷贝数是1.7个。换句话说, 我们的物理瓶颈非常严峻, 是在所取的样本中存在所能检测, 而且可以被捕捉到的ctDNA。另一个原因是ctDNA代谢快, DYNAMIC研究发现ctDNA中位半衰期只有35 min, 释放的ctDNA很快被代谢掉, 代谢速率与年龄、性别、病理、分期等临床指标无关, 因此想维持一个高的丰度, 存在很多的难题。第三, 检测带来的噪音, 所谓克隆性造血(CHIP)带来的很大的背景噪声, 就像在喷射性发动机噪音中去寻找一点耳语, 技术难度可想而知。对于早期肿瘤辅助筛查与诊断, ctDNA突变检测需要配对WBC超高深度测序才能去除CHIP的突变带来的假阳性问题。

真实情况下究竟MRD的丰度是多少?来自TRACERx的研究, 除了提前0天(即没有提前)的患者, 其他患者中, MRD平均丰度都低于0.1%, 而我们现有的技术平台的灵敏度, 往往是在0.1%以上, 虽然能用于肿瘤的基因检测, 但是并不能理想的用于MRD的应用。而且我们在临床中简单的采用增加检测频率、panel覆盖范围、采血量并不能解决所有问题, 前面提及的《Sci Adv》文章的数学建模, 模拟后边际效应的增加非常有限。因此, 我们未来的检测首先要克服的瓶颈就是技术的提高。

我总结了Lung-Clip研究(CAPP-Seq), TRACERx研究(Signatera技术)和我们最广覆盖的采用WGS的MRDetect三个平台。CAPP-Seq技术是tumor naï ve固定panel, 在不断更新迭代, 2014年首次出现为128个基因固定panel, 覆盖188 kbp, 到2020年整体优化扩大覆盖面, 增至255个肺癌相关基因, 覆盖355 kbp, 同时采用unique identifier(UID)等方法增加测序深度及单点检出的敏感性。TRACERx研究, 从18个SNV扩大到200个SNV, 增加检测突变数目提升检测敏感性。MRDetect在ctDNA检测中第一次探索了WGS的应用价值, 通过WGS扩大了所能检测的突变数量, 同时结合了CNA信息进行建模, 但是tumor-informed的建立在肿瘤标本测序知道突变种类的前提下能实现的技术, 但是也代表了广覆盖的技术极致。

所以, 关于检测技术, ctDNA检测MRD的主要物理限制因素是丰度极低, 背景噪声是挑战, 需要技术进步来提高灵敏度以降低噪音, 同时扩大检测覆盖范围是趋势, 而且, 技术需要不断的发展, 如增加CNA、甲基化等。

MRD的未来是临床应用。临床应用需要回答四个问题:是否是独立的预后因素?可否作为后续治疗的指征?能否评价疗效?能否作为替代终点?

在独立预后因素方面, 乳腺癌、结直肠癌等, MRD在术后阳性, 确实跟预后不良相关。在肺癌中, TRACERx研究, 严格来说不是MRD研究, 因为其通过连续的检测提前预警复发, 而不是在术后固定点检测存在的微小残留, 但是结果显示ctDNA确实可以提前预警复发。CAPP-Seq是tumor-naï ve策略的极致, 2017年的研究在术后固定4个月点采血, 之后连续采血, 固定4个月采血的landmark检测, 跟复发相关, 17/17ctDNA+复发和1/15ctDNA-复发, 在后续连续点检测也增加了效能, 阳性患者100%复发, 阴性患者几乎没有复发, 连续检测的表现更好。但是我们今天所谈论的MRD, 应该严格说是指术后固定点检测微小病灶的残留, 而不是提前预警复发。我们的DYNAMIC研究, 追踪不同点的血, 发现术后3天的点比较好, 同时ctDNA阳性患者在无复发生存、总生存(overall survival, OS)方面都提示不良, 这项研究也得到了《Nat Rev Clin Oncol》的highlights, 但是我觉得highlights最重要的是研究的方向, 就是MRD对于指导后续治疗研究的方向。MRDetect研究结合了基因拷贝数和单点突变之后的灵敏度, 达到了10-5检测极限, 平均术后2周半进行检测, 没有检测出MRD阳性的患者, 没有出现复发。我们跟燃石公司合作的MEDAL研究, 结合了甲基化和SNV双维度检测, 增加了检测效能, 同时有更好的预后相关性。如果把所有已经发表的主要研究放在一起, 至少能得到一个印象, 就是在NSCLC, MRD阳性跟预后确实是相关的, 是独立的预后因素。但是, 现有平台的方法、测序深度和MRD阳性判断标准都不同, 并没有统一的标准, 不同的标准会带来不同平台研究结果解读的困难。

MRD阳性在术后目前没有数据显示可以预测后续治疗疗效, 仅仅在PACIFIC研究的巩固免疫治疗研究中看到了方向, 就是存在MRD阳性的患者, 可以从免疫巩固治疗中获益, 而阴性患者不能获益, 但是样本量不大。

ctDNA动态变化能否作为辅助或者附加治疗疗效评价指标?现在只有TRACERx研究, 在治疗过程中, 持续升高的MRD预示了复发, 降低的ctDNA患者没有出现复发。同样在DYNAMIC研究也有类似的情况。在CAPP-Seq用于免疫巩固治疗研究中也观察到, 在后续治疗过程中, ctDNA降低的患者有非常好的生存, 没有降低的患者和没有进行免疫巩固治疗的生存相同。

而至于ctDNA清零能否作用替代终点?我们到目前为止没有任何证据。

所以从临床角度, MRD是否是预后因素?虽然目前证据的质量不高, 但是有多个研究, 彼此相互应证。目前检测技术、方案及判断标准尚未统一, 在肺癌中仍没有数据证明MRD可以作为附加治疗的适应证。也许MRD动态能作为疗效评价, 但未来是否能够作为替代终点尚未知道。

展望MRD, 现在美国GRAIL公司已布局MRD, 与多家大药企合作, Natera公司在多个瘤种完成MRD研究, GUARDANT和Inivata公司也都提供了MRD检测的服务, 虽然目前临床价值不明, 但各家大公司都已经布局了MRD。

临床应用是未来的方向, 我认为至少有两种研究设计方式:一是MRD阳性患者进行随机; 二是MRD所指导的辅助治疗。目前开展的研究都是MRD阳性患者进行随机, 但是这些研究有不同的平台、不同的设计方式, 主要终点既包括生存终点, 也包括MRD清零, 采用ctDNA作为疗效评价替代终点。这种标准不统一会造成对研究结果解读的困难。

是否早发现复发一定能带来生存获益呢?2017年ESMO年会汇报的Ⅲ 期IFCT 0302研究, 根治性手术后的患者随机接受胸片复查和更严格的CT复查, 胸片复查推迟了复发的发现, CT复查提早发现了复发, 但是总生存并没有区别。所以早发现复发、早治疗, 是否能带来生存获益?目前尚未清晰。我们再借鉴一下其他肿瘤, 如果把MRD阳性, 看成肿瘤标志物, 参考肝癌术后的AFP、前列腺癌术后的PSA和绒癌术后的HCG, 这些肿瘤标记物升高后的附加治疗, 目前指南都没有统一的定论。肺癌究竟怎样, 我们还需等待临床研究的数据。

最后, 我觉得ctDNA检测可手术肺癌术后MRD是目前各方瞩目的探索方向, 但技术优化、标准化、临床应用等仍是挑战。术后MRD检测具有开创性价值, 未来一定是个“ game changer” , 会真正改变辅助治疗的面貌。辅助治疗到目前为止有两个“ 卡脖子” 问题没有解决:无法确定哪些患者会复发, 只能全部按分期入组, 但样本量大且稀释疗效; 只能采用生存指标作为终点指标, 使得研究周期很长且影响因素多。如果MRD能够真正解决入组和疗效评价问题, 会真正改变所有辅助治疗的面貌。而且附加治疗和辅助治疗的改变, 又会深刻改变后续复发后晚期治疗的面貌。因此, MRD未来充满前途, 非常有可能成为肺癌的game changer。

记者:陈教授, 目前局部晚期不可手术肺癌的标准治疗方案是同步放化疗后免疫巩固治疗, MRD检测能否明确根治性放疗后残留病灶的肿瘤活性, 从而进一步区分免疫巩固治疗获益人群?

陈明教授(中山大学肿瘤防治中心):MRD起源于外科多学科问题, 外科R0切除后, 切缘阴性, 淋巴结清扫到位, 如果实现无瘤状态, 后面辅助治疗没有意义。但是早期规范化手术R0切除, 肉眼没有任何肿瘤切缘也阴性的患者, 仍然有出现转移和复发。NSCLC不同的分期, 疗效差异非常明显, 大约25%~30%的NSCLC患者确诊时为局部晚期, 5年生存率约13%~36%。不管何种治疗手段, 手术患者仍然面临着比较大的复发风险, 从前术后化疗提高约5%的疗效, 后来术后靶向治疗, 取得了一定的疗效, 但是, 不加选择的术后或者放疗后辅助治疗, 喜忧参半。

最近, 随着药物的进步, 诊疗能力的提升, 局部晚期患者的疗效越来越好, PACIFIC研究同步放化疗获得了一小部分的根治, 用PD-L1维持, 把整个疗效曲线朝上提了相当大一部分, 越来越多的患者获得了根治性疗效, 说明根治性放疗后的残留甚至微小残留客观存在, 需要辅助治疗。晚期NSCLC用单纯药物治疗, 有一小部分患者也能获得临床完全缓解(complete response, CR), 所以MRD不光在R0切除后, 同样在放疗后、药物治疗后也是存在的。

不能手术的局部晚期NSCLC的5年生存率, 从1980年单纯放疗的5%, 到2017年RTOG0617同步放化疗提高到32%, 可是我们仍然有70%的患者失败了, 所以PACIFIC时代, 对于这部分患者来说, 疗效提升后, 哪些患者需要后面的维持治疗。以及部分晚期转移性患者使用靶向药能够长期生存, 但是停药的时机尚未清晰。所以我们需要像CTC、ctDNA以及将来更可靠的技术来检测MRD, 指导晚期患者得到生存获益。

那么, 如何筛选出长期存活的患者?不加选择的巩固治疗, 利弊参半。在不加选择的Ⅲ 期肺癌同步放化疗后患者中进行吉非替尼和安慰剂对照, 发现口服吉非替尼的生存更差, 20%~30%治愈的患者酪氨酸激酶抑制剂(tyrosine kinase inhibitor, TKI)维持有害, 而在80%治疗失败的患者, EGFR阴性用TKI维持无生存获益, 只有EGFR阳性的部分患者用TKI维持有获益, 有限的好处有可能被不需要的和不获益的患者给淹没。

所以, 我想提出clinical R0概念, 经过非手术治疗后, 肿瘤体积消失, 或者肿瘤体积虽然没有消失, 但是分子影像不显影, 没有活性了, 或者外周血的细胞、ctDNA等血液活体检测均是阴性, 符合这几种情况可以称为clinical R0。有没有办法预测肿瘤活性呢?我们在930个患者中, 检测ALK突变, 用这些患者术前CT影像做深度学习的人工智能(artificial intelligence, AI)建模, 曲线下面积(area under curve, AUC)达到70%~80%, 如果把临床病理信息加上CT影像, 来预测ALK阳性与阴性, 它的AUC可以达到85%, 所以现在大数据和AI方面也可利用。

基于以上, 不可手术的局部晚期NSCLC, 利用clinical R0的概念进行分类, 结合现有的肿瘤组织或外周血进行MRD检测, 对于MRD阳性的患者进行临床多学科讨论和相应处理, 如果是clinical R0患者, 可以密切观察。

临床上针对MRD的治疗手段目前国内已经有不少探索, 如用抗EGFR药物、抗血管药物和免疫巩固。我们需要把局部晚期的患者跟MRD的概念结合在一起, 来探索局部晚期同步放化疗后维持的适应证, 而且需要明确哪些患者是获益亚群。现在注册的项目前瞻性设计仍不足, 没有很好的引用MRD的概念, 希望将来可以改善。

记者:朱教授, 您是肿瘤免疫方面的专家, 能否剖析一下晚期肺癌MRD研究现状及前景是什么?

朱波教授(陆军军医大学第二附属医院-新桥医院):第一个方面, 晚期肺癌MRD检测的必要性。首先, 晚期肺癌到底要不要做MRD的评估?我们医生面对患者的时候, 最大的成就感是治愈患者, 从这个角度, 作为肿瘤内科医生, CR是非常重要的评估指标。实际上局部晚期和晚期甚至早期手术后的NSCLC患者, 临床上尽管达到CR或者非常好的部分缓解(partial response, PR), 有些患者仍然会复发, 生存期很短。我们的治疗手段或评估方法需要改变, 以综合提高治疗效果。

整个肿瘤发展是从血液系统肿瘤开始的, 不同的评估方法, 比如细胞学的FISH评估、PCR检测评估以及MRD, 这些检测评估方法, 所发现复发的时间不一样。目前MRD的评价方法, ctDNA、NGS的技术仍处于发展过程中。那实体瘤的评价呢?从肿瘤发展规律看, 比如从肺磨玻璃影到浸润性腺癌, 发展经过漫长的时间。从临床治疗角度看, 比如免疫治疗中出现PR、CR的患者, 生存期远长于疾病稳定(stable disease, SD)的患者, 这些现象提示治疗以后的残留, 对生存影响非常大。

第二, 我们怎么评估?如果借用血液肿瘤系统的方法, 实体瘤疗效评价标准(Response Evaluation Criteria in Solid Tumors, RECIST)评估PR、CR的患者才有必要进一步评估MRD。晚期肺癌驱动基因阴性的患者在鳞癌的KEYNOTE-407研究中帕博丽珠单抗(pembro)联合化疗的完全缓解率是1.4%, 和化疗时代的完全缓解率接近。局部晚期的PACIFIC研究, 同步放化疗后巩固治疗的5年生存率超过30%以上, 但是完全缓解率只有1.4%。而小细胞肺癌是对化疗非常敏感的肿瘤, IMpower133研究联合atezo, 完全缓解率是2.5%。这样的数据告诉我们, 如果从影像学评估CR, 再考虑MRD检测, 实际上合适的人群非常少。

那驱动基因阳性的患者会不会治疗效果更好呢?目前效果最好的FLAURA研究, 奥希替尼一线治疗, 完全缓解率3.0%, ALK阳性患者在ALEX研究中完全缓解率是4%。所以不管是阳性还是阴性, 这部分患者完全缓解率并不高。但是如果我们看病理学完全缓解(pathological complete response, pCR)呢?新辅助免疫治疗中, 不可手术同步放化疗以后的患者能够活到5年, 这部分患者可能影像学看到肿块, 但是没有肿瘤细胞存在。2018年《N Engl J Med》新辅助免疫治疗的20例患者中, 只有2例患者PR, 但是pCR的患者大概70%, 也就是说, 影像学上的肿块并不等于肿瘤细胞。所以在靶向治疗、免疫治疗时代, 药物反应性比较好的部分患者当中实际上达到了pCR, 但是残留了其他的如结核球的炎症或stromal cell。

第二个方面, 没有达到CR或没办法评估pCR的患者, 是不是能借用MRD这样的评价手段重新定义?MRD在血液系统肿瘤中的目的是评估达到CR的患者, 是否需要采用额外的治疗。对于晚期肺癌患者, 评估的目的是指导停药、巩固、换药还是加药, 判断预后好还是不好, 最终提高OS。从另一方面, 我们经常讲异病同治、同病异治, 基于的分子基础是分子, 而不是真正的肺癌或者肠癌, 从这个角度来讲, EGFR突变是一个病, 如果没有EGFR突变的细胞存在的情况下, 还能说还有分子残留或者病灶残留吗?

对于晚期NSCLC没有达到CR的患者, 分子检测的目的是看药物靶点基因还在不在, 是否存在耐药靶点以及是否出现新的靶点, 来判断和治疗抉择。基于这样的基础, 我提出一个概念:药物靶点分子残留(drug-targeting molecular residual disease, DT-MRD), 也就是当你检测不到EGFR突变, EGFR突变这个病就可以达到MRD的消失了。

DT-MRD在晚期肺癌全程化管理中的应用, 例如王洁教授和吴一龙教授BENEFIT研究, 对8周的患者外周血中检测EGFR突变, 阴性和阳性患者的生存完全不同。通过这种EGFR突变MRD的检测, 可以很好的判断患者预后。在免疫治疗中我们对10个患者进行WES检测, 预测新生抗原, 选择前20位新生抗原, 制备特异性的panel, 对每一个患者进行评估。患者的肿瘤tumor mass降下来, 新生抗原就会消失。随着肿瘤长大, 新生抗原针对的ctDNA又会出现。这个研究结果中, ctDNA早期减少50%的患者, 生存远高于ctDNA没有降到50%以下的患者, 而且第二检测如果是阳性或者评估出现上升, 评估是早于影像学约70天, 即MRD的检测在肿瘤免疫治疗中也有应用场景。

所以, 对于晚期肺癌患者, 根据RECIST评估CR的患者比例大约1%~2%, 尽管不是太高, 但这种评估对后续治疗有积极指导意义。尤其对于PR、SD患者, 更有必要评估, 评估的目的是看原来的靶点还在不在, 是不是出现了新的靶点, 是不是要改用相应的治疗策略, 添加新的药物, 以延长PFS、OS。

在吴一龙教授、陆舜教授和程颖教授的主持下, 在与会专家的共同参与下, 本次论坛达成以下共识:

共识一:非小细胞肺癌MRD概念(共识级别:2A):肺癌分子残留病变, 指经过治疗后, 传统影像学(包括PET/CT)或实验室方法不能发现, 但通过液体活检发现的癌来源分子异常, 代表着肺癌的持续存在和临床进展可能; 肺癌分子异常, 指在外周血可稳定检测出丰度≥ 0.02%的ctDNA, 包括肺癌驱动基因或其他的Ⅰ /Ⅱ 类基因变异。

共识二:非小细胞肺癌MRD检测的基本技术要求(共识级别:2B):MRD检测的基本技术, 包括肿瘤先验分析(tumor-informed assays, 个体化定制或NGS panel)和肿瘤未知分析(tumor-agnostic assays, NGS panel和多组学技术), 目前均处在探索阶段, 需要前瞻性研究确定其敏感性、特异性和预测价值; 基于NGS的突变检测技术, 所选用的多基因panel中必须覆盖患者Ⅰ /Ⅱ 类基因变异, 基本技术标准是可稳定检测出丰度≥ 0.02%的ctDNA; 驱动基因阳性的非小细胞肺癌, MRD的分子检测panel应包括其驱动基因; MRD评估报告中必须包括cfDNA浓度、ctDNA浓度及所检测基因VAF值; 需要建立针对免疫治疗的MRD标准。

共识三:可手术早期非小细胞肺癌MRD的应用(共识级别:2A):早期非小细胞肺癌患者根治性切除术后, MRD阳性提示复发风险高, 需进行密切随访管理, 建议每3~6个月进行一次MRD检测; 建议基于MRD开展可手术非小细胞肺癌的围术期临床试验, 尽可能提供围术期精准治疗方案; 建议分别探索MRD在驱动基因阳性和驱动基因阴性两种类型患者中的作用。

共识四:局部晚期非小细胞肺癌MRD的应用(共识级别:2A):局部晚期非小细胞肺癌根治性化放疗后完全缓解患者, 建议检测MRD, 有助于判断预后和制定进一步的治疗策略; 建议开展基于MRD的化放疗后巩固治疗的临床试验, 尽可能提供精准的巩固治疗方案。

共识五:晚期非小细胞肺癌MRD的应用(共识级别:2A):晚期非小细胞肺癌目前缺乏针对MRD的相关研究; 晚期非小细胞肺癌系统治疗后完全缓解患者, 建议检测MRD, 有助于判断预后和制定进一步的治疗策略; 建议在完全缓解患者中开展基于MRD的治疗策略研究, 尽可能延长完全缓解持续时间, 使患者能最大获益。

参考文献