上海2021年9月30日 /美通社/ -- 2021年9月,医用光学影像辅助诊断领域的领导者 -- 微识医疗Wision A.I.宣布:主研产品EndoScreener(结肠镜辅助诊断软件)在美国多中心临床试验中临床表现优异,结果[1]发表于消化内科顶级期刊《临床胃肠病学(Clinical Gastroenterology & Hepatology)》【IF=11.382】。
此次研究由哈佛医学院Tyler M. Berzin教授领衔,在哈佛医学院附属BIDMC医院、纽约大学朗格尼医学中心、贝勒医学院圣卢克医学中心和芝加哥大学附属医院完成。
该临床试验不仅是美国全医学领域的首个人工智能(AI)辅助诊断设备(CAD)的随机对照试验(RCT),更是全球首个关于医疗人工智能技术的独立外部随机对照试验。
严谨苛刻的高基线平行&交叉对照设计下的优异临床结果
众所周知,结肠镜检查是结直肠癌筛查的金标准,检出更多的腺瘤有可能降低结直肠癌的发病率和死亡率[2]。而EndoScreener就是一款用于在结肠镜检查中实时检测病变并同步提醒医生的辅助诊断软件。该软件在之前的非临床[3]和临床研究[4],[5],[6],[7]中展现出了高敏感性,高特异性和高检出率。
而在本次研究中,采用经典的串联交叉试验设计,共232名受试者参与,随机分为2组,一组先进行AI软件辅助结肠镜检查,然后立即进行常规结肠镜检查,另一组进行相反顺序的两次检查。
试验结果显示:AI软件的介入显著提升了每次肠镜平均腺瘤检出数(0.9000 vs. 1.1947, p=0.032),显著降低了腺瘤漏诊率(31.25% vs. 20.12%, p=0.025),并大幅度降低了锯齿状病变SSL的漏诊率(42.11% vs. 7.14%, p=0.048)。
不仅如此,使用AI软件辅助后,10位医生的腺瘤检出率高达50.4%,两倍于美国消化内镜协会针对筛查人群要求的25%的腺瘤检出率。而这10位顶级内镜医生在对照组的检出率基线高达43.6%,AI介入没有发现任何天花板效应。
并且AI辅助检查中平均每例结肠镜检查产生的假阳性不到1次,据统计,软件的逐病灶敏感性高达99.05%。
由此可知,EndoScreener在真实临床环境中表现出了卓越的辅助诊断性能。
医疗AI的全球首个独立外部随机对照试验证据
该研究在临床效用之外的意义也十分显著,这是全球医疗AI领域的首个不纳入任何为AI提供训练样本医疗机构的独立外部随机对照试验,众所周知,深度学习过拟合,AI的泛化性和鲁棒性不佳的现象一直存在,因此由AI原生的医疗机构主导或重度参与的临床验证的泛化性和鲁棒性意义仍待考究。
EndoScreener辅助诊断系统是使用中国某西部医院数据研发而成,此前发表的4项前瞻性随机临床试验均来自于中国,而在这项研究中,临床试验机构、医生、病人、到消化内镜设备都来自美国。
纯外部随机对照试验验证能够更严谨的检验软件的有效性,泛化性和鲁棒性,但无疑是一项巨大的挑战。不负众望,EndoScreener的表现与此前在中国完成的串联随机对照试验7结果高度一致。完成了医疗创新AI独立外部验证零的突破,真正达到临床使用标准。
来自中国上海的AI技术
据发表论文中阐述,结肠镜辅助诊断软件EndoScreener是由中国上海Wision A.I.微识医疗研发而成。这不是领先产品和技术跳空出现,微识医疗一直是消化内镜人工智能领域的佼佼者,连续三年在真实严谨的临床环境下逐步完成医疗AI全领域的全球第一个随机对照试验[4] ,全球首个也是目前唯一的关于AI的双盲随机对照试验[5] ,全球首个AI的串联交叉随机对照试验[7]。EndoScreener技术刚面世就获得了世界胃肠病学大会WCOG/美国消化年会ACG的国际奖,欧洲联合消化大会UEG国家学者奖,临床证据在Nature生物医学工程、GUT、Gastroenterology、柳叶刀·胃肠病学、美国胃肠病学,Endoscopy等国际顶尖期刊发表,并推动结肠镜AI辅助检测系统进入欧洲临床推荐指南。去年9月该消化内镜辅助诊断系统获批国家创新医疗器械,目前FDA和欧盟也在同步注册申请中。
[1] Jeremy R. Glissen Brown, MD, Nabil M. Mansour, MD, et al. Deep Learning Computer-aided Polyp Detection Reduces Adenoma Miss Rate: A U.S. Multi-center Randomized Tandem Colonoscopy Study (CADeT-CS Trial). Clin Gastroenterol Hepatol. doi: 10.1016/j.cgh.2021.09.009
[2] Kaminski MF, regula J, Kraszewska e, et al. Quality indicators for colonoscopy and the risk of interval cancer. N Engl J Med 2010;362:1795–803.
[3] Wang P, Xiao X, Glissen Brown JR, et al. Development and validation of a deep-learning algorithm for the detection of polyps during colonoscopy. Nat Biomed Eng. 2018;2(10):741-748. doi:10.1038/s41551-018-0301-3
[4] Wang P, Berzin TM, Glissen Brown JR, et al. Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomized controlled study. Gut. 2019;68(10):1813-9. Epub 2019/03/01
[5] Wang P, Liu X, Berzin TM, et al. Effect of a deep-learning computer-aided detection system on adenoma detection during colonoscopy (CADe-DB trial): a double-blind randomized study. Lancet Gastroenterol Hepatol. 2020;5(4):343-51. Epub 2020/01/26
[6] Liu P, Wang P, Glissen Brown JR, et al. The single-monitor trial: an embedded CADe system increased adenoma detection during colonoscopy: a prospective randomized study. Therapeutic Advances in Gastroenterology. 2020;13:1756284820979165.
[7] Wang P, Liu P, Glissen Brown JR, et al. Lower Adenoma Miss Rate of Computer-Aided Detection-Assisted Colonoscopy vs Routine White-Light Colonoscopy in a Prospective Tandem Study. Gastroenterology. 2020;159(4):1252-1261.e5. doi:10.1053/j.gastro.2020.06.023