中文字幕在线天|亚洲一区二区三区手机版|少妇中文字幕乱码亚洲影视|最好看的久久综合伊人

      中國基因網您的位置:首頁 >國內研究 >

      腸癌篩查突破 首次AI相關臨床隨機對照試驗成果公布

      2月28日,由四川省醫(yī)院王璞醫(yī)生、劉曉崗主任、哈佛醫(yī)學院Tyler Berzin教授等合著的論文《Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomised controlled study》發(fā)布于《GUT》雜志,這一雜志在2018年影響因子為17.016。

      腸癌篩查突破 首次AI相關臨床隨機對照試驗成果公布

      本篇文章率先使用了隨機對照實驗的方式測定AI在結腸鏡檢查中對于息肉、腺瘤的檢查率,目的在于探索AI對于腺瘤檢出率(ADR)的提升結果。

      ADR被稱為結腸鏡檢查的黃金指標,曾有研究指出,ADR每增高1%,大腸間期癌的風險降低3%,致命性大腸間期癌風險降低5%。相關指南對50歲以上無癥狀人群腸鏡篩查時的ADR提出了要求,即男性應不低于30%,女性不低于20%。如今,通過增加ADR來降低腺瘤漏診率已成為許多關注成像技術和醫(yī)療器械設計的研究的目標。

      人工智能最近被引入用于息肉和腺瘤檢測以及分類,這項技術已在初步研究中顯示出令人振奮的結果,而本次論文更是從真實世界的研究出發(fā)給出有力的支撐證據。

      這是全球首次隨機對照臨床試驗研究人工智能在腸癌輔助診斷中發(fā)揮的作用成果在期刊中發(fā)表,過去發(fā)布的腸癌AI相關研究成果均以回顧性研究或觀察性研究為主。

      相比于回顧性研究或觀察性研究,本次實驗是前瞻性隨機對照研究,2017年9月-2018年2月隨機納入患者,同時控制了諸多可能影響實驗結果的變量,該實驗可清晰的對單一因素進行比較,以尋求人工智能技術對ADR的影響。

      論文第一作者王璞告訴動脈網記者:“由于該實驗的嚴謹性和創(chuàng)新性,這是第一個被國際權威醫(yī)學期刊認可及發(fā)表的研究AI輔助診斷是否能提高核心臨床指標的前瞻性隨機對照試驗。隨機對照試驗是最為嚴謹?shù)尼t(yī)學實驗方法之一,也是最常用的用于檢驗新藥品的臨床效果的主要手段。該項實驗最大的意義在于,首次證明了AI輔助診斷設備的使用,確實可以提高核心臨床指標。目前大多數(shù)運用AI技術的研究還停留在用回顧性的數(shù)據驗證AI技術的準確性。這是遠遠不夠的。臨床醫(yī)學真正期待的AI技術,是必須能夠在大規(guī)模前瞻性隨機臨床實驗中顯著提高核心臨床指標的設備。”

      基于人工智能的結腸鏡檢查有望大幅提高ADR

      本次研究以高性能實時自動息肉檢測系統(tǒng)是否可以在真實臨床環(huán)境中提高息肉和腺瘤檢出率為目的展開實驗,具體將探索自動息肉檢測系統(tǒng)作為內鏡醫(yī)生助手時對醫(yī)生ADR的的影響。

      整個研究全程均在中國四川省人民醫(yī)院內窺鏡檢查中心進行。研究組與對照組均使用高清內窺鏡鏡(Olympus CF-290和CF-260)和高清監(jiān)視器對患者結腸進行檢查。在受試者篩選過程中,實驗人員排除了患有炎癥性腸病(IBD)、遺傳的結直腸癌(CRC),擁有結直腸手術史和活檢禁忌癥的患者。

      在結腸鏡檢查之前,連續(xù)就診的1130位患者按照預先生成的隨機序列納入兩組。對照組將進行常規(guī)結腸鏡檢查,而研究組(計算機輔助檢測(CADe)組)將采用實時自動息肉檢測系統(tǒng)用于輔助內部檢測。檢測系統(tǒng)連接到內窺鏡處理器,同步捕獲視頻流。

      研究組中的內窺鏡醫(yī)生主要關注主監(jiān)視器,并通過聲音警報提示檢查系統(tǒng)檢測到的每個息肉位置,整個過程沒有護士,受訓人員或工作人員助理輔助決策。

      在對照組中,工作人員助手記錄了所使用的結腸鏡類型(CF-H290 / CF-Q260)、進鏡時間、退鏡時間和波士頓腸道準備量表(BBPS)。當檢測到息肉時,護士協(xié)助進行組織學活檢,并記錄位置、大小和形態(tài)特征。

      而在CADe組中,實驗以外的工作人員將額外記錄系統(tǒng)漏識別和誤識別的息肉。漏識別的息肉被定義為由內窺鏡醫(yī)師確認但未被系統(tǒng)檢測到的息肉;誤識別被定義系統(tǒng)判定為病變,而內窺鏡醫(yī)師經觀察后否認。

      最終結果顯示:相比于對照組,研究組腺瘤檢出率數(shù)量提升72%,息肉檢出數(shù)量提升89%。具體而言,CADe組的ADR、PDR及結腸鏡檢查的息肉和腺瘤平均數(shù)顯著增加,從形態(tài)上看,整體腺瘤檢測量的增加主要歸結于小腺瘤的增加。

      由CADe系統(tǒng)檢測到的大多數(shù)小腺瘤較小,這支持了傳統(tǒng)觀點,即在內窺鏡視野內醫(yī)生更容易遺漏小息肉而非更大或更突出的息肉。盡管與較大的腺瘤相比,小腺瘤的惡性風險較小,但總體腺瘤檢出率的增加最終可能會降低CRC漏診風險。

      結果還顯示,小型增生性息肉的檢出率有了顯著增加,這一類息肉常常導致醫(yī)生采取不必要的息肉切除術,增加了醫(yī)生的工作量。未來,CADe系統(tǒng)可與CADx系統(tǒng)結合使用,以支持檢測、診斷和忽略策略,避免過多的工作量。

      從以上數(shù)據可以看到,在P value小于0.001,置信區(qū)間合理的情況下,人工智能輔助下的PDR從0.291提升至0.4502,提升了61%;ADR從0.2034提升至0.2912,提升了95%。因此,相比與人為識別病灶,CADe系統(tǒng)的高性能、穩(wěn)定性和持續(xù)性能夠促進臨床診斷水平極大提高,而自動息肉檢測系統(tǒng)與不同經驗水平的醫(yī)務人員協(xié)助之間的直接比較也值得進一步研究。

      這個實驗做了哪些細節(jié)準備

      1.深度學習采用系統(tǒng)

      本次實驗采用的實時自動息肉檢測系統(tǒng)由上海忤合醫(yī)療科技有限公司(Wision AI)開發(fā)。在研究小組的前期研究發(fā)表在Nature生物醫(yī)學工程2018年10月刊上,對于回顧性數(shù)據庫,算法的每幀敏感度為94.38%,每幀特異度為95.92%,ROC曲線下面積為0.984。通過部署多線程處理系統(tǒng),系統(tǒng)在實時視頻分析中處理速度為25幀/秒,延遲為76.80±5.60 ms。這一延遲對于內窺鏡醫(yī)師而言可以忽略。系統(tǒng)監(jiān)視器與原始內窺鏡監(jiān)視器相鄰并平行固定。

      王璞表示:“在算法開發(fā)過程中,我們對息肉的表面特征做出了特殊的考慮,而不僅是只依賴于息肉的完整形態(tài)。論文中的算法與之前這個領域十年來的研究相比有明顯特點:這個算法主要依賴病灶的局部特征,所以哪怕息肉只是部分出現(xiàn)在內窺鏡的邊緣角落,或者只是從腸皺壁后面漏出一點點,或者被腸液或者糞便覆蓋只漏出一個部分,這個算法也能夠有效預警。而這些恰恰就是最容易被醫(yī)生漏掉的息肉。”

      2.實驗人員、樣本選擇

      8名來消化內科醫(yī)生參與了這項研究,包括兩名高級內鏡醫(yī)師(20000次以上結腸鏡檢查),兩名中級內鏡醫(yī)師(3000至10000次以上結腸鏡檢查)和四名初級內鏡醫(yī)師(100至500次以上結腸鏡檢查)。

      本次實驗共給予了1130名患者入組資格。在這些患者中,排除了部分符合排除標準大的患者,總計72名(常規(guī)組31名,CADe組41名)。最終有1058名符合條件的患者參與了實驗,其中536名患者隨機分入對照組,522名患者隨機分入CADe組。

      3.統(tǒng)計分析

      論文中的后續(xù)統(tǒng)計指出,整個實驗過程共檢測到767個息肉。腺瘤有422例(55.02%),無柄鋸齒狀腺瘤有31例(4.04%)??傮w而言,對照組中有269個息肉(35.07%),CADe組中有498個(64.93%)。

      對照組和CADe組中每次結腸鏡檢查檢測到的息肉平均數(shù)分別為0.51和0.97(p <0.001),對照組和CADe組的PDR分別為0.29和0.45(OR = 1.995,95%CI,1.532-2.544,p <0.001)。在基線臨床和人口統(tǒng)計學變量方面,兩組之間沒有統(tǒng)計學上的顯著差異。因此,不考慮潛在的混雜效應。

      本次實驗共檢測到422個腺瘤。對照組和CADe組每次結腸鏡檢查檢測到的腺瘤平均數(shù)分別為0.31和0.53(p <0.001)。對照組和CADe組的ADR分別為0.20和0.29(OR = 1.61,95%CI 1.213至2.135,p <0.001)

      與對照組相比,CADe組檢測到的息肉數(shù)量顯著高于考慮非帶蒂息肉。當考慮非帶蒂息肉,小于0.5cm的息肉和結腸的所有節(jié)段中的息肉時,除了盲腸和升結腸外,CADe組中檢測到的腺瘤數(shù)量也顯著增加。

      優(yōu)良腸道準備的結果(BBPS≥7):在優(yōu)秀的腸道準備情況下,CADe組的ADR顯示出比常規(guī)組高6%的趨勢。然而,由于亞組分析的樣本量不足,它未能顯示出統(tǒng)計學上的顯著差異。在CADe組中,其他結果,包括檢測到的腺瘤的平均數(shù),檢測到的息肉的平均數(shù)和PDR均顯著增加。

      自動息肉檢測系統(tǒng)誤報:CADe組共有39個誤報,每個結腸鏡檢查平均誤報0.075。在研究組中檢測到的所有息肉中,沒有一個被CADe系統(tǒng)遺漏。

      本次實驗的局限性

      論文在結尾部分談到了此次研究的局限性。首先,由于無法使內窺鏡醫(yī)生和病人采用雙盲設計,系統(tǒng)的確切貢獻可能難以評估。醫(yī)生的“競爭精神”及“被觀察時的行為”可能影響實驗組的ADR結果。這種機制可能解釋了CADe組中潛在的混淆因素,即內鏡醫(yī)師可能在已知觀察的設置中更加專注。

      在這項研究中,研究人員從每個相應的檢測時間中減去活組織檢查程序的時間,獲得的結果相似但不相關(6.07分鐘vs 6.18分鐘,p = 0.15),這一定程度上能反應兩組相似的觀察注意力。

      在未來,研究人員可以設計雙盲研究來探索該系統(tǒng)在增加的ADR中的確切貢獻。這樣的研究還可以幫助確定內窺鏡檢查者和系統(tǒng)是否同時檢測到息肉,或者內窺鏡檢查員最初是否錯過了息肉,這個問題目前的研究并非旨在解決。

      第二個限制是缺乏外部有效性。本研究以中國的患者群體選擇樣本,基線腺瘤和息肉檢出率與西方國家報道相比較低。中西方人群的遺傳,飲食,生活方式和習慣差異等因素或許是這一問題的大難。所以,本研究的結果可能不適用于基線ADR較高的世界范圍,未來仍需要進一步研究以研究該系統(tǒng)在這些領域的適應性和有效性。

      第三,盡管假陽性率低,但系統(tǒng)的設計者出乎意料地出現(xiàn)了一些假陽性,并且由于檢測到藥物膠囊,局部出血部位或未消化的食物殘渣而發(fā)生,導致在手術過程中可能分散注意力。這可以通過向當前系統(tǒng)添加足夠的訓練數(shù)據來糾正。

      第四,這項研究沒有控制參與內鏡醫(yī)師的疲勞程度,這可能是影響ADR的獨立因素,需要進一步的研究來研究這種CADe系統(tǒng)對醫(yī)生的不同疲勞水平的有效性。

      第五,由于初級內鏡醫(yī)師對結腸鏡檢查的樣本量不足,需要進一步研究以顯示該CADe系統(tǒng)在不同培訓水平中的作用和有效性。

      最后,該研究僅使用奧林巴斯結腸鏡檢查設備進行。因此,還應探索該系統(tǒng)對其他公司制造設備的適應性。

      研究結果對結腸檢測的后續(xù)影響

      論文指出,在過去的十年中,高性能和高穩(wěn)定性的自動結腸息肉檢測一直是一個有吸引力的研究課題,其目的是增加ADR。然而,目前的技術尚未產生足夠的診斷性能,以便考慮用于臨床。為了將自動息肉檢測系統(tǒng)考慮用于實際臨床應用,它必須具有非常高的敏感度和特異性,足夠的實時標準處理時間和屏幕警報系統(tǒng)。

      特異性不足會產生許多誤報。相應,敏感度不足不僅不會增加PDR/ADR,還會增加醫(yī)生負擔。此外,為了使實時檢測有效,分析時間必須快,即AI診斷必須避免明顯的延遲。由于這些先決條件,目前關于自動息肉檢測的大多數(shù)研究都是小規(guī)模的非臨床研究,盡管隨著對該領域的興趣迅速增加,并且隨著深度學習的出現(xiàn),預計未來幾年將取得巨大進展。

      如今,人工智能在消化內鏡領域的應用,目前主要分為兩大方向,一是輔助診斷CADx,通過設備的光學能力,例如幾百倍的放大內鏡,窄帶光NBI,熒光技術,加之深度學習判斷病灶的性質,以求代替病理診斷。然而這種依賴病灶表面的細微特征來預測病理結構的方式還有待考證。雖然一些傳統(tǒng)的深度學習模型在這個領域實現(xiàn)了相對高的預測性能,但其與病理結構并不能100%對應,加之各國現(xiàn)行的臨床規(guī)范有較大改變,所以并未獲得大規(guī)模應用。另一個大方向是輔助檢測CADe,即AI只提供視野中可見病灶的位置,具體的診斷還需要臨床醫(yī)生當場決斷。這個類型的應用主要解決人類肉眼的局限性,在疲勞、經驗不足、注意力分散的情況下,AI檢測為內鏡醫(yī)生提供有效輔助。由于對臨床規(guī)范和實踐并無本質影響,這類型的應用只要達到了相應的技術指標將會比較容易被廣泛接受。

      這項研究屬于后者,其臨床意義十分顯著:在結腸鏡檢查中,臨床醫(yī)生和設備廠商多年以來的共同目標就是提升ADR(腺瘤檢出率),即篩查病人中檢出腺瘤的比例。這項研究已經證明了計算機可以作為第二觀察者在結腸鏡檢查中實時為臨床醫(yī)生提示病灶。此前有臨床試驗表明配有護士或培訓生等非專業(yè)人士作為第二觀察者的結腸鏡檢查對ADR的提升達30%,而已經達到專家水準的AI作為第二觀察者對ADR的提升將非常值得期待。

      當然,最理想的狀態(tài)是CADe與CADx的結合,即“檢測+分析”,以提高ADR/PDR,以及醫(yī)生的診斷效率。在國內醫(yī)療資源稀缺的大背景下,人工智能也許是解決當前矛盾的唯一途徑。

      本片論文不是結束,而是一個新的開始。在未來,王璞團隊將繼續(xù)進行雙盲實驗、多組研究……用數(shù)據論證醫(yī)生和AI怎樣的合作才能發(fā)揮最大的效用,并讓敏感性、特異性逐漸向“1”逼近,實現(xiàn)實時自動息肉檢測系統(tǒng)從“有效”到“飛躍”的突破。

      最后引用王璞在采訪中的發(fā)言:“就消化科來看,人工智能技術的應用可以提高臨床服務水平,降低醫(yī)療服務成本及風險。好的AI系統(tǒng)需要在真實的臨床環(huán)境中驗證,現(xiàn)在很多的人機大賽是遠遠不夠的,我認為嚴謹?shù)那罢靶噪S機臨床試驗是驗證人工智能技術的最佳方式。在消化內鏡領域,除了自動檢測息肉,還有息肉窄帶光病理診斷、以及食道鏡窄帶光癌前病變檢測與分類等。每項技術都有提高現(xiàn)有臨床水平的潛力,關鍵在于能否在臨床使用中切實提高核心臨床指標。這正是研究者們所需要的并為之不懈努力的方向。”

      鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯(lián)系我們修改或刪除,多謝。

      推薦內容