AI使用圖像和組學(xué)來(lái)解碼癌癥
這是每個(gè)癌癥患者心中的問(wèn)題:我有多久了?基因組學(xué)家邁克爾斯奈德希望他有答案。目前,所有醫(yī)生都可以做的是將具有相似癌癥的腫塊患者分成大組,并猜測(cè)他們將與該組中的其他患者具有相同的藥物反應(yīng)或預(yù)后。但他們將人分配給這些群體的方法粗略且不完善,并且通?;谌搜矍蚴占臄?shù)據(jù)。
斯坦福大學(xué)基因組學(xué)和個(gè)性化醫(yī)學(xué)中心主任斯奈德說(shuō):“當(dāng)病理學(xué)家閱讀圖像時(shí),只有百分之六十的時(shí)間是他們同意的。”2013年,他和當(dāng)時(shí)的研究生Kun-Hsing Yu想知道人工智能能否提供更準(zhǔn)確的預(yù)測(cè)。
Yu將組織學(xué)圖像輸入機(jī)器學(xué)習(xí)算法,連同病理學(xué)家確定的診斷,訓(xùn)練它以區(qū)分肺癌和正常組織,以及兩種不同類(lèi)型的肺癌相互之間。然后,他為這些幻燈片提供了生存數(shù)據(jù),讓系統(tǒng)了解這些信息與圖像的關(guān)系。最后,他在新的幻燈片中添加了該模型以前從未見(jiàn)過(guò)的內(nèi)容,并詢(xún)問(wèn)了所有重要的長(zhǎng)壽問(wèn)題。
當(dāng)病理學(xué)家閱讀圖像時(shí),只有百分之六十的時(shí)間他們同意。
- 斯坦福大學(xué)邁克爾斯奈德
計(jì)算機(jī)可以預(yù)測(cè)哪些人的生存時(shí)間比這些特定癌癥的平均生存時(shí)間更短或更長(zhǎng) - 病理學(xué)家很難做到這一點(diǎn)。1“它的效果非常好,”Yu說(shuō),現(xiàn)在是哈佛醫(yī)學(xué)院的講師。
但斯奈德和俞認(rèn)為他們可以做得更多。斯奈德的實(shí)驗(yàn)室也在研究,所以他們決定不僅為幻燈片提供計(jì)算機(jī),還提供腫瘤轉(zhuǎn)錄組。通過(guò)這些數(shù)據(jù)的組合,該模型預(yù)測(cè)患者的生存率甚至優(yōu)于單獨(dú)的圖像或轉(zhuǎn)錄組,準(zhǔn)確率超過(guò)80%。2今天,病理學(xué)家通常根據(jù)組織顯微照片的視覺(jué)評(píng)估做出生存預(yù)測(cè),從中評(píng)估腫瘤的階段 - 腫瘤的大小和范圍 - 等級(jí),以及它進(jìn)一步生長(zhǎng)和擴(kuò)散的可能性。但病理學(xué)家并不總是同意,腫瘤分級(jí)并不總能準(zhǔn)確預(yù)測(cè)生存。
Snyder和Yu并不是唯一一位認(rèn)識(shí)到人工智能能夠分析癌癥相關(guān)數(shù)據(jù)集的能力的研究人員,這些數(shù)據(jù)集是關(guān)于圖像,一些人,以及最近兩者的結(jié)合。盡管這些工具在到達(dá)診所之前還有很長(zhǎng)的路要走,但AI方法可以快速準(zhǔn)確診斷,預(yù)測(cè)哪種治療方法最適合哪些患者,甚至可以預(yù)測(cè)生存率。
目前,其中一些應(yīng)用仍然是“科幻小說(shuō)”,倫敦癌癥研究所的計(jì)算生物學(xué)家Andrea Sottoriva說(shuō),他正致力于人工智能預(yù)測(cè)癌癥進(jìn)展并選擇合適的藥物治療特定腫瘤。“我們的目標(biāo)是改變這一點(diǎn)。”
INPUT:圖像,輸出:診斷
在癌癥進(jìn)展過(guò)度之前尋找和治療癌癥可能是提高生存率的關(guān)鍵。例如,在宮頸癌方面,早期檢測(cè)可使五年生存率超過(guò)90%。醫(yī)生可以在子宮頸轉(zhuǎn)化區(qū)的前四毫米處煎炸,冷凍或切除癌前細(xì)胞,這是宮頸周?chē)畛3霈F(xiàn)癌癥的組織環(huán)。然而,一旦癌癥轉(zhuǎn)移,存活率在五年內(nèi)降至56%或更低。
早期治療在發(fā)達(dá)國(guó)家很常見(jiàn),在這些國(guó)家,婦女定期進(jìn)行子宮頸抹片檢查以檢查宮頸細(xì)胞是否異常,并檢測(cè)導(dǎo)致癌癥的人乳頭瘤病毒。但在發(fā)展中國(guó)家,這種放映很少見(jiàn)。國(guó)家癌癥研究所的醫(yī)學(xué)流行病學(xué)家Mark Schiffman說(shuō),有一個(gè)更便宜的測(cè)試保健工作者在醋酸中涂抹女性子宮頸,尋找可能表明癌癥的明顯白色區(qū)域 - 但“這種技術(shù)是如此不準(zhǔn)確”。因此,一些健康女性接受治療,而其他人可能會(huì)遺漏癌前細(xì)胞,從而導(dǎo)致需要更多根治治療的癌癥,如化療,放療或子宮切除術(shù)。
Schiffman和其他研究小組一直在努力尋找一種方法來(lái)使醋酸篩選更加準(zhǔn)確 - 例如,通過(guò)使用白光以外的光譜進(jìn)行成像。Schiffman的團(tuán)隊(duì)在美國(guó)和哥斯達(dá)黎加積累了數(shù)千張來(lái)自不同來(lái)源的子宮頸圖片,包括醫(yī)療保健專(zhuān)業(yè)人員用放大鏡稱(chēng)為陰道鏡或手機(jī)拍攝的照片。但他即將放棄。“我們不能像其他[測(cè)試]一樣真正敏感,準(zhǔn)確或可重復(fù)。”
然后,在2017年底,與比爾和梅琳達(dá)蓋茨基金會(huì)相關(guān)的一個(gè)名為Global Good的非營(yíng)利組織達(dá)成了協(xié)議。該組織希望嘗試在Schiffman的圖像采集上進(jìn)行機(jī)器學(xué)習(xí),以查看計(jì)算機(jī)是否可以在醫(yī)生無(wú)法提供診斷時(shí)進(jìn)行診斷。
因此,Schiffman與Global Good和其他合作者合作,使用一種稱(chēng)為卷積神經(jīng)網(wǎng)絡(luò)的特殊機(jī)器學(xué)習(xí)來(lái)分析子宮頸圖像。該算法的目標(biāo)是識(shí)別圖像中的特征 - 例如,相似或不同的并排像素往往是多少 - 這有助于它獲得正確的診斷。一開(kāi)始,它的準(zhǔn)確性并不比偶然。在分析越來(lái)越多的圖像時(shí),它權(quán)衡了這些功能以幫助它找到答案。“這是一個(gè)變得更熱,更熱,更冷,更冷,哦是的,更熱,更熱的過(guò)程。。。直到它盡可能接近,“希夫曼解釋說(shuō)。
該團(tuán)隊(duì)開(kāi)始使用來(lái)自9,000多名女性的哥斯達(dá)黎加七年來(lái)收集的子宮頸圖像。Schiffman還積累了這些女性更準(zhǔn)確的篩查測(cè)試數(shù)據(jù),以及18年前有關(guān)癌前病變或癌癥診斷的后續(xù)信息。研究人員使用70%的完整數(shù)據(jù)集來(lái)訓(xùn)練模型,然后僅在其余30%的圖像上測(cè)試其性能。Schiffman無(wú)法相信結(jié)果:機(jī)器學(xué)習(xí)區(qū)分了健康組織,癌前病變和癌癥,91%是機(jī)器學(xué)習(xí)預(yù)測(cè)準(zhǔn)確度的標(biāo)準(zhǔn)衡量標(biāo)準(zhǔn)。相比之下,人類(lèi)視覺(jué)檢查的得分僅為69%。3“我從來(lái)沒(méi)有見(jiàn)過(guò)這么準(zhǔn)確的東西,”希夫曼說(shuō)。他確信有一些錯(cuò)誤。
該小組檢查了其工作,并要求國(guó)家醫(yī)學(xué)圖書(shū)館的合作者獨(dú)立驗(yàn)證該技術(shù)。沒(méi)有錯(cuò)誤:機(jī)器真的很擅長(zhǎng)識(shí)別癌前病變和癌癥。有了這個(gè)新工具,Schiffman希望開(kāi)發(fā)一種低成本的宮頸癌篩查測(cè)試,將手機(jī)型相機(jī)與基于機(jī)器的圖像分析相結(jié)合。首先,他想在世界各地的成千上萬(wàn)的手機(jī)宮頸圖像上訓(xùn)練他的算法。我從來(lái)沒(méi)有見(jiàn)過(guò)這么準(zhǔn)確的東西。
我從來(lái)沒(méi)有見(jiàn)過(guò)這么準(zhǔn)確的東西。
-Mark Schiffman,國(guó)家癌癥研究所
他不是唯一一個(gè)關(guān)注癌癥診斷智能手機(jī)的人。皮膚病變 - 可能是癌癥或良性 - 正好在表面,任何人都可以拍攝。斯坦福大學(xué)的研究人員建立了一個(gè)包含13萬(wàn)張皮膚病變照片的數(shù)據(jù)庫(kù),并用它來(lái)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),以區(qū)分良性腫塊和三種不同類(lèi)型的惡性病變,準(zhǔn)確率至少達(dá)到91%。該算法的表現(xiàn)優(yōu)于大多數(shù)21名皮膚科醫(yī)生要求評(píng)估的相同圖片。4
創(chuàng)建癌癥預(yù)測(cè)模型的主要挑戰(zhàn)是獲取足夠的高質(zhì)量數(shù)據(jù)。當(dāng)斯坦福大學(xué)的團(tuán)隊(duì)從斯坦福醫(yī)學(xué)院和互聯(lián)網(wǎng)上編輯皮膚癌的圖像時(shí),角度,變焦和照明都變化多端。研究人員不得不翻譯各種語(yǔ)言的標(biāo)簽,然后與皮膚科醫(yī)生合作,將病變正確分類(lèi)為2,000多種疾病類(lèi)別。
當(dāng)然,大多數(shù)癌癥需要的不僅僅是智能手機(jī)相機(jī)才能看到正在發(fā)生的事情。觀察腫瘤中的個(gè)體細(xì)胞需要顯微鏡檢查。Yu說(shuō),科學(xué)家們還想盡可能多地收集關(guān)于一個(gè)人的臨床治療和反應(yīng)的信息,以及基因組等分子數(shù)據(jù),但這也很難得到。“我們很少能找到患有我們想要的所有數(shù)據(jù)的患者。”
INPUT:圖像+ -Omes,輸出:生存
正如Snyder和Yu所發(fā)現(xiàn)的那樣,-omics數(shù)據(jù)(如果有的話)可以提供有關(guān)特定癌癥中涉及的分子途徑的信息,這些信息可能有助于識(shí)別癌癥類(lèi)型,存活或?qū)χ委煹目赡芊磻?yīng)。在他們最初的基于圖像的研究中,研究人員共有2,186個(gè)肺組織切片,人類(lèi)病理學(xué)家的疾病分類(lèi)和患者存活時(shí)間。研究人員使用計(jì)算機(jī)算法從這些圖像中提取近10,000個(gè)特征,例如細(xì)胞形狀或大小,用于訓(xùn)練多種機(jī)器學(xué)習(xí)算法。
一種運(yùn)作良好的方法稱(chēng)為隨機(jī)森林。它會(huì)生成數(shù)百個(gè)可能的決策樹(shù);然后那些“樹(shù)”在答案上投票,而大多數(shù)人都在這里投票。該算法在區(qū)分健康組織和兩種癌癥類(lèi)型方面的準(zhǔn)確度超過(guò)75%,并且可以預(yù)測(cè)誰(shuí)比單純基于癌癥階段的模型更準(zhǔn)確地進(jìn)入高或低生存組。1“這超出了目前的病理診斷范圍,”Yu說(shuō)。
在他們的后續(xù)研究中,研究人員在538名肺癌患者的組織病理學(xué)載玻片上運(yùn)行他們訓(xùn)練的圖像分析算法,然后添加來(lái)自同一患者的轉(zhuǎn)錄組和蛋白質(zhì)組,并要求“隨機(jī)森林”對(duì)他們的癌癥等級(jí)進(jìn)行投票。 。15個(gè)基因的表達(dá)水平預(yù)測(cè)癌癥等級(jí),準(zhǔn)確率為80%。這些基因被證明與DNA復(fù)制,細(xì)胞周期調(diào)控和p53信號(hào)傳導(dǎo)等過(guò)程有關(guān) - 所有這些都已知在癌癥生物學(xué)中發(fā)揮作用。該團(tuán)隊(duì)還確定了15種蛋白質(zhì) - 而不是由參與細(xì)胞發(fā)育和癌癥信號(hào)傳導(dǎo)的15種基因編碼的蛋白質(zhì),這些蛋白質(zhì)以81%的準(zhǔn)確度預(yù)測(cè)等級(jí)。雖然研究人員沒(méi)有將此與人類(lèi)表現(xiàn)進(jìn)行比較,但一項(xiàng)病理學(xué)家的研究發(fā)現(xiàn)79%的人對(duì)肺腺癌的分級(jí)達(dá)成一致5 -建立機(jī)器和人類(lèi)同樣準(zhǔn)確。但機(jī)器走得更遠(yuǎn),顯然正在尋找導(dǎo)致癌癥進(jìn)展的特定基因表達(dá)因子。
最后,研究人員要求計(jì)算機(jī)根據(jù)基因表達(dá),癌癥等級(jí)和患者年齡來(lái)預(yù)測(cè)生存。利用所有這些數(shù)據(jù),該模型實(shí)現(xiàn)了超過(guò)80%的準(zhǔn)確性,正確地將病例分類(lèi)為長(zhǎng)期和短期幸存者,比人類(lèi)病理學(xué)家,轉(zhuǎn)錄組或單獨(dú)的圖像更好。2
在Snyder和Yu的工作的啟發(fā)下,紐約大學(xué)醫(yī)學(xué)院的Aristotelis Tsirigos及其同事也試圖將圖像與肺癌的遺傳學(xué)聯(lián)系起來(lái),使用1,634張健康或癌性肺組織切片。僅基于圖像,他們的卷積神經(jīng)網(wǎng)絡(luò)能夠區(qū)分腺癌和鱗狀細(xì)胞癌,準(zhǔn)確率約為97%。然后,研究小組提供了關(guān)于肺腺癌中10個(gè)最常見(jiàn)突變基因的算法數(shù)據(jù),并且計(jì)算機(jī)學(xué)會(huì)了從病理學(xué)載玻片中預(yù)測(cè)其中6個(gè)突變的存在,準(zhǔn)確度范圍為73%至86%。6“它運(yùn)作得很好,”Sottoriva評(píng)論說(shuō),他沒(méi)有參與這項(xiàng)工作。“首先,它非常令人興奮。”
當(dāng)然,醫(yī)生和科學(xué)家不需要通過(guò)成像識(shí)別突變;其他測(cè)試更直接,更準(zhǔn)確,基因測(cè)序提供了幾乎完美的癌癥基因組讀數(shù)。Tsirigos解釋說(shuō),這項(xiàng)研究有助于證明遺傳學(xué)和圖像特征以可預(yù)測(cè)的方式相關(guān)?,F(xiàn)在,他正在努力將組織病理學(xué)和分子信息結(jié)合起來(lái)預(yù)測(cè)患者的預(yù)后,正如Yu和Snyder的研究小組所做的那樣。Tsirigos說(shuō),只要研究人員有正確的數(shù)據(jù)輸入,這些方法應(yīng)適用于任何癌癥類(lèi)型。
INPUT:-Omes,OUTPUT:腫瘤進(jìn)化
即使沒(méi)有圖像,-Omics數(shù)據(jù)也可以自己使用。例如,Sottoriva及其同事正在使用基因組學(xué)來(lái)了解腫瘤的演變。一種腫瘤通常由多種細(xì)胞譜系組成,所有細(xì)胞譜系均源自相同的原始癌細(xì)胞。為了有效治療癌癥,了解這種異質(zhì)性和腫瘤進(jìn)化的方式非常重要。如果治療僅對(duì)腫瘤的一部分起作用,癌癥就會(huì)復(fù)發(fā)。“這是生死攸關(guān)的問(wèn)題,”愛(ài)丁堡大學(xué)計(jì)算機(jī)科學(xué)家,腫瘤進(jìn)化研究合作者Guido Sanguinetti說(shuō)。
通過(guò)對(duì)單個(gè)腫瘤的多個(gè)部分進(jìn)行取樣,研究人員可以推斷出癌癥的進(jìn)化途徑;它類(lèi)似于對(duì)現(xiàn)代人類(lèi)基因組進(jìn)行抽樣,以追蹤各種群體回到祖先群體。來(lái)自不同患者的腫瘤,即使患有相同類(lèi)型的癌癥,也往往具有截然不同的進(jìn)化樹(shù)。Sanguinetti,Sottoriva及其同事認(rèn)為,如果他們能夠找到癌癥傾向于遵循的共同途徑,腫瘤學(xué)家就可以利用這些信息對(duì)可能患有類(lèi)似疾病進(jìn)展的人進(jìn)行分類(lèi),或者對(duì)藥物進(jìn)行類(lèi)似的反應(yīng)。
為了找到那些常見(jiàn)的進(jìn)化樹(shù),研究人員使用了一種稱(chēng)為轉(zhuǎn)移學(xué)習(xí)的機(jī)器學(xué)習(xí)形式。Sanguinetti解釋說(shuō),該算法同時(shí)查看患者基因組中的所有樹(shù),在它們之間共享信息以找到與整個(gè)組相容的解決方案。他們稱(chēng)他們的工具為REVOLVER,用于癌癥的重復(fù)進(jìn)化。作為第一次測(cè)試,他們發(fā)明了虛構(gòu)的腫瘤進(jìn)化樹(shù)。當(dāng)他們根據(jù)這些樹(shù)木喂養(yǎng)REVOLVER基因組學(xué)數(shù)據(jù)時(shí),它確實(shí)吐出了與發(fā)明樹(shù)相匹配的系統(tǒng)發(fā)育。
為了以眾所周知的癌癥進(jìn)化形式驗(yàn)證該工具,研究人員轉(zhuǎn)向了結(jié)直腸癌的惡性轉(zhuǎn)變。這發(fā)生在良性腺瘤累積已知驅(qū)動(dòng)基因的突變中:例如,在APC中,然后是KRAS,然后是PIK3CA。研究人員為REVOLVER提供了一組來(lái)自9個(gè)真實(shí)良性腺瘤和10個(gè)惡性腫瘤的基因組。果然,該模型繪制了與腺瘤到癌轉(zhuǎn)變相匹配的系統(tǒng)發(fā)育樹(shù)。
然后該小組分析了腫瘤樣本,對(duì)其進(jìn)展不太了解。在來(lái)自99名非小細(xì)胞肺癌患者的基因組中,REVOLVER根據(jù)腫瘤累積的突變序列確定了10個(gè)潛在的患者群。其中一些群體中的人群存活時(shí)間不到150天,而置于其他群集中的群體存活時(shí)間更長(zhǎng),表明這些類(lèi)別具有預(yù)后價(jià)值。同樣,REVOLVER在50個(gè)乳腺癌腫瘤中發(fā)現(xiàn)了6個(gè)簇,簇之間的存活水平不同。7“我們沒(méi)想到會(huì)找到團(tuán)體,真的,”Sottoriva說(shuō)。“這些結(jié)果告訴我們癌癥的進(jìn)展可以預(yù)測(cè)。”
Sottoriva說(shuō),醫(yī)學(xué)運(yùn)行的是那種可預(yù)測(cè)的模式。AI是一種強(qiáng)大的工具,可幫助識(shí)別臨床相關(guān)的模式。此外,通過(guò)從模型的輸入中選擇性地消除某些數(shù)據(jù),并查看其準(zhǔn)確性是否下降,生物信息學(xué)家開(kāi)始弄清楚計(jì)算機(jī)用來(lái)區(qū)分這些模式的特征,Tsirigos說(shuō)。
目前用于癌癥研究的AI應(yīng)用僅僅是個(gè)開(kāi)始。未來(lái)的算法不僅可以包含一些物體和圖像,還可以包含有關(guān)治療結(jié)果,進(jìn)展以及科學(xué)家可以獲得的任何其他信息的其他數(shù)據(jù)。
“在一天結(jié)束時(shí),”斯奈德說(shuō),“在處理像癌癥這樣的復(fù)雜疾病時(shí),你需要一些信息。”
推薦內(nèi)容
-
機(jī)票賣(mài)出白菜價(jià)怎么回事?幾十元就能坐飛機(jī)?
花幾十元就能坐一趟飛機(jī),你敢相信嗎?聽(tīng)起來(lái)也許不可思議,但現(xiàn)在卻成為現(xiàn)實(shí),近日,據(jù)媒體報(bào)道,從北上廣深等城市飛往重慶、成都、昆明等
-
額頂區(qū)九針治療失眠療效觀察
-2022年4月17日發(fā)(作者:埋線醫(yī)院雙眼皮價(jià)格)實(shí)用中醫(yī)藥雜志2015年7月第31卷7期(總第27O期)?。剩希眨遥危粒獭。希啤。校遥粒?
-
7月29日廣東疫情最新數(shù)據(jù)公布 廣東新增境外輸入確診病例3例
當(dāng)前疫情防控形勢(shì)仍然嚴(yán)峻復(fù)雜,要緊繃疫情防控常態(tài)化這根弦,始終保持警惕、嚴(yán)密防范。從當(dāng)下全國(guó)各地的疫情形勢(shì)來(lái)看,似乎已經(jīng)迎來(lái)了好...
-
新病毒的傳播據(jù)信發(fā)生在養(yǎng)殖和野生魚(yú)類(lèi)之間
2010年,研究人員發(fā)現(xiàn)了一種名為魚(yú)類(lèi)呼腸孤病毒(PRV)的新型魚(yú)類(lèi)病毒。該病毒在養(yǎng)殖魚(yú)類(lèi)中很常見(jiàn),很可能該病毒可導(dǎo)致鮭魚(yú)的心臟和骨骼肌炎
-
發(fā)現(xiàn)酶LSD1調(diào)節(jié)肌纖維類(lèi)型分化
我們的身體將食物轉(zhuǎn)化為能量,用于所有生命活動(dòng)這些代謝過(guò)程使細(xì)胞產(chǎn)生能量(合成代謝)并從營(yíng)養(yǎng)物質(zhì)中消耗能量(分解代謝)。在最近日本熊本大
-
膳食營(yíng)養(yǎng)指導(dǎo)改善高血壓的癥狀效果
-2022年4月21日發(fā)(作者:腎病病因)膳食營(yíng)養(yǎng)指導(dǎo)改善高血壓的癥狀效果目的:探討膳食營(yíng)養(yǎng)指導(dǎo)改善高血壓的癥狀效果。方法:原發(fā)性高血壓患者
-
我國(guó)漢族女生月經(jīng)初潮年齡變化地域分布研究
-2022年4月24日發(fā)(作者:北京男科最好的醫(yī)院)我國(guó)漢族女生月經(jīng)初潮年齡變化地域分布研究61我國(guó)漢族女生月經(jīng)初潮年齡變化地域分布研究劉穎郭
-
6月30日廣州疫情最新消息通報(bào) 廣州國(guó)際健康驛站預(yù)計(jì)九月投入使用!
內(nèi)疫情控制得很好,風(fēng)險(xiǎn)度是逐漸下降,但個(gè)別地方還是會(huì)有零散的病例發(fā)生。6月28日,廣州市政府新聞辦舉行疫情防控新聞發(fā)布會(huì),廣州市衛(wèi)健委
-
致幻劑對(duì)癌癥患者具有持久的抗焦慮和抗抑郁作用
繼2016年里程碑式的研究之后,紐約大學(xué)格羅斯曼醫(yī)學(xué)院(NYU Grossman School of Medicine)的研究人員發(fā)現(xiàn),將迷幻蘑菇中發(fā)現(xiàn)的化合物...
-
高血壓病防治知識(shí)(宣傳單)
-2022年4月21日發(fā)(作者:2020年1月黃道吉日一覽表)高血壓病防治知識(shí)每年的十月八日定為“全國(guó)高血壓日”,高血壓是最常見(jiàn)的心血管疾病,...