建立模型以比以往更準(zhǔn)確地重建進(jìn)化變化
還記得我們在中學(xué)生物學(xué)中學(xué)到的領(lǐng)域,王國,門,階級,秩序,家庭,屬,物種和達(dá)爾文的生命樹隱喻嗎?這種描述生命事物譜系的方式,是科學(xué)界對基因如何隨著時間發(fā)生突變和分裂以將事物改變?yōu)槿缃竦臓顟B(tài)所做的最好猜測。
隨著科學(xué)越來越擅長識別蛋白質(zhì)和基因的變化,將生物重新分類為另一個屬并不少見。例如,最近,各種細(xì)菌,植物和珊瑚的分類法發(fā)生了變化。
如果您可以建立一個更好的進(jìn)化變化模型,盡管它可能不是100%準(zhǔn)確(考慮到復(fù)雜的生物體已經(jīng)進(jìn)化了數(shù)十億年),卻能為您提供比以往更清晰的圖景?
克里斯汀·納格勒(Kristen Naegle)是弗吉尼亞大學(xué)工程學(xué)院的生物醫(yī)學(xué)工程和計算機(jī)科學(xué)副教授,也是UVA公共衛(wèi)生基因組學(xué)中心的常任理事,并曾擔(dān)任博士學(xué)位。當(dāng)時的學(xué)生羅曼·斯洛特斯基(Roman Sloutsky)現(xiàn)在是麻省大學(xué)阿默斯特分校的博士后研究員。他們的工作展示了如何構(gòu)建模型來比以往任何時候都更準(zhǔn)確地重建進(jìn)化變化,這為了解疾病在人體中的工作方式帶來了突破。
他們的論文“ ASPEN,一種使用整體模型重建蛋白質(zhì)進(jìn)化的方法,”在10月17日星期四發(fā)表在eLife雜志上。ASPEN代表“通過蛋白質(zhì)進(jìn)化子采樣的準(zhǔn)確性”。他們的研究突出了UVA在生物醫(yī)學(xué)數(shù)據(jù)科學(xué)中的優(yōu)勢。
當(dāng)今使用的大多數(shù)蛋白質(zhì)進(jìn)化模型可能是錯誤的。現(xiàn)在,我們有一種方法可以探究這些模型,并詢問如何使用正確的模型來構(gòu)建更好的模型。這是重要的一步。
為了更好地理解他們在建模演化變化方面工作的復(fù)雜性,Naegle提供了一個類比:“如果我要求您預(yù)測某人在舊金山和紐約之間走的路線,那將是一個模型。但是如果我要求1,000個人給我一個人走哪條路線的預(yù)測,那么這條路線在1000人中共享最多的部分就很可能是真實(shí)的,這是因?yàn)榇蠖鄶?shù)人可能都認(rèn)為,兩個城市之間的特定高速公路是最有效的要走的路,這樣高速公路的那部分就會有很大的分量或概率。
“如果我發(fā)現(xiàn)在這1000條路線中沒有人達(dá)成任何協(xié)議,那將告訴我,我對任何一種模型的準(zhǔn)確性都沒有信心。相反,如果每個人都對路線的絕大部分或大部分達(dá)成共識,我非常有信心在這兩個點(diǎn)之間必須有一種最佳的旅行方式,我可以想出一條新路線,而不是這1000個人中的任何一條,而是捕捉所有這1000個人之間共享最多的路線建議,該模型可能比提供給我的任何單個模型都更接近真實(shí)路線。最后,它可能仍然不完全準(zhǔn)確-我永遠(yuǎn)無法知道真實(shí)路線,除非我詢問實(shí)際執(zhí)行此操作的人旅行-但這可能比單獨(dú)的任何一條路線建議要好得多。
進(jìn)化就是這樣,只是就像在猜測通過時間而不是空間的路線。”
重建進(jìn)化分支是棘手的,特別是當(dāng)許多物種共享相似類型的蛋白質(zhì)時,這種蛋白質(zhì)可能已經(jīng)進(jìn)化為執(zhí)行某些不同的功能。從數(shù)學(xué)上講,問題很快就變得非常嚴(yán)重,但是發(fā)現(xiàn)這種蛋白質(zhì)進(jìn)化的含義可能會導(dǎo)致人們更好地了解我們的身體如何應(yīng)對癌癥和其他疾病。
這個問題的解決方法是Sloutsky在研究許多不同物種共有的細(xì)胞信號傳導(dǎo)中的重要蛋白質(zhì)時提出的。他想知道這種蛋白質(zhì)是如何隨著時間演變而在不同物種中具有不同功能的。這個問題是如此之大,他決定只對幾個序列進(jìn)行抽樣,以重建進(jìn)化的分歧。
他說,盡管進(jìn)行了1000次嘗試,但重建工作彼此不同。“這本身并不是一個大問題-我沒想到他們都會同意。但是我希望一個模型在大多數(shù)時間或至少很多時間可以重復(fù)。”
驚訝的是,他決定看看所有不同意見的模型有什么共同點(diǎn)。他說:“我知道我將不得不想出一種方法來合并所有這些模型中的信息,因?yàn)槲也荒苤皇褂米畛R姷哪P汀?rdquo; “這是一個意外的挑戰(zhàn),導(dǎo)致了這項(xiàng)工作。”
在幾個月的時間里,Naegle和Sloutsky改進(jìn)了軟件并測試了越來越多的針對蛋白質(zhì)的重構(gòu)問題,Naegle和Sloutsky能夠創(chuàng)建開源軟件,該軟件可以結(jié)合多個模型來非常準(zhǔn)確地重構(gòu)進(jìn)化變化。
斯勞茨基說:“我們身體所做的一切都是由蛋白質(zhì)完成的。” “這是了解分子生物學(xué)如何工作,蛋白質(zhì)如何工作以及何時出錯,出錯的強(qiáng)大工具。”
Naegle和Sloutsky的原始數(shù)據(jù)和代碼包含在eLife出版物中,因此其他研究人員可以將其用于更精確的建模。
專注于生命和生物醫(yī)學(xué)的eLife雜志在科學(xué)雜志中是獨(dú)一無二的。同行審稿人評估文章的研究和質(zhì)量,審稿人的問題和作者的答案也包含在出版物中。該雜志的哲學(xué)是知識應(yīng)該是開放的和可訪問的。
例如,研究人員將能夠使用Naegle和Sloutsky的新工具來了解相似蛋白質(zhì)的進(jìn)化程度,然后設(shè)計更好的藥物以更特異性地靶向蛋白質(zhì)。內(nèi)格勒還想象著一個醫(yī)生試圖利用醫(yī)學(xué)成像來識別隱藏在患者體內(nèi)深處的腫塊的確切位置和形狀。這種更精確的建模工具可以幫助醫(yī)生更好地了解腫塊,而無需將患者割開。
內(nèi)格勒說:“喬治·埃弗·博克斯(George EP Box)關(guān)于模型的引用哲學(xué)在這里很重要:'本質(zhì)上,所有模型都是錯誤的,但有些模型是有用的。” “我們現(xiàn)在有了一種量化的方法來詢問一個模型有多好,通過在許多模型中使用最有用的部分,我們可以構(gòu)建更好的模型。
推薦內(nèi)容
-
研究塑造人類行為的基因 但這也可能引發(fā)自閉癥
被稱為人類加速區(qū)域(HARs)的人類基因組的特定區(qū)域包含形成復(fù)雜的社會和認(rèn)知行為的基因,在進(jìn)化過程中將人類與黑猩猩(他們最親近的親屬)區(qū)分
-
與脂質(zhì)水平相關(guān)的基因分?jǐn)?shù)
一個國際科學(xué)家小組已經(jīng)確定了人類DNA的157種改變,它們可以影響血液中的脂質(zhì),如膽固醇,并在Nature Genetics中公布了它們的結(jié)果。該研究
-
研究人員正在利用機(jī)器學(xué)習(xí)來了解微生物關(guān)系
亞馬遜河及其周圍的生態(tài)系統(tǒng)是世界上生物多樣性最豐富的。但考慮到大約30英尺的人體胃腸(GI)道,它有一些競爭。這種微生物組 - 特定環(huán)境
-
團(tuán)隊(duì)揭示了生態(tài)系統(tǒng)中攜帶基因mcr-1的細(xì)菌的高流行率
最近的一項(xiàng)研究合作發(fā)現(xiàn)攜帶粘菌素抗性基因mcr-1的細(xì)菌通常存在于從香港和中國大陸收集的食品和環(huán)境樣品中。mcr-1基因是2015年中國科學(xué)家發(fā)
-
研究可能有助于科學(xué)家更多地了解慢性疼痛的原因
北卡羅萊納州立大學(xué)的研究人員發(fā)現(xiàn),炎癥會增加與小鼠的熱感覺有關(guān)的神經(jīng)元的神經(jīng)元活性,基因表達(dá)和感覺神經(jīng)(神經(jīng)突)的生長,但對小鼠...
-
10月19日四川全省疫情最新數(shù)據(jù)公布 四川昨日新增境外輸入無癥
提醒:戴口罩。上下班 工作中要佩戴口罩,如果有發(fā)熱咳嗽等癥狀時就醫(yī)時、擁擠時、乘電梯時、乘坐公共交通工具時、進(jìn)入人員密集等公共場所
-
腸道微生物群的健康和平衡在細(xì)菌感染的進(jìn)展中是重要的
根據(jù)一項(xiàng)新的研究,腸道微生物群的健康和平衡在細(xì)菌感染的進(jìn)展中很重要。由格拉斯哥大學(xué)領(lǐng)導(dǎo)并在Nature Communications上發(fā)表的一項(xiàng)新研究
-
哪些基因?qū)偶?xì)菌的能量代謝至關(guān)重要
由維也納大學(xué)的Christa Schleper領(lǐng)導(dǎo)的一個研究小組成功地從土壤中分離出了第一個氨氧化古菌:Nitrososphaera viennensis--來自維也納的
-
遺傳學(xué)家對緬甸蟒蛇眼鏡王蛇的基因組進(jìn)行測序
一個國際研究團(tuán)隊(duì)對眼鏡王蛇(Ophiophagus hannah)的基因組進(jìn)行了測序和分析。研究小組還對緬甸蟒蛇(Python molurus bivittatus)的基因組
-
10月21日昆明張掖疫情最新數(shù)據(jù)公布 甘肅新增6例本土確診病例詳
20日20時至21日12時,甘肅省新增6例本土確診病例。據(jù)消息顯示,10月20日20時-21日12時,甘肅省新增6例本土新冠肺炎確診病例。自2020年1月23