預(yù)測(cè)蛋白質(zhì)配對(duì)的算法可以幫助顯示生命系統(tǒng)如何工作
模擬細(xì)胞內(nèi)蛋白質(zhì)如何相互作用的算法將加強(qiáng)對(duì)生物學(xué)的研究,并闡明蛋白質(zhì)如何協(xié)同工作以完成諸如將食物轉(zhuǎn)化為能量等任務(wù)。研究人員開發(fā)了一種算法,通過(guò)識(shí)別細(xì)胞內(nèi)的哪些蛋白質(zhì)相互作用,基于它們的基因序列,幫助我們理解生命系統(tǒng)的工作原理。
在過(guò)去的十年中,從基因測(cè)序中產(chǎn)生大量數(shù)據(jù)的能力迅速發(fā)展,但研究人員的麻煩在于能夠應(yīng)用序列數(shù)據(jù)來(lái)更好地理解生命系統(tǒng)。發(fā)表在“ 美國(guó)國(guó)家科學(xué)院院刊”上的這項(xiàng)新研究向前邁出了重要一步,因?yàn)樯镞^(guò)程,例如我們的身體如何將食物轉(zhuǎn)化為能量,是由特定的蛋白質(zhì) - 蛋白質(zhì)相互作用驅(qū)動(dòng)的。
研究報(bào)告的共同作者,劍橋大學(xué)化學(xué)系的Lucy Colwell博士與Ned Wingreen一起領(lǐng)導(dǎo)了這項(xiàng)研究,“我們真的很驚訝我們的算法足夠強(qiáng)大,能夠在沒(méi)有實(shí)驗(yàn)數(shù)據(jù)的情況下做出準(zhǔn)確的預(yù)測(cè)。”普林斯頓大學(xué)。“能夠預(yù)測(cè)這些相互作用將有助于我們了解蛋白質(zhì)如何適應(yīng)并協(xié)同工作以完成所需的任務(wù) - 使用算法比依靠實(shí)驗(yàn)更快,更便宜。”
當(dāng)?shù)鞍踪|(zhì)相互作用時(shí),它們粘在一起形成蛋白質(zhì)復(fù)合物。在她之前的研究中,Colwell發(fā)現(xiàn)如果已知兩種相互作用的蛋白質(zhì),可以使用序列數(shù)據(jù)來(lái)確定這些復(fù)合物的結(jié)構(gòu)。一旦知道了復(fù)合物的結(jié)構(gòu),研究人員就可以研究化學(xué)上發(fā)生的情況。然而,哪些蛋白質(zhì)相互作用的問(wèn)題仍然需要昂貴,耗時(shí)的實(shí)驗(yàn)。每個(gè)細(xì)胞通常包含相同蛋白質(zhì)的多個(gè)版本,并且不可能預(yù)測(cè)每種蛋白質(zhì)的哪個(gè)版本會(huì)特異性地相互作用 - 相反,實(shí)驗(yàn)涉及嘗試所有選項(xiàng)以查看哪些蛋白質(zhì)粘附。
在目前的論文中,研究人員使用數(shù)學(xué)算法篩選可能的相互作用伙伴,并識(shí)別彼此相互作用的蛋白質(zhì)對(duì)。該方法正確地預(yù)測(cè)了配對(duì)已知的超過(guò)40,000個(gè)蛋白質(zhì)序列的數(shù)據(jù)集中存在的93%的蛋白質(zhì) - 蛋白質(zhì)相互作用,而沒(méi)有首先提供正確配對(duì)的任何實(shí)例。
當(dāng)兩種蛋白質(zhì)粘在一起時(shí),一條鏈上的一些氨基酸會(huì)粘附在另一條鏈上的氨基酸上。相互作用蛋白質(zhì)之間的界限趨向于隨著時(shí)間的推移一起進(jìn)化,導(dǎo)致它們的序列彼此鏡像。
該算法使用此效果來(lái)構(gòu)建交互模型。它首先隨機(jī)配對(duì)每個(gè)生物體內(nèi)的蛋白質(zhì)版本 - 因?yàn)橄嗷プ饔玫呐鋵?duì)在序列上往往比非相互配對(duì)更相似,該算法可以從隨機(jī)起點(diǎn)快速識(shí)別出一小組大致正確的配對(duì)。
使用這個(gè)小集合,算法測(cè)量第一蛋白質(zhì)中特定位置的氨基酸是否影響第二蛋白質(zhì)中特定位置發(fā)生的氨基酸。從數(shù)據(jù)中學(xué)習(xí)的這些依賴性被整合到模型中并用于計(jì)算每種可能的蛋白質(zhì)對(duì)的相互作用強(qiáng)度。消除了低得分配對(duì),剩余的配置用于構(gòu)建更新的模型。
研究人員認(rèn)為,只有通過(guò)研究在實(shí)驗(yàn)中發(fā)現(xiàn)的對(duì),才能首先“學(xué)習(xí)”制造良好蛋白質(zhì) - 蛋白質(zhì)對(duì)的算法,該算法才能正常工作。這意味著研究人員必須為算法提供一些已知的蛋白質(zhì)對(duì)或“黃金標(biāo)準(zhǔn)”,以便比較新序列。該團(tuán)隊(duì)使用了兩個(gè)經(jīng)過(guò)充分研究的蛋白質(zhì)家族,組氨酸激酶和反應(yīng)調(diào)節(jié)因子,它們作為細(xì)菌信號(hào)系統(tǒng)的一部分相互作用。
但是已知的例子通常很少,并且在細(xì)胞中存在數(shù)千萬(wàn)未發(fā)現(xiàn)的蛋白質(zhì) - 蛋白質(zhì)相互作用。所以團(tuán)隊(duì)決定看看他們是否可以減少他們給算法的訓(xùn)練量。他們逐漸降低了他們喂入算法的已知組氨酸激酶反應(yīng)調(diào)節(jié)劑對(duì)的數(shù)量,并驚訝地發(fā)現(xiàn)該算法繼續(xù)有效。最后,他們運(yùn)行算法而沒(méi)有給出任何這樣的訓(xùn)練對(duì),并且它仍然預(yù)測(cè)新對(duì)具有93%的準(zhǔn)確度。
“我們不需要一套訓(xùn)練數(shù)據(jù)的事實(shí)真的令人驚訝,”科爾韋爾說(shuō)。
該算法是使用來(lái)自細(xì)菌的蛋白質(zhì)開發(fā)的,研究人員現(xiàn)在將該技術(shù)擴(kuò)展到其他生物體。“生物體內(nèi)的反應(yīng)是由特定的蛋白質(zhì)相互作用驅(qū)動(dòng)的,”科爾韋爾說(shuō)。“這種方法使我們能夠識(shí)別和探索這些相互作用,這是建立生命系統(tǒng)如何運(yùn)作的重要一步。”
推薦內(nèi)容
-
量子生物學(xué)的真實(shí)歷史
量子生物學(xué)是一種年輕且越來(lái)越流行的科學(xué)類型,并不像許多人所認(rèn)為的那樣新,有著復(fù)雜而有些黑暗的歷史,解釋了世界上第一個(gè)量子生物學(xué)...
-
當(dāng)脂肪細(xì)胞改變顏色
在哺乳動(dòng)物中,存在三種類型的脂肪組織。白色脂肪細(xì)胞主要位于身體的腹部和皮下區(qū)域,非常適合儲(chǔ)存多余的能量。相反,米色和棕色脂肪細(xì)...
-
樹蘭醫(yī)療:隔離結(jié)束,6歲女童的爸爸給“大白們”寫了一封感謝信
非常感謝你們每一位的努力和付出,你們辛苦了! 大年三十晚上,我的女兒被開水燙傷手臂,是你們樹蘭醫(yī)院駐點(diǎn)的醫(yī)療團(tuán)隊(duì)第一時(shí)間在群里告知
-
Kinesins在承受重載時(shí)無(wú)視弱力
如果你是前面的運(yùn)動(dòng)蛋白,準(zhǔn)備做重拉。這是萊斯大學(xué)領(lǐng)導(dǎo)的關(guān)于驅(qū)動(dòng)驅(qū)動(dòng)蛋白的機(jī)制的一個(gè)結(jié)論,驅(qū)動(dòng)蛋白是在細(xì)胞內(nèi)攜帶貨物的運(yùn)動(dòng)蛋白。...
-
蘇寧美的超品日,拯救囧味年!
春節(jié)是中國(guó)人一年中最重要的節(jié)日,承載著中國(guó)人對(duì)于家庭以及親戚朋友難以割舍的感情寄托,團(tuán)圓對(duì)于每一個(gè)中國(guó)人來(lái)說(shuō)有著崇高的意義。但...
-
分子演習(xí)摧毀了致命的超級(jí)細(xì)菌
分子鉆具有靶向和消滅致命細(xì)菌的能力,這些細(xì)菌對(duì)幾乎所有抗生素都產(chǎn)生了抗藥性。在某些情況下,演習(xí)會(huì)使抗生素再次有效。賴斯大學(xué),德...
-
進(jìn)口降脂藥選什么成分的好?
近些年來(lái),高血脂在我們生活中算是名噪一時(shí)很多人都對(duì)這個(gè)詞比較熟悉,一般來(lái)說(shuō)高血脂在中老年人單重發(fā)病率比較高,但是這幾年數(shù)據(jù)...
-
研究人員在加利福尼亞中部附近的海底發(fā)現(xiàn)了神秘的洞
在最近一次對(duì)大蘇爾海域深海底的調(diào)查中,MBARI研究人員在海底發(fā)現(xiàn)了數(shù)千個(gè)神秘的洞或坑??茖W(xué)家和資源管理者希望了解這些坑的形成方式,因
-
一種新的高效的和選擇性的抗瘧疾分子
一種新的實(shí)驗(yàn)室合成分子,基于在海洋滑翔細(xì)菌中發(fā)現(xiàn)的稱為marinoquinolines的天然化合物,是開發(fā)新抗瘧藥物的有力候選者。在測(cè)試中,該分子
-
超分辨率顯微鏡可以顯示維持細(xì)胞極性的機(jī)制
細(xì)胞不是均勻的球體; 它們通常有各種不同的形狀。在最廣泛的意義上,這種形狀的變化被稱為細(xì)胞極性,并且它是各種細(xì)胞功能的基本特性。根