科學家揭示了繪制長期非編碼RNA的巨大未知領(lǐng)域的方法
北卡羅來納大學醫(yī)學院的科學家開發(fā)了一種有效的方法來探索稱為長非編碼RNA(lncRNAs)的神秘分子的特性,其中一些在癌癥和其他嚴重疾病中起著重要作用。到目前為止,科學家還缺乏確定人類細胞中數(shù)萬種不同lncRNA功能的正確方法。到目前為止,他們只有幾百個這樣的分子 - 這是他們所代表的巨大的未知領(lǐng)域的一小部分。
UNC科學家在Nature Genetics上發(fā)表了一篇隱藏的代碼,該代碼將lncRNA的分子構(gòu)成與他們實際做的事情聯(lián)系起來,研究人員開發(fā)了一種算法,通過它們可能的功能快速分類lncRNAs。
“長鏈非編碼RNA是您可能稱之為基因組'暗物質(zhì)'的一部分,我們開發(fā)的這種工具應(yīng)該有助于我們更好地了解它們在健康和疾病中的作用,”研究資深作者Mauro Calabrese說。 ,博士,藥理學助理教授,UNC Lineberger綜合癌癥中心成員。
動物和植物中的遺傳信息存儲在DNA中,細胞通過將DNA轉(zhuǎn)錄成稱為RNA的密切相關(guān)分子來利用該遺傳信息。許多RNA繼續(xù)被翻譯成蛋白質(zhì)。但近幾十年來科學家們不得不考慮這樣一個事實,就是不到2%的基因組就是這樣使用的。大多數(shù)DNA被轉(zhuǎn)錄成不編碼蛋白質(zhì)的RNA。這些被稱為非編碼RNA,長度超過200個核苷酸的RNA被分類為長非編碼RNA。
許多這些RNA與蛋白質(zhì)或其他分子結(jié)合以打開或關(guān)閉基因,從而調(diào)節(jié)細胞過程。最著名的lncRNA之一被稱為Xist,這對于女性的正常發(fā)育很重要。另一種稱為MALAT的高水平與更具侵襲性和轉(zhuǎn)移性的癌癥有關(guān)??偟膩碚f,生物學家確信許多l(xiāng)ncRNA具有關(guān)鍵的調(diào)節(jié)作用,其中斷會導致疾病。然而,到目前為止,它們已經(jīng)表征了數(shù)千種被認為存在于哺乳動物細胞中的lncRNA中的一小部分的功能。
生物學家慢慢了解這些分子的作用的一個原因是,當你研究它是如何從核苷酸構(gòu)建模塊的序列組合起來時,lncRNA的功能并不明顯。通常兩個具有相似功能的lncRNA似乎具有非常不同的序列。
Calabrese和他的團隊,包括第一作者Jessime Kirk和UNC藝術(shù)與科學學院的數(shù)學和應(yīng)用物理科學教授Peter Mucha,試圖破譯lncRNA序列和功能之間的其他模糊關(guān)系。他們從兩個關(guān)鍵線索開始:首先,有證據(jù)表明lncRNA主要通過與蛋白質(zhì)結(jié)合起作用。其次,RNA在其整體結(jié)構(gòu)內(nèi)使用短序列連接蛋白質(zhì)。
“我們推斷,lncRNA中蛋白質(zhì)結(jié)合序列的存在比它們在lncRNA中的相對定位更重要,”Calabrese說。“這一概念最終成為現(xiàn)實,并使我們能夠在更傳統(tǒng)的方法失敗的情況下取得成功。”
該團隊開發(fā)了一種名為SEEKR的基于計算機的方法,用于查找和比較lncRNA中稱為“kmers”的蛋白質(zhì)結(jié)合序列,無論kmers的精確位置如何。該團隊發(fā)現(xiàn),基于其kmer含量的相似性,大約一半的人和小鼠lncRNA可以分為五個不同的群落?;趉mer的方法還可以幫助預測通常在細胞內(nèi)發(fā)現(xiàn)lncRNA的位置以及它們結(jié)合的蛋白質(zhì)類型。
“我們現(xiàn)在可以從經(jīng)過充分研究的lncRNA中獲取序列信息,并用它來發(fā)現(xiàn)可能通過相關(guān)機制起作用的lncRNA。在某種程度上,它就像能夠最終理解Rosetta Stone中的不同腳本一樣。”卡拉布雷斯說。
令人驚訝的是,該團隊發(fā)現(xiàn),物種之間的kmer含量社區(qū)通常非常相似。人和小鼠lncRNA群落彼此非常相似,但是一些哺乳動物的lncRNA群落甚至在遠緣動物中也有明顯的對應(yīng)物。一個名為HOTTIP的lncRNA代表的哺乳動物lncRNA群落似乎在其他脊椎動物甚至海膽中都有表親lncRNA群落。
“就kmer含量而言,人類lncRNA的亞群可能更接近于進化上遠距離物種的lncRNA,而不是其他人類lncRNA,”Calabrese說。“這支持了lncRNA群體在不同生物體中具有相似功能的想法,盡管缺乏明顯的線性序列相似性。”
在他們的概念的最終測試中,科學家合成了完全人工的lncRNAs,設(shè)計它們包括在Xist中發(fā)現(xiàn)的kmers,同時確保分子的整體序列不同于任何已知的lncRNA。他們將SEEKR算法應(yīng)用于這些人工lncRNA,并發(fā)現(xiàn)與Xist具有最高預測功能相似性的那些在Xist樣活性的簡單試管測試中具有最高的實際功能相似性。
Calabrese和他的同事現(xiàn)在希望使用他們基于kmer的方法來指導發(fā)現(xiàn)和研究癌癥等疾病中重要的lncRNA。他們還希望改進他們的方法,以便從序列信息中更好地預測lncRNA的功能。
“我們的基因組產(chǎn)生了如此多的lncRNA,現(xiàn)在我們對如何查看這些分子的序列以預測哪些分子在我們的細胞中做重要事情有了更好的想法,”Calabrese說。
推薦內(nèi)容
-
科學家修改CRISPR以表觀遺傳學治療糖尿病,腎臟疾病,肌肉萎縮癥
Salk科學家已經(jīng)創(chuàng)建了新版本的CRISPR Cas9基因組編輯技術(shù),使其能夠在不破壞DNA的情況下激活基因,從而可能避免使用基因編輯技術(shù)治療人
-
現(xiàn)代人類大腦組織最近才出現(xiàn)
來自德國萊比錫馬克斯普朗克進化人類學研究所的研究人員揭示了現(xiàn)代人類典型的球狀大腦形狀是如何以及何時進化的。他們根據(jù)智人化石中顱...
-
改進單細胞RNA測序數(shù)據(jù)可視化的新方法
就像從針孔相機到寶麗來,對流行的生物信息學數(shù)據(jù)可視化方法的公式的重要數(shù)學更新將允許研究人員開發(fā)單細胞基因表達的快照,不僅快幾倍...
-
研究人員發(fā)現(xiàn)了新的分裂或區(qū)分植物轉(zhuǎn)換
來自VIB和根特大學的科學家在Jenny Russinova教授的指導下發(fā)現(xiàn)了一種新的植物機制,它控制著氣孔譜系中不對稱或分化的重要決定步驟。這是
-
科學家們確定了高溫下植物生長所需的通用基因
由西班牙國家生物技術(shù)中心的Carlos Alonso-Blanco博士和澳大利亞莫納什大學的Sureshkumar Balasubramanian博士共同領(lǐng)導的科學家團隊在分
-
生物鐘控制細胞周期和植物中的腫瘤生長
生物節(jié)律在自然界中無處不在,從心臟的跳動到開花植物的節(jié)律。在某些情況下,這種節(jié)律性由細胞蛋白質(zhì)活動的振蕩決定,這標志著它們控制...
-
研究揭示了非洲蝙蝠,寄生蟲和病毒的相互作用
如果有什么科學家確定蝙蝠及其在引起人類疾病方面的作用,那么他們?nèi)匀恍枰獙W習很多東西。除了狂犬病病毒,SARS冠狀病毒(引起嚴重急性呼吸
-
全球變暖使共生的腸道細菌崩潰 殺死宿主昆蟲
2016年10月4日 - 一項新的研究表明,當昆蟲腸道中共生的熱敏感細菌暴露于溫度升高時,細菌和昆蟲都會受到負面影響并死亡。本周在mBio期刊
-
非洲象鼻魚的電感能力表現(xiàn)出視覺敏銳性
非洲象鼻魚產(chǎn)生弱電脈沖以導航其環(huán)境。正如波恩大學的一項研究所表明的那樣,這種本地化感與視覺有著驚人的相似之處。該研究表明,不同...
-
遺傳因素是學業(yè)成功的關(guān)鍵
根據(jù)對雙胞胎的一項大型新研究,遺傳學解釋了學校成就中60%以上的個體差異。多年來,研究將教育成就與生活軌跡聯(lián)系起來,例如職業(yè)地位,健