閱讀長DNA序列的技術(shù)進步在理解靈長類動物進化 人類疾病方面具有分歧
閱讀長DNA序列的技術(shù)進步在理解靈長類動物進化和人類疾病方面具有分歧。西部低地大猩猩的基因組現(xiàn)在已經(jīng)被測序并以高質(zhì)量水平組裝,開始接近小鼠和人類基因組的基因組?;谳^長序列讀取的新測序技術(shù)允許首次發(fā)現(xiàn)缺失基因和缺失形式的遺傳變異。這個集合為生物物種提供了新的生物學(xué)見解,這種生物物種僅次于黑猩猩,它與人類的進化接近。
華盛頓大學(xué)基因組科學(xué)教授埃文·艾希勒(Evan Eichler)領(lǐng)導(dǎo)的研究人員在4月1日出版的“ 科學(xué)”雜志上報道了為什么大猩猩和其他哺乳動物的先前基因組裝配已經(jīng)碎片化,不完整且可能具有誤導(dǎo)性:
大規(guī)模并行測序技術(shù)在提高速度,提高準(zhǔn)確度和降低基因組測序成本的同時,通常只產(chǎn)生稱為“讀數(shù)”的短序列序列。測序后,讀數(shù)與基因組裝配軟件一起拼湊。該程序試圖通過使用序列讀數(shù)之間的重疊來重建原始基因組。不幸的是,人類和其他靈長類動物基因組中常見的長重復(fù)DNA的存在使裝配軟件混亂并導(dǎo)致其將基因組分解成非常小的片段。
“這種組裝可以像瑞士奶酪一樣,”艾希勒說,“缺口中缺少許多生物信息。” 他說,使用短讀技術(shù)創(chuàng)建的原始出版的西部低地大猩猩基因組被分解成超過40萬個。
“這些差距不是隨機的,而是聚集在重復(fù)的位置,”他說。“如果遺傳學(xué)家無法捕獲這些重復(fù)序列并確定基因組中的結(jié)構(gòu)差異,那么他們在理解基因組織和比較物種內(nèi)部和物種之間的遺傳變異方面存在問題。”
他的團隊包括威斯康星大學(xué)生物信息學(xué)專家David Gordon和John Huddleston,以及博士后研究員Mark Chaisson,Chris Hill和Zev Kronenberg。研究小組在芝加哥林肯公園動物園的一只雌性西部低地大猩猩的血液樣本中分析了DNA。
研究人員使用單分子,實時(SMRT)測序技術(shù),裝配工具Falcon和QUIVER,以及其他技術(shù)來產(chǎn)生長序列讀數(shù)。這些是最流行的序列技術(shù)的一百多倍。長讀取允許它們在組裝期間穿過大猩猩基因組的大部分重復(fù)區(qū)域。
結(jié)果是一個新的大猩猩基因組裝配體更大,并且具有更少的碎片?,F(xiàn)在只有1,800件,而不是400,000件?;蚪M片段的平均大小為800倍,原始組件中所有間隙的約90%關(guān)閉。
研究人員觀察到,這種額外的測序信息大大改善了該種大猩猩的基因注釋。它還導(dǎo)致發(fā)現(xiàn)了數(shù)千個蛋白質(zhì)和肽編碼區(qū)段以及作為第一個基因組組裝的一部分而遺漏的新的調(diào)控元件?;蛉绾伪豢刂疲踔聊承┗蛘{(diào)控元素的丟失或破壞的差異,可以解釋為什么人類祖先的進化與他們的大猿親屬如此不同。
科學(xué)家還發(fā)現(xiàn)了數(shù)以萬計的新結(jié)構(gòu)變異,例如DNA的缺失或插入,這些變異可能比之前編目的較小的單堿基對差異更重要。(堿基對是連接到DNA梯子上的梯級的兩種化學(xué)物質(zhì))
“我研究人類和大猿基因組的動機,”艾希勒說,“是試圖了解是什么讓我們成為一個物種。我希望看到所有偉大的猿類基因組重新做,包括黑猩猩和猩猩,以全面了解區(qū)分人類和類人猿的遺傳變異。我相信遺傳變異遠遠超過我們之前的想法。第一步就是找到它。“
在研究人員看到人類和大猩猩之間有趣的差異的領(lǐng)域中,有與感官知覺,角蛋白(皮膚蛋白)產(chǎn)生,胰島素調(diào)節(jié),免疫,繁殖和細胞信號傳導(dǎo)相關(guān)的基因。
新的基因組裝配也為低地大猩猩的進化歷史提供了新的線索。之前的研究表明,大猩猩種群在不久的將來經(jīng)歷了一個瓶頸,但用新基因組進行的分析表明,瓶頸比以前認為的更嚴重。
大猩猩基因組內(nèi)的遺傳變異模式可以提供疾病,氣候變化和人類活動如何影響低地大猩猩種群的證據(jù)。
“我認為帶回家的信息,”艾希勒說,“新的基因組技術(shù)和裝配將我們帶回了10年前我們應(yīng)該去過的地方。”
“測序技術(shù)和計算生物學(xué),”Eichler和他的團隊在他們的論文中寫道,“現(xiàn)在已經(jīng)進入了各個實驗室可以產(chǎn)生高質(zhì)量哺乳動物基因組的階段。這種能力有望徹底改變我們對基因組進化和物種生物學(xué)的理解。 “。
艾希勒補充說,這些進展也可能對人類疾病的遺傳基礎(chǔ)研究做出巨大貢獻,特別是如果以這種方式對更多的人類基因組進行測序。
“作為醫(yī)學(xué)研究人員,如果我們只依賴于短讀序列,那么我們的裝甲就會出現(xiàn)問題。大猩猩和其他人類基因組的工作清楚地表明,用短序列讀取方法無法理解大片的遺傳變異。長讀序列使我們能夠獲得以前難以接近,無法進入的新水平的遺傳變異,“他說。
然而,他補充道,“流行價為80,000美元,使用長讀數(shù)對人類基因組進行臨床測序的價格尚未正確。鑒于幾年的成本降低和技術(shù)的進一步發(fā)展,我愿意打賭這個我們將在未來對人類基因組進行測序以發(fā)現(xiàn)引起疾病的突變。“
推薦內(nèi)容
-
三維治療疾病-超級計算機有助于解碼RNA結(jié)構(gòu)
治愈癌癥,艾滋病毒和其他頑固疾病已經(jīng)回避了幾代人最聰明的頭腦。但隨著超級計算機 - 可以計算,分析和可視化極大量數(shù)據(jù)的計算系統(tǒng) -
-
Lonza推出新的基礎(chǔ)和飼料培養(yǎng)基以優(yōu)化蛋白質(zhì)生產(chǎn)
龍沙生物治療媒體全球產(chǎn)品經(jīng)理Nicole Wellens:生物制藥研究人員需要使用高質(zhì)量的培養(yǎng)基,這些培養(yǎng)基可以提供恒定流量的健康且有活力的細
-
尋找最小的基因可能會產(chǎn)生巨大的收益
盡管科學(xué)家們知道大約25,000個編碼重要生物學(xué)蛋白質(zhì)的基因,但隱藏在我們DNA中的其他較小基因可能同樣重要。但是事實證明,這些微小的遺傳
-
當(dāng)研究人員取下手制動器時寄生蟲會快速退出
墨爾本研究人員已經(jīng)發(fā)現(xiàn)了一種方法來阻止導(dǎo)致弓形蟲病的寄生蟲進入細胞,從而使寄生蟲喪失其生長所必需的關(guān)鍵因子。該研究結(jié)果是接近疫...
-
寨卡病毒感染基因模式的菌株差異
科學(xué)家已經(jīng)揭示了非洲寨卡病毒和亞洲寨卡病毒如何感染神經(jīng)祖細胞之間的分子差異。這些結(jié)果可以提供對Zika病毒最近作為全球健康緊急事件而出
-
單基因與多個哺乳動物譜系的進化興起有關(guān)
在古代,獨立inactivationsUCP1基因,其編碼解偶聯(lián)蛋白1,或UCP1(必要的熱產(chǎn)生棕色脂肪),為駕駛的近一半胎盤的哺乳動物訂單進化的主要力量
-
新的突變珊瑚共生藻類能夠關(guān)閉共生
日本的研究人員已經(jīng)確定了第一個自發(fā)的突變珊瑚共生藻,它不與宿主保持共生關(guān)系。他們設(shè)計了一種系統(tǒng),其中營養(yǎng)素的簡單添加或消耗可以...
-
基因療法可恢復(fù)先天性耳聾
由法國科學(xué)家領(lǐng)導(dǎo)的一個國際研究小組利用基因療法來恢復(fù)成年小鼠的聽力,這些小鼠患有DFNB9耳聾,這是最常見的遺傳性或先天性耳聾之一。除
-
兩棲皮膚細菌在寒冷 多變的環(huán)境中更加多樣化
兩棲動物是致命的皮膚病流行病的受害者。在第一項全球范圍的研究中,包括史密森熱帶研究所(STRI)在內(nèi)的31所大學(xué)和研究中心的研究人員收集了
-
鹽生長的浮游動物生長太慢 不能阻止鹽誘導(dǎo)的藻類繁殖
淡水食物鏈底部的小動物可以迅速適應(yīng)鹽污染 - 來自冬季道路除冰,農(nóng)業(yè)和采礦等來源 - 但需要付出代價。在專門討論淡水鹽污染的皇家學(xué)會