基準(zhǔn)計算宏基因組的方法
它們無處不在,但肉眼看不見。微生物是碳循環(huán)等關(guān)鍵環(huán)境過程監(jiān)管背后看不見的,有影響力的力量,但其中大部分仍然未知。十多年來,美國能源部聯(lián)合基因組研究所(DOE JGI),DOE科學(xué)用戶設(shè)施辦公室,一直致力于研究人員使用最先進(jìn)的技術(shù)研究無法在實驗室中生長的未培養(yǎng)微生物。諸如環(huán)境群落的高通量基因組測序(“宏基因組學(xué)”)和開發(fā)用于揭示和表征來自環(huán)境的微生物群落的計算工具的方法。要解決將宏基因組聚集成一組重疊的DNA片段,這些片段一起代表DNA或重疊群的共有區(qū)域,然后將這些重疊群合并到基因組區(qū)域中,
2017年10月2日發(fā)表在Nature Methods上的一個團(tuán)隊,包括DOE JGI研究人員描述了宏基因組解釋關(guān)鍵評估(CAMI)挑戰(zhàn)的結(jié)果,這是有史以來第一次,社區(qū)組織的宏基因組計算工具基準(zhǔn)評估。CAMI挑戰(zhàn)賽由比勒費爾德大學(xué)計算宏基因組學(xué)團(tuán)隊負(fù)責(zé)人Alexander Sczyrba和前任DOE JGI博士后研究員以及Helmholtz感染研究中心感染研究實驗室計算生物學(xué)負(fù)責(zé)人Alice McHardy領(lǐng)導(dǎo)。
“研究人員很難根據(jù)方法論文的結(jié)果找出用于特定數(shù)據(jù)集和分析的程序,”McHardy說。“評估中使用的數(shù)據(jù)集和評估指標(biāo)差別很大。另一個問題是開發(fā)人員在評估新型軟件的性能時,通常會花費大量時間對最新技術(shù)進(jìn)行基準(zhǔn)測試.CAMI希望改變這些事情,讓社區(qū)參與確定評估的標(biāo)準(zhǔn)和最佳實踐,并將這些原則應(yīng)用于基準(zhǔn)挑戰(zhàn)。“
CAMI挑戰(zhàn)賽于2015年進(jìn)行了三個多月。為了評估計算工具,組織者開發(fā)了3個模擬的宏基因組數(shù)據(jù)集,使用了由DOE JGI測序和組裝的300多個細(xì)菌和古菌分離株的基因組,這些基因組是基因組百科全書的一部分。最近在Nature Biotechnology上發(fā)表的細(xì)菌和古菌項目。這些基因組與CAMI Challenges聯(lián)盟共享,然后向公眾發(fā)布,以促進(jìn)不同工具的客觀基準(zhǔn)測試。這些數(shù)據(jù)集還包括來自德國科隆馬克斯普朗克研究所的相同數(shù)量的基因組,以及圓形元素和病毒。模擬數(shù)據(jù)集是150億個堿基(Gb)的單個樣本數(shù)據(jù)集,40個基因組和20個圓形元素的40 Gb數(shù)據(jù)集,以及包含數(shù)百個基因組和圓形元素的5個樣本組成的75 Gb時間序列數(shù)據(jù)集。
“JGI對工具和技術(shù)的基準(zhǔn)測試非常感興趣,這些工具和技術(shù)將推動宏基因組的分析并提高我們?yōu)橛脩籼峁┑臄?shù)據(jù)質(zhì)量。發(fā)表了關(guān)于使用模擬數(shù)據(jù)集進(jìn)行宏基因組工具基準(zhǔn)測試的第一項研究。 JGI,很高興看到這種方法多年來如何擴(kuò)展,現(xiàn)在通過這項研究,演變成該領(lǐng)域標(biāo)準(zhǔn)化社區(qū)工作的模型,“能源部JGI原核計劃超級項目負(fù)責(zé)人Nikos Kyrpides說。
DOE JGI微生物基因組學(xué)負(fù)責(zé)人Tanja Woyke補(bǔ)充說:“JGI不僅在實驗室協(xié)議基準(zhǔn)測試方面,而且還在計算工作流程方面。”“這使我們參與像CAMI這樣重要的社區(qū)工作非常重要。”
有超過40個團(tuán)隊報名參加挑戰(zhàn)賽,CAMI組織者收到了來自全球25個項目的215份提交,但只有17個團(tuán)隊愿意發(fā)布他們的軟件實施。CAMI組織者評估了3個類別的計算工具。在裝配基因組時評估了六個裝配工和裝配管道短讀序列技術(shù)產(chǎn)生的序列。在分箱挑戰(zhàn)中,根據(jù)標(biāo)準(zhǔn)評估了五個基因組結(jié)合物和4個分類學(xué)結(jié)合物,包括工具在恢復(fù)個體基因組方面的功效。最后,評估了10個具有不同參數(shù)設(shè)置的分類學(xué)分析器,以評估它們?nèi)绾晤A(yù)測微生物和環(huán)狀元素的身份和相對豐度?;鶞?zhǔn)測試結(jié)果可在https://data.cami-challenge.org/results上找到。
CAMI組織者已經(jīng)在計劃未來的基準(zhǔn)測試挑戰(zhàn),例如評估和幫助長讀取測序技術(shù)的方法開發(fā)。“CAMI是一項持續(xù)的舉措,”Sczyrba指出。“我們目前正在進(jìn)一步自動化基準(zhǔn)測試和比較結(jié)果可視化。我們邀請所有有興趣的人加入并與CAMI合作,提供計算宏基因組學(xué)工具包的綜合性能概述,以告知開發(fā)人員當(dāng)前計算宏基因組學(xué)和應(yīng)用科學(xué)家的挑戰(zhàn)適合他們研究問題的軟件。“
推薦內(nèi)容
-
在腫瘤中起作用的進(jìn)化新基因
彼得大帝圣彼得堡工業(yè)大學(xué)(SPbPU)的一組科學(xué)家研究了人類基因的進(jìn)化年齡,并確定了它們在腫瘤中表達(dá)的一類新基因-腫瘤特異性表達(dá)的進(jìn)化新(T
-
CRISPR基因切割可能提供繪制人類基因組圖的新方法
為了尋找對人類基因組進(jìn)行測序并讀取DNA關(guān)鍵變化的新方法,約翰霍普金斯大學(xué)醫(yī)學(xué)院的研究人員說,他們已經(jīng)成功地使用了基因切割工具CRISPR
-
用合成生物學(xué)建立循環(huán)生物經(jīng)濟(jì)學(xué)
2010年4月,墨西哥灣變黑。由深水地平線鉆井平臺上的甲烷氣體爆炸引發(fā)的最大海上石油泄漏應(yīng)該已經(jīng)泄漏了大約8億升石油進(jìn)入環(huán)境。造成墨西哥
-
瘧疾寄生蟲是通過雌性按蚊的叮咬傳播的
圖賓根大學(xué)的研究人員與生物技術(shù)公司Sanaria Inc 合作,在一項臨床試驗中證明,在最后一劑疫苗接種后10周評估一種名為Sanaria PfSPZ-CVac
-
研究表明奶牛中的粘土補(bǔ)充劑可提高對黃曲霉毒素攻擊的免疫反應(yīng)
在抗黃曲霉毒素的斗爭中,乳制品生產(chǎn)者經(jīng)常轉(zhuǎn)向螯合劑如粘土,以減少毒素轉(zhuǎn)移到牛奶中。這是一種有效的策略,但伊利諾伊大學(xué)的一項新研...
-
中國研究人員進(jìn)一步開發(fā)腺嘌呤堿基編輯
來自華東師范大學(xué)和中國中山大學(xué)的兩個研究小組開發(fā)并改進(jìn)了小鼠和大鼠品系的ABE系統(tǒng),這對人類遺傳疾病和基因治療具有重要意義。該研究由S
-
細(xì)胞生物學(xué)中的誤導(dǎo)性圖像
光不能用于對小于其波長一半的任何結(jié)構(gòu)進(jìn)行成像 - 長期以來,這被認(rèn)為是光學(xué)顯微鏡中的最終分辨率極限。然而,超分辨率顯微鏡的發(fā)展表明
-
KAIST推出增強(qiáng)型PDT治療癌癥副作用更少
KAIST研究小組開發(fā)了基于近紅外熒光團(tuán)的光動力療法(PDT),減少了現(xiàn)有PDT的缺點。PDT是用激光治療傷口而不是藥物治療的一種方法。當(dāng)激光照射
-
跨越真菌生命樹的DNA修飾的新比較研究
DNA活性可以改變而不改變DNA片段本身的序列?;蚣せ詈褪Щ羁梢允俏锓N如何產(chǎn)生獨特個體的基礎(chǔ)。在模式物種的背景下,很好地理解了一些改變
-
尾纖方法是基于該技術(shù)合成和測試大量尾纖類型的能力
抗生素耐藥性是一種快速發(fā)展的現(xiàn)象,給公共衛(wèi)生計劃人員造成了極大的頭痛。然而,一項新研究表明,使用一種稱為細(xì)菌噬菌體(簡稱噬菌體)...