定義未培養(yǎng)微生物的基因組標準
在工業(yè)革命期間,工廠開始依靠機器而不是人來進行大規(guī)模生產(chǎn)。在社會變革的過程中,標準化從確保螺母和螺栓的制造方式與保持生產(chǎn)質(zhì)量完全相同,成為大西洋兩岸使用的標準鐵路軌距。當標準不存在或不被普遍接受時,標準的重要性得到了極大的體現(xiàn),例如,Mac,與PC,甚至是磅與公斤。
工業(yè)革命后一個多世紀以來,DNA測序技術的進步已經(jīng)在科學研究中引起了類似的巨大變化,其中一個方面是研究地球的生物多樣性。微生物在調(diào)節(jié)涉及碳,氮和磷的全球循環(huán)中發(fā)揮著至關重要的作用,但其中許多仍未被培養(yǎng)和未知。更多地了解這種所謂的“微生物暗物質(zhì)”涉及從單細胞和宏基因組的擴增DNA中提取微生物基因組。隨著基因組數(shù)據(jù)生產(chǎn)在過去二十年中不斷增加,并且正在世界各地的各種平臺上生成,科學家們共同努力建立諸如“草案組裝”和全面適用的數(shù)據(jù)收集標準等術語的定義。元數(shù)據(jù),“簡單地定義為”關于其他數(shù)據(jù)的數(shù)據(jù)。“在序列數(shù)據(jù)的情況下,元數(shù)據(jù)可以包含什么生物體或細胞被測序,它來自哪里,它在做什么,質(zhì)量指標,以及一系列其他特征,通過為序列數(shù)據(jù)提供上下文并使序列數(shù)據(jù)的重要性得到更好的生物學理解,為序列數(shù)據(jù)增加價值。
2017年8月8日在Nature Biotechnology上發(fā)表由美國能源部聯(lián)合基因組研究所(DOE JGI)的研究人員領導的國際團隊,DOE辦公室的科學用戶設施,已經(jīng)開發(fā)了標準,用于提供單個擴增基因組(SAG)和宏基因組裝配的最小元數(shù)據(jù)?;蚪M(MAGs)提交給公共數(shù)據(jù)庫。“在過去幾年中,單細胞基因組學已成為補充宏基因組學的流行工具,”研究資深作者,DOE JGI微生物基因組學項目負責人Tanja Woyke說。“從2007年開始,來自環(huán)境細胞的第一個單細胞基因組出現(xiàn)在公共數(shù)據(jù)庫中,它們是數(shù)據(jù)質(zhì)量波動的草案集.Magagenome組裝的基因組具有相似的質(zhì)量挑戰(zhàn)。對于想要進行比較分析的研究人員來說,它' 知道進入分析的內(nèi)容非常重要。強大的比較基因組學依賴于廣泛而正確的元數(shù)據(jù)。“
基因組質(zhì)量的分類
在他們的論文中,Woyke和她的同事提出了四類基因組質(zhì)量。低質(zhì)量草案的完成率不到50%,對組裝的片段進行最少的審查,不到10%的非目標序列污染。中等質(zhì)量草案將至少完成50%,對組裝碎片的審查很少,污染不到10%。由于存在23S,16S和5S rRNA基因,以及至少18個tRNA,污染低于5%,高質(zhì)量草案將完成90%以上。完成質(zhì)量類別保留用于沒有間隙的單個連續(xù)序列,每100,000個堿基對少于1個錯誤。
在DOE JGI的基因組在線數(shù)據(jù)庫(GOLD)上,DOE JGI已經(jīng)產(chǎn)生了大約80%的超過2,800個SAG和超過4,500個MAG。DOE JGI科學家和研究第一作者鮑勃鮑爾斯說,許多已經(jīng)在GOLD中的SAG將被視為低質(zhì)量或中等質(zhì)量草案。這些是非常有價值的數(shù)據(jù)集,但出于某些目的,研究人員可能更喜歡使用高質(zhì)量或完成的數(shù)據(jù)集。“單細胞和宏基因組數(shù)據(jù)集的整體質(zhì)量差別很大。但是,如果低質(zhì)量,碎片化的基因組是生命樹上新分支的唯一代表,一些數(shù)據(jù)優(yōu)于無數(shù)據(jù),”他補充道。“提出建議的類別將迫使科學家在提交給公共數(shù)據(jù)庫之前仔細考慮基因組質(zhì)量。”
從提案到社區(qū)實施
從印刷提案轉(zhuǎn)向?qū)嵤┬枰鐓^(qū)支持。Woyke和Bowers構想了SAG和MAGs的最低元數(shù)據(jù)要求,作為序列數(shù)據(jù)的現(xiàn)有元數(shù)據(jù)標準的擴展,稱為“MIxS”,由基因組標準聯(lián)盟(GSC)于2011年開發(fā)和實施.GSC是一個開放的成員工作機構,確保研究界參與標準制定過程,并包括國家生物技術信息中心(NCBI)和歐洲生物信息學研究所(EBI)的代表。這很重要,因為這些是實現(xiàn)最低元數(shù)據(jù)要求的主要數(shù)據(jù)存儲庫。通過直接與數(shù)據(jù)提供者合作,
“其他重要的公共微生物組數(shù)據(jù)管理系統(tǒng),如MG-RAST,IMG和GOLD也已經(jīng)采用了MIxS標準,”DOE JGI原核生物超級計劃和GSC理事會成員Nikos Kyrpides表示。他指出,作為DOE JGI核心使命的一部分,該研究所一直參與組織社區(qū)以制定基因組標準。“GSC一直在幫助社區(qū)共同制定和實施越來越多的相關標準。事實上,在DOE JGI最近的一次GSC會議上確定了將MIxS擴展到未開墾的生物體的必要性。”
“這些擴展通過定義與描述宏基因組單細胞基因組和基因組的采樣和測序相關的關鍵數(shù)據(jù)元素,補充了MIxS元數(shù)據(jù)標準套件,”GSC總裁兼研究共同作者,基因組科學研究所的Lynn Schriml說。在馬里蘭大學醫(yī)學院。“這些標準開辟了元數(shù)據(jù)數(shù)據(jù)探索的全新領域,因為絕大多數(shù)微生物(稱為微生物暗物質(zhì))目前尚未在MIxS標準中進行描述。”
她將該團體及其使命描述為社區(qū)驅(qū)動。她說:“我認為制定標準的人是進行研究的人是有幫助的。” “我們對數(shù)據(jù)抱有既得利益。研究正在不斷發(fā)展和擴展,我們必須嚴格捕獲這些數(shù)據(jù)。開發(fā)這些新穎的元數(shù)據(jù)標準使研究人員能夠始終如一地報告最關鍵的元數(shù)據(jù)進行分析。使用受控數(shù)據(jù)捕獲數(shù)據(jù)詞匯表有助于數(shù)據(jù)的一致性,從而使數(shù)據(jù)庫更加豐富和可重用。“ 最后,希望序列數(shù)據(jù)伴隨著商定的元數(shù)據(jù)標準對于想要使用它的每個人來說意味著同樣的事情。
推薦內(nèi)容
-
2009直擊人心四大關鍵詞
心理活動是每個人都有的。然而這樣一個別人不知道的思想角落,往往容易被他人忽視。所以我們自身必須時刻關注自己的內(nèi)心需求,不能讓自...
-
「防災減災」減輕災害風險守護美好家園
「防災減災」減輕災害風險守護美好家園 今年5月12日是我國第14個全國防災減災日5月7日至13日為防災減災宣傳周全國防災減災日主題為減
-
國際合作在古老的水生藻類中發(fā)現(xiàn)了陸生植物基因
陸地植物從5億年前的水生親戚中分離出來,是一種極其多樣化的生物群 - 從高大的紅杉到芬芳的玫瑰,再到苔蘚的地毯。對于植物而言,在陸地
-
“你瞅啥?”“瞅我就頂你!”黑龍江一男子被頂出個血窟窿……
“你瞅啥?”“瞅我就頂你!”黑龍江一男子被頂出個血窟窿…… 西班牙斗牛估計很多朋友都看過一般斗牛士們拿著一塊紅布在牛的眼前...
-
維生素K有些啥本事??是真的嗎? 是否需要補一補?
互聯(lián)網(wǎng)時代,每個人都是信息傳播者,但是我們必須清楚一點:在沒有獲得真正證實的消息之前,千萬不能隨意散播謠言,很容易造成以訛傳訛...
-
生產(chǎn)的新型干細胞系為研究和治療提供了更大的潛力
Wellcome Trust Sanger研究所的研究人員及其合作者首次在小鼠體內(nèi)創(chuàng)造了擴增潛能干細胞(EPSCs),這種細胞比現(xiàn)有的干細胞系具有更大的發(fā)展