從未培養(yǎng)的微生物中定義基因組標準
在工業(yè)革命期間,工廠開始依靠機器而不是人來進行大規(guī)模生產。在社會變革的過程中,標準化從確保螺母和螺栓的制造方式與保持生產質量完全相同,成為大西洋兩岸使用的標準鐵路軌距。當標準不存在或不被普遍接受時,標準的重要性得到了極大的體現,例如,Mac,與PC,甚至是磅與公斤。
工業(yè)革命后一個多世紀以來,DNA測序技術的進步已經在科學研究中引起了類似的巨大變化,其中一個方面是研究地球的生物多樣性。微生物在調節(jié)涉及碳,氮和磷的全球循環(huán)中發(fā)揮著至關重要的作用,但其中許多仍未被培養(yǎng)和未知。更多地了解這種所謂的“微生物暗物質”涉及從單細胞和宏基因組的擴增DNA中提取微生物基因組。隨著基因組數據生產在過去二十年中不斷增加,并且正在世界各地的各種平臺上生成,科學家們共同努力建立諸如“草案組裝”和全面適用的數據收集標準等術語的定義。
2017年8月8日在 Nature Biotechnology上發(fā)布,由美國能源部聯合基因組研究所(DOE JGI)的研究人員領導的國際團隊,DOE辦公室科學用戶設施,已經制定了單個放大器提供的最小元數據標準提交到公共數據庫的基因組(SAG)和宏基因組裝配的基因組(MAG)。“在過去幾年中,單細胞基因組學已成為補充宏基因組學的流行工具,”研究高級作者,DOE JGI 微生物計劃負責人Tanja Woyke說。。“從2007年開始,環(huán)境細胞的第一個單細胞基因組出現在公共數據庫中,它們是數據質量波動的草案集。宏基因組裝配的基因組具有類似的質量挑戰(zhàn)。對于想要進行比較分析的研究人員來說,了解分析中的內容非常重要。強大的比較基因組學依賴于廣泛而正確的元數據。“
基因組質量的分類
在他們的論文中,Woyke和她的同事提出了四類基因組質量。低質量草案的完成率不到50%,對組裝的片段進行最少的審查,不到10%的非目標序列污染。中等質量草案將至少完成50%,對組裝碎片的審查很少,污染不到10%。由于存在23S,16S和5S rRNA基因,以及至少18個tRNA,污染低于5%,高質量草案將完成90%以上。完成質量類別保留用于沒有間隙的單個連續(xù)序列,每100,000個堿基對少于1個錯誤。
在DOE JGI的基因組在線數據庫(GOLD)上,DOE JGI已經產生了超過2,800個SAG中的大約80%和超過4,500個MAG。。DOE JGI科學家和研究第一作者鮑勃鮑爾斯說,許多已經在GOLD中的SAG將被視為低質量或中等質量草案。這些是非常有價值的數據集,但出于某些目的,研究人員可能更喜歡使用高質量或完成的數據集。“單細胞和宏基因組數據集的總體質量差異很大。然而,在低質量,零碎的基因組是生命樹上新分支的唯一代表的情況下,一些數據優(yōu)于沒有數據,“他補充道。“提出建議的類別將迫使科學家在提交給公共數據庫之前仔細考慮基因組質量。”
從提案到社區(qū)實施
從印刷提案轉向實施需要社區(qū)支持。Woyke和Bowers構想了SAG和MAG的最低元數據要求,作為序列數據的現有元數據標準的擴展,稱為“MIxS”,由基因組標準聯盟開發(fā)和實施(GSC)2011年.GSC是一個開放式會員工作機構,確保研究界參與標準制定過程,并包括國家生物技術信息中心(NCBI)和歐洲生物信息學研究所(EBI)的代表。這很重要,因為這些是實現最低元數據要求的主要數據存儲庫。通過直接與數據提供者合作,GSC可以協助大規(guī)模數據提交者和數據庫與MIxS標準保持一致并提交合規(guī)數據。
“其他重要的公共微生物組數據管理系統(tǒng),如MG-RAST,IMG和GOLD也已經采用了MIxS標準,” DOE JGI原核生物超級計劃和GSC理事會成員Nikos Kyrpides表示。他指出,作為DOE JGI核心使命的一部分,該研究所一直參與組織社區(qū)以制定基因組標準。“GSC一直致力于將社區(qū)聚集在一起,以制定和實施越來越多的相關標準。事實上,在DOE JGI最近的一次GSC會議上確定了將MIxS擴展到未開墾的生物體的必要性。“
“這些擴展通過定義與描述宏基因組單細胞基因組和基因組的采樣和測序相關的關鍵數據元素,補充了MIxS元數據標準套件,”GSC總裁兼研究共同作者,基因組科學研究所的Lynn Schriml說。在馬里蘭大學醫(yī)學院。“這些標準開辟了元數據數據探索的全新領域,因為絕大多數微生物(稱為微生物暗物質)目前尚未在MIxS標準中進行描述。”
她將該團體及其使命描述為社區(qū)驅動。她說:“我認為制定標準的人是進行研究的人是有幫助的。” “我們對數據有既得利益。研究正在不斷發(fā)展和擴展,我們必須以嚴格的方式捕獲這些數據。開發(fā)這些新穎的元數據標準使研究人員能夠持續(xù)報告最關鍵的元數據以進 使用受控詞匯表捕獲數據有助于數據的一致性,從而使數據庫更加豐富和可重復使用。“最后,希望序列數據伴隨著商定的元數據標準對于每個想要使用的人來說意味著同樣的事情。它。
推薦內容
-
血型也分貴賤?你知道嗎
相信很多人都被“誤導”過。因為現在的網絡信息非常豐富和更新迅速,還沒等我們了解事情的詳情,下一秒就又反轉了。所以大家在獲取信息...
-
探秘地球之巔——專訪第二次青藏高原綜合科學考察研究隊隊長、中
探秘地球之巔——專訪第二次青藏高原綜合科學考察研究隊隊長、中國科學院院士姚檀棟|權威面對面 已持續(xù)5年的第二次青藏高原綜合科學考...
-
“藥駕”比“酒駕”更危險?來聽聽專業(yè)人士怎么說 不要以為吃藥
日常生活中我們經常會聽到各種各樣的坊間流言。然而很少人去求證這些流言的真實性,久而久之就變成了真事。在這里,小編必須提醒大家,...
-
兒童的呼吸道感染經常使用抗生素進行不必要的治療
許多兒童病毒感染被誤認為是細菌感染,并且有可能被抗生素不必要地治療。卡羅林斯卡醫(yī)學院關于兒童呼吸道感染的一篇新論文表明,病毒是...
-
什么是應激反應綜合癥
日常生活中,我們會發(fā)現一個高情商的人是很受歡迎的。那么如何做一個情商高的人呢?其實只要懂得一點心理觀察,善于捕捉一些細節(jié),我們...
-
“打針西瓜”重出江湖?大家都來看看
相信很多人都被“誤導”過。因為現在的網絡信息非常豐富和更新迅速,還沒等我們了解事情的詳情,下一秒就又反轉了。所以大家在獲取信息...
-
心理知識:如何玩曖昧 曖昧的10大動作
生活中,不管我們在跟自己獨處還是跟別人相處的過程中其實我們會發(fā)現心理對一個人的影響是很大的。因此當我們發(fā)現自己有心理疾病的傾向...
-
基因組研究的倫理法律和社會問題在2011年ELSI大會上受到關注
研究人員在探索ELSI Universe [genomics unc edu],即2011年4月12日至14日舉行的ELSI研究大會上,就基因組研究的倫理,法律和社會影響(EL
-
心理知識:老年人再婚的心理調適!
今天也是照常給大家說說心理方面的常識。很多人提到心理這兩個字是沒有概念的,以為這個東西是不需要去在意的。其實不然,隨著科學知識...
-
女性初潮年齡越早,絕經越晚?真的假的?
相信很多人都被“誤導”過。因為現在的網絡信息非常豐富和更新迅速,還沒等我們了解事情的詳情,下一秒就又反轉了。所以大家在獲取信息...