科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)
科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)
原標(biāo)題:科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)
作為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,大數(shù)據(jù)計(jì)算加速已經(jīng)成為促進(jìn)多個(gè)行業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。隨著測(cè)序技術(shù)不斷升級(jí),測(cè)序通量越來(lái)越高,測(cè)序成本直線(xiàn)下降……基因組數(shù)據(jù)正以超摩爾定律增長(zhǎng)。如何將基因測(cè)序的原始數(shù)據(jù)讀取出來(lái)、數(shù)字化并對(duì)其進(jìn)行相應(yīng)的解讀?是制約基因行業(yè)快速發(fā)展的瓶頸,也是激勵(lì)行業(yè)科研人員持續(xù)進(jìn)步、不斷創(chuàng)新的契機(jī)。
基因組數(shù)據(jù)有多“大”?
從生物學(xué)上講,基因組數(shù)據(jù)的大小一般與其復(fù)雜性、等級(jí)高低相關(guān)。哺乳類(lèi)動(dòng)物的基因組數(shù)據(jù)大于鳥(niǎo)類(lèi),鳥(niǎo)類(lèi)大于真菌,原核生物大于病毒。植物由于是多倍體,而成為生物界最特殊的存在。它的基因組測(cè)序數(shù)據(jù)量比較大,部分植物的基因組學(xué)數(shù)據(jù)甚至要大于人類(lèi)。例如:?jiǎn)蝹€(gè)人類(lèi)的基因組數(shù)據(jù)大約為3Gb;豬的全基因組和人的基因組大小接近,約為2.51Gb;小麥為異源多倍體基因組,數(shù)據(jù)大小約17 Gb,是人類(lèi)的5~6倍。全球有近70億人口,這會(huì)產(chǎn)生多大的數(shù)據(jù)量,可想而知。
當(dāng)前,目前已經(jīng)普及商用的高通量基因測(cè)序儀單臺(tái)每天產(chǎn)生的測(cè)序數(shù)據(jù)可高達(dá)6TB,每年各測(cè)序儀新增下機(jī)的數(shù)據(jù)則高達(dá)數(shù)百PB。有了這些大數(shù)據(jù),我們就能夠從分子水平上了解物種生長(zhǎng)、發(fā)育、正常生理活動(dòng)的本質(zhì)和基礎(chǔ),還能夠通過(guò)對(duì)比健康與患病物種基因組學(xué)數(shù)據(jù)的差異找到各種疾病在分子水平的病因,從而針對(duì)性地進(jìn)行新藥研發(fā)和改良育種。相應(yīng)的,數(shù)據(jù)量越大分析難度越高,數(shù)據(jù)解讀的效率遠(yuǎn)遠(yuǎn)跟不上數(shù)據(jù)的產(chǎn)出速度,為基因行業(yè)甚至是整個(gè)生命科學(xué)的高質(zhì)量發(fā)展帶來(lái)了極大的挑戰(zhàn)。
基因組數(shù)據(jù)分析有多“難”?
隨著測(cè)序技術(shù)的發(fā)展,測(cè)序價(jià)格越來(lái)越低。人類(lèi)全基因組測(cè)序的成本已由2007年時(shí)的100萬(wàn)美元降低到1000美元以下。與此同時(shí),大量測(cè)序數(shù)據(jù)的積累讓除測(cè)序外的數(shù)據(jù)研究成本增高,后續(xù)數(shù)據(jù)存儲(chǔ)、傳輸、計(jì)算、應(yīng)用對(duì)各生物院校、實(shí)驗(yàn)室及醫(yī)療機(jī)構(gòu)的計(jì)算機(jī)配置提出了更高的要求。動(dòng)輒幾十萬(wàn)、幾百萬(wàn)甚至上千萬(wàn)的硬件投入,讓眾多科研單位不堪重負(fù)。
而基因組數(shù)據(jù)分析的“難”,不僅僅難在基礎(chǔ)設(shè)施的采購(gòu)成本過(guò)高,也難在數(shù)據(jù)處理過(guò)程的繁雜。以當(dāng)前的技術(shù)條件,基因數(shù)據(jù)的分析過(guò)程包括:1.樣本上機(jī)測(cè)序,即將化學(xué)信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);2.原始數(shù)據(jù)下機(jī),將數(shù)據(jù)記錄成響應(yīng)的數(shù)據(jù)文本格式后,對(duì)其進(jìn)行解讀、對(duì)比、分析,以此來(lái)知道樣本所對(duì)應(yīng)的物種的表型是什么?為什么可以抗病蟲(chóng)害等。同時(shí),在人類(lèi)中知道患者從基因?qū)用鎭?lái)解釋為何會(huì)患???患的什么???怎么治療和改善?3.最終形成數(shù)據(jù)交付報(bào)告。根據(jù)應(yīng)用場(chǎng)景的不同,這一過(guò)程需要用到生物學(xué)、醫(yī)學(xué)、農(nóng)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)學(xué)等專(zhuān)業(yè)知識(shí),涉及到的分析方法、軟件、算法非常多。
基于GTX.CAT的基因組數(shù)據(jù)分析解決方案
GTX.CAT( Computational Acceleration Toolkits)是人和未來(lái)實(shí)驗(yàn)室(GTX LAB)高性能基因組計(jì)算加速方案。GTX.CAT是一組計(jì)算高效、性能卓越、與工業(yè)標(biāo)準(zhǔn)高度一致的生物信息二級(jí)分析軟件工具集,集成了DNA序列比對(duì)、BAM預(yù)處理、BAM數(shù)據(jù)質(zhì)控、變異檢測(cè)等功能模塊,完全遵循行業(yè)接受度最高的BWA-GATK最佳實(shí)踐流程,提供了一套基因組數(shù)據(jù)分析全流程的完整解決方案。
GTX.CAT為純軟件解決方案,支持本地部署、云端部署及多節(jié)點(diǎn)部署。和需依賴(lài)新增異構(gòu)計(jì)算硬件進(jìn)行加速的產(chǎn)品相比,GTX.CAT無(wú)須確認(rèn)每臺(tái)服務(wù)器有空余PCIE插槽,同時(shí)也不需要每臺(tái)服務(wù)器單獨(dú)作部署。可輕松實(shí)現(xiàn)在集群上進(jìn)行部署,能大大節(jié)省計(jì)算成本,提高計(jì)算效率,單位投入硬件成本獲得高性?xún)r(jià)比加速效果。
GTX.CAT支持胚系突變檢測(cè)、腫瘤體細(xì)胞突變檢測(cè)等數(shù)據(jù)的高速比對(duì)分析,擁有豐富的質(zhì)控模塊,支持大規(guī)模群體聯(lián)合分型,與BWA-GATK標(biāo)準(zhǔn)流程一致性達(dá)到99.7%以上,結(jié)果精準(zhǔn)可靠。
責(zé)任編輯:
推薦內(nèi)容
-
狐大醫(yī)|阿司匹林不是萬(wàn)能神藥,這4類(lèi)人吃了會(huì)有反作用
狐大醫(yī)|阿司匹林不是萬(wàn)能神藥,這4類(lèi)人吃了會(huì)有反作用 原標(biāo)題:狐大醫(yī)|阿司匹林不是萬(wàn)能神藥,這4類(lèi)人吃
-
7月24日廣東疫情實(shí)時(shí)數(shù)據(jù)公布:廣東新增境外輸入確診5例
廣東23日新增境外輸入確診5例 分別為廣州、佛山和肇慶報(bào)告。那么,對(duì)于廣東疫情的這個(gè)話(huà)題,今天的你是否也在關(guān)注著?究竟什么情況?下面跟
-
大規(guī)模研究確定了玉米根際的核心微生物群落
植物的健康不僅受到水和溫度等條件的影響,還受到其根部周?chē)奈⑸锏挠绊?。根?jù)已知的微生物群落,根際微生物組調(diào)節(jié)植物從土壤中獲得...
-
用62天ECMO換肺男子能自主鍛煉了 ECMO是什么?
今天一則關(guān)于用62天ECMO換肺男子能自主鍛煉了的相關(guān)消息引起了網(wǎng)友的關(guān)注,想必大家對(duì)于什么是ECMO一事是非常感興趣的,既然大家都想要了解
-
《以你的心詮釋我的愛(ài)》第一季完結(jié) 泰劇最火的男男劇有哪些?
泰國(guó)一直以來(lái)是耽美劇的高產(chǎn)大國(guó),那么,在2020年最火的1部泰劇男男劇是什么呢?下面跟小編一起來(lái)了解下這個(gè)好看的同性戀題材泰劇吧!泰劇《以
-
篩查肺癌,哪種檢查最準(zhǔn)確?
篩查肺癌,哪種檢查最準(zhǔn)確? 原標(biāo)題:篩查肺癌,哪種檢查最準(zhǔn)確?
-
醫(yī)院在歐洲引起極度抗藥性細(xì)菌的傳播
新的研究發(fā)現(xiàn),抗生素耐藥的肺炎克雷伯菌(Klebsiella pneumoniae)是一種可引起人類(lèi)呼吸道和血流感染的機(jī)會(huì)性病原體,正在歐洲的醫(yī)院中傳播
-
12月2日大連封控區(qū)管控區(qū)疫情消息公布 大連新增9例本土確診病
大連市9例本土確診病例和2例本土無(wú)癥狀感染者今日出院。據(jù)消息顯示,記者從大連市衛(wèi)生健康委獲悉,12月2日,大連有9例本土確診患者和2例本
-
三星堆祭祀坑出土超120根象牙 三星堆究竟是誰(shuí)的墓?
三星堆祭祀坑出土超120根象牙,為何上面蓋濕毛巾?而今天的你是否有在關(guān)注三星堆祭祀坑出土超120根象牙的這個(gè)話(huà)題?具體是什么情況呢?下面跟小
-
5月12日重慶市新冠肺炎疫情防控工作新聞發(fā)布會(huì)情況通報(bào)
5月12日重慶市新冠肺炎疫情防控工作新聞發(fā)布會(huì)情況通報(bào) (來(lái)源:重慶衛(wèi)生健康) 原標(biāo)