中文字幕在线天|亚洲一区二区三区手机版|少妇中文字幕乱码亚洲影视|最好看的久久综合伊人

      中國(guó)基因網(wǎng)您的位置:首頁(yè) >國(guó)外研究 >

      科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)

      科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)

      科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)

      原標(biāo)題:科技強(qiáng)企!人和未來(lái)領(lǐng)跑?chē)?guó)內(nèi)基因組數(shù)據(jù)計(jì)算加速軟件市場(chǎng)

      作為數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,大數(shù)據(jù)計(jì)算加速已經(jīng)成為促進(jìn)多個(gè)行業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。隨著測(cè)序技術(shù)不斷升級(jí),測(cè)序通量越來(lái)越高,測(cè)序成本直線(xiàn)下降……基因組數(shù)據(jù)正以超摩爾定律增長(zhǎng)。如何將基因測(cè)序的原始數(shù)據(jù)讀取出來(lái)、數(shù)字化并對(duì)其進(jìn)行相應(yīng)的解讀?是制約基因行業(yè)快速發(fā)展的瓶頸,也是激勵(lì)行業(yè)科研人員持續(xù)進(jìn)步、不斷創(chuàng)新的契機(jī)。

      基因組數(shù)據(jù)有多“大”?

      從生物學(xué)上講,基因組數(shù)據(jù)的大小一般與其復(fù)雜性、等級(jí)高低相關(guān)。哺乳類(lèi)動(dòng)物的基因組數(shù)據(jù)大于鳥(niǎo)類(lèi),鳥(niǎo)類(lèi)大于真菌,原核生物大于病毒。植物由于是多倍體,而成為生物界最特殊的存在。它的基因組測(cè)序數(shù)據(jù)量比較大,部分植物的基因組學(xué)數(shù)據(jù)甚至要大于人類(lèi)。例如:?jiǎn)蝹€(gè)人類(lèi)的基因組數(shù)據(jù)大約為3Gb;豬的全基因組和人的基因組大小接近,約為2.51Gb;小麥為異源多倍體基因組,數(shù)據(jù)大小約17 Gb,是人類(lèi)的5~6倍。全球有近70億人口,這會(huì)產(chǎn)生多大的數(shù)據(jù)量,可想而知。

      當(dāng)前,目前已經(jīng)普及商用的高通量基因測(cè)序儀單臺(tái)每天產(chǎn)生的測(cè)序數(shù)據(jù)可高達(dá)6TB,每年各測(cè)序儀新增下機(jī)的數(shù)據(jù)則高達(dá)數(shù)百PB。有了這些大數(shù)據(jù),我們就能夠從分子水平上了解物種生長(zhǎng)、發(fā)育、正常生理活動(dòng)的本質(zhì)和基礎(chǔ),還能夠通過(guò)對(duì)比健康與患病物種基因組學(xué)數(shù)據(jù)的差異找到各種疾病在分子水平的病因,從而針對(duì)性地進(jìn)行新藥研發(fā)和改良育種。相應(yīng)的,數(shù)據(jù)量越大分析難度越高,數(shù)據(jù)解讀的效率遠(yuǎn)遠(yuǎn)跟不上數(shù)據(jù)的產(chǎn)出速度,為基因行業(yè)甚至是整個(gè)生命科學(xué)的高質(zhì)量發(fā)展帶來(lái)了極大的挑戰(zhàn)。

      基因組數(shù)據(jù)分析有多“難”?

      隨著測(cè)序技術(shù)的發(fā)展,測(cè)序價(jià)格越來(lái)越低。人類(lèi)全基因組測(cè)序的成本已由2007年時(shí)的100萬(wàn)美元降低到1000美元以下。與此同時(shí),大量測(cè)序數(shù)據(jù)的積累讓除測(cè)序外的數(shù)據(jù)研究成本增高,后續(xù)數(shù)據(jù)存儲(chǔ)、傳輸、計(jì)算、應(yīng)用對(duì)各生物院校、實(shí)驗(yàn)室及醫(yī)療機(jī)構(gòu)的計(jì)算機(jī)配置提出了更高的要求。動(dòng)輒幾十萬(wàn)、幾百萬(wàn)甚至上千萬(wàn)的硬件投入,讓眾多科研單位不堪重負(fù)。

      而基因組數(shù)據(jù)分析的“難”,不僅僅難在基礎(chǔ)設(shè)施的采購(gòu)成本過(guò)高,也難在數(shù)據(jù)處理過(guò)程的繁雜。以當(dāng)前的技術(shù)條件,基因數(shù)據(jù)的分析過(guò)程包括:1.樣本上機(jī)測(cè)序,即將化學(xué)信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);2.原始數(shù)據(jù)下機(jī),將數(shù)據(jù)記錄成響應(yīng)的數(shù)據(jù)文本格式后,對(duì)其進(jìn)行解讀、對(duì)比、分析,以此來(lái)知道樣本所對(duì)應(yīng)的物種的表型是什么?為什么可以抗病蟲(chóng)害等。同時(shí),在人類(lèi)中知道患者從基因?qū)用鎭?lái)解釋為何會(huì)患???患的什么???怎么治療和改善?3.最終形成數(shù)據(jù)交付報(bào)告。根據(jù)應(yīng)用場(chǎng)景的不同,這一過(guò)程需要用到生物學(xué)、醫(yī)學(xué)、農(nóng)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)學(xué)等專(zhuān)業(yè)知識(shí),涉及到的分析方法、軟件、算法非常多。

      基于GTX.CAT的基因組數(shù)據(jù)分析解決方案

      GTX.CAT( Computational Acceleration Toolkits)是人和未來(lái)實(shí)驗(yàn)室(GTX LAB)高性能基因組計(jì)算加速方案。GTX.CAT是一組計(jì)算高效、性能卓越、與工業(yè)標(biāo)準(zhǔn)高度一致的生物信息二級(jí)分析軟件工具集,集成了DNA序列比對(duì)、BAM預(yù)處理、BAM數(shù)據(jù)質(zhì)控、變異檢測(cè)等功能模塊,完全遵循行業(yè)接受度最高的BWA-GATK最佳實(shí)踐流程,提供了一套基因組數(shù)據(jù)分析全流程的完整解決方案。

      GTX.CAT為純軟件解決方案,支持本地部署、云端部署及多節(jié)點(diǎn)部署。和需依賴(lài)新增異構(gòu)計(jì)算硬件進(jìn)行加速的產(chǎn)品相比,GTX.CAT無(wú)須確認(rèn)每臺(tái)服務(wù)器有空余PCIE插槽,同時(shí)也不需要每臺(tái)服務(wù)器單獨(dú)作部署。可輕松實(shí)現(xiàn)在集群上進(jìn)行部署,能大大節(jié)省計(jì)算成本,提高計(jì)算效率,單位投入硬件成本獲得高性?xún)r(jià)比加速效果。

      GTX.CAT支持胚系突變檢測(cè)、腫瘤體細(xì)胞突變檢測(cè)等數(shù)據(jù)的高速比對(duì)分析,擁有豐富的質(zhì)控模塊,支持大規(guī)模群體聯(lián)合分型,與BWA-GATK標(biāo)準(zhǔn)流程一致性達(dá)到99.7%以上,結(jié)果精準(zhǔn)可靠。

      責(zé)任編輯:

      鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

      推薦內(nèi)容