基因識(shí)別的主要對(duì)象是什么?基因的識(shí)別方法有哪些?
眾所周知,基因識(shí)別,是生物信息學(xué)的一個(gè)重要分支,使用生物學(xué)實(shí)驗(yàn)或計(jì)算機(jī)等手段識(shí)別DNA序列上的具有生物學(xué)特征的片段。那么,基因識(shí)別的主要對(duì)象是什么呢?基因的識(shí)別方法有哪些呢?
基因識(shí)別的主要手段是基于活的細(xì)胞或生物的實(shí)驗(yàn)。通過對(duì)若干種不同基因的同源重組的速率的統(tǒng)計(jì)分析,我們能夠獲知它們?cè)谌旧w上的順序。若進(jìn)行大量類似的分析,我們可以確定各個(gè)基因的大致位置?,F(xiàn)在,由于人類已經(jīng)獲得了巨大數(shù)量的基因組信息,依靠較慢的實(shí)驗(yàn)分析已不能滿足基因識(shí)別的需要,而基于計(jì)算機(jī)算法的基因識(shí)別得到了長(zhǎng)足的發(fā)展,成為了基因識(shí)別的主要手段。
識(shí)別具有生物學(xué)功能的片段與判定該片段(或其對(duì)應(yīng)的產(chǎn)品)的功能是兩個(gè)不同的概念,后者通常需要通過基因敲除等的實(shí)驗(yàn)手段來(lái)決定。不過,生物信息學(xué)的前沿研究正在使得由基因序列預(yù)測(cè)基因功能變得愈發(fā)可能。
間接識(shí)別法
在基因的間接識(shí)別法(Extrinsic Approach)中,人們利用已知的mRNA或蛋白質(zhì)序列為線索在DNA序列中搜尋所對(duì)應(yīng)的片段。由給定的mRNA序列確定唯一的作為轉(zhuǎn)錄源的DNA序列;而由給定的蛋白質(zhì)序列,也可以由密碼子反轉(zhuǎn)確定一族可能的DNA序列。因此,在線索的提示下搜尋工作相對(duì)較為容易,搜尋算法的關(guān)鍵在于提高效率,并能夠容忍由于測(cè)序不完整或者不精確所帶來(lái)的誤差。BLAST是目前以此為目的最廣泛使用的軟件之一。
若DNA序列的某一片段與mRNA或蛋白質(zhì)序列具有高度相似性,這說明該DNA片段極有可能是蛋白編碼基因。但是,測(cè)定mRNA或蛋白質(zhì)序列的成本高昂,而且在復(fù)雜的生物體中,任意確定的時(shí)刻往往只有一部分基因得到了表達(dá)。這意味著從任何單個(gè)細(xì)胞的mRNA和蛋白質(zhì)上都只能獲得一小部分基因的信息;要想得到更為完整的信息,不得不對(duì)成百上千個(gè)不同狀態(tài)的細(xì)胞中的mRNA和蛋白質(zhì)測(cè)序。這是相當(dāng)困難的。比如,某些人類基因只在胚胎或胎兒時(shí)期才得到表達(dá),對(duì)它們的研究就會(huì)受到道德因素的制約。
盡管有以上困難,對(duì)人類自身和一些常見的實(shí)驗(yàn)生物如老鼠和酵母菌,人們已經(jīng)建立了大量轉(zhuǎn)錄和蛋白質(zhì)序列的數(shù)據(jù)庫(kù)。如RefSeq數(shù)據(jù)庫(kù),Ensembl數(shù)據(jù)庫(kù)等等。但這些數(shù)據(jù)庫(kù)既不完整,也含有相當(dāng)數(shù)量的錯(cuò)誤。
從頭計(jì)算法
鑒于間接識(shí)別法的種種缺陷,僅僅由DNA序列信息預(yù)測(cè)蛋白質(zhì)編碼基因的從頭計(jì)算法(Ab Initio Approach)就顯得十分重要了。一般意義上基因具有兩種類型的特征,一類特征是“信號(hào)”,由一些特殊的序列構(gòu)成,通常預(yù)示著其周圍存在著一個(gè)基因;另一類特征是“內(nèi)容”,即蛋白質(zhì)編碼基因所具有的某些統(tǒng)計(jì)學(xué)特征。使用Ab Initio方法識(shí)別基因又稱為基因預(yù)測(cè)。通常我們?nèi)孕杞柚鷮?shí)驗(yàn)證實(shí)預(yù)測(cè)的DNA片段是否具有生物學(xué)功能。
在原核生物中,基因往往具有特定且容易識(shí)別的啟動(dòng)子序列(信號(hào)),如Pribnow盒和轉(zhuǎn)錄因子。與此同時(shí),構(gòu)成蛋白質(zhì)編碼的序列構(gòu)成一個(gè)連續(xù)的開放閱讀框(內(nèi)容),其長(zhǎng)度約為數(shù)百個(gè)到數(shù)千個(gè)堿基對(duì)(依據(jù)該長(zhǎng)度區(qū)間可以篩選合適的密碼子)。除此之外,原核生物的蛋白質(zhì)編碼還具有其他一些容易判別的統(tǒng)計(jì)學(xué)的特征。這使得對(duì)原核生物的基因預(yù)測(cè)能達(dá)到相對(duì)較高的精度。
對(duì)真核生物(尤其是復(fù)雜的生物如人類)的基因預(yù)測(cè)則相當(dāng)有挑戰(zhàn)性。一方面,真核生物中的啟動(dòng)子和其他控制信號(hào)更為復(fù)雜,還未被很好的了解。兩個(gè)被真核生物基因搜尋器識(shí)別到的訊號(hào)例子有CpG islands及poly(A) tail的結(jié)合點(diǎn)。
另一方面,由于真核生物所具有的splicing機(jī)制,基因中一個(gè)蛋白質(zhì)編碼序列被分為了若干段(外顯子),中間由非編碼序列連接(基因內(nèi)區(qū))。人類的一個(gè)普通蛋白質(zhì)編碼基因可能被分為了十幾個(gè)外顯子,其中每個(gè)外顯子的長(zhǎng)度少于200個(gè)堿基對(duì),而某些外顯子更可能只有二三十個(gè)堿基對(duì)長(zhǎng)。因而蛋白質(zhì)編碼的一些統(tǒng)計(jì)學(xué)特征變得難于判別。
高級(jí)的基因識(shí)別算法常使用更加復(fù)雜的概率論模型,如隱馬爾可夫模型。Glimmer是一個(gè)廣泛應(yīng)用的高級(jí)基因識(shí)別程序,它對(duì)原核生物基因的預(yù)測(cè)已非常精確,相比之下,對(duì)真核生物的預(yù)測(cè)則效果有限。GENSCAN計(jì)劃是一個(gè)著名的例子。
比較基因組學(xué)的方法
由于多個(gè)物種的基因組序列已完全測(cè)出,使得比較基因組學(xué)得以發(fā)展,并產(chǎn)生了新的基因識(shí)別的方法。該方法基于如下原理:自然選擇的力量使得基因和DNA序列上具有生物學(xué)功能的其他片段較其他部分有較慢的變異速率,在前者的變異更有可能對(duì)生物體的生存產(chǎn)生負(fù)面影響,因而難以得到保存。因此,通過比較相關(guān)的物種的DNA序列,我們能夠取得預(yù)測(cè)基因的新線索。2003年,通過對(duì)若干種酵母基因組的比較,人類對(duì)原先的基因識(shí)別結(jié)果作了較大的修改;類似的方法也正在應(yīng)用于人類的基因組研究,并可能在將來(lái)的若干年內(nèi)取得成果。
溫馨提示:基因識(shí)別的對(duì)象主要是蛋白質(zhì)編碼基因,也包括其他具有一定生物學(xué)功能的因子,如RNA基因和調(diào)控因子?;蜃R(shí)別是基因組研究的基礎(chǔ)。
推薦內(nèi)容
-
英雄聯(lián)盟S11新版本狂風(fēng)之力 神話裝備的出現(xiàn)讓游戲質(zhì)變
以前有一個(gè)段子,就是簡(jiǎn)自豪說,你們?cè)诖说群?,我回去出一個(gè)三件套,現(xiàn)在英雄聯(lián)盟的版本變了,大變特變,或許這一次等候的,僅僅是一件...
-
白俄羅斯國(guó)防部宣布開始進(jìn)行武裝力量快速反應(yīng)戰(zhàn)備檢查
白俄羅斯國(guó)防部宣布開始進(jìn)行武裝力量快速反應(yīng)戰(zhàn)備檢查 當(dāng)?shù)貢r(shí)間5月4日,白俄羅斯國(guó)防部宣布開始進(jìn)行武裝力量快速反應(yīng)戰(zhàn)備檢查,包括在陌生
-
研究罕見病的模式生物的力量
由于人類基因組由數(shù)十億個(gè)化學(xué)單元組成,科學(xué)家們需要大量的信息來(lái)篩選,以了解基因組如何工作以及它如何影響人類健康和疾病。通常情況...
-
快餓死了?當(dāng)事人回應(yīng)攔路討要物資
快餓死了?當(dāng)事人回應(yīng)攔路討要物資 4月20日上海市青浦區(qū)慶華新村幾位女性居民手持錄音喇叭,緊跟在一名領(lǐng)導(dǎo)身后,喇叭朝向領(lǐng)導(dǎo)的后腦勺反
-
五星級(jí)酒店洗手間發(fā)現(xiàn)攝像頭 如何預(yù)防酒店裝有攝像頭?
【 五星級(jí)酒店洗手間發(fā)現(xiàn)攝像頭 】我們外出住酒店的時(shí)候,會(huì)想著房間內(nèi)會(huì)不會(huì)有攝像頭,然后就會(huì)努力檢查房間的每一個(gè)角落,因?yàn)橐坏?..
-
中子探測(cè)超冷冷凝物以了解量子物質(zhì)
玻色-愛因斯坦凝聚物是物質(zhì)的宏觀量子相,僅在非常特殊的條件下出現(xiàn)。了解有關(guān)物質(zhì)的這些階段的更多信息可以幫助研究人員更好地理解基本量
-
10月29日北京甘肅黑龍江疫情最新數(shù)據(jù)公布 昨日,31省新增本土
溫馨提示:疫情期間規(guī)范佩戴口罩,注意乘坐公共交通工具、進(jìn)入人員較為密集或通風(fēng)不良的場(chǎng)所、到醫(yī)院就診,以及出現(xiàn)呼吸道癥狀時(shí)應(yīng)自覺...
-
6月10日浙江疫情最新數(shù)據(jù)情況溫州 浙江新增無(wú)癥狀感染者3例
【摘要】雖然現(xiàn)如今疫情已經(jīng)得到很好的控制但是我們?nèi)耘f需要在生活中做好防疫的準(zhǔn)備。據(jù)最新消息顯示,6月9日0-24時(shí),浙江疫情新增無(wú)癥狀感
-
老師帶小學(xué)生課上跳魔性舞蹈 網(wǎng)友:“有這樣的老師真幸?!?/a>
近日,一段老師帶小學(xué)生課上跳魔性舞蹈的視頻引起了廣泛網(wǎng)友的關(guān)注,想必大家對(duì)于老師帶小學(xué)生課上跳魔性舞蹈一事是非常感興趣的,針對(duì)此...
-
7月28日越南胡志明疫情最新數(shù)據(jù)公布 越南在過去的24小時(shí)內(nèi)新增
【摘要】一場(chǎng)突如其來(lái)的疫情,給我們的生活、我們所在的城市,帶來(lái)了太多變化,也影響著每一個(gè)人的生活,不管你是否感受到,經(jīng)歷疫情,...