麻省理工學(xué)院的研究人員開發(fā)了分析大量細(xì)胞數(shù)據(jù)集的新方
數(shù)據(jù)采樣方法制作了笨拙的生物數(shù)據(jù)集的“草圖”,同時仍然捕獲了細(xì)胞類型的完整多樣性。
藝術(shù)草圖可用于以更簡單的圖像捕捉場景的細(xì)節(jié)。麻省理工學(xué)院的研究人員現(xiàn)在將這一概念引入計(jì)算生物學(xué),采用一種新方法,提取全面的樣本 - 稱為“草圖” - 大規(guī)模細(xì)胞數(shù)據(jù)集,更易于分析生物學(xué)和醫(yī)學(xué)研究。
近年來,人們從各種人體組織和器官(如神經(jīng)元,肌肉和免疫細(xì)胞)中分析出單個細(xì)胞,以深入了解人類健康和治療疾病。最大的數(shù)據(jù)集包含大約100,000到200萬個單元格,并且還在增長。例如,人類細(xì)胞圖譜的長期目標(biāo)是描繪大約100億個細(xì)胞。每個細(xì)胞本身都含有大量關(guān)于RNA表達(dá)的數(shù)據(jù),可以提供有關(guān)細(xì)胞行為和疾病進(jìn)展的見解。
憑借足夠的計(jì)算能力,生物學(xué)家可以分析完整的數(shù)據(jù)集,但需要數(shù)小時或數(shù)天。沒有這些資源,這是不切實(shí)際的。采樣方法可用于提取細(xì)胞的小子集以進(jìn)行更快,更有效的分析,但它們不能很好地?cái)U(kuò)展到大型數(shù)據(jù)集,并且通常會錯過較少的細(xì)胞類型。
在下周于計(jì)算分子生物學(xué)研究會議上發(fā)表的一篇論文中,麻省理工學(xué)院的研究人員描述了一種方法,該方法可以捕獲整個數(shù)據(jù)集的完全全面的“草圖”,可以與其他數(shù)據(jù)集輕松共享和合并。它不是以相同的概率對細(xì)胞進(jìn)行采樣,而是均勻地對來自數(shù)據(jù)集中存在的不同細(xì)胞類型的細(xì)胞進(jìn)行采樣。
“這些就像紙上的草圖,藝術(shù)家將試圖保留主要圖像的所有重要特征,”麻省理工學(xué)院西蒙斯數(shù)學(xué)教授,電氣工程和計(jì)算機(jī)科學(xué)教授,以及其負(fù)責(zé)人Bonnie Berger說。計(jì)算和生物學(xué)小組。
在實(shí)驗(yàn)中,該方法在幾分鐘內(nèi)從數(shù)百萬個細(xì)胞的數(shù)據(jù)集中生成草圖 - 而不是幾個小時 - 從數(shù)據(jù)集中得到的稀有細(xì)胞的表示更為平等。在一個例子中,草圖甚至捕獲了其他方法遺漏的罕見的炎性巨噬細(xì)胞子集。
“大多數(shù)分析單細(xì)胞數(shù)據(jù)的生物學(xué)家只是在他們的筆記本電腦上工作,”計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)博士生,計(jì)算與生物學(xué)研究組的Brian Hie說。“草圖繪制了一個非常大的數(shù)據(jù)集的簡明摘要,該數(shù)據(jù)集試圖保留盡可能多的生物信息......因此人們不需要使用如此多的計(jì)算能力。”
加入Hie和Berger的是:CSAIL博士生Hyunghoon Cho; 麻省理工學(xué)院和哈佛醫(yī)學(xué)院的研究生Benjamin DeMeo; 和麻省理工學(xué)院生物工程助理教授Bryan Bryson。
格子覆蓋物
人類擁有數(shù)百種細(xì)胞類別和子類別,每個細(xì)胞都表達(dá)了多種多樣的基因。諸如RNA測序的技術(shù)捕獲大量表中的所有細(xì)胞信息,其中每行代表細(xì)胞,每列代表基因表達(dá)的一些測量。細(xì)胞是散布在龐大的多維空間周圍的點(diǎn),其中每個維度對應(yīng)于不同基因的表達(dá)。
研究表明,中性粒細(xì)胞如何通過誘導(dǎo)平滑肌細(xì)胞死亡來加劇動脈粥樣硬化
所有PCOS女性中有一半患有罕見的基因變異
實(shí)際上,具有相似基因多樣性的細(xì)胞類型 - 常見和罕見 - 形成相似大小的簇,占據(jù)大致相同的空間。但是這些群集中的細(xì)胞密度差異很大:1,000個細(xì)胞可能存在于一個共同的聚類中,而同樣多樣的稀有聚類將包含10個細(xì)胞。對于提取單個細(xì)胞的目標(biāo)大小樣本的傳統(tǒng)??采樣方法來說,這是一個問題。
“如果你采取10%的樣本,并且在一個罕見的群集中有10個細(xì)胞,在一個共同的群集中有1,000個細(xì)胞,你更有可能抓住大量的常見細(xì)胞,但是會遺漏所有稀有細(xì)胞,”Hie說。“但稀有細(xì)胞可以導(dǎo)致重要的生物學(xué)發(fā)現(xiàn)。”
研究人員修改了一類算法,該算法在數(shù)據(jù)集上形成了形狀。他們的算法覆蓋了整個計(jì)算空間,他們稱之為“格子覆蓋”,就像一個大小相等的網(wǎng)格,但在很多方面。它只放置這些多維正方形,其中至少有一個單元格,并跳過任何空白區(qū)域。最后,網(wǎng)格的空列將比占用的列更寬或更瘦 - 因此是“格子”描述。該技術(shù)可以節(jié)省大量計(jì)算量,以幫助覆蓋范圍擴(kuò)展到海量數(shù)據(jù)集。
捕獲稀有細(xì)胞
占用的方塊可能只包含一個單元格或1,000個單元格,但它們都具有完全相同的采樣權(quán)重。然后,該算法隨機(jī)地通過均勻地從每個占用的方格中選擇一組單元格來找到目標(biāo)樣本 - 例如20,000個單元。生成的草圖包含更加平等的細(xì)胞類型分布 - 例如,來自100個簇的10個常見細(xì)胞和來自10個簇的8個稀有細(xì)胞。
“我們利用占據(jù)相似空間的這些細(xì)胞類型,”Hie說。“因?yàn)槲覀兏鶕?jù)體積而不是密度進(jìn)行采樣,我們可以更均勻地覆蓋生物空間......我們自然會保留稀有細(xì)胞類型。”
他們將他們的素描方法應(yīng)用于大約250,000個臍帶細(xì)胞的數(shù)據(jù)集,其中包含兩個罕見的巨噬細(xì)胞亞組 - 炎癥和抗炎。所有其他傳統(tǒng)的采樣方法將兩個子集聚集在一起,而草繪方法將它們分開。研究人員說,對這些巨噬細(xì)胞亞群的進(jìn)一步深入研究有助于揭示炎癥的洞察力以及如何調(diào)節(jié)炎癥反應(yīng)過程中的炎癥過程。
“這對于在田野界面工作是有益的,”伯杰說。“我們接受過數(shù)學(xué)家培訓(xùn),但我們了解生物數(shù)據(jù)科學(xué)問題是什么,因此我們可以將最好的技術(shù)帶到他們的分析中。
推薦內(nèi)容
-
心理知識:為什么不要去考驗(yàn)人性?
社會的發(fā)展越來越快,大家現(xiàn)在也慢慢開始關(guān)注一個人的心理健康。因?yàn)橥饨缡挛锏木薮笞兓?,很多人跟不上變化的腳步就會產(chǎn)生心理落差感從...
-
河北唐山:三女河機(jī)場5月5日正式復(fù)航
河北唐山:三女河機(jī)場5月5日正式復(fù)航 央廣網(wǎng)唐山5月4日消息(記者李長青)據(jù)唐山市互聯(lián)網(wǎng)信息辦公室消息,日前,唐山市疫情防控形勢持續(xù)向
-
赤砂糖是紅糖嗎?大家都想知道 并不是
生活中我們經(jīng)常會聽見各種各樣的流言,但是只要我們用心去思考和辨認(rèn)其實(shí) 不難發(fā)現(xiàn)這些謠言有很多破綻。所以今天,小編照常給大家辟謠一則
-
瑞典總領(lǐng)館外一幕:俄樂隊(duì)特意用俄羅斯民族樂器演奏,抗議演出被
瑞典總領(lǐng)館外一幕:俄樂隊(duì)特意用俄羅斯民族樂器演奏,抗議演出被取消 (觀察者網(wǎng)訊)據(jù)俄新社當(dāng)?shù)貢r間2日報道,上個月(4月)瑞典一樂團(tuán)曾
-
孩子多睡就能長得高嗎?具體什么情況呢
當(dāng)我們不知道一件事真假的時候,不防多等等官方的回應(yīng)。因?yàn)樾畔⑺槠?,很多小伙伴現(xiàn)在上網(wǎng)很容易只看到事情的一面就下定論,其實(shí)很多...
-
“美鼻神器”能秒變小翹鼻?科學(xué)觀點(diǎn)是說...
互聯(lián)網(wǎng)時代,每個人都是信息傳播者,但是我們必須清楚一點(diǎn):在沒有獲得真正證實(shí)的消息之前,千萬不能隨意散播謠言,很容易造成以訛傳訛...
-
研究人員提供了關(guān)于自噬和壽命之間聯(lián)系的新見解
Sanford Burnham Prebys醫(yī)學(xué)發(fā)現(xiàn)研究所(SBP)的研究人員首次對老化期間活體動物的自噬進(jìn)行了綜合分析。自噬,意思是基于其希臘根源的自我
-
女人為什么要說閑話
現(xiàn)在的人們越來越物質(zhì)化了,什么都要攀比,其實(shí)生活是自己的,過得開不開心只有自己知道。有時候我們真的不需要在意別人的眼光,做自己...
-
緩解職場壓力 專家教你怎樣“不傷肝”
<script src="http: tv people com cn img player v js">< script><script>showPlayer({id:" pvservice xml 2022 3 22 e9628430-e9db-4d
-
我們現(xiàn)在知道如何組織細(xì)胞中RNA分子
與同事在美國工作,蒙特利爾大學(xué)的研究團(tuán)隊(duì)首次可視化RNA分子是如何組織的細(xì)胞。在他們的研究發(fā)表在《分子細(xì)胞,科學(xué)家們UdeM使用超分辨率顯