Nature:新方法成功構建基因活性三維圖譜

轉化醫學網 發佈 2019-12-19T03:54:04+00:00

三維計算機模型使得科學家們能夠快速地確定哪些基因在哪些細胞中有活性,以及它們在器官中的精確位置。

三維計算機模型使得科學家們能夠快速地確定哪些基因在哪些細胞中有活性,以及它們在器官中的精確位置。在一項新的研究中,德國亥姆霍茲協會馬克斯-德爾布呂克分子醫學中心的Nikolaus Rajewsky教授、以色列希伯來大學的Nir Friedman教授及其團隊前不久在Nature期刊上發表了這種新的方法以及從中獲得的新見解,論文標題為「Gene expression cartography」。

Rajewsky教授是一位有遠見的人,他想要確切地理解在疾病進展期間人體細胞中到底發生了什麼,旨在能夠識別和處理最初出現的細胞變化。Rajewsky教授解釋道,「這不僅要求我們破譯單個細胞中的基因組活性,而且還要在器官中對它進行空間跟蹤。」比如,為了準確地診斷疾病並選擇最佳療法,癌症中免疫細胞的空間排列(「微環境」)極為重要。「總的來說,我們缺乏一種在分子水平上捕捉和了解組織的(病理)生理學特性的系統方法。」

針對不同組織類型的圖譜

通過Rajewsky教授、Friedman教授、哈佛大學的Mor Nitzan博士和「基因調控元件系統生物學」項目負責人Nikos Karaiskos博士之間的合作,這些研究人員成功地使用一種特殊的算法為非常不同的組織類型---哺乳動物中的肝臟和腸上皮,以及果蠅和斑馬魚的胚胎,小腦的某些部分和腎臟---中的單個細胞構建出基因表達空間圖。Rajewsky教授說,「有時純粹的理論科學足以在高級科學期刊上發表---我認為這種情況在未來會更加頻繁地發生。我們需要在機器學習和人工智慧上加入投入。」

Karaiskos解釋道,「利用這些計算機生成的圖譜,我們如今能夠精確地追蹤特定基因是否在組織某部分的細胞中有活性。如果沒有我們開發的這種三維計算機模型,這一點是不可能實現的。我們將這種模型命名為novoSpaRc。」

空間信息在以前的研究中丟失了

直到最近幾年,人們才能夠大規模地高精度地確定器官或組織中的單個細胞在任何給定時間從它的基因組中獲得的信息。這要歸功於新的測序方法,比如多重RNA測序,它可以同時分析大量RNA分子。當基因變得活躍並表達蛋白時,RNA就在細胞中產生。Rajewsky早就意識到了單細胞測序的潛力,並在他的實驗室中建立了它。

Rajewsky解釋道:「但是,要讓這項技術起作用,必須首先將待研究的組織分解為單個細胞。」這個過程導致有價值的信息丟失:比如,在解碼特定細胞的基因活性時,它在組織中的原始位置就丟失了。因此,Rajewsky和Friedmann正在尋找一種使用單細胞測序數據來開發數學模型的方法,該數學模型可以計算整個基因組(甚至在複雜組織中)基因表達的空間模式。

Rajewsky和在柏林醫學系統生物研究所開展研究工作的Robert Zinzen博士領導的團隊在兩年前已經取得了第一個突破。在Science期刊上,他們獲得了果蠅胚胎的虛擬模型。它以前所未有的空間解析度顯示了哪些基因在哪些細胞中有活性。這種基因定位是在84個標記基因的幫助下實現的:原位實驗確定了這些基因在某個時間點上在卵形胚胎中的位置。這些研究人員證實他們的模型可以在活的果蠅胚胎中開展進一步的複雜原位實驗。

由成千上萬個拼圖塊和顏色組成的拼圖

在這種模型中,研究人員逐個地重建了每個細胞的位置。這是可行的,這是因為只需要處理數量較少的細胞和基因。這一次研究者想知道的是,在幾乎沒有或沒有任何以前的信息的情形下,是否可以重建複雜的組織。這種算法的基本假設是,當細胞相鄰時,它們的基因活性或多或少相似。研究人員從相鄰細胞的基因組中獲得的信息要比相距較遠的細胞中的更多。

為了驗證這一假設,研究者們使用了現有的數據。對肝臟、腎臟和腸上皮而言,不存在更多的信息。他們只能夠通過使用重建的組織樣本來收集少量的標記基因。在一種情形下,只有兩個標記基因可用。

Karaiskos在試圖描述他在對這種模型進行計算的過程中面臨的困難任務時,解釋道,「這就像把一個巨大的拼圖放在一起,上面有大量不同的顏色,可能有10000多種。如果正確地拼出了這個拼圖,那麼所有的顏色就會形成一個特定的形狀或圖案。」每個拼圖塊代表待研究組織中的一個細胞,每一個顏色代表一個可通過RNA分子讀取的活性基因。

無論採用何種測序技術,該方法均有效

研究者表示:「我們如今有了一種方法,它使得我們不論使用哪種測序方法都能夠在計算機中基於從單細胞測序獲得的數據構建待研究組織的虛擬模型。關於單個細胞空間位置的現有信息可以輸入到這種模型中,從而進一步完善它。」然後,藉助於novoSpaRc,就有可能確定每個已知基因在組織中的哪些位置是有活性的,並經表達產生蛋白。

如今,Karaiskos和他的同事們也致力於使用這種模型追溯甚至預測組織或整個有機體中的某些發育過程。但是,Karaiskos承認可能存在某些與novoSpaRc算法不兼容的特定組織。他表示,這可能是一個值得期待的挑戰:一個嘗試解決新難題的機會!

轉自:細胞

參考資料:

1.Mor Nitzan et al. Gene expression cartography. Nature, 2019, doi:10.1038/s41586-019-1773-3.

2.Nikos Karaiskos et al. The Drosophila embryo at single-cell transcriptome resolution. Science, 2017, doi:10.1126/science.aan3235.

3.3-D maps of gene activity

https://phys.org/news/2019-11-d-gene.htm

關鍵字: