生信分析中不可忽視的GTEx資料庫

雲生信學生物信息學 發佈 2024-04-01T23:14:03.190595+00:00

GTEx首次出現是2013年在Nature Genetics雜誌上發表的文章The Genotype-Tissue Expression project中,該文中首次介紹了Genotype-Tissue Expression,並成立了Genotype-Tissue Expression Consortium。

爾雲間 一個專門做科研的團隊

原創 小果 生信果


小夥伴們,大家好呀,很高興和大家見面,最近看到有果粉提問關於TCGA數據沒有正常組數據的問題,大部分的癌症數據的分組均是完整的,即均有腫瘤與正常組,對於有些特殊的疾病它僅保存了腫瘤分組數據,這時就需要用到另一個資料庫:GTEx。

今天呢我們來聊聊小夥伴們關於TCGA與GTEx資料庫的疑惑。走神的小夥伴,還沒有準備好的小夥伴,此時可千萬不能打瞌睡,說不定你的幾秒鐘的專注一不小心就能解決你心中的疑惑,快快來看這吧。

疑惑一:什麼是GTEx資料庫?

答:GTEx全稱是Genotype-Tissue Expression,稱為基因型組織表達。GTEx首次出現是2013年在Nature Genetics雜誌上發表的文章The Genotype-Tissue Expression (GTEx) project中,該文中首次介紹了Genotype-Tissue Expression,並成立了Genotype-Tissue Expression Consortium。2015年發表在Science上標題為The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue gene regulation in humans文章中。

為了檢查個體內組織之間的遺傳表達如何變化,基因型組織表達(GTEx)聯盟收集了1641個屍檢樣本,涵蓋了175個個體的54個體位點。2017年在Nature上發表了4篇文章,其中標題為Landscape of X chromosome inactivation across human tissues的文章,指出GTEx整合來自449個個體的5500多個轉錄組,29個組織的940個單細胞轉錄組,並結合基因組序列數據。我們可以使用該資料庫進行查詢幾乎所有轉錄基因的基因表達數據。


疑惑二:什麼時候用到GTEx資料庫?

答:在使用TCGA資料庫的時候,有些癌症的項目收納的正常組織數據是非常少的,換句話說就是有很多病人,但是這些病人的正常組織的轉錄組測序結果沒有。比如說卵巢癌,乳腺癌,這些疾病的正常組樣本非常少。此時我們就要去想辦法從其他資料庫著手找到正常組織的樣本數據,此時GTEx資料庫就是不錯的選擇,這樣在與TCGA數據整合到一起,樣本量就比較多一些了。

至此,今天的答疑就結束了,小夥伴們有疑問可以給小果留言,小果期待與各位夥伴的交流。

推薦閱讀

  • 教你解讀WGCNA分析中的POWER圖譜
  • 不會使用MSigDB資料庫下載數據?快來看這裡
  • 小雲手把手教你用GS-MM散點圖挖掘WGCNA的hub基因
  • 小果教你解讀WGCNA分析中的module-trait realtionship圖譜
  • R語言pophelper包對 Admixture遺傳結構分析可視化


關注小果,小果將會持續為你帶來更多生信乾貨哦。

生信果 生信入門、R語言、生信圖解讀與繪製、軟體操作、代碼復現、生信硬核知識技能、伺服器等原創內容

關鍵字: