新型單鹼基解析度測序方法可同時獲取DNA的遺傳和表觀遺傳信息

生信寶典 發佈 2024-03-05T06:48:44.385858+00:00

DNA中存儲著多個維度的信息,包括遺傳和表觀遺傳基礎中的分子信息,這兩者都對我們理解生物學至關重要。DNA序列中的遺傳信息使我們認識到基因和調控原件賦予了生命的藍圖;DNA中的表觀遺傳信息,使我們發現根據基因藍圖構建生命的指示標和控制台。

DNA中存儲著多個維度的信息,包括遺傳和表觀遺傳基礎中的分子信息,這兩者都對我們理解生物學至關重要。DNA序列中的遺傳信息使我們認識到基因和調控原件賦予了生命的藍圖;DNA中的表觀遺傳信息,使我們發現根據基因藍圖構建生命的指示標和控制台。目前大多數DNA測序方法只涉及遺傳學或表觀遺傳學,不能捕獲完整的遺傳信息。

近日,英國劍橋大學研究團隊提出了一種新的單鹼基解析度全基因組測序方法,在一個工作流程中對完整的遺傳學和兩種最常見的胞嘧啶修飾進行測序。這種全基因組測序方法可以在進行測序的同時,檢測出5mC(5-甲基胞嘧啶)和5hmC(5-羥甲基胞嘧啶)。DNA樣本只使用酶進行處理,避免了亞硫酸氫鹽處理的DNA降解和基因組覆蓋偏差。該研究發表在國際頂級期刊Nature Biotechnology上,文章題為「「Simultaneous sequencing of genetic and epigenetic bases in DNA」。

文章發表在Nature Biotechnology

據文章介紹,Five-letter測序可以同時兼顧遺傳學和表觀遺傳學信息,檢測同一DNA分子上順式的遺傳和表觀遺傳標記組合,與目前的測序平台兼容(圖1a)。該方法使用雙鹼基編碼方法,即兩個鹼基的組合狀態信息,可以明確地解碼多達16個狀態(圖1c)。在其工作流程中(圖1d),樣本DNA首先通過超聲處理片段化,然後連接到兩端的短合成DNA髮夾接頭上。而後將該啞鈴結構分開,對於每條原始樣本DNA鏈,通過3′末端的DNA聚合酶延伸合成互補拷貝鏈,以產生髮夾構建體,原始樣本DNA鏈通過合成髮夾與其互補鏈相連,缺乏表觀遺傳修飾。接著將測序接頭連接到末端,將帶有修飾的C保護起來,未受保護的C則脫氨形成尿嘧啶(圖1d)。UvrD解旋酶加入到脫氨反應中,脫氨構建體不再完全互補,因此可以通過聚合酶鏈反應(PCR)擴增。這些構建體以配對端格式進行排序,其中read 1(P7引物)是原始鏈,read 2(P5引物)是拷貝鏈。reads數據成對對齊,因此read 1與其互補read 2對齊。來自兩個read的同源殘基通過計算解析以產生單個遺傳或表觀遺傳代碼(圖1e)。

圖1. Five-letter測序示意圖。來源:Nature Biotechnology

cfDNA分析是診斷學的一個新興領域,其應用領域包括增強的無創產前診斷、早期癌症檢測和疾病監測。如何高效利用血液中提取的有限數量的cfDNA是一個巨大的挑戰。一種可以同時檢測來自同一樣本的遺傳和表觀遺傳信息的精確測序方法,可以改變cfDNA分析。研究團隊利用Five-letter測序流程分析了Ⅲ期結腸癌患者的cfDNA。當DNA輸入量從2ng增加到80ng時,PCR和簇複製率為38.2%到14.5%(圖2)。當DNA輸入量為2ng、10ng和80ng時,基因組中分別有90.85%、90.89%和90.35%被至少一條reads覆蓋,平均測序深度分別為21.8×、27.6×和30.4×(圖2b)。對於λ和pUC19 DNA對照,即使2ng混合樣本中含有0.05ng對照DNA,Five-letter甲基化檢測的準確性仍然很高,達到98%以上的敏感性,特異性分別為99.89%、99.94%和99.98%(圖2c)。

圖2. Five-letter測序的cfDNA檢測應用。來源:Nature Biotechnology

5mC的酶促氧化產生5hmC。5hmC已被證明具有作為生物狀態和疾病標誌物的價值,包括從cfDNA檢測早期癌症。研究人員進一步調整了研究方法,以實現對DNA序列中G、C、T、A、mC和hmC的檢測(圖2a)。該方法中reads使用圖4b所示的雙鹼基代碼進行成對比對和解析。unmodC(未修飾的胞嘧啶)、5mC和5hmC中的每一個都可以被解析,因為三個CpG單元具有不同的雙鹼基編碼測序reads(圖4b)。研究人員使用了完全未甲基化的pUC19載體和完全甲基化的lambda載體,就像在評估Five-letter測序方案中使用的那樣,以及在特定CpGs中存在5hmC的額外短合成寡核苷酸。Six-letter測序方案在所有與這些CpGs比對的reads中正確識別了95.24%的5mC和97.93%的5hmC(圖4c),並在所有reads中保持了很高的unmodC檢測準確性(99.93%)

圖3. Six-letter測序示意圖。來源:Nature Biotechnology

該研究開發了一個測序平台,該平台只需要較少的DNA輸入量,可在單個工作流程和數據框架中以鹼基解析度提供包括5mC和5hmC的表觀遺傳信息,以及全部遺傳學信息。該平台通過分子水平的雙鹼基編碼機制與解碼軟體相結合,提高了基因測序和變異鑑定的準確性,並以高精度檢測表觀遺傳信息。該平台比對使用四鹼基系統,比亞硫酸氫鹽測序或EM-seq使用的三鹼基比對更快、更準確。在單一的實驗和數據工作流程中獲取準確的遺傳和表觀遺傳信息,可提供更全面的生物學信息,易於使用和降低成本,可以在生命科學研究和疾病診斷方面提供許多優勢。

參考資料:

Füllgrabe, J., Gosal, W. S., Creed, P., Liu, S., Lumby, C. K., Morley, D. J., ... & Balasubramanian, S. (2023). Simultaneous sequencing of genetic and epigenetic bases in DNA. Nature Biotechnology, 1-8.

https://www.nature.com/articles/s41587-022-01652-0

·END·

關鍵字: