科學家第一次實現了人類X染色體的完整測序

孜然實驗室 發佈 2020-07-15T04:21:30+00:00

問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。儘管如此,序列中還是有多個缺口,尤其是在著絲點,這個區域有特別多的重複片段,是公認的困難區域。

人類參考基因組(GRCh38)是人類有史以來取得的最準確、最完整的脊椎動物基因組。不過在這個基因組中,存在許多不準確或者未被讀取的地方,它們稱作缺口。即使經過二十多年的改進,仍有數百個未解決的缺口。

X染色體

之所以出現這麼多的缺口,是因為以前的基因測序技術一次只能讀取DNA的一個小片段,然後再將這些片段拼湊起來。問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。

現在,科學家們使用了新的方法,首次完成了人類染色體從一端到另一端的完整序列(「端粒到端粒」),沒有缺口,並且準確性達到空前水平。

科學家通過納米孔測序技術,結合其他改進和驗證的互補技術,實現了對葡萄胎CHM13全基因組進行的高覆蓋、超長讀取。首次嘗試重點是人類X染色體,科學家重建了長度為310萬鹼基對的著絲粒衛星DNA陣列,填補了現有文獻中的29個缺口,其中包括人類偽常染色體區域和癌睪丸擴增基因家族的新序列。

新的序列將被整合到未來的人類參考基因組中。嘗試是成功的,完成整個人類基因組已經觸手可及。

用於實現超長讀取的新測序技術,是由加州大學聖克魯斯分校開發的納米孔測序技術。新技術可以一次讀取數十萬個鹼基對,這個長度跨越了基因組中的整個重複區域。

納米孔測序技術示意圖

這項工作使用了納米孔測序技術,通過檢測DNA的單個分子通過膜中的小孔(也就是納米孔)時電流的變化來對DNA進行測序。

納米孔測序儀

儘管如此,序列中還是有多個缺口,尤其是在著絲點,這個區域有特別多的重複片段,是公認的困難區域。團隊不得不手動解決序列中的幾個缺口。

X染色體的著絲粒是一個包含高度重複序列的區域,總長度大約310萬個鹼基對。科學家識別重複序列中的變異並將其作為標記,利用標記將它們連接在一起,從而完成了整個著絲粒序列。

X染色體

下一步是使用來自多種測序技術的數據進行驗證,以確保序列中每個鹼基的準確性。這些輔助技術包括PacBio和Illumina的測序技術,以及BioNano Genomics的光學圖譜。通過比較在不同平台上獲得的數據,可以完善序列,達到更高的準確性。

利用這些技術,科學家團隊完成了一個全基因組序列,其連續性、完整性和準確性超過了所有先前的人類基因組裝配,甚至在某些指標上超過了目前的人類參考基因組。

這項研究填補了人類基因組序列中剩餘的缺口,同時科學家發現這些缺口實際上是人類變異最豐富的區域之一,這些信息對於理解人類生物學和疾病很重要。

納米孔測序除提供超長讀取外,還可以檢測已被甲基化修飾的鹼基。甲基化是一種表觀遺傳變化,並不會改變基因序列,但會對DNA結構和基因表達產生重要影響。

關鍵字: