首個完整人類基因組圖譜公布,長江日報記者對話6名中外專家——

長江日報 發佈 2022-04-23T11:12:26.215013+00:00

近日,國際科學團隊「端粒到端粒」聯盟在發表於《科學》的6篇論文中稱,有史以來最完整的人類基因組圖譜繪製完成,填補了近20年來缺失的「拼圖」碎片。

長江日報大武漢客戶端4月23日訊(記者李玉瑩)近日,國際科學團隊「端粒到端粒(T2T)」聯盟(以下簡稱「T2T」聯盟)在發表於《科學》的6篇論文中稱,有史以來最完整的人類基因組圖譜繪製完成,填補了近20年來缺失的「拼圖」碎片。「這在整個科學史上,包括在人類遺傳密碼的破譯中是一個里程碑事件,也意味著人類距離攻克癌症和其他疾病又更近了一步。」中國科學院院士、國際人類基因組計劃參與者陳潤生告訴長江日報記者。

為何要繪製人類基因組圖譜?完整人類基因組圖譜公布會給人類健康帶來什麼樣改變?我國基因組學研究進展如何?帶著這一系列問題,長江日報記者採訪了以下6名中外專家——

中國科學院院士、國際人類基因組計劃參與者陳潤生

中國科學院北京基因組研究所原副所長、國際人類基因組計劃參與者於軍

浙江大學生命演化研究中心求是講席教授張國捷

上海交通大學Bio-X研究所長聘教軌副教授毛亞飛

T2T聯盟聯合主席、華盛頓大學霍華德·休斯醫學研究所研究員艾文·艾克勒

T2T聯盟發起人之一、美國加利福尼亞大學聖克魯茲分校基因工程學助理教授凱倫·米加

長跑數十年繪製人類「完整說明書」

人類基因組計劃被譽為生命科學的「登月計劃」,由美國科學家於1985年提出,1990年正式啟動,美國、英國、法國、德國、日本和我國科學家共同參與,核心內容是測定人類基因組的全部DNA序列。

2001年,人類基因組工作草圖的發表被認為是人類基因組計劃成功的里程碑。2003年,研究人員公布了當時被稱為完整的人類基因組序列,並對未準確測定部分(主要是重複序列)的性質和具體參數做了具體的評估。直到此次T2T聯盟宣布人類基因組完整圖譜繪製完成,人類看到了迄今為止一個獨立的「自己最完整的說明書」。

長江日報:為什麼要繪製人類基因組圖譜?

陳潤生:破譯由約30億個鹼基對組成的人類遺傳密碼,最終目的是為了研究人類的生長發育及疾病的診斷、治療和預防。

長江日報:此次公布的人類基因組完整圖譜,與人類基因組序列草圖相比,最大的進步在哪裡?

陳潤生:最大的進步是解決了缺失的8%的片段,把整個人類基因組圖譜精準地拼接完整了。由於技術的限制,基因測序不能把人的約30億個鹼基對從頭測到尾,而是要切割成很多小段,一段一段測完了後再拼接起來,這個過程是非常複雜的,尤其是約8%的基因組序列存在複雜的重複片段,我們很難正確地拼接與組裝。

於軍:假如我們把繪製人類基因組圖比作繪製一張製造高端汽車藍圖,其組裝零件的精準性和有效性就決定了這個汽車的水平。但是,實際操作的時候,總會有幾個小零件,其特異性不大,重要性遭到質疑,實用性又被淘汰,發展的潛力就受到限制,實際存在就受到質疑。

長江日報:此次取得突破的主要原因是什麼?

張國捷:對基因組排序有點類似拼拼圖,測序的時候我們是先把基因組打斷成短的DNA片段,然後對每個片段進行測序,得到這些片段的序列信息,這些片段就像拼圖的碎片,之後我們再用計算機方法把碎片組裝成完整的圖。在過去,大部分的圖塊已經被讀寫出來,也被安放到了拼圖框裡。但是一部分序列是由長得很像的重複序列組成,導致組裝難度很大。過去測序技術的讀長很短,越短就表示拼圖的碎片越碎,越難把這些序列拼接起來。之所以能取得這次進展,最重要的是因為第三代單分子測序技術的發展,能夠得到更長的測序片段,因此極大降低了拼接的難度。同時現有的各種測序技術同時應用可以互相矯正錯誤,也極大提高了基因組排序的準確度。

長江日報:現在的技術是將「拼圖塊」變得更大了?

凱倫·米加:是的。我們目前的技術無法從頭到尾讀取整個基因序列,因此,我們必須使用少量的信息來「重建」基因組,這個重建的過程可以看作是「拼圖」。在過去,研究人員只有一些小「拼圖」,而我們目前的技術提供了獲取更大「拼圖」的能力。顯然,雖然是同樣的拼圖,對比過去用10000個小「拼圖塊」拼湊來說,目前使用100個大的「拼圖塊」會更加容易,也更準確。

長江日報:為什麼一定要填補這8%的基因片段?

艾文·艾克勒:這8%的空白很重要,因為它攜帶的基因是我們成為人類的原因(例如決定腦容量大小相關基因),其包含的序列對染色體的分離以及細胞蛋白質的生產都有著極其重要的影響。如果沒有這部分基因,人類便無法成為人類。

長江日報:填補的8%的基因片段,與哪些疾病存在聯繫?

凱倫·米加:新的序列表示的是著絲粒和亞端粒區域、複製的基因家族以及核糖體DNA(rDNA)陣列,它們分布在對基本細胞過程有著非常重要作用的基因區域中。例如,著絲粒是基因中的關鍵結構,它負責每次細胞分裂時染色體信息的可靠傳遞。著絲粒的重排可能使細胞分裂出現錯誤,從而導致例如癌症、出生缺陷等人類疾病的發生。

距離攻克癌症和其他疾病又更近一步

繪製人類基因組圖譜,即是將人體細胞脫氧核糖核酸(DNA)的約30億個鹼基對進行精準排列,拼成一張完整的「地圖」。

關於人類生長、發育、衰老、遺傳病變的秘密,隨著基因組圖譜的繪製,都將得以展現。人類不知道的很多事,基因都知道。

長江日報:人類基因組完整圖譜首次繪製完成,有什麼重大意義?

陳潤生:這在整個科學史上,包括在人類遺傳密碼的破譯中是一個里程碑事件,也意味著人類距離攻克癌症和其他疾病又更近了一步。

長江日報:人類何時能擁有自己的基因組測序數據?

張國捷:精準醫療不僅需要完整精準的參考序列,最終也將需要繪製每個個體或者患者的完整基因組,從而全面地找出相關疾病位點。

長江日報:完整基因圖譜將給人類健康帶來什麼樣的改變?

凱倫·米加:在未來,如果一個人擁有完整的基因組測序,研究人員和臨床醫生便能夠通過識別其DNA中所有變異的部分來更好地引導其醫療與康復。理解人類基因組的完整序列可以為科學家研究人類基因變異、疾病以及進化等課題提供一個完整的框架。

長江日報:可以展開哪些想像?

毛亞飛:人類為什麼會存在某些遺傳疾病?很可能有一部分原因與現在破解的這8%重複序列有關。有了這個完整的圖譜,我們可以更好地理解以前不了解的疾病。如,與中心粒和複雜重複片段有關的疾病。舉個例子,人類1號染色體(1q21)上有個一段人類特有的基因片段,該片段包含多個重複基因叫NOTCH2NL,這些基因相關的缺失和重複分別會導致小腦症和大腦症。這段基因組區域非常複雜,在以前的圖譜中,它其實是不夠完整和具有代表性的。在這次的完整圖譜中,我們就能更深入地了解這段基因組的排列順序。如果能夠給病人做一套完整的基因組圖譜,我們就能知道這些基因是怎麼缺失或重複的。接下來,我們是不是可以設計分子探針,在臨床上就能去探測病人的樣本,以此幫助該疾病的診斷。再進一步來講,我們能不能在產前就去做分子診斷,判斷小寶寶出生前會不會患有這樣的疾病。再者,理解這段人類特有基因片段是怎麼演化的,可以進一步幫助我們了解「人類為什麼是人類」這一基本生物學問題。這些都是值得期待的。

此次的完整圖譜不是「最終版」

新版本基因組被命名為T2T-CHM13,被認為是自人類參考基因組首次發布以來進行的最大改進,將為人類參考基因組38(GRCh38)提供補充。據了解,T2T-CHM13由30.55億個鹼基對和19969個蛋白質編碼基因組成,比此前的人類基因組草圖增加了近2億個鹼基對以及2000多個新基因。新版本還發現了大約200萬個額外的人類遺傳變異位點,這些位點增加了622個與疾病相關的基因的遺傳變異探測精準度。

長江日報:這份完整人類基因組圖譜是繼人類基因組草圖公布後的多少版?

於軍:人類基因組計劃實施的背後其實是有5條主線的,叫作「五位一體」。一是建立一個科學學科。二是建立一個學科的實際支撐或叫作「實體」。就是一個研究單元,一個支撐機構,每年有固定的預算,有一伙人在貢獻青春。三是策劃一個可以完成的目標,譬如人類基因組序列的工作框架圖和包括所有可變位點(代表人類數百個人物個體的)實際序列完成圖。四是能推動技術的發展,實現共享的人類基因組草圖。最後的步驟是建立具有不斷發展潛能、目標單一、技術可行的機構。在過去20多年裡,科學家一直在努力將人類基因組的序列升級為完整版——一個序列的存在都不會被放棄。

長江日報:此次完整的人類基因組圖譜有哪些不足之處?

張國捷:目前發表的T2T基因組實際測的是一個單倍體,即所採用的DNA序列不是來自自然人的組織樣本,而是來自女性子宮中的水泡狀胎塊(葡萄胎)。真正人類的基因組應該是兩套基因組,一套來自父本,一套來自母本,也叫雙倍體,真正意義的完整基因組應該將兩套基因組完全解讀出來,各自達到T2T水平。目前技術上還存在挑戰。

長江日報:T2T聯盟下一步的研究重點是什麼?

艾文·艾克勒:我們現在已經補全了一個人類基因組,下一個重點任務將是完成二倍體基因組的補全(父系和母系的互補)。

凱倫·米加:此外,單一的完整基因組並沒有捕捉到人類基因變異的多樣性。為了解決這個問題,T2T聯盟正在與人類泛基因組參考聯盟合作,致力於集合不同族群的基因序列,建立一個能夠代表全人類的高質量參考基因組,這將是今後幾年的研究重點之一。

長江日報:預計未來多久可以完成一個自然人的二倍體基因組?

毛亞飛:準確來說,我們現在還沒有能力組裝到一個真正意義上的自然人的二倍體完整基因組,特別是一個男性的基因組,因為男性基因組X和Y性染色體在組裝過程當中是非常困難的。但從我的知識結構來講,我認為五年之內是有希望的。

長江日報:「國際人類基因組計劃」的最終目標是什麼?

於軍:繪製出完整的基因圖譜並不是終極目標,終極目標是做每個人的基因測序,因為每個人的基因都不盡相同。

期待測出中國人的完整基因組序列

1999年9月,中國成為美、英、日、法、德之外,第六個參與「人類基因組計劃」的國家,也是唯一的發展中國家。中國在「人類基因組計劃」中負責測定和分析3號染色體短臂上從端粒到標記D3S3610間大約30厘摩爾(相當於3000萬個核苷酸)的區域,因此被稱為人類基因組計劃「1%項目」。2001年8月,中國科學家完成「1%項目」的基因序列圖譜,提前兩年高質量完成任務。

長江日報:我國的基因組學研究是從何時啟動的?

陳潤生:我們國家的「人類基因組計劃」嚴格來講從1992年開始,由吳旻、談家楨、強伯勤、陳竺等科學家來推動的。我是從1992年就參加的。1994年,國家自然科學基金資助開展的中華民族基因組若干位點基因結構研究項目,標誌著我國人類基因組研究正式啟動。1995年,於軍、汪建、楊煥明、劉思奇等一些在國外從事這方面的科學家回來,使我國的基因組學研究加速上了一個台階,同時完成了與國際的接軌。1999年,我們拿到了「國際人類基因組計劃」的1%的任務,帶動了中國基因組學研究躋身世界前列。

長江日報:目前來講,我國的基因組學研究在世界上是什麼水平?

陳潤生:總體來講,我們是與國際接軌的,有些達到了國際先進水平,有些方面還有差距。

長江日報:近些年,我國的基因組學研究有哪些突破性成果?

張國捷:以華大基因和中科院基因組所研究人員為主力的我國科學家團隊參與人類基因組1%項目之後,在過去的20多年裡,我國的基因組技術和研究取得了飛躍式的發展,由國內科學家發起和引領了各種動植物基因組項目,近幾年不斷地有高水平工作產出。

長江日報:人類基因組完整圖譜首次繪製完成給我們帶來哪些啟示?

於軍:中國人的基因組和現在的完整白人基因組序列之間是有差異的。我們希望能儘快實現自主和獨立的項目支持,並且運用和發展第三代、四代測序技術的核心和基礎,能用中國人的技術和設備,測出完整的中華民族基因組代表性個體和群體的基因組序列。

張國捷:中國人的完整基因組序列也應該加快步伐。每個個體存在大量的個體特異性或者是族群特異性的重複序列、複製片段或者其他結構差異,利用其他族群的基因組作為參考,會漏掉許多亞洲人或者中國人特異性的序列信息,也會影響針對中國人的醫學研究和精準醫療的開展。

【編輯:丁翾】

更多精彩內容,請在各大應用市場下載「大武漢」客戶端。

關鍵字: