你和貝克漢姆的差距,只差0.1%!

格致論道講壇 發佈 2020-08-20T06:17:12+00:00

以下內容為中科院基因組研究所癌症基因組學博士陳科演講實錄:大家好,我是陳科,來自中科院北京基因組研究所,今天和大家分享的主題是——生命的基因組。

出品:"格致論道講壇"公眾號(ID:SELFtalks)

以下內容為中科院基因組研究所癌症基因組學博士陳科演講實錄:

大家好,我是陳科,來自中科院北京基因組研究所,今天和大家分享的主題是——生命的基因組

小時候經常會有人說,「陳科,你長得這麼像你爸爸」;也會有人說,「陳科,你像你媽媽多一點」。

為什麼會這樣呢?學過生物的人都知道,因為我們的DNA,也就是鹼基,一半來自爸爸,一半來自媽媽。

毫無疑問,我們的面貌特徵是他們結合後的體現。

實際上,不僅在面貌上,我們的身高、胖瘦,還有我們是否容易患上某種疾病,都與我們的基因背景有密切關聯。

這是一張萬人迷的照片,大部分人對他都不陌生吧。沒錯,他就是貝克漢姆。

從基因組學的術語上來講,他是由1×10^14個細胞組成。每一個細胞從外到內,分別由細胞膜、細胞漿和細胞核三大部分組成。

細胞核,顧名思義就是核心,是細胞最主要的成分。細胞是構成生命世界中每一個有機體的基本單位

細胞核再往下分是什麼狀態呢?就是1953年人類發現的DNA雙螺旋結構。由大到小觀察,從細胞核、染色體,到DNA。

DNA是最基本的單元,我們稱之為鹼基,有A、T、G、C四種類型。換句話說,我們是由這四種結構的DNA構成的。

3.2×10^9個鹼基對,這就是我們人類基因組的數目

以上是從宏觀到微觀,從貝克漢姆到鹼基DNA來進行觀察。反過來看看是怎樣的過程?

首先是DNA,有四種最基本成分,分別是A、T、G、C,它們形成一定的序列;

再往上,有功能的序列稱之為基因,基因與包含在基因周邊的蛋白質和RNA稱為基因組;

基因組構成了細胞核,細胞核是細胞的主要成分;

細胞往上走,形成了器官,形成了系統,比如呼吸系統,血液系統,消化系統;

到最後,貝克漢姆組裝完畢,這是由微觀到宏觀的過程

這個過程的奇妙之處在哪兒呢?大家可能會問基因是什麼、有什麼作用?

生物學教科書里有一個所謂的「中心法則」,從DNA開始,到RNA,到蛋白質,這個過程最終的目的是形成蛋白質

孩童的微笑,情侶之間的眉目傳情,我在這裡講,您在下面聽,所有的動作都是蛋白質在執行功能。

DNA如此重要,被稱為我們生命的原始碼,支持我們所有的活動。這些活動都能夠回溯到DNA上去,因此我們可以從DNA中找到某種問題的緣由。

人類基因組計劃

正是因為基因組的重要性,人類科學家開始聯合起來進行研究

在上世紀90年代,確切來講是1990年起,以美國和英國為首的遺傳學領域科學家們聯合發起了人類基因組計劃,這個計劃簡稱為HGP,由六國科學家組成。

當時計劃用15年的時間測序一個人的基因組。為什麼花這麼長時間呢?

因為我們基因組的大小是3.2×10^9個序列,其中75%以上都不是完全不同於別人的。換句話說,裡面有很多的重複序列,這種重複序列的存在導致我們想把它從1到3.2×10^9的過程完全弄清楚是不太容易的。

人類基因組計劃從1990年開始啟動。2000年,美國總統說我們完成了人類最偉大的計劃之一,宣布草圖,到2003年出來精細圖。

到2016年,這個版本已經更新到了第38版,最新更新時間是2013年12月。預計它的更新還會持續,更新幅度可能越來越小,離真相越來越近。

人類基因組計劃啟動之後,相關測序產業也蓬勃發展,直接作用就是我們可以了解更多物種的基因組是什麼樣子。

到2016年,已經測出了將近一萬個物種的基因組序列

不做基因組的人可能不太清楚,總統先生和黑猩猩有多少相似度?

剛才猜測60%、70%、80%、90%的人都有,事實上是99%

從基因組學角度來看,我們認為自己多麼與眾不同,其實是毫無意義的。我們和猩猩的差別其實只有1%

而且,從更大範圍來看,人類的基因組並不是最大的,基因數目也不是最多的;最大的基因組、最多的基因數來自於日本一種植物

這個表格中,平常不起眼的玉米大概有5萬個基因;中國人和美國人的基因只相差0.1%;我和你99.99%的基因都是一樣的,差別不大。

但是,因為基數是3.2×10^9,乘基數之後,得到了10^4到10^5之間的差異

我們經常聽到基因突變跟某些疾病有關,腫瘤、糖尿病、心腦血管疾病等。

但是,請大家一定注意,很多情況只是一種關聯,關聯不是因果。

因果是,我和我老婆的存在導致了我女兒的出生;而關聯不是因果關係,只是一個隨帶的關係

比如,我女兒碰巧上了這家幼兒園,她上這家幼兒園是一個關聯,不是因果。

基因突變很多時候是一個關聯,並不可怕。而且剛剛提到,哪怕我們99.99%相似,只有萬分之一的不同,但是基數足夠大。

我們從爸爸媽媽繼承來的基因突變,每一代大概是72個,這是有據可循的,而這72個基因突變里大部分來自於父親的貢獻。

有遺傳學家就此認為進化的動力來自於父親,因為它顯現了更多突變,更有可能給後代帶來基因的多樣性,更有可能使得後代與眾不同。

正是因為基因組學如此重要,在人類基因組計劃之後,全世界範圍的科學家並沒有放棄追逐。

當時的人類基因組計劃研究對象只有一個人,但一個人太少了,每個人都不一樣。

因此便有了後來的千人基因組計劃,檢測一下黃色人種、黑色人種、白色人種,每一個人種,不管是中國人,還是日本人,雖然差別可以縮小到十萬分之一,但數目還是很大的。

千人基因組計劃出台後,今後在序列比對時,可能不用再比對人類基因組計劃中的HG38(人類基因組計劃的第38版),而是比對我們自己的,比對中國人群的,比對中國南方人群里滿足某一個亞系人群的基因組。

這樣才更有可能找到我突變了什麼,我哪種疾病爆發的可能性更大?這就是千人基因組計劃的初衷

後來,為了把一直困擾人類的癌症難題解釋清楚,世界範圍內的兩大組織,分別是加拿大領銜的國際癌症基因組聯盟和美國領銜的癌症基因組圖譜,用基因組學方法去測序某一個類別的腫瘤


比如說腎癌,他們選擇了500多名同一類的腎癌患者來測序基因組,分析哪些基因組產生了突變,哪些突變跟愈後相關聯,哪些藥物針對哪些突變,可以用來指導患者的後續治療。

美國領銜的計劃(TCGA)已經結束了,加拿大領銜的計劃(ICGC)還未結束。但是毫無疑問,不管是白種人,黑種人,還是我們黃種人,人類最主要的腫瘤測序基本結束,產生了大量數據。

一個U盤大概有10G,乘1024倍是10T,再乘1024倍是10P。我們研究所存儲的數據遠高於此,因為數據無時無刻不在產生,意味著我們需要更大的容器來裝它,不然我們沒有辦法比對,沒有辦法很好地使用。

這導致了生物大數據的出現,達到了T級、P級。

精準醫學應用

在應用方面,精準醫學毫無疑問是對大數據最好的回饋。花了那麼多的錢,十幾個國家的科學家投入研究,十幾年的時間,數百億美金的投入,對我們人類產生了如此多的數據,不使用的話豈不變成了垃圾?

精準醫學不僅被美國總統在2015年和2016年的國情咨文中提及。之前,在中國科學院,很早就有人提出來精準醫學。

需要針對每個人的基因背景、蛋白背景做個性化的裁減與個性化的治療,這就是精準醫療,形象點說,就是哪裡壞了修哪裡,這是最好的想法。


精準醫學在癌症領域的應用。展示的這個流程圖是以肝癌為例的整個精準醫療的流程

術前影像顯示有個腫塊,影像結果出來之後,大部分患者會選擇做手術。

手術之後會進行病理學的判斷,診斷肝癌到哪一級、哪一期,並且對手術樣本進行基因組學建庫;之後進行基因組學測序,測序之後進行分析,然後由董事會(諮詢委員會)討論患者的基因背景是什麼,哪些突變可能是致病的,哪些不是主要的突變。

董事會裡至少包含四類人員:生物信息學家、遺傳學家、臨床大夫、病理醫生。討論結束後,我們針對這些可用的突變頻譜進行驗證,驗證結束之後報告給患者。

比如肝癌,已有的病理學分析到了哪個層面,基因組分析到了哪個狀態,針對患者有哪些藥可以用,這樣的報告就是精準醫學最直接的體現

精準醫療已經在國外頂尖醫院應用了5年左右的時間,但並沒有完全鋪開,而中國才剛剛起步。但中國人從來都是勤奮的,國外需要一個月完成的流程,我們中國10天就可以搞定。

講一個故事,主角是華盛頓大學的助理教授,做白血病研究。

不幸的是,2003年他自己得了白血病。按照以往的方法進行了化療,但5年後病情復發,他移植了弟弟的骨髓,好景不長,三年之後他再次復發。

此時,癌症基因組學的進展處在高峰階段,發現他有一個基因異常高表達,而且靶向藥物可以治療這個異常高表達基因

這裡有一點特彆強調的是,這個靶向藥物其實是治療晚期腎癌的。換句話說,他用治療腎癌的藥物治療了白血病。

他的現狀如何呢?最近的資料顯示他還活著。這是一個幸運兒,從開始治療到2016年已經過去了十二三年的時間,對於白血病患者來說,這是一個奇蹟,對於腫瘤基因組學應用來說也是一個非常令人振奮的消息。

另一個例子與預測糖尿病有關。這位長者是史丹福大學的教授,做遺傳學研究,他的故事於2012年發表在Cell期刊--這是生物學研究人員最夢寐以求發文章的地方,可以近似理解為頂級期刊。

他的故事講到,600多天的時間,他分20個時段採集自己的血液做基因組學分析,發現自己存在罹患二型糖尿病的風險,風險值大概0.5左右,這個時候他有點著急了。

我們在網絡上看到過,安吉麗娜·朱莉因為家族罹患乳腺癌和卵巢癌的風險過大,就把乳腺全部切除了。

這位教授知道自身血糖升高之後,開始進行行為干預,此後血糖降了下來。

對於他來說精準醫學是一個成功案例,因為它成功延緩了糖尿病的進展,很有可能讓自己的糖尿病發生時間延後,甚至不發生

這是兩個經典例子:一個是癌症,一個是糖尿病。

這麼好的例子,我們大部分人支付的起嗎?答案是肯定的。

2000年每個人做基因組測序的花費是27億美金,到今天(2015年)變成了一萬元人民幣,時間成本和人力成本直線式下降。13年變成13天,人力成本從三千人變成了三到五個人就能夠搞定。

現在(2016年)一萬塊錢就可以測一個人的基因組,這個費用還會下降,業界最終目標是一千塊錢測一個人的基因組

正是因為生物數據如此複雜多樣,它的層次除了DNA、RNA、蛋白質,還有更多層面,這麼多數據,大夫不可能完全記得。

對大部分民眾來說也沒有必要記,因為有人替我們去做。

以IBM為代表的商業機構推出了電腦醫生平台——Doctor Watson,最大的特點就是在15秒訪問時間內搜索百萬級別的文獻,並給出相對合理的治療方案。其中診斷階段,治療階段,每個方案都有參考文獻,不是憑空而來。

可能有人會擔心,我們去醫院看病,可能醫生不見了,被電腦替代了。

事實上,不論怎麼變,大夫必不可少,因為電腦所做的事情雖然如此強大,但這個答案仍基於已有的資料庫,沒有推斷的能力。

當然,基於AlphaGO擊敗李世石這件事,可以認為人工智慧存在無限可能,但至少從目前來看,電腦醫生只是供人們搜索和檢索的資料庫,不是具有推動、推算、推演能力和邏輯思維能力的真正的人

所以大家想像的,到醫院與一台機器對話,他告訴我去哪裡檢查,給我抽血、做按摩、做手術,這還需要很長的時間,但不能說絕對沒有可能。

精準醫療推廣壁壘

既然精準醫療是如此好的東西,為什麼沒有廣泛推廣?

除了之前提到的費用原因,就我們國內狀況來看,還有以下幾個方面的壁壘需要進一步打破。

第一個方面,精準醫療是新事物,所以在監管層面還有很多東西沒有理順,沒有真正的條文規定告訴我們該怎麼做。

第二個方面,對於患者或者家屬來說,他們非常想參與進來,但不知道有什麼途徑可以了解相關的信息

我把測序儀買回來,測序結果出來以後,醫院不會分析。如果依靠第三方機構,問題又來了,第三方機構魚龍混雜,難以取信。

甚至我們經常在街邊巷尾看到兜售行為,給孩子測基因,看他未來適合做科學家、藝術家,還是當教師。

這些到現在為止,因為我們的資料庫不夠強大,都是一些虛假的廣告

還有一個層面,目前沒有一家第三方機構能夠把前面提到的四種認證專家集中起來,因為這個行業還處於起步階段,還有很多需要完善的地方,但是曙光已經出現,今後的可能性很大。

我們人類有史以來,死亡的主要原因一直在變遷

100多年前,我們的祖先絕大部分因為飢餓和戰亂而死亡;

上世紀上半葉,感染性疾病、西班牙流感、黑死病……給人類留下巨大創傷,我們今天讀教科書的時候仍然心有餘悸;

上世紀下半葉,心腦血管疾病、癌症成為死亡的主要原因。

一些科學家預測,當我們解決這些問題之後,在即將到來的未來,神經系統疾病將成為我們人類消亡的最主要原因。

基因組學能夠解決所有問題嗎?答案是否定的

每個人的基因只有一套,但基因上所修飾的、依附的、被黏附在上面的分子是多種多樣的,基因上面的表觀修飾可以成百上千套。這個數目仍在持續不斷的增加,比如說我們的頭髮、面貌、骨骼、肝臟等,同一套DNA,但具有不同的表現型

時至今日,生命的天書已經被打開了,我們期待它給我們帶來不一樣的應用,最終造福於我們人類的健康,為我們人類謀更大的福祉,謝謝大家,感謝。

「格致論道」,原稱「SELF格致論道」,是中國科學院全力推出的科學文化講壇,由中國科學院計算機網絡信息中心和中國科學院科學傳播局聯合主辦,中國科普博覽承辦。致力於非凡思想的跨界傳播,旨在以「格物致知」的精神探討科技、教育、生活、未來的發展。獲取更多信息。本文出品自「格致論道講壇」公眾號(SELFtalks),轉載請註明公眾號出處,未經授權不得轉載。

關鍵字: