DNA雙螺旋發現70周年,它給生命科學帶來了什麼?

文匯網 發佈 2024-05-06T05:26:05.295561+00:00

1953年2月28日,第一個DNA雙螺旋結構的分子模型誕生,引發生物學研究的重大革命,開啟了分子生物學時代。今年是DNA雙螺旋結構發現70周年。過去70年間,人類逐步了解了書寫「生命天書」的基本「字母」和「書寫」規則,更在不斷深入「閱讀」其內容的基礎上,開啟了全新的「創作」之路。

1953年2月28日,第一個DNA雙螺旋結構的分子模型誕生,引發生物學研究的重大革命,開啟了分子生物學時代。

今年是DNA雙螺旋結構發現70周年。過去70年間,人類逐步了解了書寫「生命天書」的基本「字母」和「書寫」規則,更在不斷深入「閱讀」其內容的基礎上,開啟了全新的「創作」之路。DNA雙螺旋結構的發現,指引著人類從認識基因走向合成生命,在造福人類自身的同時,也將給未來世界帶來更多可能。

「龍生龍,鳳生鳳,老鼠生兒會打洞」。生物體與非生物體之根本差異在於,生物體能夠保存和利用信息,並把自身的信息一代又一代地傳遞下去。從古至今,人們一直試圖闡明生物體這種承載和傳遞信息的能力。

這個夢想在1953年終於得到了實現——美國科學家沃森和英國科學家克里克提出了DNA雙螺旋模型,藉此在分子水平上清晰地解釋了生物體是如何保存和傳遞信息的。在此基礎上,分子生物學誕生,現代生命科學的「帷幕」也就此正式拉開。

1953年,美國科學家沃森(左)和英國科學家克里克(右)提出了DNA雙螺旋模型。

過去70年間,人類認識到生命最根本的基石是四個「鹼基字母」及其相應的「書寫規則」,並由此打開「生命之書」的閱讀之門,進入了比世界上任何一個圖書館藏書都要豐富的「生命之書」殿堂。

「生命之書」之閱讀篇

研究者從DNA雙螺旋模型中認識到,生命的底層邏輯是「文字」,即用「A」「T」「G」「C」4種鹼基作為基本單元連接成長長的多核苷酸鏈,這樣的兩條多核苷酸鏈相互纏繞而形成DNA雙螺旋。

這4種鹼基正是記錄生命遺傳信息的「字母」,其中每3個鹼基組成一個類似單詞的遺傳密碼子,對應一個特定的胺基酸。蛋白質是執行生命活動的主要功能元件,由多個胺基酸作為基本單元連接而成。從4種鹼基中選擇3種來構成一個密碼子,總數為64,所以生物體擁有64個密碼子「單詞」。

由於生物體用來合成蛋白質的天然胺基酸只有20種,因此除了兩種胺基酸(甲硫氨酸和色氨酸)分別由一個密碼子決定以外,其他18種胺基酸分別對應2到6個密碼子。生物體內的基因正是一段由多種密碼子連接起來的「鹼基句子」,用來指導一種蛋白質的胺基酸組成和排序。

由此可見,大自然在創造生命時採用了「寫書」的方式,只需4個鹼基作為基本的「字母」,就可以創作出無數的「作品」。因此,研究者的主要工作通常就是閱讀「生命之書」中的一段段鹼基序列組成的「句子」,並揭示這些句子的含義和可能的生物學功能。

認識編碼基因

從「一字一義」到「複雜句式」

研究者最初認為,一個編碼基因用於指導一種蛋白質的合成。但隨著「閱讀」工作的深入,研究者發現,雖然這種「一基因一蛋白」的觀點在大腸桿菌等簡單生物體上基本成立,但在動植物等複雜生物體上,情況就明顯不一樣了——這類生物體擁有大量的「斷裂基因」,即在一個編碼蛋白質的鹼基序列之間插有若干段不編碼蛋白的鹼基序列,其基因內編碼蛋白質的鹼基序列稱為「外顯子」,不編碼的稱為「內含子」。換句話說,「斷裂基因」好比一段完整的「語句」被拆開,在中間加入了一些無意義的文字。

研究者還注意到,生命形式越高等,斷裂基因就越多。比如,在用於製造麵包和啤酒的酵母細胞里,只有4%的基因擁有內含子;而在小鼠或人的基因組內,絕大部分基因都擁有內含子。

為什麼大自然在創作「生命之書」時會發展出這樣的策略?這看上去與人類的文字創作歷史有著某種相似之處。在文學發展早期,創作者以描述為主,每句話都比較明確。但隨著文學的發展,創作者希望在一個句子裡表達出不同的內容和感覺,從而發展出了複雜句式。比如,愛爾蘭作家喬伊斯在其著名的「意識流」小說《尤利西斯》的許多句子中,就摻雜了沒有意義的文字。

對擁有這種策略的複雜生物體而言,一個斷裂基因內多個外顯子通常會受到不同的剪切和拼接,即「可變剪接」——如果把不同的外顯子用可變剪接方式進行連接,一個基因就能製造出多種蛋白質。目前已經知道,人類擁有的基因總數大約是兩萬多個,而能夠製造出的蛋白質種類顯然要遠遠大於這個數目。

發現表觀遺傳

生命「塗抹」的色彩也可傳代

「生命之書」擁有眾多編碼各種蛋白質的基因,生物體必須精準地控制這些基因,以便在需要時製造出特定的蛋白質。為此,生命在基因到蛋白質合成的過程中增加了一個中間步驟,稱為「轉錄」——把基因的鹼基序列之信息轉錄到一條稱為「信使RNA」(mRNA)的鹼基序列之上,然後用mRNA作為模板指導蛋白質合成。也就是說,生命通過轉錄方式選擇性地「閱讀」基因。

近年來的研究發現,DNA上的許多鹼基序列通常被化學基團修飾,其中最常見的是甲基化修飾。而DNA甲基化修飾的主要功能正是促進或抑制某個基因的轉錄活動。由於DNA鹼基序列上的化學修飾通常受到機體內外環境的調節,這就成了生命響應環境變化來控制基因轉錄的重要手段。

最重要的是,這些控制基因轉錄活動的化學修飾往往可以通過細胞分裂的過程,傳遞給子代細胞。顯然,在這一過程中,DNA鹼基序列本身並沒有發生改變。人們把這種在DNA鹼基序列上的化學修飾信息傳遞現象稱為表觀遺傳,並由此產生了一門新學科:表觀遺傳學。

如果把DNA鹼基序列的各種化學修飾比喻為不同的顏色,那麼「生命之書」就不再是最初人們認識到的單色印刷本,而是一本五顏六色的彩色圖書——不僅用鹼基序列寫出的「文字」可以被複印和傳遞,用化學基團塗抹在這本「書」里的各種「顏色」也可以被複印和傳遞。

經典遺傳學觀點認為,生命只採用多核苷酸鏈上的鹼基序列保存和傳遞所有可以遺傳的信息,且只有DNA鹼基序列上發生的改變才能夠遺傳給下一代。而環境等外部因素導致的個體性狀之改變,不論好壞,都不會遺傳給後代。

比如,個體因膳食不平衡導致的肥胖是不會遺傳給後代的。也就是說,個體在身體內建了一道無形的「牆」,機體在環境作用下後天所獲得的性狀信息,無法隔「牆」傳遞到其生殖細胞的DNA序列上,因此後代是不會受到親代生存環境之影響。而表觀遺傳現象的發現不僅打破了鹼基序列是生命遺傳活動唯一載體的教條,而且一系列研究證明,表觀遺傳信息在某些情況下可以從親代遺傳給子代。

由此可見,表觀遺傳活動把生命的開放性提升到了一個新的高度,使得從外部環境獲得的信息通過表觀遺傳修飾與機體內的DNA鹼基序列上的信息進行整合,不僅能夠影響個體當下的生理和病理活動,還能夠傳遞給下一代。

「生命之書」之 編寫篇

人類認識自然的一個主要目的是要改造自然,為人類服務。同樣,人類也不會停留在對生命的「閱讀」階段,而是努力地發展各種新技術去改造生命。為了改寫「生命之書」,研究者發展出了兩種基本工具:識別「字母」——測定DNA上4種鹼基的排列順序;編輯「文字」——剪切和連接DNA上的鹼基序列。

要想識別「生命之書」里的鹼基「文字」並對相關內容進行改寫,首先需要的就是DNA測序技術。早在1977年就誕生了第一代DNA測序技術。不過,當今生命科學研究的主流是高通量的第二代測序技術。它不僅大大降低了測序成本,還顯著提高了測序速度,用一代測序技術完成一個人類基因組30億個鹼基的測序需要三年左右的時間,而使用二代測序技術則可能在一周內完成。不久前,研究者又開發出能夠檢測單個多核苷酸分子的第三代測序技術。

人們往往用「剪刀加漿糊」形容文字編輯工作。要對「生命之書」里的鹼基序列進行編輯,同樣需要「剪刀加漿糊」。研究者開發出來的「基因剪刀」是各式各樣的核酸酶,其中最常用的是「限制性內切酶」。這類酶能夠識別DNA上特定的鹼基序列,從而找到準確的剪切位點,並實現DNA鏈內的定點切割。

2012年,美國科學家通過改造細菌的核酸酶系統發展出一種全新的「CRISPR-Cas9」技術,它被譽為「基因魔剪」,是目前進行基因編輯最強有力的工具,沒有之一。鹼基序列被剪切之後,需要用「漿糊」重新連接,為此,研究者有針對性地發展出了若干DNA連接酶,以便把DNA鏈間缺口連接起來。

基因工程誕生

生命「移花接木」帶來人類福祉

上世紀70年代,隨著DNA限制性內切酶的發現,研究者開始了「生命之書」的編寫工作,並把這類在分子水平上對DNA鹼基序列進行操作的技術稱為「基因工程」——通常是將外源基因轉入到受體細胞,從而使其特性發生改變或產生新的性狀。在這個過程中,首先是利用限制性內切酶把一種生物體(供體)DNA上的特定基因切下來,將其與運載工具(如質粒或病毒)上的DNA在體外人工連接,形成新的重組DNA,然後轉送到另一種生物體(受體)中進行擴增和表達。

基因工程誕生以來,為人類的福祉做出了巨大貢獻。生產治療糖尿病的胰島素就是一個典型範例。

2022年是胰島素用於臨床治療的第100周年。第一代醫用胰島素主要是源於牛或豬的胰腺提取物。這種生產方式不僅昂貴,而且產量很低,遠不能滿足臨床需求。1981年,美國研究者利用基因工程技術,將人的胰島素基因導入大腸桿菌,通過大腸桿菌大量生產重組人胰島素。從此第一代胰島素產品完全被這個第二代產品所取代。為了進一步提高胰島素的療效和安全性,研究者又對胰島素基因進行精細改造,獲得了第三代產品——重組胰島素類似物。

基因工程在農作物領域同樣發揮了巨大作用。1983年,科學家培育出了第一個轉基因作物——轉基因菸草;到2002年,世界上大約有550萬到600萬菸農種植轉基因菸草。1996年,美國的農場主開始種植轉基因大豆——在這種大豆里轉入了植物「矮牽牛」的一種抗性基因,從而可以抵抗除草劑。2021年,美國轉基因大豆種植面積占美國大豆總種植面積的95%,總產量為1.2億噸。

基因編輯疊代

為治癒遺傳病點亮希望之光

基於DNA限制性內切酶的基因工程技術極大改善了人類的生產生活,但該技術在基因編輯的應用中也表現出來一些明顯的不足,比如實驗流程比較複雜,結果獲取需時較長,編寫能力不夠精準等。

為此,研究者一直在努力開發更好的基因編輯技術。2012年,美國科學家道德娜和沙爾龐捷在細菌的基因編輯系統基礎上發展出了一種理想的基因編輯技術「CRISPR-Cas9」。這種技術的基本原理是:利用一段設計好的RNA序列「sgRNA」引導DNA內切酶「Cas9」至特定的DNA序列上進行剪切。該技術經過不斷疊代,目前不僅可以在細胞的基因組內插入長達3.6萬個鹼基的外源DNA片段,而且可以對細胞內的DNA乃至RNA進行單個鹼基的修改。

這類新型基因編輯技術的出現,顯著提升了人類抗擊疾病的能力,尤其為治療基因鹼基序列異常的遺傳性疾病提供了有力武器。據統計,目前已知的單基因遺傳病超過9000種,對人類的健康造成了巨大危害。

例如,血紅蛋白基因異常會導致「地中海貧血」。目前,全球有近3.5億地中海貧血基因的攜帶者,我國長江以南各省是該病的高發區,在部分高發地區,這種基因的攜帶者在人群中超過10%。過去,由於沒有好的治療藥物或方法,重度地中海貧血患者只能定期進行輸血;現在則有望利用CRISPR技術來治療地中海貧血。目前,全球進入臨床研究階段的地中海貧血基因編輯治療產品有6個,其中5個是採用CRISPR技術。

值得注意的是,CRISPR技術在改良農作物品種方面同樣有著巨大優勢。它不僅可以利用外源基因來改造作物,還能夠把作物自身的基因按照設計好的目標直接進行「改寫」。2013年,中國科學家高彩霞在世界上首次報導了利用CRISPR技術編輯水稻和小麥DNA序列的研究工作,並在2014年報導了使用CRISPR技術修改小麥的基因序列,從而使編輯後的小麥能夠抵抗小麥白粉病的侵襲。

可以說,在CRISPR等一系列基因編輯技術的推動下,傳統的那種不可控的作物自然育種未來將轉變為高度可控的作物設計育種。

「生命之書」之創作篇

人工合成生命始終是研究者在探索生命奧秘過程中一個不滅的夢想。

早在1828年,德國化學家維勒就在實驗室中利用氰酸銨合成了尿素,首次證明人類可以在實驗室里利用簡單的無機分子合成源自生物體內的有機化合物。上世紀60年代,中國科學家在世界上首次人工合成了第一個具有生物活性的蛋白質——由51個胺基酸組成的牛胰島素;1981年又在世界上首次人工合成了具有生物活性的多核苷酸鏈——由76個核苷酸組成的酵母丙氨酸轉移核糖核酸(酵母tRNAAla)。

隨著科學技術的發展,近年來研究者在實驗室合成生命的能力也在顯著提高,他們甚至試圖創作出自然界中不存在的「生命之書」。

試管里合成生命

人類基因組計劃將出「編寫版」

2010年5月,美國生物學家文特爾發布了世界上首個「人造生命」——科學家依據一種最簡單的細菌基因組序列信息,首次全人工化學合成了這個完整的、長度超過100萬個鹼基的基因組。而且,含有這一人造基因組的人工細菌能夠展現出相應的生命活動。

不久前,美國和中國等多國科學家聯合發起的「合成酵母基因組計劃」,提出了一個更為宏大的目標——把擁有大約2400萬個鹼基的酵母細胞基因組序列用化學合成的方式複製出來,目前這個項目進展估計已經過半。

上世紀90年代啟動的「人類基因組計劃」的目標,是把人類自身這部由30億個鹼基構成的「天書」通過測序技術完整地「閱讀」一遍。它的實施,為生命科學和醫學帶來了革命性變化。2016年5月,百餘位專家學者提出,要把人類基因組這部「天書」用化學合成的方式在試管里「寫」出來,稱為「人類基因組計劃——編寫版」(HGPWrite)。可以想見,一旦HGP-Write正式實施,必將對人類認識和控制自身帶來更為深遠的影響和意義。

設計和改造生命

按照人的意願進行全新創作

研究者的腳步並沒有停留在按照自然界已有的「生命之書」進行複製,而是開始按照人的意願來創作全新的「生命之書」。

例如,美國生物學家文特爾在其化學全合成的首個「人造生命」上進行了設計和改造,把他認為冗餘的或非必需的基因「句子」從該基因組上刪除,化學合成了一個比原基因組鹼基序列少了一半的「微型細菌基因組」。而含有這個微型基因組的細胞,其自我繁殖的速度比具有全長基因組序列的細胞快了近五倍。

自然狀態下的「生命之書」通常擁有64個「單詞」——遺傳密碼子,用來指導20種天然胺基酸合成蛋白質,其中有一些密碼子是冗餘的,稱為「同義密碼子」。2019年,英國科學家發布了一個「人造」大腸桿菌,它含有一個人工設計並化學合成的人造大腸桿菌基因組,其中全新設計併合成的人工基因「句子」大約包含400萬個鹼基對;在這些人工設計的基因里,只保留了61個遺傳密碼子,刪除了3個同義密碼子,這些改造過的基因序列仍然可以製造出正常的蛋白質。

研究者不僅試著修改基因「句子」和密碼「單詞」,還在鹼基「字母」上做起了文章。2014年,美國研究者宣布他們在大腸桿菌的DNA序列里加入了兩種非天然鹼基——dNaM和dTPT3,這兩個鹼基也能夠在體內通過複製的方式傳遞信息。而在2017年的論文裡,這些研究者進一步證明,這兩個插入到天然基因序列里的非天然鹼基,同樣能夠在蛋白質合成中引導特定的非天然胺基酸。

作者:吳家睿(作者為中國科學院生物化學與細胞生物學研究所研究員)

圖片:視覺中國

編輯:許琦敏

關鍵字: