Cell專刊:機器學習 & 基因編輯

bioart 發佈 2020-06-14T12:19:32+00:00

在當下社會和科研中,機器學習已經多方面得到應用,例如遊戲博弈、推薦系統、自動駕駛等等。同時人們也在各個生物特徵之間建模,例如預測基因突變是如何影響基因表達、可變剪切或者是轉錄因子結合。

撰文、編譯丨奚望


1、機器學習如何改變生物醫學



機器學習適用於從大規模異質性的數據中尋找特徵。在當下社會和科研中,機器學習已經多方面得到應用,例如遊戲博弈、推薦系統、自動駕駛等等。而在生物醫學領域,人們也已經將機器學習用於基因組分析、疾病診斷和藥物研發等過程中。現在越來越多的研究項目認識到了機器學習的潛力,並投入到大規模的數據採集中。機器學習可分為監督和無監督型,其中包含集成學習、深度學習、貝葉斯學習等多類方法。作者接著列舉了機器學習在生物醫學多個關鍵領域內的應用:



提升臨床圖像和分子診斷水平

臨床圖像採集技術在飛速發展,人們現在已經可以獲得三維甚至是四維的器官和組織圖像了。許多基於深度學習的CAD軟體也隨之誕生,幫助醫生解釋圖像含義,從而輔助糖尿病或是乳腺癌的診斷。通常訓練數據集越大,深度學習的算法精確性越高。


分子化驗可以從血液、唾液等樣本中分析出遺傳突變、基因表達等信息。由於其數據本身的高位特徵,利用機器學習算法來尋找生物標誌物是順理成章的。在癌症生物學中,人們利用DNA甲基化和核小體位置來預測腫瘤起源與預後。將多種組學數據整合能產生更好的潛在效果。


多尺度建模和精確治療

機器學習在生物醫學中最有潛力的應用領域就是精準醫療。以癌症為例,面對個體攜帶的基因突變、疾病的不同階段還有上百種不同的藥物,人們希望利用機器學習算法精確地預測病人手術和用藥後的反應。同時人們也在各個生物特徵之間建模,例如預測基因突變是如何影響基因表達、可變剪切或者是轉錄因子結合。未來的模型將會向多維度和多任務的方向發展。


人們還希望,除了直接將治療結果作為輸出以外,算法還能對各種治療手段進行排序,從而協助醫生做臨床決定。此外,機器學習還可被用來搜索文獻或是公共資料庫中的相關知識。


健康管理與調控

人們對於機器學習應用的預期,不僅在於疾病治療,還有健康和疾病的控制管理。社會對於健康管理有著巨大的渴求,而通過整合在疾病預防和治療上的理念,機器學習在其中大有可為。


可穿戴電子設備是最好的例子之一。人們時刻佩戴它們,來實時監測自身健康狀態。他們採集海量數據,包括運動、脈搏、呼吸率、體溫、血壓、氧含量等等。這對於糖尿病,動脈硬化,心臟病乃至早發帕金森病都可能起到監測。研究者甚至希望將深度學習與手機拍照結合診斷皮膚癌。整合和建模大量健康數據是機器學習在健康管理中的關鍵角色。


人們有充分的理由在現代生物醫學的各個環節使用機器學習來解決所面臨的問題。建立能在疾病檢測、診斷和治療中扮演可靠角色的機器學習系統是未來的目標。


2、基於AAV載體遞送的CRISPR基因編輯治療



自從發現基因突變和損傷會造成疾病之後,基因治療(gene therapy)就一直是人們的希望。然而傳統的插入一個野生型基因拷貝的方法有許多局限性,它們缺乏表達調控,也不能解決獲得型的病理突變。人們還是希望能在細胞的自然環境下修復基因。


其實細胞自身就有著一天重複上千次的修復系統。在面臨DNA損傷或是雙鏈斷裂的時候,細胞會使用非同源末端連接(NHEJ)或同源定向修復(HDR)來恢復DNA序列。人們進一步觀察到,由內切酶引發的雙鏈斷裂可以在真核細胞中激活HDR,因此開展了一系列尋找此類可編程的內切酶的研究,包括ZFN,TALEN和CRISPR-Cas系統。基於CRISPR的基因編輯是目前應用最廣泛,也最具臨床潛力的技術。基因編輯工具的體內遞送依然是基因治療的一大瓶頸,而腺相關病毒(AAV)載體是目前領先的遞送平台。它產生免疫反應小,表達穩定,因此有諸多優勢。本位對基於AAV的CRISPR基因治療展開了一系列討論:


CRISPR應用

基於NHEJ的基因破壞 - NHEJ是一個不斷重複剪切-修復的過程,直到一個indel形成,阻止核酶的識別才停止。這種看似破壞型的修復在某些特殊情況下卻可以被用於治療,例如PCSK9的破壞可以釋放LDL受體,降低血脂;CCR5的破壞可以製造出抗HIV的T細胞。在CRISPR系統的引導下,NHEJ甚至可以只破會兩種allele中的一個。同時,雖然NHEJ的修復結果存在異質性,其範圍是可以預測的。這種單次切斷DNA(single cut)的方式在應用時也更為簡便。


基於HDR的精確修復 - HDR的理念很直接,即改正突變的位點,但實際操作上卻面臨效率較低等問題。不過,在那些只需要改變一小部分細胞的情形下還是具備應用價值。例如在HT-1小鼠內修復一部分肝細胞的FAH基因,就可以使得這些細胞獲得生長優勢,從而改變疾病性狀。另一種手段是利用HDR插入外源DNA序列,其中最著名的是CAR-T。使用CRISPR編輯從病人體內取出的T細胞,插入目標CAR序列,並將T細胞送回病人體內後,CAR-T攜帶有新的抗原受體,可以靶向性識別和殺死腫瘤。


大規模DNA編輯 - 有些疾病的患者在特定基因上存在大量突變,或是當突變有很強的異質性時,例如杜氏肌營養不良症(DMD),此時可以利用基因編輯系統將攜帶突變的外顯子片段整個切除並替換。而其中Cas9和guide RNA的遞送都可以用AAV載體完成。


RNA靶向治療 - 理論上,靶向RNA的編輯具有可逆性的優勢。而Cas13等蛋白則較傳統的RNAi特異性更強(專家點評Cell丨楊輝/周海波等利用CasRx在神經性疾病治療領域取得重大進展;專家點評丨楊輝/黃鵬羽合作組首次證實Cas13d系統在成體動物體內具有靶向沉默RNA的活性)。在腫瘤內不斷遞送針對KRAS的guide RNA被證明可以減緩小鼠腫瘤生長。AAV同樣可以遞送Cas13系統。



Cas-效應蛋白融合體系 - 除了基因編輯之外,Cas9還可以被當作一個DNA結合蛋白使用,構建CRISPRi/a的基因干擾或激活系統。將dCas9與KRAB融合可以顯著抑制目標基因表達,有時甚至比基因破壞更有效。同樣,dCas9-VP64也能上調基因表達。將dCas9與甲基化或去甲基化酶結合可以改變表觀修飾。此外base editing和prime editing也是修復單鹼基或小範圍基因突變的有效手段。


AAV載體遞送

ex vivo/in vivo - ex vivo是指基因編輯發生在分離到體外的細胞上,編輯後將擴增的細胞重新植入人體。ex vivo方法的主要優勢在於,體外基因編輯技術已經非常成熟了。在體外也更容易對基因編輯的結果進行篩查。在體外操作還可以避免免疫系統對基因編輯的排異反應。然而主要的問題在於,可以使用ex vivo方法操作的人體細胞種類太少了,且大都是終端分化的細胞,因此in vivo的方法是必不可少的。而in vivo非常依賴於一個安全的遞送系統。AAV載體已經在多個模型上獲得成功,其在CEP290基因編輯上的應用已經進入到臨床實驗階段。


AAV載體並不大,總長度上限約為5kb,其中可留給CRISPR工具的大小約為4.7kb。這對Cas蛋白造成了很大的限制。人們通過尋找更小的Cas9蛋白來解決這個問題。但是上文提及的Cas-效應蛋白融合系統需要更大的容量。這是AAV基因治療領域的長期問題。通常的解決方法是將這些蛋白分別包裝在兩個AAV載體上,使其通過同源重組完成重構。重組的過程可以發生在DNA、RNA或是蛋白水平上。


人們在應用CRIPSR做基因編輯的同時也希望對潛在的不利結果進行控制。一種方法是構造可誘導的表達體系,例如藥物誘導、光激活等等。另外一種則是通過構造可自我切除的AAV-CRISPR系統來達到暫時性改變基因表達的目的。此外,還可以利用不同組織攜帶的不同miRNA來控制CRIPSR系統在人體內的空間分布。


AAV-CRISPR系統和傳統基因治療手段面臨著相同的障礙,例如宿主免疫反應,遞送效率和載體構建等。此外Cas蛋白的獨特性也帶來了特殊的安全風險。脫靶效應也是人們在討論CRISPR的優勢時同時會提起的問題。然而總的來說,CRISPR和AAV為如何利用自然系統作為生物工具提供了極好的例子。對AAV-CRISPR系統進行進一步研究和仔細的臨床觀察在未來會產生更多治療機會。


原文連結:

https://doi.org/10.1016/j.cell.2020.03.022

https://doi.org/10.1016/j.cell.2020.03.023


製版人:珂

關鍵字: