新冠病毒的未來是什麼?計算機模型預測SARS-CoV-2主要突變體

醫學營養治療 發佈 2022-05-27T08:32:20.591493+00:00

生物通 2022-05-27 12:37 發表於廣東自大流行早期以來,世界各地的研究人員一直在努力預測不同的SARS-CoV-2病毒變異的適應度。但是以前的模型不能同時比較所有的變異,或者只需要花費幾天的時間來處理幾千個基因組。

生物通 2022-05-27 12:37 發表於廣東


自大流行早期以來,世界各地的研究人員一直在努力預測不同的SARS-CoV-2病毒變異的適應度。但是以前的模型不能同時比較所有的變異,或者只需要花費幾天的時間來處理幾千個基因組。

從患者樣本中分離出的感染 SARS-COV-2(黃色)的細胞(紫色)的電子顯微鏡圖像


麻省理工學院布羅德研究所、哈佛大學和麻薩諸塞大學醫學院的科學家開發了一種機器學習模型,可以分析數百萬個SARS-CoV-2基因組,並預測哪些病毒變異可能會主導並導致COVID-19病例激增。這個名為PyR0(發音為pie-are- none)的模型可以幫助研究人員識別病毒基因組的哪些部分不太可能變異,從而成為疫苗的良好目標,對抗未來的變異。


這些發現發表在Science雜誌上。


研究人員使用2022年1月GISAID資料庫中的600萬個SARS-CoV-2基因組訓練了機器學習模型。他們的工具也可以評估基因突變對病毒適應度的影響——它在一個種群中繁殖和傳播的能力。當該團隊從2022年1月開始在病毒基因組數據上測試他們的模型時,預測了BA2變異的增加,這種變異在2022年3月在許多國家成為主流。PyR0也在2020年11月底之前識別出alpha變種(B.1.1.7),比世界衛生組織將其列為令人擔憂的變種早一個月。


該研究團隊包括第一作者Fritz Obermeyer,以及資深作者Jacob Lemieux,Broad研究所的成員Pardis Sabeti。


PyR0基於名為Pyro的機器學習框架,該框架最初是由Uber AI Labs的一個團隊開發的。2020年,該團隊的三名成員,包括Obermeyer和該研究的第二作者Martin Jankowiak,加入了Broad研究所,並開始將該框架應用於生物學。


Lemieux說:「這項工作是生物學家、遺傳學家、軟體工程師和計算機科學家共同努力的結果。」「我們能夠解決公共衛生中一些真正具有挑戰性的問題,任何單一的學科方法都無法單獨回答這些問題。」


Sabeti說:「這種基於機器學習的方法可以查看所有數據,並將其組合成一個單一的預測,這是非常有價值的。它讓我們在識別正在出現的潛在威脅方面占據優勢。」


新冠病毒的未來

自大流行早期以來,世界各地的研究人員一直在努力預測不同的SARS-CoV-2病毒變異的適應度。但是以前的模型不能同時比較所有的變異,或者只需要花費幾天的時間來處理幾千個基因組。


相比之下,PyR0可以在大約一個小時內分析數百萬個基因組——所有公開的SARS-CoV-2數據。它通過將相似的序列組合在一起,然後根據它們共享的突變群來定義基因組的「集群」。PyR0專注於突變,這種突變可以出現在多種變異中,因此它比專注於病毒變異的模型具有更大的統計能力。


接下來,該模型確定哪些突變變得更常見,並估計每個突變導致病毒傳播的速度。它還根據基因組成來估計不同變異病例的增長速度。


通過確定哪些突變對特定變異的適應度重要,該模型還為COVID-19的傳播和發展提供了生物學見解。例如,了解關鍵的突變可以幫助科學家預測新的變異是否更具有傳染性或逃避中和抗體,也可以幫助他們決定更詳細地研究哪些突變。


「SARS-CoV-2基因組現在積累了許多突變,因此檢測所有突變組合變得極具挑戰性,這種分析的優勢在於,它從整體上看整個基因組,可能會指出在實驗室中受到較少關注的突變或變異。」


早期預警

研究人員說,他們的研究表明,當前病毒適應性的增加源於病毒逃避免疫反應的能力。他們還說,公共衛生官員在對變異的序列和特徵發出預先警告後,可以實施具體措施來管理病例計數。而且知道哪些突變有助於變體的生存,可以幫助科學家為未來的疫苗選擇更好的靶點。


這種或類似模型的新版本可以通過考慮突變之間的相互作用進一步提高預測。研究人員說,隨著進一步的工作,他們的模型可以幫助監測其他有足夠基因數據的病毒。


「我們擁有的大量數據,加上我們開發的方法,使我們能夠實時看到病毒在世界各地不同地點的演變,這是在以前的疫情中不可能做到的。在1917年,人們只知道自己是否得了流感。現在,我們有了數千種不同的SARS-CoV-2亞譜系的非常精確的視圖。這是驚人的!」

參考文獻

Analysis of 6.4 million SARS-CoV-2 genomes identifies mutations associated with fitness

關鍵字: