利好!生物島實驗室「新冠病毒大數據在線分析系統」上線

fans news 發佈 2021-10-04T19:27:55+00:00

近日,「新冠病毒基因組大數據在線分析系統」攻關項目在生物島實驗室領導的大力支持下,上線運行並正式通過驗收。這是一套能夠支撐重大突發性傳染病病原基礎研究的生物信息學和計算生物學技術中台及數據中台,為新冠病毒基礎科研、防控與預警研究提供強有力的支持,填補了我國相關領域的空白。



近日,「新冠病毒基因組大數據在線分析系統」攻關項目在生物島實驗室領導的大力支持下,上線運行並正式通過驗收。這是一套能夠支撐重大突發性傳染病病原基礎研究的生物信息學和計算生物學技術中台及數據中台,為新冠病毒基礎科研、防控與預警研究提供強有力的支持,填補了我國相關領域的空白。

病毒將長期威脅人類,積極防控急需科技創新

新冠疫情爆發以來,國內疫情防控取得了舉世矚目的成效,在基礎研究方面也取得了大量的科研成果。

但是,新冠疫情防控形勢仍不容掉以輕心。一方面,各地輸入性病例導致的疫情反彈時有發生;另一方面,近期有研究表明,世界上有五億人生活在由蝙蝠帶來的冠狀病毒可能溢出的地區,而我國南部地區和周邊國家大都位於這一區域,類似於新冠肺炎這樣的新型突發性傳染性疾病將會如「達摩克利斯之劍」始終高懸在人類頭頂,必須時刻警惕並採取積極措施。

有效、快速地對病毒預警預防,需要在病毒溯源、病毒基因組注釋、基因組變異和疫苗的有效性分析、病毒對人類可能的長期危害研究、新的藥物作用靶點發現等方面予以長期關注。而此前國內一直缺少一個系統性的、依託前沿IT技術、能支撐包括新冠病毒在內的重大突發性傳染病病原基礎研究的生物信息學和計算生物學技術中台和數據中台。

為此,生物島實驗室牽頭整合中科院北京基因組研究所(國家生物信息中心)、中科院上海營養與健康研究所、中國醫學科學院系統生物學研究所、中山大學、上海同濟大學的科研力量,在中科院北京基因組研究所(國家生物信息中心)新冠大數據平台和中科院B類戰略性先導科技專項」多維大數據驅動的中國人群精準健康「的項目支持下,協同攻關,基於實驗室與「火山引擎」合作開發的生物醫學大數據「作業系統」-Bio2S的開源框架體系,構建了部署在雲端的「新冠病毒基因組大數據在線分析系統」。該系統於2021年9月27日正式上線運行,除支撐本實驗室的科學研究外,也為全國的科研工作者開展新冠病毒基礎科研、防控與預警研究提供強有力的數據中台和技術中台,正好填補了這一空白。

大數據分析系統將為疫情防控提供有力保障

據實驗室介紹,「新冠病毒基因組大數據在線分析系統」具有統一的、一站式的方便用戶訪問的服務界面,其具備八大功能模塊。

一、新冠變異株檢測系統-CMM-Group。該應用模塊通過合併新冠病毒基因組上共出現的核苷酸突變對,抽提出完整的共突變模塊,用於表徵不同基因型組別的新冠病毒,實現對新冠病毒變異體的簡單直觀的分類。同時能夠識別當前流行變異株以及有潛在流行能力的變異株,通過它們的時空分布揭示主要流行時間和流行區域,並提供在線分組信息、進化樹和突變信息展示。用戶可通過該應用實時追蹤新冠病毒的進化方向和傳播路徑,為新冠病毒疫情防控的快速響應提供科學依據。

二、新冠病毒變異分析系統-VASS。該應用模塊可以在線實時分析新冠病毒基因組變異、變異注釋及其可視化。用戶通過在線上傳新冠病毒序列,進行變異檢測與功能注釋。應用會根據序列進行變異檢測,並反饋檢測到的變異在所有新冠菌株中的時空信息,如變異的地理分布特徵、最早出現時間等,還能在結果中提醒用戶注意可能影響較大的基因組變異,如與引物/探針相關的變異或影響病毒與宿主ACE2結合親和力的變異。

三、新冠病毒抗原表位分析系統-SAS。該應用模塊能夠計算分析所有S蛋白突變體的表位、表位區域和潛在的抗原性。在此基礎上,針對新出現的漂移突變體生成監測報告,並進一步提示具有代表性的mAbs的免疫保護覆蓋率的動態變化。資料庫預先定義的表位區域包括驗證表位和預測表位。對於每個被查詢的突變體,用戶可以操作抗原聚類樹或熱圖來可視化查詢、對比S和基準S蛋白之間的抗原性相似度。提供mAbs動態監控,支持以折線圖圖標形式,幫助監測抗原性的變化,方便mAbs疫苗的開發,同時還可以針對S蛋白突變,評估其對疫苗保護作用的影響。

四、新冠病毒基因組分析工具集-ViGTK。該應用模塊整合了超過四百萬條來自所有公開資料庫中的新冠病毒全基因組序列、全球疫情數據、科研論文數據,實現日級的數據更新,整合病毒系統分類、序列聯配、變異分析、進化網絡、病毒鑑定、免疫抗原等工具,持續對新冠病毒組學數據進行跟蹤分析,每日發布新冠病毒疫情日報和變異日報,持續跟蹤病毒的疫情變化、數據變化和變異情況。可以實現針對病毒基因組的所有信息的全方位智能化檢索、關聯統計分析、直觀展示基因組變異信息,病毒動態演化趨勢、時空傳播路徑,方便科學研究人員根據自己的科研需求,設計檢索思路,發現關鍵信息。

五、SARS-CoV-2基因組瀏覽-GenBrowser。該應用模塊基於自主研發的新的理論分析體系,開發了完整的數據分析流程和數據可視化模塊。利用新的理論框架,基於建立的新冠病毒數據倉庫,GenBrowser在線版可以順利完成十萬、百萬數量級新冠病毒基因組序列的分析和日常更新,可為國內和國際防疫防控的相關團隊,提供系列方便使用的免費工具,用以監測病毒變異頻率的變化,監測境外輸入的病毒株系可能的來源。

六、新冠病毒知識圖譜系統-KGCoV。該應用模塊提供可對臨床數據、基因組信息和流行病學數據進行整合分析的知識圖譜工具。構建並匹配新冠肺炎(COVID-19)的流行病學信息和新型冠狀病毒(SARS-CoV-2)的基因組數據,並採用組合管理方法,整合了生物信息學工具生成的變異信息,為重構COVID-19感染路徑及其進化趨勢提供有力證據,同時可視化地展示基因組與流行病學相關的信息。此外,該應用還整合了新型冠狀病毒基因組,新冠肺炎相關的流行病學、臨床症狀、旅行史、接觸史、文獻以及世界167個以上國家的新聞媒體報導等數據資源。

七、病毒基因組自動化鑑定注釋系統-VIC。該應用模塊是病毒基因組檢測分析和注釋工具。可直接對接各種宿主及環境樣本的RNA二代測序原始數據,具有對數據全自動質量控制、拼接和病毒組成分析的功能,能對樣本中可能存在的包括新型冠狀病毒在內的各種病毒進行快速檢測,並可在線分析其相對載量。

八、新冠AI影像識別系統。該模塊可提供基於胸部CT影像的新冠肺炎智能輔助篩查,提供病灶智能識別與精準勾畫、新冠概率百分比參考、雙肺病灶容積比、雙肺CT值密度分析、四維重構圖顯示、影像模板參考,具有PACS系統基礎功能(手動勾畫、窗位調節、量尺、旋轉、CT值等),產品能準確、快速輔助醫生對個體患者進行疾病篩查判斷,精準了解個體患者在治療後病灶的精準變化,為臨床醫生下一步的治療提供有力的幫助。

生物島實驗室「新冠病毒基因組大數據在線分析系統」攻關項目驗收專家組組長陳潤生院士、副組長趙國屏院士代表專家組對生物島實驗室大數據團隊在李亦學研究員的帶領下,快速地整合、開發和部署該系統給予了高度讚賞,一致認為該系統將新冠大數據分析的技術中台與大數據體系融為一體,功能豐富,性能卓越,填補了我國新冠病毒分析缺乏系統性技術中台的空白。希望在提供服務的過程中,不斷發展優化各模塊的功能,拓展其應用,並強化該系統的工程化運維能力,對新冠病毒的深入研究及其預防醫學與臨床醫學的實戰處置提供有力的支撐和廣泛的應用。未來,平台還將與國家呼吸醫學中心等醫療機構進行數據對接,為大數據時代感染性疾病防控研究工作奠定範式轉變、能力提升的基礎。

陳西

關鍵字: