微生物組數據分析:近期有哪些值得關注的新方法新工具?

熱心腸研究院 發佈 2024-01-04T12:40:14.802944+00:00

Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data。


Nature子刊:高精度去污方法SCRuB助力微生物組數據分析

Nature Biotechnology——[68.164]

① 開發出一種高精度去污方法(微生物組污染物去除的來源追蹤;SCRuB),通過結合多個樣品和對照的共享信息,進而精確識別和清除污染;② 在多個數據驅動的模擬和實驗數據集中,SCRuB的準確性比最先進的方法(microDecon及decontam等)平均高出15-20倍;③ SCRuB在多個生態系統、數據類型和測序深度方面均展現出較好的穩健性;④ SCRuB可從血漿DNA中改善黑色素瘤分類,並利用被淨化的腫瘤微生物組數據對黑色素瘤患者的治療反應進行較好預測。

【主編評語】

基於測序的微生物群落分析方法很容易受到污染,這可能會掩蓋生物信號或產生假象。使用對照組進行計算去污染的方法是常規使用的,但不能最佳地利用不同樣品的共享信息,也不能處理來自污染或生物材料泄漏到對照組的分類群。近日,哥倫比亞大學研究人員在Nature Biotechnology發表最新研究,開發出一種高精度去污方法SCRuB(https://github.com/Shenhav-and-Korem-labs/SCRuB),通過結合多個樣品和對照的共享信息,可精確識別和清除污染,值得關注。(@九卿臣)

【原文信息】

Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data

2023-03-16, doi: 10.1038/s41587-023-01696-w


基於菌株特異性法或可用於檢測交叉樣本的污染?

Microbiome——[16.837]

① 宏基因組分析會受到DNA污染影響,其本身的污染還未報導,採用高解析度菌株特異性法,評估兩個大規模臨床宏基因組學數據集污染;② 將菌株共享映射到DNA提取板,在一個數據集中識別到陰性對照和生物樣本中的孔間污染,污染可能發生在萃取板相同或相鄰列/行上的樣品,不是相隔很遠的樣品;③ 在其他數據集中,也存在外部衍生物對DNA樣本污染,生物量較低樣本污染更顯著。④ 建議使用基因型特異性監測法和陰性對照,確保結果完整性和可重複性。

【主編評語】

在高通量測序中,污染是不可避免的,雖然DNA提取試劑盒等外部污染源已經被廣泛報導和調查,但來自研究本身的污染仍然被低估。近日,美國加利福尼亞大學研究人員在Microbiome發表最新研究,對於低生物量樣品來說,污染尤其成問題,並且孔間污染比外部污染更難檢測,是微生物組領域應該關注的問題。未來建議使用基因型特異性監測方法和陰性對照,以確保結果的完整性和可重複性。(@九卿臣)

【原文信息】

Using strain-resolved analysis to identify contamination in metagenomics data

2023-03-02, doi: 10.1186/s40168-023-01477-2


國內團隊:基於宏基因組測序數據組裝方法的基準測試

Briefings in Bioinformatics——[13.994]

① 多種宏基因組組裝工具被開發用於簡化組裝並解決微生物基因組中序列重複的問題;② 使用由一系列測序技術(短讀長、鏈讀長和長讀長測序)生成的32個宏基因組測序數據集,對19種主流組裝工具進行全面的基準測試;③ 長讀長組裝工具可產生較高的contig連續性,但未能揭示一些中/高質量的MAGs;④ 鏈讀長組裝工具可從人類腸菌中獲得最高數量的接近完整的MAGs,基於短和長讀長測序的雜合組裝是提高總組裝長度、獲得近乎完整MAGs有希望的方法。

【主編評語】

宏基因組組裝是一種利用宏基因組測序數據重建微生物基因組的有效方法,多種組裝工具也被開發用於簡化組裝並解決微生物基因組中序列重複的問題。然而,目前還沒有對宏基因組測序技術進行全面評估,也缺乏選擇合適的宏基因組組裝工具的實用指南。近日,香港浸會大學張璐及團隊在Briefings in Bioinformatics發表最新研究,使用由一系列測序技術生成的32個宏基因組測序數據集,對19種主流組裝軟體工具進行了全面的基準測試,發現通過雜合組裝是提高總組裝長度、獲得近乎完整MAGs有希望的方法,值得關注。(@九卿臣)

【原文信息】

Benchmarking Genome assembly methods on metagenomic sequencing data

2023-03-14, doi: 10.1093/bib/bbad087


國內團隊:從宏基因組序列中加速識別病原體的新工具GPMeta

Briefings in Bioinformatics——[13.994]

① GPMeta基於GPU加速方法,可以快速且準確地從複雜的微生物組數據中識別病原體;② 基於模擬數據和臨床樣本的菌群數據集,GPMeta在速度和準確性方面均優於現有的鑑定工具(如Bowtie2, Bwa及Kraken2等);③ GPMeta還提供了一種聚類算法(GPMetaC),用於提升高度同源序列的鑑定準確性,且GPMetaC表現出比其他產品更高的精度和召回率;④ GPMeta支持多GPU同時對拆分資料庫進行微生物序列比對和分類,可自動合併多個子資料庫的結果。

【主編評語】

宏基因組測序由於其無偏性和低成本特性,是臨床微生物檢測中識別病原體的有力工具。然而,在臨床相關的時間框架內對序列進行分類的挑戰阻礙了測試技術的臨床實踐。近日,華大基因Zengquan He、Dongfang Li、Xuebin Wang及團隊在Briefings in Bioinformatics發表最新研究,開發了GPMeta(https://github.com/Bgi-LUSH/GPMeta),可以快速且準確地從複雜的微生物組數據中識別病原體,相比其他工具性能較好,值得關注。(@九卿臣)

【原文信息】

GPMeta: a GPU-accelerated method for ultrarapid pathogen identification from metagenomic sequences

2023-03-14, doi: 10.1093/bib/bbad092


從宏基因組數據中鑑定真核生物的工具CORRAL

Microbiome——[16.837]

① 開發出CORRAL工具,通過與真核生物特異性標記基因的比對和馬爾可夫聚類在鳥槍宏基因組數據中鑑定真核生物;② 通過結合模擬數據集、模擬社區標準和大型公開的人類微生物組研究,CORRAL不僅靈敏準確,而且能夠推斷出標記基因參考中未包含的真核生物的存在,如新菌株;③ 在MicrobiomeDB.org資源上公開了CORRAL,生成了人體各種環境中存在的真核生物圖譜,並將它們的存在與研究協變量聯繫起來;④ CORRAL允許真核生物檢測自動化並大規模進行。

【主編評語】

微生物群落中,真菌和原生生物等真核生物經常與細菌和古菌共存。大多數環境中,由於原核信號占主導地位,因此很難用「鳥槍法」宏基因組測序來研究它們的存在。最近的真核生物檢測方法是使用真核生物特異性標記基因,但它們沒有包含處理參考標記基因集中沒有代表的真核細胞存在的策略,並且它們與基於網絡的用於下游分析的工具不兼容。Microbiome近期發表的文章,開發出從鳥槍宏基因組數據中鑑定真核生物的工具——CORRAL,並進行公開分享。(@章台柳)

【原文信息】

Improved eukaryotic detection compatible with large-scale automated analysis of metagenomes

2023-04-10, doi: 10.1186/s40168-023-01505-1


用於病毒宏基因組數據分析的新工具ViroProfiler

Gut Microbes——[9.434]

① 開發了一種用於病毒宏基因組數據分析的新工具ViroProfiler,將分析工具、資料庫與工作流管理系統結合,可對病毒組數據進行靈活且可重複的分析,並顯著縮短處理時間;② 在模擬數據集中,ViroProfiler性能優於現有病毒分類工具,對病毒的分類準確度也高於屬級;③ ViroProfiler可檢測病毒複製周期,預測宿主並識別病毒序列中的輔助代謝基因;④ 基於先前發表的病毒宏基因組數據,ViroProfiler在病毒識別、分類及功能注釋等方面均有顯著提升。

【主編評語】

噬菌體通過調節細菌群落,在大多數生態系統的維持和功能中發揮著核心作用。然而,由於缺乏健全的生物信息學標準,目前對其多樣性的理解仍然有限。近日,德國亥姆霍茲慕尼黑中心病毒所Li Deng及團隊在Gut Microbes發表最新研究,開發了一種用於病毒宏基因組數據分析的新工具ViroProfiler(https://github.com/deng-lab/viroprofiler),可對病毒組數據進行靈活且可重複的分析,並顯著縮短處理時間。此外,ViroProfiler可以大大提高病毒組研究中的數據分析質量,並為更標準化地描述複雜生態系統中的病毒群落奠定新基礎,值得關注。(@九卿臣)

【原文信息】

ViroProfiler: a containerized bioinformatics pipeline for viral metagenomic data analysis

2023-03-30, doi: 10.1080/19490976.2023.2192522


用於微生物基因組學研究的工具箱GEN-ERA

GigaScience——[7.658]

① 開發了GEN-ERA工具箱,專為細菌和小型真核生物比較基因組學設計,無需任何安裝,允許下載、組裝和儲存(宏)基因組數據;② GEN-ERA還提供了同源推斷、分類樹重建、核苷酸序列比較和代謝建模等流程;③ 在早期分支藍藻的18個基因組數據集上測試,可提供最新的Gloeobacterales(藍藻細菌進化樹中第一個分化群體)系統基因組分析;④ GEN-ERA可供沒受過專門生信培訓的用戶使用,也可供微生物分類學和比較基因組學的實驗室使用,應用價值廣泛。

【主編評語】

用於分類學研究的可重複基因組工具的可用性與微生物收集相關。近日,比利時研究人員在GigaScience發表最新研究,開發了GEN-ERA工具箱(https://github.com/Lcornet/GENERA),一種專門用於細菌和小型真核生物比較基因組學平台,包含多種常見的分析流程(核苷酸序列比較和代謝建模等),可供沒受過專門生信培訓的用戶使用,應用價值非常廣泛,值得關注。(@九卿臣)

【原文信息】

The GEN-ERA toolbox: unified and reproducible workflows for research in microbial genomics

2023-04-10, doi: 10.1093/gigascience/giad022


低豐度物種和抗性基因的最優宏基因組組裝比較(綜述)

Briefings in Bioinformatics——[13.994]

① 生成一種半合成的長讀(LR)和短讀(SR)宏基因組數據集;② 發現SR組裝者以高精度恢復更多抗生素抗性基因(ARG),而LR組裝允許將ARG放置在更長大腸桿菌特定重疊群中,確定其分類起源;③ 分離物中摻入競爭菌株時,所有裝配器類型的強度保持不變,但精度都降低;④ 對於菌株鑑定和已知基因背景LR組裝最優,對於基本準確的基因鑑定SR組裝器最優;⑤ 混合裝配提供連續性和基本精度,但要在多個平台上生成數據,存在應變多樣性時出現高誤裝配率。

【主編評語】

測序和計算機技術的進步使高解析度評估複雜菌群的宏基因組組裝成為現實。基於此,Briefings in Bioinformatics發表的綜述專門評估了長讀(LR)和短讀(SR)以及混合(HY)宏基因組組裝器在低豐度物種上的性能和優缺點。(@好雨)

【原文信息】

Comparison of long- and short-read metagenomic assembly for low-abundance species and resistance genes

2023-02-20, doi: 10.1093/bib/bbad050


國內團隊:空間宏轉錄組測序技術SMT

Genome Research——[9.438]

① 開發了空間宏轉錄組測序及一體化生信分析技術SMT,可實現宿主基因表達和微生物分布的空間定位及聯合分析;② 基於小鼠大小腸組織及結直腸癌病人手術樣品,利用螢光原位雜交、傳統批量測序等技術證明SMT分析結果可靠性較高;③ 通過模擬可控的組織駐留菌,發現不同濃度菌液內的菌形成深淺不同的電子「菌斑」,通過計算可定量顯示SMT捕獲率和召回率;④ SMT還可復現一些菌群與宿主的互作,如螺桿菌屬的高免疫原性及梭菌屬穿越腸壁的移行能力。

【主編評語】

近年來,空間轉錄組技術發展迅速,可解析實體組織基因表達的空間異質性,確定其細胞組成及功能特點。然而標準的ST技術在評估宿主細胞與駐留微生物的互作研究方面仍存在精度及通量方面的局限性。近日,上海市免疫學研究所陳磊及團隊在Genome Research發表最新研究,開發了空間宏轉錄組測序及一體化的生物信息分析技術SMT, 通過結合空間轉錄組數據和微生物豐度數據,可在空間層面揭示宿主細胞和微生物的大致分布與互作狀態。總之,該研究為微生態研究提供了有力的工具,值得關注。(@九卿臣)

【原文信息】

Simultaneous profiling of host expression and microbial abundance by spatial metatranscriptome sequencing

2023-03-27, doi: 10.1101/gr.277178.122


Nature子刊:新型單細胞RNA測序或可助力預測細菌毒素?

Nature Microbiology——[30.964]

① 開發了基於探針的細菌測序(ProBac-seq),是一種使用DNA探針庫和現有商業微流體平台進行單細胞RNA測序的方法;② 對每個實驗的數千個單細菌細胞的轉錄組進行測序,平均每個細胞中可檢測數百個轉錄本;③ 應用於枯草芽孢桿菌和大腸桿菌,ProBac-seq可正確識別已知細胞狀態,並揭示先前未報導的轉錄異質性;④ ProBac-seq發現不產生毒素的產氣莢膜梭菌細胞可得到充足營養,而產毒的細胞似乎缺乏多種關鍵的營養物質,這類亞群可由醋酸鹽控制。

【主編評語】

克隆細菌種群依賴於單個細胞間的轉錄變異來產生特殊的狀態,從而增加適應性。要了解所有的細胞狀態,就需要在單細胞水平上研究等基因細菌種群。近日,哈佛大學、普林斯頓大學等研究人員在Nature Microbiology發表最新研究,利用DNA探針庫和現有商業微流體平台開發了一種基於探針的細菌單細胞RNA測序方法(ProBac-seq),發現細菌群落中基因相同的細胞(如產氣莢膜梭菌)具有不同的功能,一些成員表現得更溫順,而另一些成員則會產生毒素,值得關注。(@九卿臣)

【原文信息】

Probe-based bacterial single-Cell RNA sequencing predicts toxin regulation

2023-04-03, doi: 10.1038/s41564-023-01348-4


感謝本期日報的創作者:九卿臣,YANG WEI,往、昔℡,章台柳,Leo,Sunflower

點擊閱讀過去10天的日報:

04-21 | BMJ最新研究:糖尿病患者如何選飲料?

04-20 | 10文一覽:益生菌研究有何新動態?

04-19 | 房靜遠等Nature子刊:他汀抑腸癌,腸菌來幫忙!

04-18 | 菌群藥物臨床研究再登JAMA

04-17 | Nature領銜+4篇高分綜述,一覽5種消化道腫瘤研究前沿

04-16 | 飲食如何影響認知功能?吃核桃真能「補腦」嗎?

04-15 | 馬迎飛/戴磊等Cell子刊領銜!11文一覽噬菌體/病毒組研究前沿

04-14 | 武陽豐等Nature子刊:降低老年人血壓,代鹽vs限鹽誰勝出?

04-13 | 李娟/周宏偉/陳世賢等Cell子刊:促關節炎的「壞」腸菌被鎖定

04-12 | GUT新證:幽門螺桿菌如何促進大腸癌?

關鍵字: