農林漁牧網

您現在的位置是:首頁 > 漁業

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

2021-07-03由 微生物組 發表于 漁業

桿菌什麼意思

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

原文資訊

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

題目:Diversity within species: interpreting strains in microbiomes

期刊:

Nature Reviews Microbiology [IF: 34.208]

發表時間:2020。06

第一作者:Van Rossum Thea

通訊作者:Bork Peer

第一單位:European Molecular Biology Laboratory

原文連結:

https://doi。org/10。1038/s41579-020-0368-1

編譯:範秋萍 雲南大學 國際河流與生態安全研究院

摘要

傳統上,研究種內變異僅限於可培養細菌的純培養菌株和低解析度微生物群落指紋圖譜分析。宏基因組測序和其它技術的進步使在高通量和複雜環境中研究未培養微生物、高解析度菌株和亞種成為可能。宏基因組分析具有巨大的科學前景,但也產生了大量描述亞種變異的方法和術語。本綜述透過關注微生物學背景下的細菌和古細菌種內多樣性來闡明這些進展。我們涵蓋了與種群遺傳學相關的基礎微觀進化概念,並概述瞭如何在微生物群落內直接研究和對種內變異進行分級,並重點關注宏基因組。最後,我們描述瞭如何使用宏基因組資料來實現物種內部變異的常見應用。我們旨在指導選擇合適的術語和分析方法使研究人員從越來越高解析度的微生物基因測序資料的獲取中受益。

前言

一個多世紀以來,細菌培養已使數千種細菌菌株得以分離和分類。物種在細菌語境中被翻譯為一群形成一致基因組簇的個體(有關詳細資訊和分歧,請參見下文)。儘管具有這種遺傳相似性,但可以確定

同一物種的菌株(同種菌株)之間可能存在很大的表型變異

。在致病性的背景下,對種內變異的重要性進行了深入的研究,發現許多物種同時具有致病性和共生性菌株(例如大腸桿菌和

Bacteroides fragilis

)。確實,有研究發現大腸桿菌菌株可以是致病的、共生的、與宿主或與環境相關的。菌株特性與宿主健康之間的關係表明在物種水平上對微生物群落的研究可能是不充分的,並且在藥物反應、養分迴圈、固氮和寄主關聯等許多其它領域也有相同的應用。

在研究種內變異方面時基於培養的方法具有根本性和持續性的作用,儘管最近它們在方法上取得了進展,但仍具有較大的侷限性。很少有微生物可以很容易地在分離的、實驗室條件下獲得培養,現有純培養微生物是在典型的低通量條件下培養出來。即使可以進行培養,對微生物進行研究也是在分離後進行,而不是在其自然群落中進行。對整個微生物群落的非培養型菌株水平的分析已經進行了15年以上,但是受到測序深度淺和樣本量較少的限制。隨著宏基因組的技術和演算法的創新(框1)以及測序成本的下降,有望對物種內變異進行大規模的宏基因組分析(框2)。這些方法有很大的前景,但同時也帶來了科學和語義上的挑戰。

在傳統的培養方法中,“菌株”是指純培養株或分離株,表示的是分類實體而不是自然概念,該操作定義不能直接轉移到現代非培養的方法中。

在高解析度微生物組研究中出現了大量重疊的術語,這些術語通常定義不清。由此產生的混亂阻礙了微生物組領域和其它領域研究人員的交流和合作

。為了在現有種內變異的定義下正確的納入新的操作定義,必須瞭解創造和限制種內變異的微觀進化過程。

在這項綜述中,我們總結了產生和限制種內變異過程的同時描述了這些力量的平衡是如何塑造變異的大小和結構的。我們使用宏基因組資料概述了可用於研究這種變異並將其分級的主要方法,並在應用的背景下定義了常用術語。我們使用“種內變體”來指代物種水平以下的任何分組。在這篇綜述中,我們重點介紹了使用宏基因組資料研究種內多樣性的進步和挑戰。

框1. 描述物種內變異的分子方法

在微生物群落中有很多種方法可用於研究種內變異。基於微生物組的方法較少,但不限於可培養的微生物群。諸如DGGE、TRFLP和ARISA之類的基礎群落指紋識別方法使某些物種無需培養即可進行高解析度研究。由於它們的通量和解析度低,這些方法在很大程度上已被基因測序方法所取代。儘管16S rRNA基因擴增子分析起源於低解析度方法,但現在有時可以在整個基因序列中使用Oligotyping、擴增子序列變異體(ASV)和單核苷酸變體區分某些物種。然而,在種內分析的解析度上,16S rRNA的方法仍然受到極大限制,可能被

每個基因組中16S rRNA基因的多個非相同複製所混淆

鳥槍法宏基因測序為標記基因或者全基因組提供了更多的資訊。已經開發出許多工具分析宏基因組資料以描述物種內變異。主要方法包括在預定義的標記基因內還是在整個物種參考基因組,單核苷酸變體與參考菌株基因組的總體相似性以及序列分類和基於基因含量的結構分析。基因組組裝的基因組可以透過裝箱和組裝共同豐富的基因來恢復。然而,這些都有重要的侷限性(框3)。

基於微流控的技術可在測序和單細胞測序之前富集特定生物體,從而產生單個擴增的基因組。由於方法學的進步,我們能培養越來越多的細菌,該技術結合了多種培養條件和細菌的快速鑑定。

基於冷凍電子顯微鏡的成像和轉錄組以及基於蛋白質組和代謝組學的分析方法都是非基因組方法,可以捕獲物種內的表型差異,可以單獨使用,也可以結合基因組方法使用。

框3. 在宏基因組中研究物種內變異的挑戰

對微生物群落種內變異的調查面臨研究設計、技術和方法上的挑戰。研究設計的主要挑戰是“無法觀察到的變化”:您看不到未取樣的內容。

如果一個物種內變異性低,這很難證明這不是由於取樣欠缺或採樣偏差引起的

。這種偏差可以是暫時的(例如,由於菌株轉換或滅絕)或空間的(例如,由於鄰近取樣區域隱藏著很多不同的同物種結構,例如土壤或面板)。較淺的測序深度也不利於觀察物種內部低丰度的變體。越來越多的深度測序宏基因組樣本減輕了這些偏差,但這些樣品在整個研究中的整合仍然面臨宏基因組眾所周知的一些技術挑戰。

宏基因組組裝基因組(MAG)對於研究未知和代表性不足的物種是很有用的,但也具有重要的侷限性。

MAG是種群共有基因組。因此,基因座位可能是未連線的多等位基因。與分離的基因組相比,MAG的裝配質量通常較低、不完全並且更可能是嵌合的

。由於

難以檢測低於物種水平的嵌合體,因此不應將MAG等同於分離株的基因組測序

。與完整分離株基因組相似的MAG才能使用“完整MAG”一詞,該基因組通常是沒有間隙的單個圓形拼接體。

為避免將分離株基因組和MAG混淆,應避免將MAG上傳到公共基因組資料庫的做法,並且不應將“基因組解析的宏基因組”這一短語用於不直接評估MAG內異質性的MAG研究。

單細胞測序方法為從宏基因組中回收基因組提供了一種替代MAG的方法,但單分子DNA的使用受到高成本、低通量、潛在汙染和質量問題的限制

持續的技術進步,測序成本的降低以及互補方法的日益整合對於應對資料生成和整合中的這些挑戰將是必要的。

物種內的變異和內聚力

導致種內變異的過程

種內多樣性是由變異和隨後的選擇和漂變造成的(圖1)。突變和基因流使遺傳變異進入其它相同的克隆子細胞譜系中。

DNA複製過程中的錯誤、DNA修復和重組機制的錯誤使基因組中不斷出現突變(即替換、插入、缺失和反轉)。儘管在雙螺旋DNA中10

9

個核苷酸複製一次才約有一個核苷酸改變,但物種間和物種內部的突變率可以相差一個數量級。選擇較低或更高的比率可以平衡突變頻率降低的代謝成本以及有害突變的影響。這種平衡的方向取決於棲息地條件、種群大小和等位基因突變強度。一個細菌譜系內突變的累積速率取決於突變率以及影響突變的自然選擇和遺傳漂變。此外,並非所有的細菌基因組都容易發生突變,除非核心基因位於輔助基因或可移動遺傳基因附近,

輔助基因的突變累積率才高於核心基因,次級染色體中的突變累積率高於初級染色體

。一般來說,

缺失比插入更為頻繁,非功能性序列很容易從細菌基因組中丟失。一個基因組中發生的突變可以垂直傳遞給後代,也可以水平傳遞給鄰近的細胞

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

圖1.

細菌種內變異的主要驅動因子

從一個物種轉移到另一物種(基因流)的遺傳變異會使基因組重排。DNA可以透過轉化、轉導、接合、轉染和膜囊泡等水平基因轉移(HGT)途徑在細胞之間轉移DNA。新獲得的供體DNA可以作為質粒或裂解噬菌體在受體細胞內保持分離,或者可以透過同源重組等多種機制摻入受體基因組中。

HGT在種內更常見但也在種間也存在

。HGT可以透過物種內同源重組用供體同源物替代遺傳片段,獲得新的遺傳物質。就HGT對物種內變異的影響而言,最重要的不是同源重組而是所傳遞的遺傳物質對受體物種而言是否是新的(如下所述)。

結合過程缺乏表面相容性、CRISPR介導的微生物免疫力和噬菌體宿主特異性受限是限制HGT的主要過程

自然選擇和遺傳漂變決定了透過突變和基因流引入的物種內部變異。遺傳漂變隨機消除了種群內的遺傳變異,而自然選擇則維持或消除了帶來適應性優勢或劣勢的變異。自然選擇是由多種生物和非生物因素驅動的,這些因素不同程度地影響了亞群生存和複製的能力(

圖1

)。這些因素可以透過群落聚集和經典進化力來影響物種間和物種內微生物群落的組成。

選擇壓力因子隨生境而異,可能包括pH、溫度、氧氣和其它氣體的濃度、養分的可利用性、與其它細菌的直接競爭或合作、噬菌體和真核生物的捕食以及壓力誘導產生的藥物、抗菌化合物和重金屬等異源生物的存在

物種定義和物種內聚力機制

透過突變的垂直積累和基因的水平獲取,一個細胞後代之間的變異可能會不斷增加,從而在整個細菌基因組中形成連續的遺傳變異景觀。但是,當比較細菌之間的基因組相似性時,會觀察到不同的簇。儘管人們質疑“物種”概念的適用性,但這些簇被認為是細菌中的物種。在本綜述中,我們使用“物種”一詞來反映這些遺傳相似性簇。

數十年來,已經使用

DNA-DNA雜交(DDH)

來測量基於基因組相似性的細菌種類。根據細菌命名法,透過DDH,同種基因組具有≥70%的相似性。DDH逐漸由分離株的DNA測序和

平均核苷酸一致性(ANI,average nucleotide identity)

比較來補充或取代,

DDH相似性≥70%對應於核心基因組中ANI≥94%和通用標記基因中ANI≥96%

。這些對應關係中的近似值可能會影響分類,如透過DDH對核梭菌(

Fusobacter nucleatum

)進行分類後建議透過ANI將其重新分類為單獨的物種。早期研表究表明使用宏基因組資料可以識別出獨特的細菌物種邊界。最近,透過研究基於

整個基因組(~95%)和標記基因(96.5%)在ANI閾值

處確定該邊界並描述了核心基因組中的基因流急劇下降。

儘管ANI基因組資料具有總體一致性,但對細菌和古細菌物種的定義仍存在爭議,關於“物種”的定義有20多個,並對此概念存在質疑。物種的生物學和系統發育概念最適用於細菌和古細菌。前者將物種定義為一組可以透過雜交產生有活力後代的個體,這意味著原核生物可能會發生同源重組,而後者則將物種定義為具有獨特表型特徵的進化枝。這兩個概念都預測不同物種之間的同源重組速率和HGT速率會下降。僅基於基因組的ANI比較並不一定能很好地滿足對眾多潛在物種的定義,相反

可以使用其它方法來定義除了ANI之外的物種或替代ANI的物種,例如透過表型、通用單複製基因(例如16S rRNA基因)中的相似性和基因含量來定義物種

物種內的基因組相似性稱為“內聚力(cohesion)”

。這主要透過種內重組和選擇低適應性等位基因來維持。如果等位基因比某個群體中的其它所有基因更有利,那麼它可以在該群體中完全傳播產生硬性選擇性掃描。當重組率較低時,整個基因組可能會藉助適應性等位基因使其流行,從而產生全基因組選擇性掃描。當發生硬性全基因組選擇性掃描時可以減少物種內多樣性,保持物種間相似性。

決定物種內部變異大小和結構的因素

物種內多樣性產生、維持和清除的程度不同,因此某些物種具有高度異質性,而另一些物種則具有緊密的內聚力。種內變異的這些特徵取決於所觀察到的種群(

框3

),並可以整體或區域性描述。增加多樣性與保持內聚力之間力量的平衡決定了物種內變異的程度和結構。

物種的變異量取決於突變率、產生時間、種間HGT的傾向和種群大小,而持續存在的變異量取決於生境中選擇壓力的嚴格性、種群大小以及選擇性掃描的頻率和程度。差異和內聚力之間的平衡是由選擇和漂變調節的,而選擇和漂變是由生物和非生物因素決定的(

圖1

)。如果所轉移物質對受體種群而言是新的,那麼HGT可以增加種群內的遺傳變異,例如,如果供體細胞是從外來種群中散佈的或遠緣相關的,那麼種內遺傳變異增加;相反,如果HGT將遺傳物質散佈到整個種群中,則可以根據特定基因含量或單核苷酸變異(SNV)使種群均質化,從而產生基因特異性的硬性選擇性掃描。

在一個物種內,結構化群落可以透過軟性選擇掃描的組合(當多個替代適應性等位基因在種群中擴散並共存時)使其沿著漂變和擴散到相似的或新的生態位。例如,當突變率高而種內重組的速率低時,菌株可能會分化成更具內聚力的亞組。具體而言,重組與突變之比在0。25以下時可以使亞種群自由擴散,這可能使能夠在物種形成過程中破壞部分基因流的亞種形成。

亞種可能是由物理或地理障礙引起或加速的,這些障礙阻礙了亞種之間的基因流動(異源),自然選擇或漂變使亞種產生差異。但是,在沒有空間隔離的情況下也可以產生亞種。在這種情況下,專業化可能具有選擇優勢,可以減少對資源的競爭。由於細菌和古細菌的擴散能力極高,對基因流來說,完整的物理阻隔可能很少,兩種情況都有可能發生。當出現偶然的基因流動以及生態位重疊時,對選擇進行純化可以維持亞種之間的部分內聚力,這可以避免建立穩定亞種時產生差異。

在一種極端情況下,物種可能是單型的,也就是說,它們在整個種群中的遺傳相似性分佈均勻或“模糊”。多樣性較低的單型物種更可能是專一的,地理分佈或寄主範圍狹窄,或者是最相近形成物種的產物。在另一種極端條件下,具有亞種(多型)和高度多樣性的物種更可能是自由存在的通才,能適應不斷變化的環境,具有廣泛的地理範圍或許多部分重疊的生態位。

上述許多知識都是透過培養和分離實驗逐個物種獲得的。微生物學方法的興起使得我們能夠大規模地表徵物種之間的變異,並新的提供可行的研究途徑(框2)。將這些發現有意義地應用於上下文中對於適應這一知識體系中的概念和術語並用於宏基因組研究非常重要。

框2分離株培養與宏基因組分析物種內變異的比較

傳統上,對物種水平以下進行研究依賴於培養的分離株。隨著宏基因組的興起,高解析度遺傳資料增加了。通常,這些資料是基於特定遺傳片段(例如標記基因)內的變異或透過組裝回收的基因組(由基因組組裝的基因組;MAG)中的變異進行分析的(框1)。儘管生成的資料量巨大使空前的發現成為可能,但這些新方法也具有重要的侷限性並帶來新的複雜性(請參見下表)。儘管宏基因組比研究分離株更有優勢,但這兩種方法仍是互補的。為了確保兩種方法之間的協同作用,分離基因組和MAG資料質量必須易於獲得且具有可比性,並且應維持通用詞彙表。

基於分離培養和宏基因組測序的種內變異研究

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

種內變異的分級

通常需要將物種內變異分為有意義的組進行研究,並與諸如健康狀況、地理位置或代謝能力等分類變數相關聯。上面描述的理論可以支援此類群的概念定義,但通常不能直接在微生物研究中使用。相反,必須基於可衡量的標準來設計變體群組的操作定義。通常,這是在遺傳或表型尺度上完成的。在操作上定義變體群組(例如菌株)的適當度量取決於所問的生物學問題和所使用的方法(圖2a)。

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

圖2

。 種內變異的分級。a:基於研究領域“菌株”的各種可操作分類定義;b:每一個點都是一個分離株基因組與所有其它同種分離株基因組的成對比較。

使用宏基因組資料進行遺傳分級

物種內的遺傳變異可以透過多種方式來衡量,其中一些共同的指標是總體基因組相似性以及共有基因和獨特基因的數量和/或SNV的數量和性質。在本節中,我們討論如何採取這些措施,並探討其優勢和侷限性。當將這些分析方法應用於宏基因組測序產生的大量資料時可以以高通量方式同時對多個物種進行物種內結構分析,但這也引起了諸如

資料不完整和資料存在部分錯誤的各種資料質量問題,也存在大的計算需求和儲存需求等技術挑戰

同源基因組在亞種水平上的總體相似性可以透過序列數和參考基因組中直接獲得的宏基因組資料進行評估或者透過比較宏基因組聚集的基因組(MAG)來評估。合適參考基因組的可用性低會限制基於參考基因組的方法的使用,尤其是在非人類微生物組中。現在可以

使用大量的MAG,並且計算ANI方法的效率也得到了提高

。但是,對於大型基因組序列ANI的計算仍然具有挑戰性。此外,由於資料質量的侷限性和不完整性,在ANI比較中使用MAG可能會引入不準確性(

框3

)。

ANI和重組速率下降表明正在對一個物種進行細分。但是,與物種邊界相反,

物種內變種沒有顯示出基於基因組或標記基因的通用閾值

,基因組或者標記基因能夠將種分為幾組。相反,物種內ANI值的分佈和範圍因類群和種群而有所不同,這限制了其在分級中的效用。此外,由

少量核苷酸編碼的遺傳差異對錶型的影響很大但對ANI的影響很小

。因此,在物種內ANI差異較小的情況下,

基因含量、SNV和indel的測量值在定義生物學上相關的物種內變體方面提供的資訊比ANI多

基因含量是基因組中所有基因的總和,包括幾乎存在於所有亞種變體中的核心基因和僅存在於一個亞種中的輔助基因

。變體之間輔助基因含量的差異可能在單基因水平或遺傳片段水平出現,其中可能包括多個基因(結構變異),可以根據是否存在基因或該基因的複製數來計算基因含量差異。認為在結構變異記憶體在基因順序,但尚未直接透過宏基因組方法解決。透過尋找基因簇或透過將基因含量與SNV結構定義的變體相關聯,宏基因組資料可用於研究物種內基因含量的變異。HGT使基因含量相似性和系統發育之間的關係複雜化。但是,對同種基因組的比較研究表明基於基因含量的配對相似性與基於核心基因組ANI的成對相似性相關(

圖2b

),並且不同的SNV結構可以對應於不同的基因結構。

SNV差異可用於比較高解析度的同種變體。這些比較可以考慮變體位置的數量,在核心基因、輔助基因或基因間區域中的位置,它們在基因組中的傳播(聚集或擴散)及其潛在的表型影響(同義或非同義突變)

。在宏基因組中,SNV的鑑定可以基於MAG或從現有的參考基因或基因組。參考的群落成員與實際群落成員之間的相似程度可能會對結果的準確性產生重大影響。基於

MAG識別的SNV可以揭示種群動態,但是由於MAG參考的基因潛在質量低,也可能產生錯誤(框3)

。可以基於不同的SNV(例如SNP型別)從宏基因組資料中定義同種基因組群組。用於顯示

單個SNV差異的分離株資料可以確定致病性或抗菌藥物耐藥性

。當測序深度較淺且種群規模較大時,不利於丰度較低的SNV的檢測。當SNV垂直轉移時可用於定義單倍型和譜系。可以進一步擴充套件這種方法,將SNV用於重建物種內的系統發育,但必須注意使用不太可能位於HGT區域的基因座。

當多個遺傳變異出現在一條染色體上時,它們是“連著”的。連著的變異可以一起遺傳,但可以被重組或突變破壞。確定等位基因之間的聯絡可以用來追蹤譜系、重建單倍體型別(階段性變體)以及檢測HGT。然而,當使用典型的短片段、鳥槍式測序方法時,在提供聯絡資料方面,宏基因組資料存在固有的侷限性,因為這種方法會分解DNA。短序列的組合可能能夠記錄聯絡的基因資訊,但當一個樣本中存在多個高度相似的基因組時會產生很多嵌合體,例如多個同源菌株(菌株異質性)。鳥槍宏基因組通常不提供聯絡等位基因的精確圖譜,而僅限於提供一組具有等位基因頻率資訊的多等位基因座;如本綜述最後一節所述,這些方法仍然可以用於許多應用,還可以用其對一個物種進行種群遺傳分析,例如計算種群多樣性、種群結構和選擇壓力。

已經開發了許多軟體工具以使用宏基因組資料

對物種內的多樣性進行測量和分類

。通常,它們有分類和發現這兩大目標。面向

分類的工具有metaMLST、PathoScope、MetaPhlAn2、StrainSifter、Sigma、SPARSE和StrainEst,目的是檢測樣品中是否存在已知的、特徵化的物種內群組。面向發現的工具通常使用以下三種方法中的一種將物種內部變異按相似性簇進行分組:基因含量(例如PanPhlAn),整個或核心基因組中的SNV(例如metaSNV)或標記基因中的SNV(例如,譜系演算法、ConStrains、StrainPhlAn、DESMAN、StrainFinder和mOTUs2),然後檢測獨特的基因內容(例如DESMAN)。儘管許多工具聲稱可以提供菌株水平的解析度,但術語“菌株”在軟體中的定義有所不同

(有關定義的討論,請參閱下一部分)。可以

從整個樣本的SNV多度中恢復SNV聯絡資訊的工具包括ConStrains、DESMAN、StrainFinder和Lineages演算法。當假設樣本包含物種內單一優勢種群時,也可以用StrainPhlAn和metaSNV之類的工具將SNV聚類為物種內群組(分別為菌株和亞種)

儘管這些工具支援用宏基因組資料來研究物種內變異(請參見下文),但它們具有一些較大的侷限性。例如,依賴於繪製參考基因組或標記基因序列圖的工具固有地受到適宜參考基因組可用性的限制,

在某些環境下(例如淡水和土壤),參考基因組的利用率非常低。可以透過構建和使用MAG來規避此限制

(例如,在DESMAN中),但是必須考慮MAG質量,特別是在沒有時間序列資料的情況下(

框3

)。其它限制包括極高的覆蓋深度和無法處理大量資料。這說明隨著宏基因組領域向更大、複雜的資料集發展的過程基礎軟體的侷限性是如何產生的。這些侷限性和其它侷限性結果導致某些工具難以執行或無法執行,或者無法與當前大小合理的資料集一起使用,從而無法再現或擴充套件結果。

本綜述參考的軟體可以執行所描述方法論方法中的工具示例。這些參考不是對準確性或可用性的認可或報告。最近的綜述中對許多工具的功能進行了比較,儘管預期在宏基因組解釋框架的關鍵評估(CAMI)中會解決這些問題,但尚未完成對準確性的徹底比較。預計未來的工作將對種內分析軟體進行比較;但是,每種工具特定術語(例如,SNV型別,菌株種群等)的確切含義以及它們對通用術語(例如,菌株和亞種)的對映都必須謹慎處理。

基因分級的術語

有許多術語可以對物種內的變異進行分級(

表1

)。從國際原核生物命名法中最常用和公認的術語中我們

重點對基因組、菌株和亞種這三個涵蓋物種內遺傳變異範圍的術語進行介紹(圖2c)。在本節中,我們討論在基於培養的微生物學和宏基因組中使用這些術語時的衝突,並提出解決方案

幾十年來,微生物基因組最常見的是來源於分離株的測序。近來,MAG的快速產生,以及超越了分離株基因組的應用。分離株和宏基因組之間

協同作用的障礙是將MAG等同於分離株基因組(框3)。前者可能代表包含有多樣性非常多的種群,而後者通常代表了多樣性幾乎沒有的培養分離株

。考慮到單細胞測序的興起,將“基因組”一詞視為細胞、分離株或宏基因組是有用的。

“菌株”一詞廣泛應用於微生物學的各個領域,且有許多不同的定義(圖2a)。在細菌學中其定義是:

一個在純培養條件下產生的單一分離株後代組成的,通常是由在一個或多個細胞中發現最初的單個菌落,最終衍生出來的一系列培養物組成

。在這種情況下,菌株是起源於分離的。在流行病學中對菌株有另外的定義,認為菌株是作為子實體存在於自然界中的。這種“自然菌株”被定義為一組具有獨特基因型和/或表型特徵的同種分離株。可以將“分類菌株”視為自然菌株的分離培養物。在操作上,自然菌株和分類菌株的邊界各不相同。例如,分類菌株可以表型異質,即使具有至少三個突變,也被稱為同一菌株。相比之下,在某些情況下,

分離株需要少於三個SNV差異才能被認為來自同一自然株

。這表明在以培養為核心的微生物學中尚未普遍設定菌株描述的遺傳閾值。

表1.

描述種內變異的常用術語

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

在以培養為核心的微生物學中,菌株的這兩個定義繼續共存,在微生物學中採用這一術語擴大了這種複雜性。很少使用字首帶有歧義的“分類”和“自然”。但是,這種二元性可以闡明“菌株”一詞在宏基因組中的混合用法。菌株水平的宏基因組經常提出分類和發現這兩種型別的問題。分類問題會問遺傳片段(測序片段數)是否屬於特定的分類菌株,例如檢測糞便樣本中是否存在益生菌菌株雙歧桿菌BB12。發現問題會問物種內是否存在形成自然菌株的亞組,例如透過聚類基因組或遺傳片段的遺傳變異。用於菌株發現的宏基因組工具之間可能會產生衝突,這些工具使用不同的自然菌株定義,因此會給出不同的結果,例如,基於差異基因含量和共享基因中的SNV來定義自然菌株。

尚未對菌株建立一個能夠普遍適用,具有牢固生物學基礎的操作定義,這也可能是不存在的。從理論上講,可以將只有一個SNV差異的基因組稱為不同菌株。但是,由於宏基因組資料能產生大量的菌株,因此不建議使用此方法。對於多少個SNV定義一個分離菌株以及是否需要在種群中固定這些SNV或者需要影響其表型沒有規定。在實踐中,在菌株水平工具選擇中如何選擇設定此臨界值(例如,

在StrainPhlAn中設定物種特異性標記基因的核苷酸超過0.1%)或者由分析作者設定的臨界值是不確定的(例如,ANI大於98%

)。鑑於菌株的操作定義具有這種可變性,因此使用更具體的術語代替“菌株”的通用術語變得特別有價值(有關指導,請參見表1和標題為“種內變異的應用”部分)。

亞種是群組的同種菌株,該術語存在許多定義。在經典微生物學中,亞種是遺傳或表型不同的菌株簇,具有可用的型別菌株並被命名(例如,枯草芽孢桿菌亞種)。隨著時間的流逝,亞種分類的基礎已經從定性表型方法轉變為分離株之間的基因組相似性。這種變化導致了分類轉換,例如物種降級為亞種(例如,在長雙歧桿菌中),反之亦然(例如,在必要的多核細菌中)。因此,已命名的經典亞種不一定與不同的基因組簇對齊。相比之下,在種群生物學的背景下,亞種是一組生活在一個物種空間範圍內的區域性物種,並且與相同物種的其它種群在基因型或表型上不同。將“亞種”一詞用於微生物組意味著這與菌株描述的二分法用法相同,即將序列分類為現有的“經典亞種”和“種群亞種”,種群亞種是透過空間尺度上的種內遺傳變異進行聚類的。

儘管這些術語的嚴格定義並不限制它們各自可以包含的相對變化量,但實際上,將它們放在彼此的背景中並在建議的範圍內使用它們是有用的(圖2c)。由於這些範圍是準則,因此在使用每個術語時應在報告中包括群組劃定的實際閾值。重要的是,“菌株”從屬於“亞種”,因此不應被普遍用來指任何從屬於物種的分組(有時是這樣)。由於定義不同,但在視覺上與“亞種”相似,因此我們也

不鼓勵用“亞種”一詞來代替“物種以下”

。相反,我們建議使用“出現在同種中的”或“種內”一詞。例如,

“菌株水平分析”或“亞種分析”的不當用法將由“同種物種分析”或“種內分析”代替

。此外,物種內的非特定群組也可以稱為“物種內變體”。

微生物群落的表型分級

一個物種內的遺傳變異可以以複雜的方式表現為表型差異。不同的遺傳變體可以表現為相同的表型,而相同的遺傳變體可以在不同條件下表現為不同的表型。遺傳差異的大小及其表型影響不一定相互關聯,例如在

抗生素耐藥性急劇增加的情況下,只需少一個SNV即可

。此外,當細菌在分離培養或共培養或在其自然群落中培養時,可以觀察到不同的表型。例如,銅綠假單胞菌在體外和人類感染期間有不同的基因表達結構,包括與抗生素抗性、細胞間通訊和代謝相關的基因,對治療的發展具有影響。在物種內部也可以看到表型的差異,例如兩株嗜鹽細菌鹽沼細菌的菌株在分離培養時具有相似的表達模式,而在共培養時則具有不同的表達模式。這些例子強調了直接在微生物群落中研究物種表型變異的重要性,這可以通過幾種方法來完成(

框1

);例如,超轉錄組學已被用於揭示貽貝中同種共生體之間的功能多樣性,並且透過宏基因組學推斷的複製率已經區分了嬰兒中

Citrobacter koseri

的亞群。

基因型和表型之間的複雜關係意味著表型分類方案可能與遺傳分級不一致。在醫學和流行病學中,基於不同的致病性(病理型)或細胞表面抗原(血清型)將細菌分類為群組(可能是多系統的)是有用的。例如,腸道大腸桿菌群包括共生菌株和致病菌株,它們被分為至少七個致病型。在生態學中,還可以基於行為及其在群落中的功能角色來定義群組,例如,根據所使用的資源型別和開發方式來定義群組。以這種方式分組的物種稱為“公會”,這一概念和術語可以類似地用於描述菌株群組。此類分組旨在為生態系統內的競爭分析提供適當的解決方案並在整個群落中推廣。儘管表型與許多生物學問題最相關,但很難進行大規模測量。透過微生物基因組測序,基因型在高通量條件下更容易測量,但是將它們與表型聯絡起來具有挑戰性,因為表型會隨生境和較小的基因型差異而急劇變化。

種內變異的應用

種內變異的多種尺度和維度反映了物種內調查可以解決許多生物學問題。基於分離的方法已用於調查涉及種內變異的許多生物學問題。隨著宏基因組方法的興起,現在可以在高通量下調查一些相同的問題,也可以同時對群落中的許多物種進行研究(有重要限制;框2;框3)。下面,我們將描述基於分離方法開創的重要的生物學應用現在有多少可以使用宏基因組方法進行研究。我們將這類調查的常見例子歸納為5大主題,圍繞關鍵生物學問題開展(圖3)。對於每個主題,我們總結了方法論方法和適當的術語,並提供了相關研究或軟體的示例。

此樣本中的細胞最初來自哪裡?為了確定微生物細胞傳播或擴散方式,必須確定其確切來源。透過比較來自目標細胞或種群的遺傳物質與其潛在來源種群或祖先的遺傳物質進行比較,可以計算出細胞從特定來源種群中擴散或成為特定來源種群直接後代的可能性(來源追蹤、傳播追蹤或譜系追蹤;圖3a)。從宏基因組資料確定源種群的策略包括檢測共享SNV、CRISPR訊號或菌株特異性基因的存在以及基因組重建。這些方法已用於評估是否有細菌細胞從人的口腔傳播到腸道,從母親傳播到嬰兒,從益生菌治療傳播到消費者或從糞便微生物組的捐贈者傳播到受體。這些策略可能被等位基因連線的宏基因組破壞,從而使多個來源種群以及目標種群的進化變得複雜。因此,儘管譜系追蹤方法可用於病原體源檢測,但對於流行病爆發的分析可能不夠。在源追蹤中,可以用更具體的術語“譜系”來代替通用術語“菌株”,該術語可以用單倍型來表徵。由宏基因組資料確定基因組單倍型仍然是一個挑戰。然而,隨著錯誤率的降低,有望實現單個DNA分子的長序列測序。

系統發育重建

該物種內中變體的進化史是什麼?

在系統發育重建中,從遺傳相似性推斷一個物種內多個譜系的相關祖先(圖3b

)。這種相似性可以基於完整的基因組或遺傳片段(例如標記基因)獲得。由於HGT和同源重組,重建的系統發育可能會根據所選擇的基因座而有所不同,可能無法用遺傳片段的系統發育反映總基因組的系統發育。可選擇地,物種內的系統發育研究可能集中於重建物種內特定基因的歷史或質粒的歷史。物種內系統發育把這些歷史放在觀察到的地理分佈背景下。使用分離基因組進行系統發育分析已得到很好的實踐,如果回收了高質量的基因組,例如使用

MAG或單個擴增的基因組,這些方法可以應用於微生物群落。但是,在此應用之前必須考慮資料質量問題(框3

)。另外,一種典型的方法是在宏基因組中鑑定同種、同源基因片段(例如,透過比對參考序列),檢測其中的SNV,然後推斷其最可能的歷史。可以基於系統發育來定義物種內的群組,方法是在任意相似度上將生成的樹切割為任意相似度,從而建立“系統型”。在這種情況下,可以用更具體的術語“ 進化枝”或“系統型”代替通用詞“菌株”。

Nature綜述 | 種內多樣性:解釋微生物組中的菌株

圖3。 種內變異的應用

遺傳種群結構描述

該物種是否具有不同的亞種群?描述物種的遺傳種群結構可以表明其地理歷史或解釋與宿主疾病狀態的異質性聯絡。物種的種群結構可以透過與觀察資料重疊的遺傳資料確定以描述種內和種間變體遺傳相似性的分佈。當在所觀察到的物種變體中遺傳相似性具有平滑分佈時,就會出現均勻的結構(塗片)。當祖先和姐妹進化枝種群存在時,即在樹內幾乎沒有未觀察到的種群不時,就會發生這種情況(

圖3e

)。相反,當遺傳相似性之間存在不連續性時,會出現簇狀結構,從而使進化枝可以分為不同的簇。這種不均勻的結構是由樹內滅絕的分支所形成的(圖3d)。這表現為亞群,即整個種群中遺傳變異頻率不同(例如,等位基因或SNV)的子集。

透過尋找潛在亞群之間遺傳相似性的聚類,宏基因組可用於研究微生物群內的種群遺傳學。檢測亞種群對取樣工作很敏感,因為遺傳相似性的不連續性可能是因為未能觀察到中間產物(

框3

),可以根據整個基因組中SNV等位基因頻率,標記基因中SNV或基因含量差異來評估此類遺傳相似性。當MAG或單個擴增基因組產生時可以使用基於基因組ANI進行聚類。MAG還可以用於追蹤SNV和基因含量差異,在這種情況下,有時用“菌株”來指代一個或多個亞種是不恰當地。如果亞種適應了不同的生態位則可能是生態型,例如透過基因組廣泛掃描而不是基因特異性掃描。

生態位推斷

該物種內的變體是否適應了不同的條件?研究物種內變體及其生境可以提供生態位特異性的資訊(圖3f)。當使用遺傳資料推斷未描述的棲息地時,有時被稱為“反向生態”。這些查詢通常旨在確定那些對於適應特定環境至關重要的遺傳片段(例如,基因、操縱子或質粒)。這些片段的獲取可能來自垂直傳播或水平傳播,因此可能與該物種的系統發育史形成鮮明對比。例如,由於在選擇性條件下(基因特異性掃描),HGT頻繁發生,因此一個基因能夠在種群間廣泛傳播,例如在抗生素存在的情況下,HGT頻繁發生使得基因可以在人群中迅速普及。使用宏基因組資料研究這些問題的常用方法是檢視已適應不同條件的同種亞群細胞(例如,不同人類宿主飲食、土壤與植物宿主或湖水棲息地的變化),然後確定獨特的基因。基因組寬度聯絡研究中使用的方法也可以在這裡應用,儘管這些方法通常不關注種群的適應性進化。在這種情況下,一般術語“菌株”可用更具體的術語“生態型”代替。

在圖3所示的例子中,遺傳種群結構調查將關注於歐洲和亞洲種群的等位基因頻率差異,以決定這些種群是不同的亞群還是屬於一個連續種群。無論歐洲和亞洲人口是否是不同的亞群,生態位推斷研究將關注與不同飲食相關的腸道微生物組物種的基因差異。

分類

該物種變體是否屬於先前描述的物種亞組?分類分析評估了同種物種變體中具有

特定目的的遺傳特徵(例如SNV、基因、操縱子或質粒;圖3c

)。在這種情況下,物種內群體的確定不是基於進化史或棲息地範圍,而是根據是否存在特定遺傳特徵。這樣的特徵可以賦予棲息地適應性,可以是短暫的,並且僅在抗微生物抗性基因、致病性基因(例如,腸致病性大腸桿菌)或鞭毛等罕見或人工條件下表達。在這種情況下,主要考慮HGT,因為其結果意味著遺傳特徵的存在並不一定反映系統發育。

宏基因組方法可用於檢測定義分類的遺傳特徵。可以基於參考序列檢測已知SNV或新SNV的重要性。在宏基因組中已經基於與參考序列的同源性檢測搭到分類基因的存在,但是群落內可能存在HGT,因此很難確定這些基因是否存在於特定菌株中。在宏基因組資料中,無論有無組裝基因組,均可直接研究HGT。

物種變體內相同表型的比較分析能發現與該表型相關(並可能引起該表型)的特定遺傳特徵(例如在基因組寬度相關的研究)。例如,僅基於它們在顯示相似症狀的宿主中存在就可以將同種細胞分組為致病性“變體”,而無需瞭解細胞或其典型棲息地的進化關係。在這種情況下,一

般術語“菌株”可以用更具體的術語“病理型”代替

傳統上,使用分離基因組方法或低解析度分子方法對上述主題進行了研究(框1)。隨著宏基因組研究產生了大量資料,已經建立了數十種新方法來研究相同的問題,通常使用它們自己的新詞彙。考慮如何將這些新方法對映到它們要解決的基本生物學問題上以及該領域的研究歷史將如何控制術語的爆炸式增長。許多研究將上述主題組合在一起,但是單獨考慮基本單元將有助於分解複雜問題並選擇最合適的方法和術語。

結論

儘管在微生物組調查中,通常考慮的是最高解析度的分類類別,但

物種仍可能具有極端的表型變異性

。過去使用的是一些基於分離方法獲得的數量有限的可培養細菌,因此研究這種變異性的範圍相對有限。隨著宏基因組測序的發展,可以研究的物種數量和可以使用的方法數量大大增加。根據許多標準和尺度,對物種內部變異進行分級也使術語增長和不精確。揭示物種內部變異是如何產生的,並確定所要研究的核心生物學問題,有助於確定正確的術語和方法。在某些情況下,最合適的術語可能具有操作性定義,並且其詳細資訊和閾值可能因研究而異。為了促進溝通和協作,能對宏基因研究進行比較,應儘可能避免使用沒有嚴格定義或廣為人知的術語。本綜述旨在指導此類描述,並

支援將物種內調查技術更廣泛地應用於宏基因組學資料的開發和應用

引文:Thea Van Rossum, Pamela Ferretti, Oleksandr M。 Maistrenko & Peer Bork。 (2020)。 Diversity within species: interpreting strains in microbiomes。 Nature Reviews Microbiology, doi: https://doi。org/10。1038/s41579-020-0368-1

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人