農林漁牧網

您現在的位置是:首頁 > 畜牧業

DNA甲基化與癌症之NGS檢測

2022-06-26由 貴州人體密碼基因 發表于 畜牧業

文庫構建為什麼要連線接頭

DNA甲基化是哺乳動物中研究最為深入的表觀遺傳修飾之一。正常細胞中,DNA 甲基化有效的調控基因表達水平。某些抑癌基因的失活是由於啟動子區域的高甲基化,大量實驗研究表明,在多種型別癌症中,DNA甲基化導致了大範圍的基因沉默。除了啟動子區域和DNA重複序列中的甲基化水平改變外,甲基化還與非編碼RNA(如腫瘤抑制作用相關的microRNA)的表達調控有關。

DNA甲基化水平與腫瘤發生發展過程的聯絡,鼓勵著我們不斷的解碼人類表觀基因組。甲基化測序是研究不同生命過程中基因調控的一個重要工具,例如細胞分化和疾病進展,並且越來越多的應用到包括腫瘤早篩、診斷等臨床檢測中。全基因組甲基化測序(WGBS)允許無偏好性的進行單鹼基解析度檢測,是理想的檢測目標區域方法。當您想進一步研究感興趣的目標基因組區域,經過雜交捕獲後再測序,這種有針對性的甲基化測序檢測方案成本更低。特別地,在評估具有低水平甲基化特徵的複雜樣本時(如液體活檢中的遊離DNA),一般需比常規全基因組甲基化測序達到更高的測序深度,雜交捕獲成為理想的實驗方案。

什麼是甲基化

在哺乳動物細胞中,DNA甲基化的特徵是在DNA甲基轉移酶(DNMT)的作用下,胞嘧啶嘧啶環(5-甲基胞嘧啶;5mC)第5位碳原子上新增上甲基基團(-CH3),並且甲基的共價加成通常發生在CpG二核苷酸中的胞嘧啶中(見下圖[1]),該二核苷酸集中在稱為CpG島中,CpG位點成簇的以預期頻率出現。在人類基因組中,約有2800萬個CpG位點,約70%的正常體細胞中為甲基化,並且,這些CpG位點的分佈並不均勻。大多數CpG島的長度為500-1000個鹼基對(bp),他們通常跨越啟動子區域,特別是管家基因。與大部分基因組不同,位於CpG島內的CpG位點通常在正常體細胞中為未甲基化狀態。

DNA甲基化與癌症之NGS檢測

在哺乳動物中,負責5-甲基胞嘧啶(5mC)形成的DNA甲基轉移酶包括DNMT1,DNMT3A及DNMT3B。DNMT1酶可以識別半甲基化的DNA,並保證維持現有的甲基化模式;DNMT3A和DNMT3B會在未甲基化的胞嘧啶上新增甲基基團。除了5-甲基胞嘧啶(5mC),5-羥甲基胞嘧啶(5hmc)為已發現胞嘧啶的甲基化中間產物,與5-甲基胞嘧啶(5mC)都為哺乳動物基因組中發現的兩種最常見的表觀遺傳標記,透過雙加氧酶家族TET(包括TET1、TET2和TET3)蛋白,將5-甲基胞嘧啶(5mC)氧化為5-羥甲基胞嘧啶(5hmc)[2]。DNA的5-甲基胞嘧啶(5mC)和5-羥甲基胞嘧啶(5hmc)水平,在腫瘤發生發展中發揮了重要的作用。

甲基化與癌症

DNA甲基化對於發育以及維持細胞正常功能至關重要,腫瘤細胞中甲基化特徵與正常細胞大有不同,並且,在癌症患者中可以同時檢測到低甲基化和高甲基化水平的改變。在腫瘤的發生的初始及進展階段,表觀水平就已經出現了異常,DNA甲基化整體上發生了改變。一般而言,CpG區域的甲基化水平總體下降,可導致基因組的不穩定性,但較少地啟用沉默的原癌基因[1]。

癌症的發生、發展伴隨著DNA甲基化模式的改變,包括了逆轉錄元件、著絲粒及原癌基因的DNA低甲基化,以及與基因抑制相關的關鍵基因調控元件(如遠端增強子和啟動子轉錄起始的重疊區域)的甲基化。如下圖所示,在整個基因組的所有基因調控元件,正常細胞和癌症細胞之間的DNA甲基化模式存在廣泛差異。正常基因組中的大部分CpG位點都攜帶著5mC,而遠端增強子元件及CpG島區域對甲基轉移酶DNMT的活性具有抗性。癌細胞主要表現特徵為整體範圍的失去甲基化遺傳學修飾,反而增強子和啟動子區域內出現異常的甲基化位點。這種甲基化分佈的改變,導致了腫瘤抑癌基因的表達受抑制,並伴隨著原癌基因表達的增加,從而進一步推動了腫瘤的發生、發展。(在下圖中,白色圓圈代表未甲基化CpG位點;黑色圓圈代表甲基化CpG位點[1])。

DNA甲基化與癌症之NGS檢測

DNA甲基化為常見的腫瘤標誌物

二十多年前,盧煜明教授等人已經證明了利用DNA甲基化作為生物標記物檢測孕婦/癌症患者血漿中胎兒/腫瘤源性DNA的可行性[3,4]。研究表明,在妊娠和癌症模型中,cfDNA與其組織來源的基因組DNA之間的DNA甲基化特徵高度一致。DNA甲基化在同一個體具有高度的組織特異性,同時,不同個體的相同組織,其甲基化水平可能也具有著一致性[5]。可將這一概念應用於分析血漿樣本中的DNA甲基化水平,就可以推測cfDNA的組織起源。與檢測遺傳水平突變相比,表觀遺傳修飾在不同癌症種類中具有更高的一致性。在臨床實踐中,可以從實體瘤或癌症患者的血漿DNA中挖掘出具有臨床價值的DNA甲基化生物標記物。Wanxia Gai等人總結了近些年利用此類DNA生物標記物進行癌症檢測的研究(見下表) [2]。

DNA甲基化與癌症之NGS檢測

DNA甲基化與癌症之NGS檢測

甲基化檢測應用

提到甲基化在癌症領域的應用,最值得分享的便是長期專注於癌症早診早篩的醫療公司GRAIL及將MRD用於早期結直腸癌患者的檢測和復發監測的Guardant Health(GH)。

2020年6月,GRAIL在歐洲腫瘤學會(ESMO)旗下期刊《腫瘤學年鑑》(Annals of Oncology)發表了CCGA(Circulating Cell-free Genome Atlas,CCGA)的三個子專案實驗結果。在CCGA1的原理髮現階段,使用訓練集樣本1785例及驗證集樣本1015例,同時對三種不同的高通量測序(NGS)方案進行評估,包括了靶向測序、全基因組測序(複製數變異,CNV)及全基因組亞硫酸氫鹽測序 (WGBS)。驗證結果證明, 相比於DNA突變水平檢測,WGBS技術路線更適合應用於癌症早篩的研究領域[6]。GRAIL也同時公佈了其結合機器學習演算法的cfDNA的甲基化測序分析技術可以同時檢測五十多種癌症型別,其檢測的特異性>99%,並且對腫瘤訊號組織來源的預測準確性>90%[6]。由於CCGA是一項病例對照研究,可能無法真實的反映該血液檢測在普通人群篩查情況下的表現。目前,研究團隊仍在持續進行PATHFINDER實驗,透過納入更多的健康人群,以評估檢測方案在臨床護理環境中的實施及效能。

甲基化應用的另一個方向為MRD(Minimal Residual Disease),即微小殘留病灶(是指癌症治療後殘留在體內的少量癌細胞(對治療無反應或耐藥的癌細胞))。2021年4月,《臨床腫瘤研究》(Clinical Cancer Research)線上發表了名為《Minimal Residual Disease Detection using a Plasma-only Circulating Tumor DNA Assay in Patients with Colorectal Cancer》文章,Guardant Reveal首次公開了僅使用血漿ctDNA MRD的檢測資料,證明MRD檢測靈敏度達到91%,特異性達100%。Guardant Reveal的MRD技術路線是Tumor-agnostic策略,又稱為Tumor-uninformed,即僅依賴於血漿ctDNA進行MRD檢測(無需組織活檢),檢測方案為整合ctDNA突變(LOD為0。01%ctDNA)及ctDNA甲基化水平檢測(見下圖)。該研究表明,透過整合表觀基因組標記,如DNA甲基化分析,比單獨基因組水平突變檢測靈敏度更高[7]。

DNA甲基化與癌症之NGS檢測

甲基化檢測之NGS方法及流程

隨著高通量測序技術的發展,NGS(Next-generation sequencing)也成為一種可快速獲得任何物種DNA甲基化圖譜的檢測方法。除了選擇全因組範圍內的甲基化水平檢測外,還可以進行DNA富集後再測序,如MeDIP或MBD Cap(也稱為MeDIP-seq或MBD-Cap-seq)。甲基化DNA片段被特定的抗體或蛋白質捕獲 ,經過純化、擴增等步驟後測序。但該種檢測方案不能準確的識別單個位點的甲基化水平,常用於評估特定區域的甲基化水平。與之類似的為基於限制內切酶的前處理方案,稱之為MSRE(MSRE-seq),使用甲基化位點敏感的限制性內切酶(BstUI、HpaII、NotI和SmaI),針對非甲基化限制位點進行切割,同樣經過純化、擴增等步驟後測序。由於以上兩種方法都具有較低的檢測解析度和基因組覆蓋率,也就限制了在腫瘤領域,特別是癌症早篩、早診的臨床應用[8]。

重亞硫酸氫鹽處理一直是繪製DNA甲基化圖譜的金標準,由來自澳大利亞的Kanematsu等科學家開發的技術方案[10,11],DNA經重亞硫酸氫鹽處理後,其胞嘧啶殘基轉化為尿嘧啶殘基,5-甲基胞嘧啶(5mC)則保持不變,各檢測方案對比見下表[9]:

DNA甲基化與癌症之NGS檢測

如果想針對大量樣本的特定區域進行甲基化檢測時,WGBS無疑成為一個成本相對較高的技術方案。幸運地是,雜交捕獲技術可以在一次反應中檢測成千至上百萬個目標基因組序列鹼基,為此提供了一種價效比極高的解決方案,在成本允許的情況下可以實現更高的測序深度和更大規模的研究。

常規甲基化文庫製備方法為下圖中流程B所示,DNA在連線反應步驟中加入測序接頭,轉化成可以上機測序的文庫後進行重鹽硫酸鹽處理,也稱作PreBS(Pre-Bisulfite)方法。該方案通常需至少微克量級別DNA,其主要原因是亞硫酸氫處理會破壞DNA雙鏈結構,導致測序時損傷的文庫無法進行簇生成。文庫序列資訊或獨特分子的大量丟失,限制了供人類疾病研究的樣品型別,如遊離核酸。即使低起始量DNA樣本最終轉化成可以上機的測序文庫,但由於重鹽硫酸鹽處理而導致極低的文庫分子複雜度,影響了最終的測序質量,如產生較高的dup率。

為了解決上述遇到的難題,重亞硫酸氫鹽處理後進行建庫的技術方案逐漸成為主流的檢測路線,即PostBS (Post-Bisulfite),PBAT(Post Bisulfite Adapter Tagging)也屬於該方法之一(流程C)。PBAT是以重亞硫酸氫鹽轉化後的單鏈DNA為初始模板,透過兩輪隨機引物延伸,從而連線兩端測序接頭。由於隨機引物的使用,使得:

1

重亞硫酸鹽處理後所產生的損傷DNA模版, 其中有一定的比例無法結合引物,從而降低了測序文庫的分子複雜度;

2

隨機擴增有著模版偏好性。

值得注意的是,PBAT方案的改良版本也一直用於單細胞甲基化分析方案中。

Swift Biosciences(IDT埃德特公司收購)創立了更加最佳化的建庫PostBS流程,與PBAT相同,都以重亞硫酸氫鹽轉化後的單鏈DNA為初始模板;不同的是,IDT xGen Methyl-Seq Library Prep(原來名稱Accel-NGS Methyl-Seq Library Kit,Adaptase技術)對重亞硫酸氫鹽轉化處理後的單鏈及損傷DNA進行最大程度地利用和轉化,從而提供更完整、偏好性更低的甲基化文庫(流程A)。

DNA甲基化與癌症之NGS檢測

IDT xGen Methyl-Seq Library Prep基於Adaptase專利技術,該技術是一種高效的、不依賴於模板的單鏈DNA接頭連線方法。該建庫試劑盒提高了文庫轉變效率,允許將重亞硫酸氫鹽轉化處理後的DNA樣品連線測序接頭,對樣本組成實現精準呈現。透過高效率的接頭連線方式,對重亞硫酸氫鹽轉化處理後的單鏈及損傷 DNA 進行文庫構建,相比構建文庫後再做亞硫酸氫鹽轉化處理的方法,文庫產量可提升100倍;除此之外,使用IDT特有的、無偏好性的接頭連線方式,經全基因組亞硫酸氫鹽測序(WGBS)驗證,xGen Methyl-Seq Library Prep甲基化建庫試劑盒可提供更完整、更偏好性更低的NGS文庫。

來自新加坡南洋理工大學Li Zhou等人在Illumina NovaSeq和HiSeqX測序平臺上,系統的比較了三種PostBS文庫製備試劑盒效能,包括xGen Methyl-Seq Library Prep, Illumina TruSeq DNA Methylation kit(PBAT)和QIAGEN QIAseq Methyl Library kit(PBAT)[12]。實驗設計如下表所示,樣本1-4及樣本5-8分別為全血和白細胞亞群(樣本5和8:CD4+T細胞;樣本6和7:中性粒細胞)

DNA甲基化與癌症之NGS檢測

該研究團隊評估了包括測序質量(Q20, Q30, 低質量鹼基去除比例等)、文庫質量(平均插入片段大小、重疊區域比例、dup率等)、覆蓋度(平均有效測序深度、覆蓋度均一性、CpG位點覆蓋情況)等測序指標,下方熱點圖綜合了三種建庫製備方法的總體效能比較結果,其中“綠色”和“紅色”分別表示效能表現好及差的技術方法。如某一特定指標兩兩比較時,在統計上沒有顯著差異,那麼該兩種方法將被賦予平均表現的相同等級,例如,在評估Q20測序指標時,IDT xGen Methyl-Seq Library Prep和TruSeq都為最佳表現的試劑盒,且等級分數相同(2。5=(2+3)/2),因為兩者之間沒有統計學上的顯著差異。

DNA甲基化與癌症之NGS檢測

總 結

甲基化測序是研究不同生命過程中基因調控的一個重要工具,例如細胞分化和疾病進展,並且越來越多的應用到包括腫瘤早篩、分診、治療選擇、微小殘留監測、復發檢測等臨床領域中。包括遊離核酸在內的體液樣本,含有來自於腫瘤的特異的DNA甲基化訊號,作為生物標誌物樣本檢測來源,無疑是一個絕佳的選擇。

重亞硫酸氫鹽處理一直是繪製DNA甲基化圖譜的金標準,由於其轉化效率的穩定性,保證了後續甲基化檢測結果的準確性。在針對特定的目標區域進行大樣本量的檢測時 ,WGBS就成為一個成本相對較高的技術方案。雜交捕獲技術,搭配PostBS單鏈建庫流程,可對感興趣的目標區域進行精準研究。