農林漁牧網

您現在的位置是:首頁 > 農業

Nature | 增強子選擇啟動子的新模型

2022-01-08由 BioArt植物 發表于 農業

啟動子是什麼

Nature | 增強子選擇啟動子的新模型

責編 | 兮

增強子與啟動子是高等動物尤其是人類中最重要的兩類基因表達調控元件。它們之間的有效互作可保證基因的準確轉錄,從而保證細胞狀態和正常發育。它們之間的錯誤聯絡也同樣可以導致疾病相關的基因表達異常。

因此,瞭解增強子選擇啟動子的機制可幫助更好地認識健康與疾病。近日,美國德克薩斯大學休斯敦健康科學中心麥戈文醫學院的

李文博

研究組和加州大學聖地亞哥分校

Michael Rosenfeld

研究組合作在

Nature

雜誌上發表了一篇題為

Enhancer release and retargeting activates disease-susceptibility genes

的文章。這項研究提出了一個被稱為

enhancer release and retargeting

ERR

的增強子選擇啟動子的模型。在這個過程中,被優先選擇的啟動子因為功能丟失

(DNA片段切除,單核苷酸突變或者表觀遺傳導致的沉默)

而失去了與增強子互作,但這個被釋放的增強子並不會因此不發揮作用,而是在同一個染色體結構互作域

(contact domain)

中重新選擇其他啟動子,從而導致相鄰基因表達上升。

ERR模型為啟動子區域及其附近的遺傳突變的致病機制提供了新的解釋。

Nature | 增強子選擇啟動子的新模型

高解析度的染色質結構資料表明,增強子與啟動子往往形成很小尺度的環,一般距離10-50Kb

【1,2】

。大多數增強子只調控短距離範圍內的一個靶基因

【3】

。每一個細胞型別內都有上千至上萬個增強子和啟動子,但增強子如何選擇配對的啟動子並啟動基因轉錄這一過程仍不清楚

【4】

。增強子可以轉錄生成增強子RNA

(enhancer RNA)

或eRNA,可用來表徵增強子的活性

【5】

為了瞭解增強子-啟動子配對選擇機制,基於染色體構象捕獲技術4C-seq和ChIA-PET資料,作者們選擇了4對增強子-啟動子來研究他們之間的關係。CRISPR/Cas9敲除這些啟動子後,對應的基因表達下降,然而讓作者感到有趣的是,與其互作的增強子RNA則上升,表示

增強子的活性反而因為丟失他們的啟動子反而更加活躍

了。同時,作為對照,位於其他染色體的基因的表達沒有變化。另外一方面,敲低cohesin複合物RAD21亞基後,增強子-啟動子互作會被破壞,同樣導致eRNA上升基因表達下降,而H3K4me3和H3K4me1都沒有變化。這些結果都提示增強子在喪失其啟動子配對以後反而會變得更活躍。

有趣的是,當作者們把目光擴大到被敲除的啟動子周圍整個染色體互作域的時候,他們發現這個格外活躍的增強子可能導致了整個互作域內的許多基因表達的上調。比如在其中一對的一個已知的增強子-啟動子組合。在這個locus,TFF1基因與另外4個基因位於同一個150Kb長的互作域。敲除TFF1啟動子後,除了TFF1基因自身的表達下降和對應eRNA上升外,同時伴隨的還有其相鄰的TFF3基因非常高的上調錶達

(18倍)

,另外3個基因表達也顯著上升但幅度略低。這說明一個可能性,TFF1啟動子的喪失導致了他原本配對的增強子選擇了其他的互作域內基因作為目標來影響基因表達。

為了搞清楚這其中的分子機制,作者們在上述敲除的4個啟動子中找尋某些共同點,他們發現一個這些啟動子都有CTCF結合位點。同樣的,在RAD21敲低實驗中表達下降的啟動子區,CTCF結合也比隨機選擇的啟動子要高。因此,作者們提出了CTCF在啟動子上幫助決定增強子-啟動子配對選擇的假設。事實上,啟動子的CTCF結合比增強子更強,但比TAD邊界弱。僅敲除啟動子區的CTCF結合位點或僅突變CTCF結合的很小片段的motif,產生的效果與敲除啟動子所造成的效果非常相似,這些實驗初步支援作者們關於CTCF幫助選擇增強子-啟動子的假設。

更進一步,作者們發現,在TFF1相鄰的其他基因中,TFF3啟動子也有一個CTCF位點,但其結合比TFF1啟動子的CTCF弱,但比另外兩個基因強。TFF1和TFF3兩個基因的啟動子雙敲除後,另外兩個相鄰的基因TFF2和UBASH3A顯示了更進一步的表達上升。其幅度比TFF1啟動子單敲除更高。對應的,如果用dCas9系統把CTCF蛋白強制“託運”到TFF3啟動子後,TFF3表達上升而TFF1表達則下降,但如果“託運“的是Y226A/F228A突變的CTCF蛋白

(失去cohesin互作)

,則沒有顯著變化。這些實驗進一步說明在增強子選擇其啟動子目標時候,她會有機會掃描整個互作域,優先選擇有CTCF結合的啟動子,如果CTCF結合強的優先啟動子被破壞,則增強子會選擇CTCF結合較弱的啟動子

(圖1)

Nature | 增強子選擇啟動子的新模型

圖1。 思考增強子選擇啟動子過程的工作模型以及在疾病中的可能作用。圖中,藍色P1,P2,P3,P4示意四個不同啟動子。左側示意正常工作狀態下增強子優先選擇P1,因為較強的CTCF結合。右側示意當疾病狀態改變了P1的功能以及CTCF結合,那麼增強子將改變選擇,ERR發生。

作者們把上述的,啟動子功能喪失時候增強子在相同互作域重新選擇啟動子的過程稱為enhancer release and retargeting

(ERR)

。在這些實驗的基礎上,基於ERR模型,作者們認為癌基因

(oncogene)

相鄰的其他基因啟動子的突變可能造成癌基因表達的變化

(圖1,右側)

。利用ICGC基因組資料,檢查已知的315個癌基因啟動子

(oncogene promoter, OP)

及其200Kb範圍之內的1,693個相鄰其他基因啟動子

(oncogene-neighboring promoter, ONP)

,發現OP和ONP的突變略高於背景。用CRISPRi技術成功抑制25個攜帶有癌症突變或缺失的ONP後,發現其中8個相鄰的癌基因的表達可顯著上升,而其中1個則顯著下降。這說明ERR比較普遍的存在,但並非在任何一個基因上都存在。進一步敲除三對

(PVT1-MYC、ZCCHC7-PAX5、CLPTM1L-TERT)

癌基因附近的ONP,發現對應的重要癌基因

(比如MYC,TERT)

的表達升高了2-5倍,同時癌基因與附近增強子的互作增強了。在CLPTM1L啟動子中,作者們利用CRISPR/Cas9敲入了可導致CTCF motif丟失的癌症突變後,CLPTM1L表達下降,TERT卻上升。這些資料充分論證了相鄰基因啟動子上的CTCF motif上的突變,可以在其他條件不變的情況下,導致癌基因的表達上升,為非編碼區突變的致癌機制提供了新的論據。

除了癌症之外,作者們還檢索GTEx資料,利用生物資訊的方法發現至少有19,000對基因的表達都與同一個SNP顯著相關,且趨勢相反。聯合增強子註釋以及限定SNP-基因距離不超過200Kb,其中872對基因可能存在ERR現象。進一步整合人類遺傳疾病GWAS資料,發現其中85個單核苷酸多型位點

(SNP)

是和人類遺傳疾病相關的。為了找尋一些ERR相關例子做進一步實驗論證,作者們聚焦在3個帕金森病相關的SNP位於NUCKS1基因的啟動子,其相鄰基因RAB7L1已被發現在帕金森疾病中發揮關鍵的作用。作者們和加州大學聖地亞哥Kelly Frazer組合作,鑑別了兩株人來源的iPSC細胞系,攜帶雜合基因組,暨兩條等位基因具有不同序列且其中一條包含上述SNP。這樣的細胞系因為具有幾乎完全一樣的細胞內環境,可以用來精確的比較SNP序列導致的表觀遺傳和基因表達變化。作者們設計了可以分辨等位基因的環狀染色體構象捕獲技術4C-seq和單核苷酸敏感的定量PCR,實驗結果發現攜帶SNP突變的等位基因上,NUCKS1與下游的一個增強子的互作丟失,表達下降,而同時,隔壁的疾病相關基因RAB7L1與同一個增強子的互作卻顯著增強,同時表達上升。此外,使用CTCF 免疫共沉澱,作者發現在攜帶SNP突變的等位基因上,NUCKS1啟動子的CTCF結合也變弱。這些資料都表明,

啟動子功能改變,包括但不限制於CTCF位點的突變,可顯著影響增強子對啟動子的選擇,並且改變重要疾病基因的表達。

該研究發現啟動子自身的特徵是增強子掃描染色體附近區域產生功能性增強子-啟動子配對的基礎。

這項研究的結果是和最近領域內的cohesin extrusion假設一致的,暨在工作中的cohesin透過extrusion的過程掃描增強子附近的互作域,而啟動子區的較強CTCF可與增強子上的cohesin互作以建立比較穩定的增強子-啟動子環,從而啟用轉錄事件。不過,

值得注意的是雖然CTCF在多個基因區出現並決定啟動子和增強子的選擇過程,但並非所有啟動子都有CTCF結合,因此,本研究提出的模型僅適用於部分啟動子的選擇場景

。在癌症和其他複雜疾病中,都存在大量可能導致ERR事件發生的突變位點,因此未來的工作有必要對啟動子附近突變進行大規模篩選,以發現可導致ERR以及促進疾病發生的更多功能突變。

此工作的意義有兩方面。第一,作者們提供了新的機制證據來理解和描述增強子-啟動子互作的過程。這些機制揭示了增強子-啟動子選擇特異性或可變形的來源,提供了新的思路進一步研究這個重要過程在正常發育和基因表達調控中的作用。第二,這個工作說明很多在染色體互作域或者拓撲結構域

(TAD)

內部的DNA序列,而非在結構域邊緣,是對增強子-啟動子配對有重要決定作用的。

這些發現揭示很多和疾病相關的(比如癌症和帕金森病)單核苷酸變異或小序列缺失很可能透過ERR的機制來影響疾病相關基因表達。

博士後吳秀煥

(韓國籍)

,邵嬌芳博士

(目前回到南京醫科大學任職)

,雄峰博士等是主要作者。紐約阿爾伯特愛因斯坦醫學院Zhang Zhengdong組和博後Joydeep Mitra在此工作中做了重要貢獻。

參考文獻

1。 Hsieh TS, Cattoglio C, Slobodyanyuk E, Hansen AS, Rando OJ, Tjian R, Darzacq X: Resolving the 3D Landscape of Transcription-Linked Mammalian Chromatin Folding。

Mol Cell

2020, 78(3):539-553 e538。

2。 Schoenfelder S, Fraser P: Long-range enhancer-promoter contacts in gene expression control。

Nat Rev Genet

2019, 20(8):437-455。

3。 Gasperini M, Hill AJ, McFaline-Figueroa JL, Martin B, Kim S, Zhang MD, Jackson D, Leith A, Schreiber J, Noble WS et al: A Genome-wide Framework for Mapping Gene Regulation via Cellular Genetic Screens。

Cell

2019, 176(6):1516。

4。 van Arensbergen J, van Steensel B, Bussemaker HJ: In search of the determinants of enhancer-promoter interaction specificity。

Trends Cell Biol

2014, 24(11):695-702。

5。 Li W, Notani D, Rosenfeld MG: Enhancers as non-coding RNA transcription units: recent insights and future perspectives。

Nat Rev Genet

2016, 17(4):207-223。

原文連結:

https://www.nature.com/articles/s41586-021-03577-1

Nature | 增強子選擇啟動子的新模型