農林漁牧網

您現在的位置是:首頁 > 林業

神經網路學習預測蛋白「分子機器」的運動

2022-09-03由 ScienceAI 發表于 林業

衰變方程怎麼理解

編輯 | 橘子皮

來自美國莫格里奇研究所的 Timothy Grant 發表觀點文章,評論《

Nature Methods

》上的兩項蛋白質分子動力學方面的研究,並表示

新的計算方法從冷凍電鏡影象中捕獲分子運動,並提供對蛋白質動力學的更完整理解。

該文章以「

Neural networks learn the motions of molecular machines

」為題,於 2021 年 7 月 29 日釋出在《

Nature Methods

》。

神經網路學習預測蛋白「分子機器」的運動

溫馨提示,乾貨在文章後半部分

雖然分子結構通常被視為靜態和固定的,但實際上蛋白質及其複合物通常是極其動態的,表現出一系列運動,並且在任何給定點具有許多可能的三維排列。最近在 《

Nature Methods

》上發表的兩項研究(一項由 Ellen D。 Zhong 等人發表,另一項由 Muyuan Chen 和 Steven J。 Ludtke 發表),已經證明了神經網路能夠從給定分子的眾多影象中學習多個結構,每個影象都凍結在不同的位置。然後,這些訓練有素的網路能夠生成一個結構集合,允許對樣本中發生的動力學進行深入分析,最終導致對重要分子機制的更好理解。

神經網路學習預測蛋白「分子機器」的運動

Ellen D。 Zhong 等人的論文。

論文連結:

https://www。nature。com/articles/s41592-020-01049-4

神經網路學習預測蛋白「分子機器」的運動

Muyuan Chen 和 Steven J。 Ludtke 的論文。

論文連結:

https://www。nature。com/articles/s41592-021-01220-5

簡單介紹背景

X 射線晶體學歷來是解決高解析度蛋白質結構的主要技術。該技術依賴於將分子形成的非常規則的重複晶體,因此晶體通常會將分子鎖定為單一結構。過去人們傾向於認為分子結構是靜態的、剛性的,但實際上這些結構往往是動態的。蛋白質內部發生的運動可能是其功能所固有的,因此它們可以被視為分子機器。

正如透過影片比從一張照片更容易理解汽車發動機的工作原理一樣,擁有有關分子運動的詳細資訊,可以增強我們對這些蛋白質背後機制的理解,最終提高我們對它們的生物學理解,從而在藥物設計時,增加對其功能進行修改編輯的可能性。

近年來,單粒子冷凍電子顯微鏡 (Cryo-EM) 已挑戰 X 射線晶體學的主導技術稱號,從僅生成低解析度結構的方法轉變為較大分子的首選結構技術。Cryo-EM 在解決的近原子解析度結構的數量上,正在經歷指數增長,並且最近在真正的原子級解析度下進行了第一次觀察,已經能夠準確定位單個原子。冷凍電鏡的工作原理是,使用電子顯微鏡對嵌入薄冰層中的分子進行成像。

用於對樣品成像的高能電子也會迅速破壞它們,因此必須使用很少的電子對樣品進行成像——就像在黑暗中拍照一樣。這會導致圖片背景非常嘈雜,從而使圖片難以解釋。然而,如果利用冷凍電鏡實驗記錄目標分子的數千個不同副本的影象,將這些單獨的圖片計算組合,便有可能得到分子的真實結構。

該技術能夠對處於溶液狀態的分子進行成像,因此來自冷凍電鏡實驗的資料將包含不同位置陣列中分子的各種快照。

這既是一種祝福也是一種詛咒:

一方面

它使求解結構變得更加複雜,並且在非常大的運動的情況下,可能使求解實際上變得不可能。

另一方面

如果這個問題能夠得到解決,單個冷凍電鏡實驗就可以揭示大量資訊,不再只提供單一的靜態結構,而是提供一系列結構和對機制的更深入瞭解

(如下圖)。

神經網路學習預測蛋白「分子機器」的運動

酵母剪接體的兩種可能的運動,一個高度動態的複合體。

介紹方法

Ellen D。 Zhong 和 Muyuan Chen 等人使用深度學習來解決這個問題;

建立神經網路,當呈現不同位置的數千張分子影象時,能夠學習潛在的結構,包括任何存在的運動。

這兩種方法都透過

讓神經網路學習在抽象的「潛在空間」中對粒子影象進行編碼,基本上只使用幾個數字來描述整個影象。與此同時,另一個神經網路學習如何將這幾個數字轉換或解碼為分子的三維結構。

結合這兩個網路,不僅學習編碼和解碼分子的初始靜態結構,還學習編碼和解碼結構變化——例如,由於潛在運動引起的變化。這兩種方法的另一個關鍵特徵是,透過檢查從所有分子影象建立的學習抽象空間,可以看到對應於不同結構的不同區域和模式,還可以展示它們之間的結構路徑。

兩種方法的不同

儘管這兩種方法在使用深度學習來學習結構的整合方面相似,但它們在結構的表示方式上有所不同。Ellen D。 Zhong 等人的研究,將表示保持為影象,網路學習從影象編碼並解碼為完整體積,直接將觀察到的差異與體積聯絡起來。相比之下,Muyuan Chen 將體積表示為高斯分佈的組合——球體加在一起形成結構的近似值——網路從影象編碼,然後解碼成具有不同位置和大小的球體列表。這簡化了它們的表示,允許更容易地跟蹤特定運動,同時允許關注特定區域或型別的變化;但在某些情況下可能會導致錯誤 ——例如,高度移動的區域可能永遠不會被球體填充或可能使用的球體太少,很難準確描述小細節和小差異。

展望

目前,這兩種方法都需要對結構進行初始估計,要求使用傳統方法至少已經解決了其中的一部分。未來,一個令人興奮的前景是網路有可能在沒有任何先驗資訊的情況下,學習給定樣本中的潛在結構和運動,從而可能解鎖當前方法無法獲得的結果。

即使在目前的形式中,這兩項研究的解決方案,表明冷凍電鏡終於開始發揮其全部潛力,揭示蛋白質的真正動態性質。對於該領域來說,這是一個激動人心的時刻,它可能會改變我們對蛋白質外觀的看法,從漂浮在太空中的一個靜態原子到一個動態機器,優雅地操縱以完成它們的任務。

論文連結:

https://www。nature。com/articles/s41592-021-01235-y