A worldwide e-Infrastructure for NMR and structural biology

如何利用小角度X光散射資料對HADDOCK計算結果評分

在這份教學中,我們將介紹小角度散射資料及其在HADDOCKing中的使用,這是一份計分練習,因此我們提供這份練習所需要的檔案.您並不需要設定新的對接程序(docking procedures and calculations)。

  1. 關於小角度散射資料

  2. 關於CRYSOL 和 Chi(c)

  3. 如何在HADDOCK 計分功能中納入c值

  4. 練習以小角度散射為基礎的HADDOCK計分

  5. 參考資料


1.關於小角度散射資料

藉由測量蛋白質樣本的小角度X光散射(SAXS)強度,可以偵測在生物分子複合物自然條件下的特徵.包括分子大小和形狀的資訊,例如分子量、迴轉半徑、分子的最大直徑和奈米解析度的三維空間分子包膜構形。

(關於小角度散射的其他解說及工具,可以參考WeNMR服務超連結)

因此,由小角度散射的資訊可以計算以下幾項

  1. 分子包膜 用來引導第一原理珠模型(ab initio bead model)及獨立三維結構接合建構的指標。
  2. 限制能量項(restrained energy term) 可以利用小角度散射曲線作為目標,結合NMR分向性的結構資訊用來精算生物分子錯合物的構形。
  3. 計分項 用來計算實驗散射曲線與透過分子模型反推之理論曲線間的差異。

我們將在這份教學中著重第三點的計分方式,研究小角度散射資料的資訊內容物及過濾接合計算結果正確性的實用性。


2.關於CRYSOL和 Chi(c)

Crysol是一套免費軟體,可以用來計算理論及實驗小角度散射資料之間的差異。其主要功能有以下兩項:

  1. 模擬已知原子結構(需PDB格式)的巨分子的預期的小角度散射曲線;
  2. 調整模擬的小角度散射圖譜,使其實驗結果之間的差異最小化。

 (關於CRYSOL的細節,可參照以下連結)

CRYSOL 輸出範例

ChiExample.png

黑色線:由CRYSOL計算的理論散射曲線;紅色線;實驗小角度散射結果

(實驗使用的蛋白其結構如圖示 PDB : 2r15), 計算出的c值為 4.9


3.在HADDOCK 計分功能中結合透過小角度散射以計算c值

為了探討小角度散射與模擬模型的區別,我們根據對應實驗的c值重新對HADDOCK計算結果進行排序。根據我們的統計,SAXS的c值對於接合模型的正確性有顯著的辨別度。 (Karaca and Bonvin, Acta Cryst D, 2013). 同時,當c權重為50%時可以獲得最好的結果

HADDOCKSAXS = HADDOCKScore + 50 . χSAXS

這裡的HADDOCKScore 指的是指的是在不同對接階段下不同能量項的组合

it0 (Rigid-body): 0.01EvdW + 1.0EElec+0.01ERestr - 0.01BSA + 1.0EDesolv + 0.1ESym

it1 (Simulated Annealing): 1.0EvdW + 1.0EElec + 0. 1ERestr  - 0.01BSA + 1.0EDesolv + 0.1ESym

water (Solvent Refinement): 1.0EvdW + 0.2EElec + 0.1ERestr +1.0EDesolv + 0.1ESym

Evdw 指的是分子間的凡德瓦位能,EElec 是分子間的靜電位能, ECM 是束縛能,EDesolv  是脫水能, BSA 是分子介面被掩蓋的表面積, ESym 是對稱束縛位能。


4.測試以小角度散射為基礎的HADDOCK計分權重

在這一部份,我們以實際的CAPRI (Critical Assessment of PRediction of Interactions, http://www.ebi.ac.uk/msd-srv/capri/capri.html) 標的為例進行示範。CAPRI是針對各種接合(docking)演算法的競賽,利用已知但尚未公開的分子複合物結構作為目標,讓各個參賽的實驗進行盲目測試(blind test),以評估不同演算法的效益及準確性。

4g9s.png

這個例子是屬於CAPRI的第27輪 (共58輪),溶菌酶-與其抑制物的複合物結構(PDB:4g9s), 由於本範例的目的是為了評定SAXS計分的績效,我們將使用一組預先執行過且已評估結束的數據,該結構群是透過特殊的水合對接模型生成程序。(關於操作過程資訊可參考 Kastritis et al., Proteins, 2013)

為了執行下列步驟,您須在Unix / linux 環境下先下載附件檔 HADDOCK-SAXS-Scoring.tgz和解壓縮

         wget http://www.wenmr.eu/wenmr/files/HADDOCK-SAXS-Scoring.tgz

tar xvfz HADDOCK-SAXS-Scoring.tgz 

解壓縮後,請移到新建立的資料夾

cd HADDOCK-SAXS-Scoring

我們對接的統計資訊已提供在 index.html 這個檔案內,請用任合一種網頁瀏覽器開啟該檔案,並瀏覽其內容。在網頁中可以看到有多少種群集cluster(結合模式)被篩選出來以及最高分數。您可以下載每個群集中排名較高的結構進行比較同時與標定答案,4g9s進行比較(此時您可以看到第6個群集(排第4)代表接近對照結構4g9s的點)。

接下來,可以計算小角度散射 結果與生成模型間的分數比較。您需要一條SAXS的實驗曲線(T58_SAXS.dat -在資料夾中) 和兩個指令檔案 (HADDOCK-SAXS-Scoring.csh, re-rank-SAXS.csh)

第一步需要執行HADDOCK-SAXS-Scoring.csh

這個指令檔會執行Crysol 用來計算每個模型與實驗結果之間差異。

CRYSOL 下載連結 (http://www.embl-hamburg.de/biosaxs/download.html.

請更改CRYSOL在HADDOCK -SAXS Scoring.csh指令檔中的路徑 (第29行) 到您實際下載CRYSOL的位置:

set crysol_dir = <enter here the location of the Crysol executable>

HADDOCK-SAXS-Scoring.csh  有兩個參數: 第一個是需進行分析的PDB列表;第二個是這些PDB檔案的根名。 在此使用如下的指令:

./HADDOCK-SAXS-Scoring.csh file.nam cluster &

這個過程耗時約5分鐘, 結束之後,會產生一個saxs.fit 的輸出檔.不同的模型對應的c值大小都可以在這檔案裡找到。接下來我們將加入c值到HADDOCK分數.執行以下指令檔re-rank-SAXS.csh:

./re-rank-SAXS.csh

這個指令檔可輸出分數,及HADDOCKSAXS的數值。接著檢查加入c值後對HADDOCKSAXS的影響

./prepare-plot-stats.csh

這個指令檔的輸出檔是HSSAXS_HS_SAXSFit_RMSD.list, 其中包含各個不同結構的計分(c, HADDOCK, HADDOCKSAXS ) 和i-RMSD.i-RMSD定義為分子錯合物介面均方根偏差值(root mean sequenced deviation)間的RMSD,用來評估分子介面正確性(因為我們已經有X光單晶結構,因此可以預先計算i-RMSD). 一般而言,可接受的i-RMSD應該小於4Å。

接下來可以用任意繪圖工具繪製HSSAXS_HS_SAXSFit_RMSD.list來觀察每個計分和i-RMSD的分布。例如,如果您已安裝xmgrace,您也可以使用下面的命令繪圖:

 

./make_rms-ene.csh 5 3 *_RMSD.list  

./make_rms-HSSAXS.csh 5 2 *_RMSD.list

./make_rms-chi.csh 5 4 *_RMSD.list

接下來,藉由xmgrace執行圖像輸出:

xmgrace rms-ene.xmgr

xmgrace rms-HSSAXS.xmgr

xmgrace rms-chi.xmgr

最後,會得到下面的圖表:

rmsd-HS_0.pngrmsd-chi.pngrmsd-HSSAXS.png

這些圖表顯示HADDOCK和小角度散射計分的組合提供了最像漏斗狀的分布,可以透過以下檔案檢查排序第一的結構並比較傳統HADDOCK的結果。 HSSAXS_HS_SAXSFit.list,在這個分布中,第一列是的PDBID,第二列是HADDOCKSAXS的計分,第三列是HADDOCK的計分,第四列則是c值。

 

現在我們再來看看排名的變化,從HADDOCKSAXS 的分數為基準統計能量

#Clstrid   meanE   stdE
Cluster7   -71.2   17.7
Cluster1   -59.8   3.1
Cluster6   -56.4   24.3
Cluster4   -55.6   12.9
Cluster2   5.7   16.5
Cluster9   31.2   46.3
Cluster3   31.6   11.2
Cluster5   66.9   5.9
Cluster8   69.9   16.4

原本的第六的群集在新的計分制度現在排第三。因此,我們有改良後的計分方式,觀察不到這個戲劇性變化的理由是小角度散射對形狀的依賴:當複合物的兩個單體大小與形狀都相似之時,我們無法用小角度散射判別兩者的差異。

在理想狀況下,使用者可以利用我們提供的指令檔計算任何一個HADDOCK模型的HADDOCKSAXS 分數,如果在特定情況下,指令檔會需要更多的細節描述,可以諮詢我們在HADDOCK-SAXS scriptorium的說明.或者您也可以發送您的問題到ezzgikaraca@gmail.com

 


參考資料

E. Karaca and A. M. J. J. Bonvin, On the usefulness of ion-mobility mass spectrometry and SAXS data in scoring docking decoys, Acta Cryst. (2013). D69, 683-694, doi:10.1107/S0907444913007063   

0
Your rating: None

Cite WeNMR/WestLife

 
Usage of the WeNMR/WestLife portals should be acknowledged in any publication:
 
"The FP7 WeNMR (project# 261572) and H2020 West-Life (project# 675858) European e-Infrastructure projects are acknowledged for the use of their web portals, which make use of the EGI infrastructure and DIRAC4EGI service with the dedicated support of CESNET-MetaCloud, INFN-PADOVA, NCG-INGRID-PT, RAL-LCG2, TW-NCHC, SURFsara and NIKHEF, and the additional support of the national GRID Initiatives of Belgium, France, Italy, Germany, the Netherlands, Poland, Portugal, Spain, UK, South Africa, Malaysia, Taiwan and the US Open Science Grid."
 
And the following article describing the WeNMR portals should be cited:
Wassenaar et al. (2012). WeNMR: Structural Biology on the Grid.J. Grid. Comp., 10:743-767.

EGI-approved

The WeNMR Virtual Research Community has been the first to be officially recognized by the EGI.

European Union

WeNMR is an e-Infrastructure project funded under the 7th framework of the EU. Contract no. 261572

WestLife, the follow up project of WeNMR is a Virtual Research Environment e-Infrastructure project funded under Horizon 2020. Contract no. 675858

West-Life