A worldwide e-Infrastructure for NMR and structural biology

範例研究:準備執行HADDOCK所需的輸入檔

這裡闡釋於核磁共振化學位移擾動資料下定義AIRs(ambiguous Interaction Restraints)的流程,以下幾點說明:

  1. 定義“顯著”化學位移擾動的殘基

  2. 根據溶劑可接觸性質篩選主動殘基

  3. 定義被動殘基

  4. 由一整體平均的結構來篩選殘基

  5. 建立AIR


1.     定義具有顯著化學位移擾動的殘基

我們假設有個稱為csp.dat的檔,由15N HSQC NMR滴定實驗獲得具有結合氫/氮化學位移差異,其格式如下(第一行對應到蛋白質殘基數,第二行為化學位移擾動)

1  0.0

2  0.0

3  0.06

4  0.3

HADDOCK 由許多ack,csh與perl scrips 來處理分析資料,為了計算平均的擾動資料,你可以使用average.perl這個script,位於$HADDOCKTOOLS (見Installation章節),利用下列命令提示,你可以得到具有兩行的csp.dat檔作為average.perl的輸入檔。

awk '{print $2}' csp.dat | $HADDOCKTOOLS/average.perl

然後選定具有化學位移擾動大於平均值avcsp的所有殘基:

awk '{if ($2>avcsp) print $0}' csp.dat

這可以幫助你條列出所有選定的殘基。下個步驟包含根據溶劑可接觸性質如何篩選那些殘基。
 

2.     根據溶劑可接觸性質篩選主動殘基

在定義AIRs時,一個關於殘基溶劑可接觸性(RSA)很重要的參數。RSA可以利用NACCESS這個程式來計算(見軟體連結http://www.nmr.chem.uu.nl/haddock/ [1] ) 。NACCESS 將輸出一個延伸檔 .rsa含有每個殘跡的溶劑可接觸性被分類為許多形式:

ACCESS.png

只有具有高溶劑可接觸性質的殘基會被選定,選定所有原子可觸性質的工作可以利用Unix prompt中的命令提示:

awk '{if (NF==13 && $5>50) print $0; if (NF==14 && $6>50) print $0}' pdb_filename.rsa

或是要求以蛋白質主鏈或側鏈上相對溶劑可接觸性高於50%的那些殘基:

awk '{if (NF==13 && ($7>50 || $9>50)) print $0; if (NF==14 && ($8>50 || $10>50)) print$0}' pdb_filename.rsa

藉著結合實驗上的資料(點突變或是核磁公振化學位移擾動)與每個殘跡的溶劑可觸性質,你應該可以精確地在使用HADDOCK時定義主動的蛋白質殘基。
 

3.     定義被動殘基

AIR-Rasmol1.png

被動的蛋白質殘基即所有位在主動殘基旁溶劑可接觸表面的殘基。你可以定義於space-filling模型中 (如利用Rasmol) 來顯示,且以紅色顯示。
AIR-Rasmol2.png
然後篩選掉具有低溶劑可觸性的殘基(黃色的殘基)

AIR-Rasmol3.png

選擇所有位於表面及種動殘基旁的被動殘基(綠色的殘基)

AIR-Rasmol4.png

利用溶劑可觸性為依據篩選被動的殘基(如上)。如果你用一整體平均的結構作為起始,就需要使用一平均的溶劑可觸性質來篩選蛋白質結構上被動與主動的殘基。
 

4.     由一整體平均的結構來篩選殘基

如果你在一平均的結構下做接合(docking),其溶劑可觸性質篩選上也必須考慮其整體相對的平均值(ASAav)。在此情況下我們使用以下性質排除偏離平均的值:

ASAav + SD > 50% (for either all or main-chain or side-chain atoms)

這裡SD代表標準偏差(standard deviation)。於$HADDOCKTOOLS路徑下我們提供一個csh script稱為calc_ave_asa.csh 讓你利用NACCESS由一個平均的結構計算平均的溶劑可觸性質。如此,你應該將你的pdb檔拆成具單一結構的不同檔案,然後使用calc_ave_asa.csh:

$HADDOCKTOOLS/calc_ave_rsa.csh *.pdb

一個稱為“rsa_ave.lis”具有每個殘基的平均溶劑可觸性與平均偏差的檔案將被建立:

rsa_ave.list_.png

選擇那些溶劑可觸性SD > 50% 的殘基:

awk '{if (($5+$6)>=50 || ($7+$8)>=50) print $0}' rsa_ave.lis

要注意的是SD > 50% 並不是嚴格的限制,由使用者決斷。
 

5.     建立AIR

當你已經定義你的主被動殘基,到HADDOCK首頁(http://www.nmr.chem.uu.nl/haddock/ [1] ),選擇project setup與點選“Generate AIR restraint file”。鍵入主動與被動殘基所對應到的殘基數。你可以對AIRs定義一個較高的距離限制(在一分子內的主動殘基的任一原子到另一分子上主被動殘基原子間的最大距離) 最後,點選 Generate AIR restraints 的選項,由此,一個以CMS 模式的AIR restraints 檔便可產生。為了儲存這個檔案,可以利用copy& paste 其內容至一個新的檔案或是利用File>Save as 選項來選擇儲存路徑。

來源 URL: http://www.wenmr.eu/wenmr/case-study-preparing-input-files-manual-haddock-run
 

參考連結:

[1] http://www.nmr.chem.uu.nl/haddock/

 

0
Your rating: None

Cite WeNMR/WestLife

 
Usage of the WeNMR/WestLife portals should be acknowledged in any publication:
 
"The FP7 WeNMR (project# 261572) and H2020 West-Life (project# 675858) European e-Infrastructure projects are acknowledged for the use of their web portals, which make use of the EGI infrastructure and DIRAC4EGI service with the dedicated support of CESNET-MetaCloud, INFN-PADOVA, NCG-INGRID-PT, RAL-LCG2, TW-NCHC, SURFsara and NIKHEF, and the additional support of the national GRID Initiatives of Belgium, France, Italy, Germany, the Netherlands, Poland, Portugal, Spain, UK, South Africa, Malaysia, Taiwan and the US Open Science Grid."
 
And the following article describing the WeNMR portals should be cited:
Wassenaar et al. (2012). WeNMR: Structural Biology on the Grid.J. Grid. Comp., 10:743-767.

EGI-approved

The WeNMR Virtual Research Community has been the first to be officially recognized by the EGI.

European Union

WeNMR is an e-Infrastructure project funded under the 7th framework of the EU. Contract no. 261572

WestLife, the follow up project of WeNMR is a Virtual Research Environment e-Infrastructure project funded under Horizon 2020. Contract no. 675858

West-Life