Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Przykłady przygotowywania plików wsadowych oraz danych do uruchamiania usługi UNRES w różnych wariantach wraz z opisem zawaste w archiwum zip przykłady.zip można pobrać korzystając z przytoczonego linku.

Poniżej krótki opis wraz z objaśnieniem uruchamiania kanonicznej dynamiki molekularnej Langevina. Używany jest wariant pola siłowego UNRES oznaczony jako pole E0lL2Y (pole "ogólnych zastosowań"). Ten przykład jest zawarty w przytoczonym archiwum w katalogu ff_1l2y_1le1/LANG.

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Skrypt QCG (plik langdyn.qcg):

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

#QCG host=inula                                                                                   # Obliczenia na inuli (na razie jedyna możliwość)

#QCG walltime=PT15M                                                                          # maksymalny czas zadania 15 minut

#QCG nodes=1:1                                                                                   # używamy 1 procesor

#QCG note=l2y-langdyn                                                                        # identyfikator zadania

#QCG output=${JOB_ID}.output                                                            # specyfikacja nazw pliku z wydrukami z programu i systemu qcg na ekran

#QCG error=${JOB_ID}.error                                                                # specyfikacja nazwy pliku z komunikatami o błędach

#QCG stage-in-dir=.                                                                              # pliki danych będą brane z bieżącego katalogu

#QCG stage-out-dir=.                                                                            # pliki wynikowe będą umieszczane w bieżącym kagalogu

module load plgrid/apps/unres-e0ll2y/3.2.1                                           # ładowanie modułu zawierającego komp0onentu usługi dla pola E0LL2Y

export NPROCS=`cat $PBS_NODEFILE | wc -l`                       

cd $PBS_O_WORKDIR

mpirun -machinefile $PBS_NODEFILE -np $NPROCS unres.csh          # uruchamiamie skryptu unres.csh

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

 Plik unres.csh

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

#!/bin/csh

setenv FGPROCS 1                                                                              # obliczenia energii nie są zrównoleglone

setenv POT GB                                                                                     # specyfikacja potencjału oddziaływań między łańcuchami bocznymi (musi być taka dla pola E0LL2Y)

setenv PREFIX 1L2Y_lang                                                                    # specyfikacja nazw plików; plik wynikowy będzie się nazywał 1L2Y_lang.inp

setenv OUT1FILE YES                                                                          # plik wynikowy będzie produkowany tylko przez procesor główny (tutaj nie jest to ważne bo obliczenia są jednoprocesorowe)

unresMD_gfortran_MPICH_E0LL2Y.exe $*                                            # uruchamianie aplikacji.

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 

 Plik danych 1L2Y_lang.inp (uwaga: formatowanie przy wyświetlaniu na stronie podręcznika nie jest poprawne); plik poprawnie sformatowany można pobrać stąd. Poniżej podany jest tylko przykładowy skrótowy opis; pełen opis danych znajduje się w dokumentacji pakietu UNRES (w języku angielskim).

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

1L2Y                                                                                                                                                      # tytuł (łańcuch tekstowy 80-znakowy).                                  

SEED=-3059743 PDBREF MD                                                                                                               # ogólne dane; startowa liczba losowa, specyfikacja, że będzie struktura odniesienia i specyfikacja obliczeń MD

nstep=1000000 ntwe=100 ntwx=10000 dt=0.01 damax=10000.0 lang=1 scal_fric=0.01  &                    # 10 mln kroków dynamiki, zrzut energii co 100 kroków, zrzut wsółrzędnych co 10000 kroków, krok 0.01 jednostek "gruboziarnistych" (4.89 fs), obliczenia w trybie Langevina, skalowanie lepkości wody przez 1/100, kontynuacja tych danych w następnej linii ("&" w 80-tej kolumnie).

t_bath=300                                                                                                                                              # temperatura 300 K.

WLONG=1.00000 WSCP=1.23315 WELEC=0.84476 WBOND=1.00000 WANG=0.62954            &        # wagi wkładów do energii (nie mogą być zmienione dla używanej wersji pola siłowego)

WSCLOC=0.10554 WTOR=1.84316 WTORD=1.26571 WCORRH=0.19212 WCORR5=0.00000        &

WCORR6=0.00000 WEL_LOC=0.37357 WTURN3=1.40323 WTURN4=0.64673 WTURN6=0.00000    &

WVDWPP=0.23173 WHPB=1.00000 WSCCOR=0.0                                         &

CUTOFF=7.00000 WCORR4=0.00000

1L2Y.pdb                                                                                                                                                  # nazwa pliku ze strukturą eksperymentalną (strukturą odniesienia); podlinkowany do pobrania.

22                                                                                                                                                             # 22 reszty aminokwasowe

 D   ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO      # sekwencja białka w kodzie trójliterowym (D oznacza grupę blokującą, która nie zawiera pełnej grupy peptydowej); format 20 (1X,A3).

 SER D  

 0                                                                                                                                                              # brak reszt cysteiny mogących tworzyć wiązania disulfidowe

 0                                                                                                                                                              # brak więzów

  104.9286   87.6954   81.9040   82.4664   84.4658   83.9446   85.3958   91.4490                                # specyfikacja geometrii wirtualnej: wirtualne kąty walencyjne, wirtualne kąty torsyjne oraz kąty sferyczne określające geometrię łańcuchów bocznych.

   94.6016  101.8618  119.3634   94.3628   96.2641  138.1186   96.2995  129.7022

  109.4446  106.3486  106.0416  108.7182

 -100.4302   72.4264   66.0265   51.4337   53.5083   60.5686   44.1766   67.6037

  -72.8136  -61.9155  -75.8939   67.3579  129.7011  -95.5708   63.9717  -74.5043

 -122.3059 -134.6048   92.1133

  102.3561  120.0919  152.3636  134.9756  122.3426  152.1780  159.0518  100.5580

  139.9612    0.0000    0.0000  117.4525  137.0250  146.2899    0.0000   93.9014

  101.0251  113.0432   93.7775  153.8351

  -82.3166  -56.6854   85.0901  -88.6662 -140.9453   38.0240  179.4707  -73.0903

 -144.7967    0.0000    0.0000 -133.1635 -106.6593 -130.3055    0.0000 -102.7467

 -111.6412 -122.0445 -102.3738 -143.3033

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Uruchamianie. Po zalogowaniu się na serwer, z którego można uruchamiać zadania w systemie Qcg-Qos, np. qcg.man.poznan.pl i przeniesieniu tam wymienionych powyżej plików, należy wydać polecenie:

qcg-sub langdyn.qcg

Do monitorowania zadań służą polecenia qcg.

Plikami wynikowymi będą:

1L2Y_lang,out_MD000 : plik zawierający podstawowe informacje o danych wejściowych, typie obliczeń, zastosowanych ustawieniach oraz przebiegu obliczeń.

1L2Y_lang_GB000.stat : plik zawierający skróconą informację o powszczególnych krokach czasowych dynamiki; opis (w języku angielskim) znajduje się na stronie opisu programu UNRES.

1L2Y_lang_GB000.cx : plik zawierający współrzędne poszczególnych konformacji z trajektorii dynamiki Langevina (zgodnie z informacją podaną w pliku wejściowym, są one zapisywane z częstotliwością co 10000).

Trajektoria zapisana w formie skompresowanej w pliku cx nie jest gotowa do oglądania/przetwarzania programami grafiki molekularnej. Należy przekształcić go do formatu Protein Data Bank (PDB)  przy użyciu programu xdrf2pdb. Program jest dostępny w ramach usługi UNRES i może być uruchamiany w trybie wsadowym jednak z uwagi na to, że pliki pdb zajmują znacznie więcej miejsca niż pliki cx, lepiej skopiować plik cx na swój lokalny komputer i tam uruchomić xdrf2pdb interaktywnie. Program xdrf2pdb można uzyskać ze strony "downloads" pakietu UNRES. Po wejściu na stronę należy kliknąć na guzik "ACCEPT LICENSE TERMS"  i ściągnąć archiwum xdrfpdb-src-v.3.2.1.tar.gz.

Polecenie konwersji dla podanego przykładu jest następujące:

xdrf2pdb three seq-3let 1L2Y_lang_MD000.cx 1 1 100 1L2Y_lang.pdb

gdzie

three oznacza, że podawana będzie sekwencja aminokwasowa białka w kodzie trójliterowym

seq-3let jest plikiem z sekwencją; format 20(A3, 1X); zawartość poniżej

D   ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO

SER D

1L2Y_lang_MD000.cx jest nazwą pliku ze współrzędnymi konformacji białka z obliczonej trajektorii w formacie skompresowanym.

1 1 100 : konformacje będą zapisywane co 1, począwszy od konformacji 1 a skończywszy na konformacji 100

1L2Y_lang.pdb : wynikowy plik z konformacjami w formacie PDB; konformacje te zawierają geometrię na poziomie gruboziarnistym; tylko atomy węgla alfa (CA) i centra łańcuchów bocznych (CBplik przykłady.zip).

Zaawansowane użycie

Przewidywanie de novo struktury białka przy pomocy pola siłowego UNRES

...