...
Usługa UNRES jest przyjazną dla użytkownika realizacją pakietu modelowania gruboziarnistego białek, opartego na polu siłowym UNRES opracowanym w wyniku współpracy grupy prof. Adama Liwo z Wydziału Chemii Uniwersytetu Gdańskiego oraz grupy prof. Harolda A. Scheragi , z Cornell University, USA. Dzięki znacznemu uproszczeniu reprezentacji łańcucha polipeptydowego przy jednoczesnym ścisłym związku wyprowadzonego pola siłowego z fizyką oddziaływać symulacje są przyspieszone 1000 - 10000 razy w stosunku do obliczeń w reprezentacji pełnoatomowej. Adresatami usługi są biofizycy, biologowie molekularni i bioinformatycy, którzy mają potrzebę symulowania zainteresowani symulowaniem zmian strukturalnych, dynamiki i termodynamiki dużych układów białkowych w czasie rzeczywistym. W szczególności usługa będzie przydatna dla badaczy, którzy chcą wykonać wspomniane wielkoskalowe symulacje białek, natomiast brak czasu nie pozwala im na zapoznanie się z uruchamianiem zadań bezpośrednio na serwerach przy użyciu systemu kolejkowania.
Z usługi można korzystać na dwa sposoby: za pośrednictwem interaktywnego portalu UNRES oraz przy pomocy systemy wsadowego QosCos. W tym drugim przypadku należy najpierw załadować moduł /usr/share/Modules/modulefiles/plgrid/plgrid/apps/unres-e0ll2y/3.2.1 (obliczenia przy użyciu ogólnej wersji pola siłowego opisanej w W usłudze dostępne są dwie wersje pola siłowego. Wersja pierwsza, ogólna, oznaczana dalej jako E0LL2Y, umożliwia obliczenia dla białek o wszystkich typach struktury drugorzędowej, jednak wymaga użycia metod przewidywania struktury drugorzędowej i nałożenia słabych więzów na tę strukturę (He et al., J. Comput. Chem., 2009, 30, 2127-2135) lub /usr/share/Modules/modulefiles/plgrid/plgrid/apps/unres-gab/3.2.1 (obliczenia dla wersji pola siłowego odpowiedniego dla białek helikalnych; . Wersja druga, oznaczana dalej jako GAB, umożliwia obliczenia dla białek o strukturze helikalnej (Liwo et al., J. Phys. Chem. B, 2007, 111, 260-285).
...
...
Z usługi można korzystać na dwa sposoby: za pośrednictwem interaktywnego portalu UNRES oraz przy pomocy systemy wsadowego QosCosGrid.
Aby skorzystać z usługi UNRES należy posiadać konto w portalu PLGRID oraz posiadać aktywny grant obliczeniowywłaściwy PLGrid. Należy również złożyć wniosek o dołączenie do zespołu plggunresng usługę UNRES w Katalogu Aplikacji i Usług. Spowoduje to dodanie użytkownika do zespołu plggunresng (zespół użytkowników usługi UNRES).
...
Obecnie aplikacje składające się na usługę są zainstalowane w ramach systemu PLGRID tylko na klastrze inula infrastruktury PLGrid na klastrach:
Portal QCG umożliwiający interaktywne uruchamianie zadań kieruje zadania tylko na klaster inula. Za pośrednictwem portalu .Obecnie za pośrednictwem portalu QCG można uruchomić tylko główny moduł obliczeniowy UNRES, natomiast moduły analizy wyników dynamiki molekularnej z wymianą replik można uruchomić jedynie bezpośrednio w trybie wsadowym. Rozszerzenie funkcjonalności portalu QCG na ten moduły jest w toku.
Ponieważ w chwili obecnej system QosCosGrid nie obejmuje kierowania zadań na klaster Prometheus, w przypadku uruchamiania zadań na tym komputerze należy używać systemu slurm, podobnie jak w przypadku uruchamiania innych zadań na tym komputerze. Szczegółowy opis znajduje się w podręczniku Prometheus:Podstawy.
Zalecane jest zapoznanie się z dokumentacją części składowych pakietu UNRES dostępną na stronie pakietu (dokumentacja w języku angielskim).
Zlecanie zadań przez portal UNRES możliwe jest tylko na klaster inula w PCSS.
Portal UNRES jest dostępny pod adresem https://unres-portal.plgrid.pl. Portal jest zintegrowany z OPENID. Należy zalogować się na portal używając identyfikatora użytkownika w systemie PL-GRID.
W celu W celu zlecenia zadania z poziomu portalu UNRES należy wybrać zakładkę "Zlecanie zadań", a następnie przycisk "nowe zadanie":
W celu zlecenia dynamiki molekularnej należy w zakładce "MD" :
Następnie w zakładce "Zasoby" ustawiamy klaster obliczeniowy oraz czas obliczeń. UWAGA: W chwili obecnej pakiet UNRES zaimplementowany jest tylko na klastrze Inula.
Przykłady przygotowywania plików wsadowych oraz danych do uruchamiania usługi UNRES w różnych wariantach wraz z opisem zawaste w archiwum zip przykłady.zip można pobrać korzystając z przytoczonego linku.
Poniżej krótki opis wraz z objaśnieniem uruchamiania kanonicznej dynamiki molekularnej Langevina. Używany jest wariant pola siłowego UNRES oznaczony jako pole E0lL2Y (pole "ogólnych zastosowań"). Ten przykład jest zawarty w przytoczonym archiwum w katalogu ff_1l2y_1le1/LANG.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Skrypt QCG (plik langdyn.qcg):
...
Uwaga 1: Wybranie pliku pdb, który zawiera strukturę odniesienia danego białka (na ogół strukturę eksperymentalną z bazy pdb), jest o w obecnej konfiguracji portalu konieczne. Jeżeli ten plik nie zostanie podany, zadanie zakończy się z błędem.
Uwaga 2: Sekwencja aminokwasowa musi zaczynać/kończyć się resztą "dummy" oznaczaną jako X jeżeli łańcuch nie zaczyna się/kończy pełną grupą peptydową (czyli grupa początkowa jest grupą -NH3+ lub grupa końcowa jest grupą COO-; sekwencja "nieblokowana"). Jeżeli łańcuch zaczyna się/kończy pełną grupą peptydową lub pierwszą/ostatnią resztą jest glicyna, należy wstawić G. Wstawienie innych reszt niź X lub G na początku lub końcu spowoduje błędy w obliczeniach. Wstawienie grup blokujących powoduje pozorne wydłużenie sekwencji, np. jeżeli chcemy wykonać obliczenia nieblokowanego pentapeptydu Ala-Lys-Gly-Pro-Ser to musimy wprowadzić sekwencję XAKGPSX a jeżeli chcemy wykonać obliczenia analogicznego blokowanego pentapeptydu Ac-Ala-Lys-Gly-Pro-Ser-NHCH3 to wprowadzamy sekwencję GAKGPSG. W przypadku sekwencji np. Gly-Leu-Pro-Leu-Ala-Gly nie trzeba dodawać grup blokujących i wprowadzić sekwencję GLPLAG
Następnie w zakładce "Zasoby" ustawiamy klaster obliczeniowy oraz czas obliczeń. UWAGA: W chwili obecnej portal uruchamia zadania jedynie na klastrze inula).
Więcej opcji dynamiki można uzyskać po kliknięciu napisu "Zaawansowane" w zakładce MD. Odpowiednie pola są objaśnione poniżej; wartości domyślne podano w nawiasach:
NTWE (100): częstość zapisu energii w dynamice molekularnej.
NTWX (1000): częstść zapisu współrzędnych cząsteczki białka.
DT: (0.1) długość kroku czasowego; jednostka jest równa 48,9 fs.
Aby wybrać grant w ramach którego będą wykonywane obliczenia, należy wykonać następujące czynności:
1. wybrać zakładkę MD,
2. kliknąć napis "pokaż zaawansowane",
3. wpisać w pole Grant ID grantu.
Program UNRES wygeneruje tyle niezależnych trajektorii ile wynosi liczba procesorów.
Plikami wynikowymi, które po poprawnym zakończeniu zadania pojawią się w katalogu roboczym i będą mogły być pobrane przez gftp, są:
ZADANIE.out_GB000 - ZADANIE.out_GB00n (gdzie zadanie jest prefiksem nadawanym przez portal a n+1 jest liczbą procesorów): główne pliki wynikowe. Zawierają podstawowe informacje o układzie, informacje o ustawieniach obliczeń dynamiki molekularnej oraz ewentualne informacje o błędach w danych.
ZADANIE_GB000.stat - ZADANIE_GB00n : pliki zawierające podstawowe informacje o przebiegu dynamiki dla każdej trajektorii (nr kroku, czas, energia, rmsd od struktury odniesienia). Proszę zapoznać się z opisem plików danych i wynikowych programu UNRES (dokumentacja w języku angielskim).
ZADANIE_MD000.pdb - ZADANIE_MD00n.pdb : zrzuty konformacji w formacje pdb dla każdej trajektorii. Pliki te można bezpośrednio oglądać przeglądarkami do molekuł np. pymol.
W celu zdefiniowania ścieżek dostępu oraz ustawienia wartości zmiennych środowiskowych dla usługi należy załadować moduł plgrid/apps/unres-e0ll2y/3.2.1
(pole E0LL2Y0) lub plgrid/apps/unres-gab/3.2.1
(pole GAB), w zależności od żądanego pola siłowego. W przypadku uruchamiania zadań przez portal odpowiedni moduł jest ładowany poprzez wybór odpowiedniego pola siłowego z menu.
Przykłady przygotowywania plików wsadowych oraz danych do uruchamiania usługi UNRES w różnych wariantach wraz z opisem zawarte są w archiwum zip. przykłady.zip można pobrać korzystając z przytoczonego linku.
Poniżej krótki opis wraz z objaśnieniem uruchamiania kanonicznej dynamiki molekularnej Langevina. Używany jest wariant pola siłowego UNRES oznaczony jako pole E0lL2Y (pole "ogólnych zastosowań"). Ten przykład jest zawarty w przytoczonym archiwum w katalogu ff_1l2y_1le1/LANG.
-----------------------------------------------------------
...
#QCG host=inula # Obliczenia na inuli (na razie jedyna możliwość)
#QCG walltime=PT15M # maksymalny czas zadania 15 minut
#QCG nodes=1:1 # używamy 1 procesor
#QCG note=l2y-langdyn # identyfikator zadania
#QCG output=${JOB_ID}.output # specyfikacja nazw pliku z wydrukami z programu i systemu qcg na ekran
#QCG error=${JOB_ID}.error # specyfikacja nazwy pliku z komunikatami o błędach
#QCG stage-in-dir=. # pliki danych będą brane z bieżącego katalogu
#QCG stage-out-dir=. # pliki wynikowe będą umieszczane w bieżącym kagalogu
module load plgrid/apps/unres-e0ll2y/3.2.1 # ładowanie modułu zawierającego komp0onentu usługi dla pola E0LL2Y
export NPROCS=`cat $PBS_NODEFILE | wc -l`
cd $PBS_O_WORKDIR
mpirun -machinefile $PBS_NODEFILE -np $NPROCS unres.csh # uruchamiamie skryptu unres.csh
------------------------------------------------------------------------------------------------------------------------------------------------
Skrypt QCG (plik langdyn.qcg; nie ma w nim dodanych tutaj komentarzy
):
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
...
Plik unres.csh
----------------------------------
...
#!/bin/csh
setenv FGPROCS 1 # obliczenia energii nie są zrównoleglone
setenv POT GB # specyfikacja potencjału oddziaływań między łańcuchami bocznymi (musi być taka dla pola E0LL2Y)
setenv PREFIX 1L2Y_lang # specyfikacja nazw plików; plik wynikowy będzie się nazywał 1L2Y_lang.inp
setenv OUT1FILE YES # plik wynikowy będzie produkowany tylko przez procesor główny (tutaj nie jest to ważne bo obliczenia są jednoprocesorowe)
unresMD_gfortran_MPICH_E0LL2Y.exe $* # uruchamianie aplikacji.
...
#QCG host=inula
## Obliczenia na inuli (na razie jedyna możliwość)
#QCG walltime=PT15M
## maksymalny czas zadania 15 minut
#QCG nodes=1:1
## używamy 1 procesor
#QCG note=l2y-langdyn
## identyfikator zadania
#QCG output=${JOB_ID}.output
## specyfikacja nazw pliku z wydrukami z programu i systemu qcg na ekran
#QCG error=${JOB_ID}.error
## specyfikacja nazwy pliku z komunikatami o błędach
#QCG stage-in-dir=.
## pliki danych będą brane z bieżącego katalogu
#QCG stage-out-dir=.
## pliki wynikowe będą umieszczane w bieżącym kagalogu
module load plgrid/apps/unres-e0ll2y/3.2.1
## ładowanie modułu zawierającego komp0onentu usługi dla pola E0LL2Y
export NPROCS=`cat $PBS_NODEFILE | wc -l`
cd $PBS_O_WORKDIR
mpirun -machinefile $PBS_NODEFILE -np $NPROCS unres.csh
## uruchamiamie skryptu unres.csh
-----------------------------------------------------------------------------------------------------------------------------------------
...
Plik danych 1L2Y_lang.inp (uwaga: formatowanie przy wyświetlaniu na stronie podręcznika nie jest poprawne); plik poprawnie sformatowany można pobrać stąd. Poniżej podany jest tylko przykładowy skrótowy opis; pełen opis danych znajduje się w dokumentacji pakietu UNRES (w języku angielskim).
------------------------------------------------------------------
Plik unres.csh (nie ma w nim dodanych tutaj komentarzy)
-------------------------------------------------------------------------------------------------------------------------------------------------------
...
----------------------------------------------------
#!/bin/csh
setenv FGPROCS 1
# obliczenia energii nie są zrównoleglone
setenv POT GB
# specyfikacja potencjału oddziaływań między łańcuchami bocznymi (musi być taka dla pola E0LL2Y)
setenv PREFIX 1L2Y_lang
# specyfikacja nazw plików; plik wynikowy będzie się nazywał 1L2Y_lang.inp
setenv OUT1FILE YES
# plik wynikowy będzie produkowany tylko przez procesor główny (tutaj nie jest to ważne bo obliczenia są jednoprocesorowe)
unresMD_gfortran_MPICH_E0LL2Y.exe $*
# uruchamianie aplikacji.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Plik danych 1L2Y_lang.inp
(uwaga: formatowanie przy wyświetlaniu na stronie podręcznika nie jest poprawne); plik poprawnie sformatowany można pobrać stąd. Proszę NIE KOPIOWAĆ jego treści podanej dalej bezpośrednio z ekraru ponieważ zawiera ona komentarze, które będą powodowały błędy czytania. Poniżej podany jest tylko przykładowy skrótowy opis; pełen opis danych znajduje się w dokumentacji pakietu UNRES (w języku angielskim).
-------------------------------------------------------------
1L2Y # tytuł (łańcuch tekstowy 80-znakowy).
SEED=-3059743 PDBREF MD # ogólne dane; startowa liczba losowa, specyfikacja, że będzie struktura odniesienia i specyfikacja obliczeń MD
nstep=1000000 ntwe=100 ntwx=10000 dt=0.01 damax=10000.0 lang=1 scal_fric=0.01 & # 10 mln kroków dynamiki, zrzut energii co 100 kroków, zrzut wsółrzędnych co 10000 kroków, krok 0.01 jednostek "gruboziarnistych" (4.89 fs), obliczenia w trybie Langevina, skalowanie lepkości wody przez 1/100, kontynuacja tych danych w następnej linii ("&" w 80-tej kolumnie).
t_bath=300 # temperatura 300 K.
WLONG=1.00000 WSCP=1.23315 WELEC=0.84476 WBOND=1.00000 WANG=0.62954 & # wagi wkładów do energii (nie mogą być zmienione dla używanej wersji pola siłowego)
WSCLOC=0.10554 WTOR=1.84316 WTORD=1.26571 WCORRH=0.19212 WCORR5=0.00000 &
WCORR6=0.00000 WEL_LOC=0.37357 WTURN3=1.40323 WTURN4=0.64673 WTURN6=0.00000 &
WVDWPP=0.23173 WHPB=1.00000 WSCCOR=0.0 &
CUTOFF=7.00000 WCORR4=0.00000
1L2Y.pdb # nazwa pliku ze strukturą eksperymentalną (strukturą odniesienia); podlinkowany do pobrania.
22 # 22 reszty aminokwasowe
D ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO # sekwencja białka w kodzie trójliterowym (D oznacza grupę blokującą, która nie zawiera pełnej grupy peptydowej); format 20 (1X,A3).
SER D
0 # brak reszt cysteiny mogących tworzyć wiązania disulfidowe
0 # brak więzów
104.9286 87.6954 81.9040 82.4664 84.4658 83.9446 85.3958 91.4490 # specyfikacja geometrii wirtualnej: wirtualne kąty walencyjne, wirtualne kąty torsyjne oraz kąty sferyczne określające geometrię łańcuchów bocznych.
94.6016 101.8618 119.3634 94.3628 96.2641 138.1186 96.2995 129.7022
109.4446 106.3486 106.0416 108.7182
-100.4302 72.4264 66.0265 51.4337 53.5083 60.5686 44.1766 67.6037
-72.8136 -61.9155 -75.8939 67.3579 129.7011 -95.5708 63.9717 -74.5043
-122.3059 -134.6048 92.1133
102.3561 120.0919 152.3636 134.9756 122.3426 152.1780 159.0518 100.5580
139.9612 0.0000 0.0000 117.4525 137.0250 146.2899 0.0000 93.9014
101.0251 113.0432 93.7775 153.8351
-82.3166 -56.6854 85.0901 -88.6662 -140.9453 38.0240 179.4707 -73.0903
-144.7967 0.0000 0.0000 -133.1635 -106.6593 -130.3055 0.0000 -102.7467
-111.6412 -122.0445 -102.3738 -143.3033
----------------------------------------------------------------------------------------------------------------------------------------------
1L2Y # tytuł (łańcuch tekstowy 80-
...
znakowy).
SEED=-3059743 PDBREF MD # ogólne dane; startowa liczba losowa, specyfikacja, że będzie struktura odniesienia i specyfikacja obliczeń MD
nstep=1000000 ntwe=100 ntwx=10000 dt=0.01 damax=10000.0 lang=1 scal_fric=0.01 & # 10 mln kroków dynamiki, zrzut energii co 100 kroków, zrzut współrzędnych co 10000 kroków, krok 0.01 jednostek "gruboziarnistych" (4.89 fs), obliczenia w trybie Langevina, skalowanie lepkości wody przez 1/100, kontynuacja tych danych w następnej linii ("&" w 80-tej kolumnie).
t_bath=300 # temperatura 300 K.
WLONG=1.00000 WSCP=1.23315 WELEC=0.84476 WBOND=1.00000 WANG=0.62954 & # wagi wkładów do energii (nie mogą być zmienione dla używanej wersji pola siłowego)
WSCLOC=0.10554 WTOR=1.84316 WTORD=1.26571 WCORRH=0.19212 WCORR5=0.00000 &
WCORR6=0.00000 WEL_LOC=0.37357 WTURN3=1.40323 WTURN4=0.64673 WTURN6=0.00000 &
WVDWPP=0.23173 WHPB=1.00000 WSCCOR=0.0 &
CUTOFF=7.00000 WCORR4=0.00000
1L2Y.pdb # nazwa pliku ze strukturą eksperymentalną (strukturą odniesienia); podlinkowany do pobrania.
22 # 22 reszty aminokwasowe
D ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO # sekwencja białka w kodzie trójliterowym (D oznacza grupę blokującą, która nie zawiera pełnej grupy peptydowej); format 20 (1X,A3).
SER D
0 # brak reszt cysteiny mogących tworzyć wiązania disulfidowe
0 # brak więzów
104.9286 87.6954 81.9040 82.4664 84.4658 83.9446 85.3958 91.4490 # specyfikacja geometrii wirtualnej: wirtualne kąty walencyjne, wirtualne kąty torsyjne oraz kąty sferyczne określające geometrię łańcuchów bocznych.
94.6016 101.8618 119.3634 94.3628 96.2641 138.1186 96.2995 129.7022
109.4446 106.3486 106.0416 108.7182
-100.4302 72.4264 66.0265 51.4337 53.5083 60.5686 44.1766 67.6037
-72.8136 -61.9155 -75.8939 67.3579 129.7011 -95.5708 63.9717 -74.5043
-122.3059 -134.6048 92.1133
102.3561 120.0919 152.3636 134.9756 122.3426 152.1780 159.0518 100.5580
139.9612 0.0000 0.0000 117.4525 137.0250 146.2899 0.0000 93.9014
101.0251 113.0432 93.7775 153.8351
-82.3166 -56.6854 85.0901 -88.6662 -140.9453 38.0240 179.4707 -73.0903
-144.7967 0.0000 0.0000 -133.1635 -106.6593 -130.3055 0.0000 -102.7467
-111.6412 -122.0445 -102.3738 -143.3033
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Po zalogowaniu się na serwer, z którego można uruchamiać zadania w systemie Qcg-Qoscos, np. qcg.man.poznan.pl i przeniesieniu tam wymienionych powyżej plików, należy wydać polecenie:
qcg-sub langdyn.qcg
Do monitorowania zadań służą polecenia qcg.
Plikami wynikowymi będą:
1L2Y_lang.out_GB000 : plik zawierający podstawowe informacje o danych wejściowych, typie obliczeń, zastosowanych ustawieniach oraz przebiegu obliczeń.
1L2Y_lang_GB000.stat : plik zawierający skróconą informację o powszczególnych krokach czasowych dynamiki; opis (w języku angielskim) znajduje się na stronie opisu programu UNRES.
1L2Y_lang_GB000.cx : plik zawierający współrzędne poszczególnych konformacji z trajektorii dynamiki Langevina (zgodnie z informacją podaną w pliku wejściowym, są one zapisywane z częstotliwością co 10000).
Trajektoria zapisana w formie skompresowanej w pliku cx nie jest gotowa do oglądania/przetwarzania programami grafiki molekularnej. Należy przekształcić go do formatu Protein Data Bank (PDB) przy użyciu programu xdrf2pdb. Program jest dostępny w ramach usługi UNRES i może być uruchamiany w trybie wsadowym jednak z uwagi na to, że pliki pdb zajmują znacznie więcej miejsca niż pliki cx, lepiej skopiować plik cx na swój lokalny komputer i tam uruchomić xdrf2pdb interaktywnie. Program xdrf2pdb można uzyskać ze strony "downloads" pakietu UNRES. Po wejściu na stronę należy kliknąć na guzik "ACCEPT LICENSE TERMS" i ściągnąć archiwum xdrfpdb-src-v.3.2.1.tar.gz. Program xdrf2pdb wymaga biblioteki xdrf, która jest w pakiecie UNRES. Jeżeli jeszcze jej nie posiadamy to trzeba ściągnąć archiwum lib.tar.gz ze strony pakietu UNRES. Można też ściągnąć cały pakiet UNRES unrespack-v.3.2.1.tar.gz; biblioteka jest w sources/lib/xdrf lub xdrf_em64 (64 bit) albo xdrf-Argonne (BlueGene Q) gdyby ta nie zadziałała.
Polecenie konwersji dla podanego przykładu jest następujące:
xdrf2pdb three seq-3let 1L2Y_lang_MD000.cx 1 1 100 1L2Y_lang.pdb
gdzie
three oznacza, że podawana będzie sekwencja aminokwasowa białka w kodzie trójliterowym
seq-3let jest plikiem z sekwencją; format 20(A3, 1X); zawartość poniżej
D ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO
SER D
1L2Y_lang_MD000.cx
jest nazwą pliku ze współrzędnymi konformacji białka z obliczonej trajektorii w formacie skompresowanym.
1 1 100 : konformacje będą zapisywane co 1, począwszy od konformacji 1 a skończywszy na konformacji 100
1L2Y_lang.pdb : wynikowy plik z konformacjami w formacie PDB; konformacje te zawierają geometrię na poziomie gruboziarnistym; tylko atomy węgla alfa (CA) i centra łańcuchów bocznych (CB).
Zadania są uruchamiane w systemie kolejkowania slurm. W zależności od używanego pola należy załadować jeden z modułów:
Dodatkowo należy załadować moduł plgrid/tools/impi.
Podobnie jak w przypadku klastra inula, załadowanie modułów powoduje zdefiniowanie plików z właściwymi dla danego pola parametrami; pliki te można jednk podmienić na pliki z parametrami użytkownika. Przykładowy skrypt jest podany poniżej.
----------------------------------------------------------
Plik energy-pdb.sbatch
----------------------------------------------------------
#!/bin/bash -l
#SBATCH -J unres
#SBATCH -N 1
#SBATCH --ntasks-per-node=1
#SBATCH -n 1
#SBATCH --time=00:01:00
#SBATCH -A unresprometheustest
#SBATCH -p plgrid
#SBATCH --output="output.out"
#SBATCH --error="error.err"
#
module load plgrid/apps/unres-e0ll2y/3.2.1
module add plgrid/tools/impi
export PREFIX=1L2Y_ene-pdb
export OUT1FILE=YES
export FGPROCS=1
mpirun unresMD_ifort_MPI_E0LL2Y.exe
-----------------------------------------------------------------
Przykładowe pliki wsadowe dla systemu slurm oraz pliki danych i pliki wynikowe dla różnych trybów obliczeń wraz z krótkim opisem są dostępne w katalogu /net/software/local/unres/Przyklady na klastrze Prometheus; archiwum można pobrać stąd w postaci pliku Przyklady_prometheus.zip
Uruchamianie. Po zalogowaniu się na serwer, z którego można uruchamiać zadania w systemie Qcg-Qoscos, np. qcg.man.poznan.pl i przeniesieniu tam wymienionych powyżej plików, należy wydać polecenie:
qcg-sub langdyn.qcg
Do monitorowania zadań służą polecenia qcg.
Plikami wynikowymi będą:
1L2Y_lang,out_MD000 : plik zawierający podstawowe informacje o danych wejściowych, typie obliczeń, zastosowanych ustawieniach oraz przebiegu obliczeń.
1L2Y_lang_GB000.stat : plik zawierający skróconą informację o powszczególnych krokach czasowych dynamiki; opis (w języku angielskim) znajduje się na stronie opisu programu UNRES.
1L2Y_lang_GB000.cx : plik zawierający współrzędne poszczególnych konformacji z trajektorii dynamiki Langevina (zgodnie z informacją podaną w pliku wejściowym, są one zapisywane z częstotliwością co 10000).
Trajektoria zapisana w formie skompresowanej w pliku cx nie jest gotowa do oglądania/przetwarzania programami grafiki molekularnej. Należy przekształcić go do formatu Protein Data Bank (PDB) przy użyciu programu xdrf2pdb. Program jest dostępny w ramach usługi UNRES i może być uruchamiany w trybie wsadowym jednak z uwagi na to, że pliki pdb zajmują znacznie więcej miejsca niż pliki cx, lepiej skopiować plik cx na swój lokalny komputer i tam uruchomić xdrf2pdb interaktywnie. Program xdrf2pdb można uzyskać ze strony "downloads" pakietu UNRES. Po wejściu na stronę należy kliknąć na guzik "ACCEPT LICENSE TERMS" i ściągnąć archiwum xdrfpdb-src-v.3.2.1.tar.gz.
Polecenie konwersji dla podanego przykładu jest następujące:
xdrf2pdb three seq-3let 1L2Y_lang_MD000.cx 1 1 100 1L2Y_lang.pdb
gdzie
three oznacza, że podawana będzie sekwencja aminokwasowa białka w kodzie trójliterowym
seq-3let jest plikiem z sekwencją; format 20(A3, 1X); zawartość poniżej
D ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO
SER D
1L2Y_lang_MD000.cx jest nazwą pliku ze współrzędnymi konformacji białka z obliczonej trajektorii w formacie skompresowanym.
1 1 100 : konformacje będą zapisywane co 1, począwszy od konformacji 1 a skończywszy na konformacji 100
1L2Y_lang.pdb : wynikowy plik z konformacjami w formacie PDB; konformacje te zawierają geometrię na poziomie gruboziarnistym; tylko atomy węgla alfa (CA) i centra łańcuchów bocznych (CB).
Pole siłowe UNRES umożliwia przeprowadzanie przewidywania de novo struktury białka, korzystając jedynie z sekwencji aminokwasowej. W tym celu należy wykonać symulację dynamiki molekularnej ze zwielokrotnioną wymianą replik (MREMD) wprowadzając sekwencję białka o poszukiwanej strukturze do przykładowego (Rysunek 1) pliku wejściowego MREMD.
Rysunek 1. Przykładowy plik wejściowy używamy w polu siłowym UNRES. Linia pierwsza stanowi komentarz, linie 2-14 zawierają parametry używane w polu siłowym, linia 15 zawiera całkowitą liczbę reszt aminokwasowych symulowanego układu z uwzględnieniem „dummy atom”, natomiast kolejne linie zawierają sekwencję aminokwasową w kodzie jednoliterowym wraz z „dummy atom” (litery X). Ostatnie linie wykorzystywane są do wprowadzenia ograniczeń swobody układu (więzów) np. na strukturę drugorzędową lub odległości między parami atomów.
Przy wprowadzaniu sekwencji należy pamiętać o dodawaniu „dummy atom” „dummy atom” na początku i końcu każdego łańcucha białka (litery X w kodzie jednoliterowym).
...
Zalecany schemat postępowania został umieszczony na poniższym diagramie:
Strona dokumentacji pakietu UNRES ze szczegółowym opisem wprowadzanych danych (w języku angielskim).
...
)
...
.
...