You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 12 Next »

Krótki opis usługi

Usługa jest przeznaczona dla biologów i bioinformatyków. 

Usługa BioKepler składa się z kilku elementów: dostarczane jest całe wirtualne środowisko pracy dostępne poprzez zdalny desktop: maszyna wirtualna uruchomiona na zasobach chmurowych, a na niej zainstalowany zestaw popularnych narzędzi i aplikacji bioinformatycznych oraz oprogramowanie BioKepler. BioKepler jest modułem platformy zarządzania naukowymi scenariuszami obliczeniowymi -  Keplera, który służy do uruchamiania zestawu narzędzi bioinformatycznych w rozproszonych środowiskach obliczeniowych takich jak PLGrid. Użytkownik może tworzyć całe scenariusze obliczeniowe (ang. Workflows lub pipelines), składające się z wielu kroków, a poszczególne komponenty mogą być uruchamiane na różnych zasobach obliczeniowych.

Przykładowe komponenty BioKeplera (aktorzy): 2bwt-builder, DynamicTrim.pl, RNA_parse.pl SOAPdenovo31mer, blast_rRNA.pl, blastall, bowtie, bowtie-build, bowtie2-build, breakdancer-max, bwa_align bwa_index, cd-hit cd-hit-454, cd-hit-est, clustalw, clustalx, cuffdiff, cytoscape, faa_stat.pl, fastq2fasta.py, fraggene_scan.pl, fraggene_scan_parse.pl, hmm_rRNA.pl, hmmsearch.pl, hmmsearch_parse.pl, kegg.pl, kegg_parse.pl, metagene.pl, mother, muscle orf_2_tbl.pl, orf_finder, qc_filter.pl, qc_filter_fastq.pl, qiime rasmol, rpsblast.pl, rpsblast_parse.pl, samtools, soap, ssake, tRNAscan-SE.pl, tophat, uchime, velvetg, velveth

Środowisko Kepler w którym scenariusze są tworzone graficznie poprzez łączenie aktorów (elementarnych cegiełek wykonujących określone zadanie) przy użyciu kabli (które transportują dane) ma wbudowaną bibliotekę ponad 400 aktorów (np. 'wyrażenie matematyczne', 'czytnik danych tabelarycznych', 'kod Java', 'skrypt Python', 'narysuj wykres'). Gotowe scenariusze mogą być uruchamiany w trybie graficznym bądź z linii komend.

Aktywowanie usługi

Aby skorzystać z usługi BioKepler, należy mieć aktywne konto w infrastrukturze PLGrid.

Do usługi BioKepler może uzyskać dostęp każdy użytkownik PLGrid, który jest użytkownikiem usługi Grid Dziedzinowy Biologia . W celu uzyskania dostępu do tych usług należy wejść na stronę http://portal.plgrid.pl a następnie zalogować się podając swój identyfikator plgrid (np. plgnowak) i hasło do portalu, po czym z górnej belki zawierającej menu wybrać opcję „Moje konto”. W prawej kolumnie ukaże się Katalog usług dostępnych dla danego użytkownika.

Z katalogu usług należy wybrać kategorię: Platforma Dziedzinowa – Biologia, a następnie „rozwiń”, ukaże się lista usług w tej kategorii, wśród nich będzie usługa o nazwie „Biologia” a tuż obok link zatytułowany „aplikuj o usługę”. Akceptacja użytkownika następuje automatycznie. Gdy rejestracja się powiedzie, usługa na liście w katalogu zyska status „aktywny”.

Pierwsze kroki

Poniżej przedstawione są następujące kroki:

  • instalacja oprogramowania x2go
  • konfiguracja x2go
  • łączenie ze środowiskiem pracy użytkownika BioKepler ( na zasobach chmurowych)
  • uruchomienie oprogramowania BioKepler
  • załadowanie przykładowego scenariusza (ang. Workflows)
  • uruchomienie przykładowego scenariusza w narzędziu BioKepler

Instalacja oprogramowania x2go

  1. Pobranie oprogramowanie x2go (klient) ze strony: http://wiki.x2go.org/doku.php/doc:installation:x2goclient - na odpowiednią platformę.
  2. Instalacja klienta x2go

Konfiguracja klienta x2go:

  1. Session name: BioKepler
  2. Host: 62.3.168.25
  3. login: 'plgusername'
  4. sessiontype: (na przykład GNOME)
  5. "ok" doda nową sesję do listy dostępnych sesji na pasku po prawej stronie

 

 

Dalsza konfiguracja:

  1. Zmiana rozmiaru zdalnego desktopu: wg. preferencji

 

Łączenie ze środowiskiem pracy użytkownika BioKepler ( na zasobach chmurowych)

  1. Wybór skonfigurowanej sesji
  2. podanie hasła
  3. potwierdzenie zaufania dla kluczy

 

 

 

 

Po połączeniu ze zdalnym środowiskiem pracy, powinien pojawić się zdalny pulpit, na której między innymi znajduje się ikona do narzędzia BioKepler: kepler.sh

 

Uruchomienie oprogramowania BioKepler (poprzez ikonę kepler.sh).

"Run in terminal" da możliwość obserwowania komunikatów w konsoli.

Pierwsze odpalenie BioKeplera będzie trwało dłużej ze względu na automatyczne tworzenie katalogów i kopiowaniu plików do katalogu domowego.. 

 

 

Po uruchomieniu pojawi się splash screen aplikacji, który należy zamknąć.(można wybrać opcje żeby nie pojawiał się przy następnych uruchomieniach)

 

 

Uruchomienie przykładowego scenariusza

Z zakładki po lewej stronie przestrzeni roboczej (dashboard) można wybrać gotowe scenariusze lub utworzyć samemu nowy scenariusz. Dla przykładu wpisując "blast" lub wybierając "Demos BioKepler Alignment Blast.xml"

i klikając podwójnie na ikonę można otworzyć przykładowy workflow

Ponieważ workflow jest prekonfigurowany i są dostępne przykładowe dane wejściowe, można od razu przejść do uruchomienia scenariusza.

Można to osiągnąć poprzez naciśnięcie ikony "press"

Wynik uruchomienia tego scenariusza powinien się pojawić w osobnym oknie (blast.Display)

 

 

 

 

Zaawansowane użycie

Analogicznie do przykładu przedstawionego w sekcji pierwsze kroki, można uruchomić kilkanaście innych gotowych scenariuszy.

Poniżej przykładowe wyniki uruchomień przykładowych scenariuszy/

 

Soap

 

Assembly/velvet

 

SAMTOOLS

 

Zestaw kilkuset najczęściej używanych programów domenowych jest dostępnych na ścieżce uruchomieniowej, może być również wykorzystany poprzez BioKeplera.

Część narzędzi bioinformatycznych jest również dostępnych z poziomu menu (na przykład Dendroscope, cn3d, sequin, splitstree, tetra, trev, squint, etc)

W sprawie konstruowania innych scenariuszy/pomocy przy konfigurowaniu obecnych można zwrócić się do zespołu zajmującego się wsparciem 

Gridu dziedzinowego Biologii, w szczególności do Marcina Płóciennika i Marka Żywickiego.

 

Gdzie szukać dalszych informacji?

Szczegółowe informacje o użytkowaniu infrastruktury PLGrid znajdują się w Podręczniku Użytkownika.

Szczegółowa dokumentacja programu BioKepler znajduje się na stronie: http://www.biokepler.org/userguide

Szczegółowa dokumentacja platformy Kepler znajduje się w pliku: dokumentacja.pdf 

Informacje o usługach dziedzinowych Biologia dostępne są na stronie: http://biologia.plgrid.pl/

Uzyskanie informacji/helpdesk PLGrid: dokumentacji o pomocy

 

 

 

  • No labels