Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

 Usługa umożliwia realizację zadań obliczeniowych na dla bardzo zbiorach dużych danych zbiorach danych lub też wielu bardzo małych zadań w jak najszybszym najkrótszym czasie. Budowane środowisko umożliwia złożone analizy i obliczenia w takich problemach jak:

...

Proszę sprawdzić czy aplikowano o wszystkie niezbędne usługi w Portalu PLGRID. Więcej  wymaganiach Complex Networks zamieszczono w osobnym rozdziale.

Pierwsze kroki

Zlecanie zadań obliczeniowych z użyciem QCG

...

Complex Networks umożliwia zlecania zlecanie zadań obliczeniowych z wykorzystaniem poniżej przedstawionego formularza. Wszystkie parametry oraz ich znaczenie można znaleźć na stronie Format opisu zadań.

Po wskazaniu parametrów zadania możemy je uruchomić klikając na przycisk Zleć zadanie.

Każda Każde z uruchomionych przez Portal Complex Networks zadań można podejrzeć w zakładce Zadania -> Moje zadania.

...

Najpierw musimy dodać pliki na jedną z naszych maszyn dostępowych - możemy połączyć się do nich poprzed poprzez SSH Dostęp do UI (User Interface) albo wykorzystanie GridFTP w Portalu Complex Networks.

...

Wybieramy aplikację BASH (skypt bash użyjemy zostanie użyty do uruchomienia zadania), a w polu Plik główny wskazujemy plik ze skryptem bash. 

Zaznaczamy wybór przy nazwie pliku i potwierdzamy przyciskiem Wybierz.

...

W konsekwencji otrzymujemy wynik jak poniżej (podgląd pliku wyjściowego) - plik można znaleźć wybierając Zadania -> Moje zadania i wchodząc w szczegóły zleconego zadania oraz wybierając Przeglądaj katalog roboczy.

 

Zlecanie zadań

...

z wykorzystaniem Edytora QCG

Widok składa się co do zasady z 3 części:

...

W przykładzie poniżej widać wywołanie kodu BASH wc -w AFINN-111.txt. Należy zwrócić uwagę na wskazanie pliku AFINN-111.txt, plik ten został wybrany z repozytorium (po zleceniu zadania zostanie pobrany z repozytorium i przeniesiony na maszyny obliczeniowe - nie musimy nic dodatkowo kopiować!) Jeśli chcemy przenieść więcej plików należy je odnaleźć w repozytorium, a następnie pojedynczym kliknięciem myszy dodać do zadania. W celu dodania pliku w kodzie należy (po dodaniu go do zadania) ustawić kursor w odpowiednim miejscu kodu oraz kliknąć dwukrotnie na nazwę pliku (w poniższym przypadku można wybrać AFINN-111.txt albo license.txt w sekcji repozytorium). Usuwanie plików z zadania - kliknięcie krzyżyka po prawej stronie nazwy pliku. 

...

W celu wykonania zadania należy opakować kod Python

...

w następującą strukturę:

python - <<END

kod python

END

Patrz przykład z przetwarzaniem danych sieciowych poniżej

 Zlecanie Zlecanie zadania z wykorzystaniem przykładowych kodów - Python

Chcąc zlecić zadanie w języku Python należy zmienić typ Aplikacji z BASH na Python.

Następnie wyszukać nas interesujący fragment nas  fragment kodu, w przykładzie kod obliczający liczbę wystąpień poszczególnych słów w tekście - word_count.py

...

Wybieramy przycisk Użyj, a kod zostanie skopiowany do Edytora. 

Następnie musimy do zadania dodać z repozytorium plik, dla którego chcemy wykonać analizę z repozytorium do zadania oraz zmodyfikować kod Python w taki sposób, żeby wskazać tenże plik.

...

W przedstawionym poniżej przypadku zlecamy zadanie obliczeniowe dla klastra SupernovaZeus, a do to pociąga wybór modułu Python odpowiedniego właśnie dla tego klastra. W przypadku wyboru innego/dodatkowego klastra należy uwzględnić do to w parametrze Moduły.

Image Added

Odpowiednie biblioteki Python są już pre-instalowane w następujących modułach:

Python-Task - plgrid/tools/python/2.7.9
Python-Zeus - tools/python/2.7.5
Python-Bem -  plgrid/tools/python/2.7.Image Removed8
Python-Inula - plgrid/tools/python/2.7.3

UWAGA!! Proszę nie usuwać zaznaczenia TRWAŁE z formularza specyfikacji parametrów zadania. W przeciwnym razie zadania zostaną wykonane na klastrze, ale nie zostaną zachowane i skopiowane z powrotem na maszyny lokalne, przez co nie będzie można zobaczyć wyników analiz! 

...

Python-Task - plgrid/tools/python/2.7.9
Python-Zeus - tools/python/2.7.5
Python-Supernova - Bem -  plgrid/tools/python/2.7.8
Python-Inula - plgrid/tools/python/2.7.3

Image RemovedImage Added

Wszystko gotowe i można zlecić zadanie.

...

Wchodzimy do zakładki Zadania/Edytor QCG

W polu Aplikacja wybieramy bash

Następnie wybieramy Przykład kodu Spark distributed

...

Następnie musimy wybrać odpowiedni klaster obliczeniowy (niestety nie wszystkie wspierają Spark). Przechodzimy do zakładki Zaawansowane

Dalej wybieramy klaster Zeus oraz moduł Spark

Image RemovedImage Added

W tym momencie mamy wszystkie ustawione wszystkie niezbędne parametry do wywołania zadania. Możemy zlecić zadania klikając na przycisk Zleć zadanie

...

Dodatkowo polecamy stronę Gdzie szukać pomocy?Helpdesk PLGrid