Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Krótki opis usługi

Usługa pozwala wyszukiwać asocjacje w danych GWAS, wykorzystując metodę selekcji zmiennych Boruta i szybki, stochastyczny klasyfikator, paprocie losowe. Formalnie program duplikuje funkcjonalność kanonicznych implementacji tych narzędzi, pozwala jednak analizować dane GWAS szybciej i z użyciem mniejszych zasobów.

Aktywowanie usługi

Aby skorzystać z usługi należy mieć konto w projekcie PL-Grid (Zakładanie konta w portalu PL-Grid) wraz z aktywnym grantem (Granty obliczeniowe). Oprogramowanie składa się z kilku aplikacji konsolowych, można z nich korzystać zarówno bezpośrednio na systemie obliczeniowym (w trybie interaktywnym lub w skryptach) lub w skryptach uruchamianych za pośrednictwem systemu UNICORE.

Pierwsze kroki

Pierwszym krokiem jest konwersja danych GWAS na format bsi natywny i zrozumiały dla narzędzia borsnip; służą do tego programy pomocnicze plink2bsi i gen2bsi które akceptują binary plikozbiór narzędzia Plink (trójka .bed .bim i .fam) oraz format GEN (.gen). Dane rozbite na podzbiory (np. oddzielnie chromosomy albo oddzielnie obiekty z różnych grup) należy wcześniej połączyć korzystając z innego narzędzia.

Decyzję należy zachować oddzielnie, jako plik tekstowy z klasami zakodowanymi jako liczby od 0..(#klas-1), po jednej na linię. Połączenie z danymi genomicznymi odbywa się na zasadzie wspólnej kolejności. Jeśli plik/i/ danych zawiera już decyzję, zostanie ona zignorowana.

Przykładowo, zakładając że decyzja jest w pliku input.dec, jeśli mamy dane w formacie Plink jako pliki input.bedinput.bim i input.bed, a chcemy przepakować dane do pliku wejściowego borsnip test.bsi, należy wywołać:

plink2bsi input input.dec test.bsi

Jeśli mamy plik w formacie GEN, input.gen, należy wywołać:

gen2bsi input.gen input.dec test.bsi

W zasadniczym zadaniu należy zamieścić wywołanie głównego programu, borsnip.

borsnip -D 5 -N 100000 test.bsi

Parametr N (liczba paproci) powinien być nie mniejszy niż liczba analizowanych zmienności, podczas gdy parametr D (głębokość paproci) należy dopasować do złożoności problemu.

Wynikiem będzie tabela podobna do

rs999969     Confirmed        25         25
rs9999966    Rejected          0         11
rs9999662    Rejected          0         11
rs9999931    Confirmed        25         25
rs9999604    Rejected          0         11

Pierwsza kolumna to identyfikator zmienności, skopiowany z pliku wejściowego, druga to decyzja narzędzia (Confirmed dla istotnej asocjacji, Rejected dla nieistotnej, Tentative dla braku decyzji). Kolejne dwie kolumny to odpowiednio liczba zaliczonych i przeprowadzonych testów istotności dla zmienności.

Wywołanie borsnip z parametrem -h wyświetli listę dostępnych opcji. W szczególności, flagą -s można ustawić ziarno generatora pseudolosowego by zapewnić reprodukowalność obliczeń. Flaga -j przełącza output z tabeli na czytelny maszynowo format JSON, zawierający również dodatkowe informacje.

Gdzie szukać dalszych informacji?

Metoda Boruta jest opisana w artykułach http://www.jstatsoft.org/v36/i11/paperhttp://www.biomedcentral.com/1471-2105/15/8

Info

Poniższy szablon należy odpowiednio uzupełnić.

  • Układ należy zachować (z dopuszczeniem minimalnych modyfikacji).
  • Opis nie powinien przekraczać 10 stron przeciętnego ekranu laptopa.
  • W razie potrzeby należy założyć podstrony (na końcu z rozdziałem "Co dalej?" i odnośnikiem do kolejnego rozdziału dokumentacji).
  • Język opisu - polski. W sytuacji, gdy zasadnicza dokumentacja usługi ma być po angielsku, w tym rozdziale powinny znaleźć się podstawowe informacje pozwalające zorientować się w zaletach usługi i zgrubnie w wymaganych krokach do jej uruchomienia.
  • Uprawnienia do odczytu strony (Tools/Restrictions) powinny być ustawione na "Confluence-users" w trakcie pisania dokumentacji, inaczej będzie widoczna od razu dla osób niezalogowanych.
  • Pytania dotyczące systemu dokumentacji: Hubert Siejkowski,
  • Pytania dotyczące Podręcznika Użytkownika: Unknown User (plgfilocha).

...

Wstawianie odnośników do innych stron podręcznika

Przy wstawianiu linków do stron wewnętrznych Podręcznika użytkownika (np. certyfikat="Aplikowanie, rejestracja i użycie certyfikatu"' założenie konta="Zakładanie konta w portalu"; Pomoc="Gdzie szukać pomocy") należy w trybie edycji strony:

  • wpisać tekst, pod który będzie podpięty link
  • zaznaczyć tekst
  • wstawić link (Ctrl+K lub ikona Link na pasku narzędzi)
  • wybrać opcję Search z lewej strony okna Insert Link
  • w pasku po prawej wpisać tytuł strony (lub zacząć wpisywać tytuł i wybrać właściwą stronę z pojawiających się podpowiedzi)
  • zatwierdzić wybraną stronę opcją Insert w prawym dolnym rogu

Efekt powyższego opisu można zobaczyć klikając lewym klawiszem myszki (w trybie edycji strony) na dowolny link w tym oknie informacji. Pojawi się pole, w którym do wyboru będzie opcja Edit, którą klikamy. Pojawi się okno Edit link, z aktywnym polem Search i nazwą strony wewnętrznej podręcznika.

LINKI ZEWNĘTRZNE

Linki zewnętrzne np. do strony PL-Grid wstawiamy w oknie Insert Link (Ctrl+K) w opcji Web Link.

Info
Pomoc w pisaniu stron w Confluence: https://confluence.atlassian.com/display/DOC/Using+the+Editor

 

Krótki opis usługi

Dla kogo jest przeznaczona, jakie najważniejsze możliwości oferuje?

Aktywowanie usługi

Co należy aktywować, aby móc skorzystać z usługi? (Założenie konta, certyfikat, grant?, aktywacja konkretnych usług w portalu). Należy pamiętać o istnieniu rozdziałów ogólnych podręcznika, do których warto się odwołać.

Ograniczenia w korzystaniu (podsekcja opcjonalna)

Tutaj wpisujemy specjalne zasady korzystania z usługi jeśli takowe są np. konieczność ustawienia grantu domyślnego, zakaz uruchamiania intensywnych zadań na UI itp. Jeśli takowych nie ma to należy tę podsekcję usunąć.

Pierwsze kroki

Koniecznie z przykładowymi zrzutami ekranu lub fragmentami kodu.

Zaawansowane użycie

Ewentualnie jako osobny podrozdział.

Gdzie szukać dalszych informacji?

Strony zewnętrzne (jeśli są), odnośnik do helpdesku lub strony dokumentacji o pomocy.

Info
Można też dodać sekcję "Co dalej?" ze wskazaniem (odnośnikiem) do dalszej części dokumentacji, o ile jest wymagana.

 

 

  oraz na stronie metody https://m2.icm.edu.pl/boruta, zaś metoda paproci losowych w artykule http://www.jstatsoft.org/v61/i10/paper. Wszelkie pytania prosimy kierować do opiekuna aplikacji, na adres M.Kursa@icm.edu.pl.