Page tree

Versions Compared

Key

 • This line was added.
 • This line was removed.
 • Formatting was changed.

...

 1. Załaduj z dysku pliki z folderu Sesja2:
  adrenal_1.fastq
  adrenal_2.fastq
  brain_1.fastq
  brain_2.fastq

  Aby to zrobić wybierz narzędzie Get Data -> Upload File, następnie użyj przycisku Choose local file. Można zaznaczyć wszystkie pliki jednocześnie z wciśniętym klawiszem shift. Następnie należy określić format plików. Dla plików .fastq w kolumnie Type wybierz fastqsanger (pliki fastq z kodowaniem jakości w skali Sanger). Naciśnij przycisk Start. Podczas transferu można zamknąć okno przyciskiem Close bez przerywania transferu. Aby do niego wrócić należy ponownie wybrać Get Data -> Upload File.
   

 2. Pobieranie z UCSC Genome Browser plików z adnotacją genomową w formacie GTF. Narzędzie: Get Data -> UCSC Main table browser. Aby pobrać adnotacje znanych genów o wysokiej wiarygodności dla genomu człowieka w wersji złożenia hg19 dla chromosomu 19 wybierz następujące opcje:

  • clade: Mammal

  • genome: Human

  • assembly: Feb. 2009 (GRCh37/hg19)

  • group: Genes and Gene Predictions

  • track: UCSC Genes

  • table: knownGene

  • region: zaznacz opcję position i wpisz chr19

  • output format: GTF – gene transfer format, zaznacz opcję Send output to Galaxy

   Wciśnij przycisk get output i następnie potwierdź przyciskiem Send query to Galaxy. Plik z adnotacją pojawi się w panelu historii Galaxy.
    

 3. Pobieranie plików z adnotacją genomową w formacie BED. Powtórz poprzedni punkt, tym razem w opcjach na stronie UCSC Genome Browser wybierając output format: BED – browser extensible data. Tym razem po wciśnięciu przycisku get output, pojawi się strona z dodatkowymi opcjami. Pozostaw ustawienia domyślne, i wciśnij przycisk Send query to Galaxy
   

 4. Mapowanie odczytów do genomu referencyjnego.Narzędzie: NGS: Mapping -> Bowtie2 – map reads against reference genome. Wybierz następujące parametry:

  • Is this single or paired library: Paired end

  • Pierwszy plik FASTQ: adrenal_1.fastq (plik zawierający odczyty „forward” (zazwyczaj zawiera ‘_1’ albo ‘f’ w nazwie)

  • Drugi plik FASTQ: adrenal_2.fastq (plik zawierający odczyty „reverse” (zazwyczaj zawiera ‘_2’ albo ‘r’ w nazwie)

  • Will you select a reference genome from your history or use a built-in index?: Use a buillt-in genome index

  • Select reference genome: Human (Homo sapiens) (b37): hg19 Canonical

   Wciśnij przycisk Execute. Spróbuj powtórzyć procedurę dla plików brain_1.fastq i brain_2.fastq. Pamiętaj, że możesz wybrać tylko pliki o zgodnym formacie. Podczas importu plików, dla brain ustawiliśmy opcję Auto-detect. Klikając na nazwę pliku w historii rozwiną się informacje na temat pliku. Sprawdź, czy pliki brain mają format fastqsanger. Jeśli nie, wciśnij ikonę ołówka, a następnie w zakładce Datatype zmień typ pliku na fastqsanger
    

 5. Zwizualizuj uzyskany plik BAM w przeglądarce genomowej. W panelu historii klliknij na nazwę pliku i poszukaj ikonki z wykresem, która po najechaniu na nią myszką powinna być adnotowana jako Visualize in Trackster. Po jej wciśnięciu zostaniesz przekierowany do okna wizualizacji. Aby utworzyć nowa wizualizację, należy wpisać jej nazwę (dowolną) oraz wybrać genom Human Feb. 2009 (GRCh37/hg19) (hg19) oraz wcisnąć przycisk Create. Dane są dostępne dla rejonu: Chr19:3000000:3500000. Aby porównać rozłożenie odczytów z pozycjami genów, należy załadować plik GTF. Naciśnij ikonę + znajdującą się w prawym górnym rogu (Add tracks). Wybierz plik GTF pobrany wcześniej z UCSC Genome Browser. Zwróć uwagę, że po odpowiednim zawężeniu obserwowanego regionu zmienia się reprezentacja odczytów oraz sposób wyświetlania genów. Po zakończeniu, wciśnij ikonę save a następnie close. W ten sposób wizualizacja ta będzie dostępna później poprzez menu górnej belki Visualization -> Saved visualizations.
   

 6. Analiza jakości mapowania. Narzędzie: pakiet RseQC. Wszystkie narzędzia z pakietu uruchomić należy na plikach BAM uzyskanych za pomocą mapowania programem Bowtie2 (Input file) oraz pliku BED zawierającym adnotację chromosomu 19 pobranym w punkcie 3 tej sesji (reference gene model). W ramach pakietu należy wybrać następujące narzędzia i opcje:

  • NGS: QC and manipulation -> Gene Body Converage (BAM)

  • NGS: QC and manipulation -> RPKM Saturation. Opcje: Strand-specific?: Pair-End RNA-seq z pierwszym układem odczytów.

  • NGS: QC and manipulation -> Read Distribution

  • NGS: QC and manipulation -> BAM/SAM Mapping Stats

   Uruchom narzędzie dla plików BAM uzyskanych z mapowania próbek adrenal oraz brain. Porównaj wyniki.
    

 7. Testowanie statystyczne genów pod względem różnicowej ekspresji. Narzędzie: NGS: RNA Analysis -> DESeq2. Jako plik GFF podaj plik GTF z adnotacją chromosomu 19 pobrany w punkcie 2 tej sesji. Należy dodać po jednym replikacie dla każdej z grup. Jako pierwszy wskaż plik BAM będący wynikiem mapowania odczytów pochodzących z mózgu, a w ramach grupy drugiej wskaż plik BAM będący wynikiem mapowania odczytów z nadnerczy.
   

 8. Przeanalizuj uzyskane wyniki zawierające listę genów ulegających różnicowej ekspresji

 

 

 

 

Zaawansowane użycie

Ewentualnie jako osobny podrozdział.

Gdzie szukać dalszych informacji?

Strony zewnętrzne (jeśli są), odnośnik do helpdesku lub strony dokumentacji o pomocy.

Info
Można też dodać sekcję "Co dalej?" ze wskazaniem (odnośnikiem) do dalszej części dokumentacji, o ile jest wymagana.

 Szczegółowe informacje o użytkowaniu infrastruktury PLGrid znajdują się w Podręczniku Użytkownika.

Szczegółowa dokumentacja platformy Galaxy znajduje się na stronie: https://galaxyproject.org/

Materiały szkoleniowe opracowane przez deweloperów platformy Galaxy dostępne są na stronie: https://wiki.galaxyproject.org/Learn/Screencasts 

Informacje o usługach dziedzinowych Biologia dostępne są na stronie: http://biologia.plgrid.pl/

Uzyskanie informacji/helpdesk PLGrid: dokumentacji o pomocy