Page History

...

Interfejs aplikacji Chipster podzielony jest na 4 obszary: Datasets, Workflow, Analysis tools oraz Visualisation. W obszarach Datasets oraz Workflow możliwe jest śledzenie wyników analiz oraz wskazywanie plików na których mają byc uruchomione narzędzia dostepne w obszarze Analysis tools. Ostatni z obszarów, Visualisation, służy do wyświetlanai informacji o wybranym pliku/wyniku oraz do wyświetlania jego wizualizacji.

Przykładowy scenariusz użycia: analiza danych RNA-seq

Pobierz, a następnie załaduj do Chipster pliki :
adrenal_1.fastq
adrenal_2.fastq
brain_1.fastq
brain_2.fastq
chr19_hg19.bed
chr19_iGenomes_GRCh37.gtf
Mapowanie odczytów do genomu referencyjnego.Narzędzie: Alignment -> Bowtie2 for paired end reads. Przed wyborem narzędzia i parametrów zaznacz pliki adrenal_1.fastq oraz adrenal_2.fastq. Wybieramy narzędzie i parametry:

Genome: Homo_sapiens.GRch37.75
No 1 mate reads: plik zawierający odczyty „forward” (zazwyczaj z ‘_1’ albo ‘f’ w nazwie): adrenal_1.fastq
No 2 mate reads: plik zawierający odczyty „reverse” (zazwyczaj z ‘_2’ albo ‘r’ w nazwie): adrenal_2.fastq

Powtórz procedurę dla plików brain_1.fastq i brain_2.fastq. Przejrzyj dostępne wizualizacje plików wynikowych. W wizualizacji genome browser wybieramy ten sam genom, który był użyty do mapowania. Dane są dostępne dla rejonu: Chr19:3000000:3500000.

Analiza jakości mapowania. Narzędzie: Quality Control -> RNA-seq quality metrics with RseQC. Narzędzie uruchom na pliku BAM uzyskanym z mapowania oraz załadowanym pliku chr19_hg19.bed. Przeanalizuj otrzymane wykresy oraz informacje diagnostyczne.
Powtórz mapowanie wybierając tym razem narzędzie Bowtie2 for single-end reads. Ustaw podobne opcje, wybierając do mapowania wyłącznie plik adrenal_1.fastq. Powtórz analizę dla pliku brain_1.fastq. Porównaj wyniki uzyskane z zastosowaniem tylko odczytów z jednego końca oraz z obu końców przez analizę wynikowego pliku BAM programem RseQC (patrz punkt 3) oraz przez wizualizację plików bam w przeglądarce genomowej. Po analizie wyników usuń wyniki otrzymane w tym punkcie, aby nie przeszkadzały w dalszych analizach.
Zliczanie ilości odczytów zmapowanych w obrębie genów. Narzędzie RNA-seq -> Count aligned reads per genes with HTseq-count. Uruchamiamy dla plików bam uzyskanych z mapowania paired-end z użyciem bowtie2. Parametry:

Reference organism: Homo_sapiens.GRch37.75
Does the BAM file contain paired-end data: yes
Was a data produced with a strand-specific protocol: yes

Zdefiniowanie układu eksperymentalnego. Narzędzie: Utilities -> Define NGS experiment. Uruchamiamy na plikach htseq-count.tsv z poprzedniego kroku (zanzaczyć oba przed uruchomieniem). W opcjach należy zaznaczyć kolumnę zawierającą zliczenia w obrębie plików wybranych do analizy, w naszym przypadku „count”. Po uruchomieniu powstaje tabela łącząca zliczenia z obu plików oraz plik phenodata.tsv. Plik ten należy zaznaczyć i w oknie wizualizacji wybrać Phenodata editor. Teraz należy przyporządkować próbki do grup eksperymentalnych. W naszym przypadku nie mamy replikatów, więc sample001.tsv opisujemy w kolumnie „group” jako „adrenal”, natomiast sample0002.tsv jako „brain” i naciskamy „close”.
Testowanie statytyczne genów pod względem różnicowej ekspresji. Narzędzie: RNA-seq -> Differential expression using edgeR. Narzędzie uruchom na plikach otrzymanych w poprzednim kroku. Parametry pozostaw domyślne. Przeanalizuj wykresy diagnostyczne oraz listę genów ulegających statystycznie istotnej różnicowej ekspresji.

Zaawansowane użycie

Ewentualnie jako osobny podrozdział.

...

Space shortcuts

Page tree

Versions Compared

Old Version 3

New Version 4

Key

Zaawansowane użycie