Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Interfejs aplikacji Chipster podzielony jest na 4 obszary: Datasets, Workflow, Analysis tools oraz Visualisation. W obszarach Datasets oraz Workflow możliwe jest śledzenie wyników analiz oraz wskazywanie plików na których mają byc uruchomione narzędzia dostepne w obszarze Analysis tools. Ostatni z obszarów, Visualisation, służy do wyświetlanai informacji o wybranym pliku/wyniku oraz do wyświetlania jego wizualizacji.

 

Przykładowy scenariusz użycia: analiza danych RNA-seq

  1. Pobierz, a następnie załaduj do Chipster pliki :
    adrenal_1.fastq
    adrenal_2.fastq
    brain_1.fastq
    brain_2.fastq
    chr19_hg19.bed
    chr19_iGenomes_GRCh37.gtf


  2. Mapowanie odczytów do genomu referencyjnego.Narzędzie: Alignment -> Bowtie2 for paired end reads.  Przed wyborem narzędzia i parametrów zaznacz pliki adrenal_1.fastq oraz adrenal_2.fastq. Wybieramy narzędzie i parametry:
  • Genome: Homo_sapiens.GRch37.75
  • No 1 mate reads: plik zawierający odczyty „forward” (zazwyczaj z ‘_1’ albo ‘f’ w nazwie): adrenal_1.fastq
  • No 2 mate reads: plik zawierający odczyty „reverse” (zazwyczaj z ‘_2’ albo ‘r’ w nazwie): adrenal_2.fastq

    Powtórz procedurę dla plików brain_1.fastq i brain_2.fastq. Przejrzyj dostępne wizualizacje plików wynikowych. W wizualizacji genome browser wybieramy ten sam genom, który był użyty do mapowania. Dane są dostępne dla rejonu: Chr19:3000000:3500000.
  1. Analiza jakości mapowania. Narzędzie: Quality Control -> RNA-seq quality metrics with RseQC. Narzędzie uruchom na pliku BAM uzyskanym z mapowania oraz załadowanym pliku chr19_hg19.bed. Przeanalizuj otrzymane wykresy oraz informacje diagnostyczne.
  2. Powtórz mapowanie wybierając tym razem narzędzie Bowtie2 for single-end reads. Ustaw podobne opcje, wybierając do mapowania wyłącznie plik adrenal_1.fastq. Powtórz analizę dla pliku brain_1.fastq. Porównaj wyniki uzyskane z zastosowaniem tylko odczytów z jednego końca oraz z obu końców przez analizę wynikowego pliku BAM programem RseQC (patrz punkt 3) oraz przez wizualizację plików bam w przeglądarce genomowej. Po analizie wyników usuń wyniki otrzymane w tym punkcie, aby nie przeszkadzały w dalszych analizach.
  3. Zliczanie ilości odczytów zmapowanych w obrębie genów. Narzędzie RNA-seq -> Count aligned reads per genes with HTseq-count. Uruchamiamy dla plików bam uzyskanych z mapowania paired-end z użyciem bowtie2. Parametry:
  • Reference organism: Homo_sapiens.GRch37.75
  • Does the BAM file contain paired-end data: yes
  • Was a data produced with a strand-specific protocol: yes

 

  1. Zdefiniowanie układu eksperymentalnego. Narzędzie: Utilities -> Define NGS experiment. Uruchamiamy na plikach htseq-count.tsv z poprzedniego kroku (zanzaczyć oba przed uruchomieniem). W opcjach należy zaznaczyć kolumnę zawierającą zliczenia w obrębie plików wybranych do analizy, w naszym przypadku „count”. Po uruchomieniu powstaje tabela łącząca zliczenia z obu plików oraz plik phenodata.tsv. Plik ten należy zaznaczyć i w oknie wizualizacji wybrać Phenodata editor. Teraz należy przyporządkować próbki do grup eksperymentalnych. W naszym przypadku nie mamy replikatów, więc sample001.tsv opisujemy w kolumnie „group” jako „adrenal”, natomiast sample0002.tsv jako „brain” i naciskamy „close”.
  2. Testowanie statytyczne genów pod względem różnicowej ekspresji. Narzędzie: RNA-seq -> Differential expression using edgeR. Narzędzie uruchom na plikach otrzymanych w poprzednim kroku. Parametry pozostaw domyślne. Przeanalizuj wykresy diagnostyczne oraz listę genów ulegających statystycznie istotnej różnicowej ekspresji. 

Zaawansowane użycie

Ewentualnie jako osobny podrozdział.

...