Cours 9 - Introdiction aux données de séquençage haut-débit par la plateforme Galaxy Flashcards

1
Q

Que peut-on étudier avec une expérience ChIP-seq?

A

l’épigénétique principalement, le 3D de la structure et où se lie le promoteur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que peut-on étudier avec un RNA-seq?

A

Le nombre de fois qu’un gène est transcrip

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Sous quel format se présente un fichier FastQ?

A

4 lignes, 1) location de la séquence 2) séquence 3) + 4) score en Phred + 33

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les premières étapes de traitement des lectures?

A
  • Démultiplexer
  • Vérifier qualité des lectures
  • rogner les extrémités au besoin
  • alignement avec génome de référence OU assemblage de novo
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dans un graphique de ‘sequence length distribution’, si on a rogner les longueur de lecture, on s’attend a ce que le graphique ressemble à quoi?

A

Un triangle, car toutes les mesures ont une seule longueur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quel est le but d’aligner des lectures de séquençage à haut-débit?

A

identifier le meilleur alignement local possible sur le
génome de référence pour chaque lecture

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quand on aligne des séquences suite à un séquençage à haut-débit, est-ce qu’on utilise un Smith-waterman ou BLAST?

A

ces deux techniques sont en faite peu efficace (demande trop de mémoire et trop de temps). Donc au lieu on indexe les lectures puis on fait un seul balayage du génome (BWT donc Bowtie).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les avantages de BWT?

A
  • BWT facilite la compression du texte (bcp de caractères identiques se suivent)
  • BWT est réversible, permettant de facilement récupérer la séquence initiale et
    des sous-séquences (alignement de lectures!!)
  • Une fois que la BWT(T) est obtenue, on se débarasse du reste.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

pourquoi Bowtie 2 a-t-il été inventé? quel problème cette version règle?

A

Ne ralenti pas autant en présence de mismatch, délétion ou insertions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment se fait un séquençage en pair illumina?

A

on séquence des deux coté de chaque fragment, on option donc le read 1 et le read 2 (mate).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel information peut-on avoir avec un séquençage en pair?

A

comme la longueur du read est connu, on peut savoir s’il y a insertion ou délétion comparer au génome de base.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les divers format de fichiers d’alignement des lectures?

A
  • SAM: Sequence Alignment/Map
  • BAM: format binaire compressé du format SAM
  • CRAM : Compression basée sur la séquence du génome de référence, compression plus efficace que BAM (2 à 50X)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment se présente un fichier SAM?

A

Une ligne par séquence avec 12 colonnes contenant les information sur l’alignement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce qu’une valeur de flag?

A

c’est un nombre obtenu par la somme des puissances de deux. ces puissances sont obtenus en fontion des réponses positives à 11 questions en lien avec l’alignement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quel est le but d’un ChIP-seq?

A

Savoir si une protéine lie un fragment d’ADN in vivo;
couplée au séquençage, cette technique permet de trouver tous les sites de liaison d’une protéine sur un génome

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

que représente un enrichissement du signal d’un ChIP-seq?

A

suggère un site de liaison à l’ADN. Donc suggère que la structure qu’on a immunoprécipité est présente plus souvent dans cette zone

17
Q

Si on veut bien comparer les pics obtenus dans un ChIP-seq (donc zones d’enrichissement) que doit-on faire?

A

On doit établir un threshold (un seuil) et on doit comparer à un controle

18
Q

Décrire les formats de fichiers génomiques.

A
  • BED : chr début fin […]
  • bedGraph : chr début fin valeur
  • WIG : même information mais sans répéter la colonne « chr » à chaque ligne (placé dans entête de section), et sans conserver la « fin » des intervalles (variableStep) ou même sans conserver le « début » des intervalles (fixedStep), donc fichier prend moins d’espace sur disque
  • bigWig : WIG (ou bedGraph) compressé (binaire)
    et indexé !
19
Q

Résumer les formats de fichiers.

A
  • FastQ : données brutes (séq + qual)
  • SAM : données alignées (… + chrom + position + MapQ + …)
  • BAM : SAM compressé
  • BedGraph/WIG : densité de lectures (chr début fin valeur)
  • BigWig : BedGraph/WIG compressé
  • BED : régions d’intérêts (chr début fin)
20
Q

À quoi sert UCSC?

A

À visualiser les divers résultats sur le génome de référence. On peut donc voir les régions enrichies des les expériences

21
Q

ARN ribosomal est présente en multiple copie dans le génome eucaryote

A

ARN ribosomal est présente en multiple copie dans le génome eucaryote

22
Q

Dire les étapes d’analyse suivant une expérience de ChIP-Seq.

A

À partir de FastQ - Grommer (FastQ à FastQ), peut faire FastQC - trimmomatic (FastQ à FastQ), peut faire FastQC - Bowtie (FastQ à SAM) - filtrer BAM (BAM à BAM), peut faire flagstat après - MACS (BAM à BED(+bg)) - bedGraph-to-bigWig (bg à bigWig) - UCSC genome Browser