Cours 11 - Introduction à l'analyse de données de séquençage d'expression (transcriptomique) Flashcards
Pourquoi séquencer l’ARN plutôt que l’ADN génomique?
La portion fonctionnelle du génome dans une condition donnée est généralement celle qui est exprimée
Prédire la structure exacte d’un transcrit à partir de sa séquence génomique est quasi impossible (épissage alternatif)
Quantifier l’expression de chaque gène, isoforme et allèle (bien meilleur dynamic range que puces ADN)!
Identifier des gènes/transcrits différentiellement exprimés entre diverses conditions
quels sont les défis du séquençage d’ARN?
ARN beaucoup moins stable qu’ADN
L’abondance relative varie grandement
Potentielle contamination ARNr et ARNt
Vaste diversité des tailles
Alignement des séquences à cause de l’épissage (petits exons adjacents dans l’ARNm maissé parés par de longs introns dans l’ADN génomique)!!
Quelles sont les diverses stratégies d’analyse de RNA-seq?
- Genome mapping
- transcriptome mapping
- reference-free assembly
- Séquençage d’ARN complets
nommer les divers éléments de la suite tuxedo moderne.
Bowtie
HISAT-2
Stringtie
Ballgown
qu’est ce que bowtie?
Algorithme d’alignement pour des ChIP-seq
qu’est-ce que HISAT-2?
Algorithme d’alignement pour des expériences de séquençage d’ARN
qu’est ce que StringTie?
c’Est un outil de la suite tuxedo, c’est une étape de quantification (l’étape qui normalise l’expression des gènes). Cela qui permet de fournir des annotations des gènes
que est l’amélioration de HISAT qui permet d’être meilleur pour l’Alignementde ARN?
Les aligneurs utilisant un index global éprouvent de la difficulté avec ces types de lectures (par exemple, une séquence de 8nt est représentée en moyenne 48000 fois dans le génome humain).
qu’Est ce que le biais 3’ et où cela devient-il un problème?
lié à la queue poly A
Quand tu fais un controle de qualité l’extrémité est surreprésenté?
En transcriptomique, comment est-ce qu’on peut mesurer le niveau d’Expression?
on doit prendre en compte la profondeur de séquençage et la longueur de la séquence analysée
Normaliser par longueur du transcrit et par nombre de lectures séquencées (profondeur de séquençage)
quel est le facteurs le plus important à prendre en compte si on veut comparer l’expression transcriptomique de deux gènes?
leur longueur
quels méthodes peuvent favoriser un meilleur résultat d’analyse d’expression différentielle?
- UTILISER DIVERS OUTILS
- plusieurs rééplicats biologiques
à quoi sert Cuffdiff?
identification+quantification des gènes/isoformes différentiellement transcrits
Dire les étapes d’un RNA-seq pipeline.
À partir de FastQ - Groomer (FastQ à FastQ) - Trrimmomatic (FastQ à FastQ) - HISAT (FastQ à BAM) - Filtrer BAM (BAM à BAM) - StringTie (BAM à tab) - bedGraph-to-bigWig (bg à bigWig) - UCSC genome browser
que signifie une accumulation de lectures pour un expérience de transcriptomique?
le gène était transcrit dans mes conditions