Module 3 : les techniques de séquencage et d'assemblage Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Nomme un objectif en bioinfo qui est au cœur de la biologie moléculaire

A

Obtenir la séquence des bases des molécules d’ADN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelle caractéristique fondamentales ont en commun les nouvelles méthodes de séquencage par rapport aux méthodes antérieures?

A

Elles produisent plus de données à moindre couts

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les applications du NGS en génomique?

A
  • Séquencage de novo
  • Re-seq de génome connus pour y détecter des variations genetique
    • mutations + polymorphisme
    • Seq de l’ADN ancien
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou faux

Lorsqu’un génome est séquencer de nouveaux, l’entiereté du génome doit être séquencer

A

Faux,
Possible de re-seq des régions ciblées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

À quoi sert le RNA-seq

A

Cherche à quantifier l’expression des transcrits en séquencant directement l’ADNc généré à partir d’ARNm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle méthode a été remplacer par la RNA-seq?

A

biopuces à ADN (microarrays)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que permettent les méthodes de NGS en épigénomique?

A

Cartographier à haute résolution les interactions entre des facteurs de transcription et de l’ADN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles méthodes combine la ChIP-seq?
Qu’est ce que cette méthode identifie?

A

immunoprécipitation de la chromatine et NGS
identifier les sites actifs de la transcription

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pour quoi sont utilisées les NGS en métagénomique?

A

Explorer la diversité microbienne d’échantillons les plus divers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel est le lien entre méthode de séquencage et d’assemblage?

A
  • assemblage intimement lié aux stratégies et technologies de séquencage
  • Les algorythme des programmes d’assemblage ont du s’adapter aux nouvelles technologies de séquencage
    -Dev d’algoryhtme radicalement différents
    -Courte taille des séquences
    • Grand nombre de séquences produites
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Donne les étapes d’alignement de séquences et leur ordre de volume de données (plus grans au plus petit)

A

traitement de l’image 1
Données d’intensité 3
Données pour chaque base et scores de qualité 4
Alignement 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi la bio-info est-elle utile pour l’alignement des séquences?

A

Les méthodes NGS produisent une énorme quantité de données qu’il est impossible d’analyser/traiter sans l’aide d’outils informatique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle méthode de nouvelle génération n’utilise pas de polymérase?
Cette méthode utilise quoi au lieu de la polymérase?
Pourquoi la polymérase est-elle essentielle pour les autres méthodes?

A

SOLiD
Ligase
Impossible de lire directement la séquence d’ADN sans faire la synthèse du brin complémentaire avec une amorce

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux pour que les technologies NGS fonctionnent l’ADN doit être fixée sur un support solide

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Ces technologies reposent sur des réaction de séquencage _____. Elles intègrent des mécanismes de …

A

Cyclique
de gestion automatisée des fluides

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vrai ou faux
Les technologies NGS font des séquences de taille supérieur à la méthode sanger

A

Faux,
Contraire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment se fait la détection des réactions chimiques pour les NGS

A

par imagerie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les étapes principales du séquencage à haut-débit?

A
  • Préparation des échantillons d’ADN
  • Immobilisation sur support solide
  • Séquencage
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment sont appelés les séquences définies ajoutées aux extrémités de fragments d’ADN lors de la préparation d’échantillons d’ADN?

Vrai ou faux
les fragments d’ADN sont par la suite brisées de manière symétrique

A

Adaptateurs

Faux,
préalablement brisés de manière aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

À quoi servent les adaptateurs?

A

À ancrer les fragments d’ADN à une surface solide et à définir le site ou la réaction de séquencage aura lieu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou faux
Il est souhaitable que les fragments d’ADN soient de tailles différentes
Explique

A

Faux, de taille semblable (400 pb ou +) parce que il est souhaitable pour le programme d’assemblage de connaitre la distance approximative séparant deux séquences issus du même fragments (paired-end)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelles sont les trois principales approches pour ajouter des séquences adaptatrices?

A
  • Adapter ligation
    -Circularization et redigestion
  • Adapter ligation
    -> voir 3.1 diapo 8
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vrai ou faux
La grande majorité des technologies de séquencage nécessitent une étape d’amplification pour former des regroupement de molécules clonales.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Sur quoi sont fait les clusters?

A

sur un support solide comme une lamelle ou des microbilles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

L’étape d’amplification est indispensable pour…

A

rendre détectable les signaux émis par les fluorophore

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

L’étape d’amplification peut se faire dans quels milieux?

A

in situ, dans une émulsion ou en solution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Quelles technologies utilisent la PCR par émulsion?

A

454 et SOLiD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Quelle technique dMaplification utilise la technologie illumina?

A

Bridge PCR

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Quelle approche utilise la compagnie CGA pour l’amplification?

A

amplification par cercle roulant

30
Q

Comment sont appeler les reésultats d’amplification par cercle roulant?

A

DNA nanoballs

31
Q

Décrire brievement la technologie SMRT de PACBio

A

Les complexes former des AND polymérases et des fragments d’ADN sont immobilisées au fond de chambres microscopiques appellées ZMW

32
Q

À quoi fait appel la technologie 454 pour produire de la lumière?

A

à la luciférase

33
Q

Comment la technologie SOLiD utilise la lumière?

A

utilise une ligase pour ajouter de cours oligonucléotides fluorescents.

34
Q

Des cycles de ____, de _____ et de _____ sont répétés pour construire la séquence d’ADN

A

d’incorporation, de lavage et d’imagerie

35
Q

Vrai ou faux
La première technologie de séquencage à haut-débit est Illumina

A

Faux, 454

36
Q

Comment fonctionne la technologie 454?

A
  • ADN fragmenté en morceaux de 300-1000 pb et séparer en molécule simple brin
  • adapteurs spécifiques liés aux fragments d’ADN
  • Fragments d’ADN amplifier par émulsion par PCR un seul fragments par microbille. isoler les une des autres dans de minuscules réacteurs formés par une émulsion d’huile et de mélange réactionnel
  • Émulsion brisé, ADN dénaturé et microbille contenant les molécules clonales se retrouvent en phase solide
    -Ajout de plus petites microbilles contenant les enzymes nécessaire à la réaction de pyroséquencage
37
Q

Vrai ou faux
À la fin de la réaction d’émulsion par PCR on retrouve sur chaque microbille une dizaine de milliers de copies d’un fragment d’ADN spécifique

A

Faux, Dizaine de millions

38
Q

Quelle étape de la technologie 454 peut mener à des erreurs?

A

l’émission de lumière par la sulfurylase et la luciférase.
Parce que l’intensité du signal lumineux est proportionnel au nombre de nucléotide ajouté, donc en présence d’homopolymère plus difficile car intensité très haute.

39
Q

Qu’est ce qi limite la taille des séquences pouvant être obtenues avec Illumina?

A

la qualité du signal diminue avec le nombre de cycles

40
Q

Quelles sont les 12 étapes de la technologie Illumina?

A
  1. préparer échantillons d’ADN
  2. Fragments s’attachent de manière aléatoire sur la surface de la lamelle
  3. Fragments se replient en U pour apparier leurs extrémités libres à des oligonucléotides complémentaire
  4. oligo complémentaire attaché à la surface allongé par l’ADN pol
  5. Cycle répétés d’amplification et dénaturation
  6. Formation de clusters
  7. ajout de nucléotides fluo et excitation
  8. Image à haute résolution de la lamelle
  9. initiation d’un second cycle de séquencage
  10. Acquisiation d’une seconde image à haute résolution
  11. Répétition du cycle
  12. alignement des données sur un génome de référence et identification des variations génétiques
41
Q

Décrire la flow cell de la technologie Illumina

A

Cette plaque est tapissée
d’oligonucléotides complémentaires aux adaptateurs qui sont ajoutés lors de la
préapartion de la librairie de séquençage.

42
Q

Quelle modification a été apportée aux nucléotides dans la technologie Illumina?

A

grp protecteur fluo à leur extrémité 3’-OH
-> pas possible d’ajouter plus d’un nucléotide par cycle

43
Q

Vrai ou faux
Les groupement protecteur doivent être clivés enzymatiquement après chaque cycle de Illumina

A

Vrai

44
Q

Pourquoi est-il nécessaire d’assembler les séquences?

A

-Parce que les réactions de séquencage in vitro ne sont pas capable de répliquer le génome en entier
-> Les lectures produites par les réactions enzymatiques de séquencage sont très courtes
-> les génomes comptent des millions de pb chez les bactérie et des milliards chez les eucaryotes

45
Q

Qu’est ce qu’un assemblage?

A

structure de données de séquence hiérarchisées en une reconstruction possible d’un génome

46
Q

Quel est le plus gros défi de l’assemblage de séquence?

A

Mettre en ordre des dizaines de millions de courtes séquences d’ADN issues de la fragmentation d’un génome

47
Q

Quelles sont les deux approches pour l’assemblage de génome? quelle est la plus utilisée?

A

hiérarchique et shotgun (WGS)
WGS

48
Q

Définir reads

A

Courtes séquence d’ADN issues de réactions enzymatiques de séquencage (935-1000 pb)

49
Q

Définir contig

A

Séquence génomique continue résultant de l’assemblage des reads

50
Q

définir scaffolds

A

Ensemble de contigs dont l’orientation et la taille des brèches sont connues

51
Q

Quelle est la différence entre les single ends et les paired ends?

A

single ends: correspondent aux séquences provenant d’une seule extrémité d’un fragment d’ADN

paired ends: courtes séquences situées aux extrémités d’un même fragment d’ADN génomique dont la taille approximative est connues

52
Q

Vrai ou faux
la qualité des assemblages avec la méthode sanger est meilleure que celle avec les NGS

A

Vrai

53
Q

Quels programmes sont concus pour l’alignement de séquence avec un génome de référence?

A

Maq, Bowtie et BWA

54
Q

Combien de mésappariements sont allouées pour des reads de 36 pb?

A

1 ou 2

55
Q

Selon quoi le nombre de mésappariement allouées peut varier?

A

Selon le score de qualité des bases environnantes

56
Q

quel pourcentage des séquences peuvent être alignées à partir des données brutes?

A

50-80

57
Q

Pourquoi n’est-il pas possible d’aligner 100% des séquences?

A

erreurs de séquencage
reads s’alignent à plusieurs endroits dans le génome
différence importante existe avec le génome de référence

58
Q

Vrai ou faux
le pourcentage de reads positionnés sur le génome fournit un bon indice de la qualité des données de séquences

A

Vrai

59
Q

Quelle technique est utilisée pour l’assemblage de novo?

A

algorythme d’approximation découlant de la théorie des graphes

60
Q

Quels sont les 2 critères majeurs lors de l’évaluation de la qualité des assemblages?

A

la taille et l’exactitude des contigs et des scaffolds

61
Q

À quoi correspond la couverture du génome?

A

% de nucléotides d’un génome de référence présent dans les contigs assemblés

62
Q

Quelles données sont importantes lors de l’évaluation de la qualité de l’assemblage?

A

la taille et l’exactitude des contigs et des scaffolds
La taille maximale, la taille médiane et la taille moyenne des contigs

63
Q

Vrai ou faux
Dans un assemblage il est souhaitable que les contigs soine t de taille plus petites et plus nombreux

A

Faux, moins nombreux et plus long pour autant que des erreurs ne soient pas introduites

64
Q

Qu’est ce que le N50?

A

taille du plus petit contigs parmis ceux dont la taille combinée représente 50% de l’assemblage

65
Q

Vrai ou faux
Plus le N50 est petit, meilleure est la qualité de l’assemblage

A

Faux, plus il est élevé

66
Q

Vrai ou faux
le traitement des séquences répétées représente le défi principal de l’assemblage

A

vrai

67
Q

Résoudre les problèmes d’assemblage passe par…

A

l’augmentation de la taille des reads

68
Q

Quelle approche est employée par les algorithme de première génération (gourmands)?

A

Dans un premier temps, toutes les paires de
reads sont comparées les unes aux autres. Celles qui se chevauchent le plus sont jointes
en premier. Pour tenir compte des erreurs de séquençage et des polymorphismes, les
chevauchements sont calculés avec une variante de l’algorithme de Smith-Waterman qui
admet de petites différences entre les séquences, entre 1 et 10%. Par la suite, les reads
avec les chevauchements les plus longs sont joints pour former des contigs. Ce
processus est répété, à chaque fois en joignant les séquences présentant le
chevauchement avec le score le plus élevé jusqu’à ce que tous les chevauchements soient
épuisés.

69
Q

Dans quel cas les algorithmes de première génération posent problème?

A

Lorsque la taille des répétitions excède la taille des reads

70
Q

Quelles sont les étapes des assembleurs de nouvelles génération?

A
  1. Détection des erreurs et correction selon la composition des reads
  2. Contruction d’un graphe pour représenter les reads et les séquences qu’elles partagent
  3. Réduction des chemins qui ne se croisent pas à des noeuds uniques dans le graphe
  4. suppression des chemins erronés
  5. Fusion de la complexité engendrée par les polymorphismes
  6. Simplification des enchevêtrements grâce à de l’information externe au graphe : read paired-end
  7. Conversion des chemins réduits en contigs et en scaffolds
  8. Réduction de l’alignement à une séquence consensus