Cours 5 - Introduction à l’analyse de données protéo(géno)miques Flashcards

1
Q

Définir le terme protéomique

A

Étude à large échelle des protéines

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qui en inclus dans le protéomes?

A

protéines + protéines modifiées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

À quoi sert le pré-processing?

A

à simplifier et la clarifier le signal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les étapes de la production de spectres de protéines?

A
  • Données brutes
  • Sprectres réduits (filtration des pics / pré-processing)
  • Peptide-spectre (PSM) (moteur de recherche - assignation des spectres à un peptide)
  • Peptides (validation des peptides)
  • Protéines (inférence protéique)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que fait-on exactement lors du lissage?

A

on retire le bruit de haute fréquence. Lisse le graph.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les étapes compris dans le pré-processing?

A

Lissage
Ajustement
Détection des pics

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que fait-on exactement lors de l’ajustement?

A

On retire le bruit de basse fréquence, unifie le signal en le mettant à zéro.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que fait-on exactement lors de la détection des pics (pré-processing)?

A

On simplifie et on définie le signal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Niveau méthode, comment fait-on le pré-processing (point de vue manip)?

A

On utilise un logiciel avec les paramêtres désirés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quand on fait un spectre pour déterminer quelles protéines on a, est-ce que on analyse réellement les protéines présentes?

A

Non, on ne peut que ‘séquencer’ les peptides présents. On a donc aucune information sur la structures.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Lors de la digestion enzymatiques précédent un spectre, où est faite la coupure?

A

Coupe au niveau des a.a. positifs, soit lysine et arginine.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

par spectre, peut-on différencier des a.a. de même poids moléculaire? Qu’est-ce que cela implique?

A

Non, on ne peut pas les différencier. Cela signifie que la leucine et l’isoleucine ne peuvent être différencié tout comme des modifications d’a.a. qui ne résultent pas en un changement de poids moléculaire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

que ce passe-t-il si la force de fragmentation dest mal ajustée?

A

possibilité de fragmenter les peptides à des endroits inabituels (presque impossible de nos jours)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dans un monde idéal, à quoi ressemble un spectre ayant des fragments de direction b et y?

A

Il y a un fragment présent pour toutes a.a. donc pour un peptide de trois a.a. j’ai 1, 12, 123, 3, 32, 321.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

donner trois raisons qui rendent l’annotation d’un spectre difficile

A
  1. fragmentation incomplète de certains fragments (pi par défaut tu ne sais pas qui est mal fragmenté)
  2. On ne sait pas quels fragments viennent d’un cote ou de l’autre (b VS y)
  3. modifications port-traductionnnelles des a.a. .. on sait pas qu’est-ce qui est arrivé ou.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Est-ce qu’il est possible de lire un spectre sans liste prédéfinie de protéines connues?

A

Ben si tu veux une réponse non, pas vraiment. On a besoin d’une base de données pour comparer les spectre potentiels avec le spectre obtenu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels sont les deux axes d’un spectre de masse?

A

Abondance en fonction de la masse / charge

17
Q

Comment détemrine-t-on qu’un score de spectre est bon?

A

En fonction d’un seuil, si le score est différent du seuil c’est un bon score

18
Q

Comment mon score de spectre est affecté si j’augmente le nombre de pics présents dans le spectre?

A

le score augmente aussi

19
Q

À quoi correspond le score donné par le logiciel SEQUEST?

A

Système de score selon l’intensité. Fait la somme de l’intensité des pics du spectre théorique.

19
Q

À quoi correspond le score donné par le logiciel MASCOT / andromeda?

A

Système de score selon le nombre de pics, score statistique. inclus la probabilité que un pic N corresponde à pic K aléatoire, donc est un p-value.

20
Q

À quoi correspond le score donné par le logiciel X!Tandem?

A

Système de score hybride, somme des intensitées des pics associés et du nombre d’ions b et y associés, donc est un e-value.

21
Q

Comment je fais pour choisir le logiciel adéquat pour l’analyse de mon spectre?

A

J’utilise un autre logiciel! SearchGUI / PeptideShaker, qui combiner les scores obtenus de divers locigiels

22
Q

Comment analyse-t-on les chances d’avoir des faux positifs dans notre spectre?

A

On fait une distribution nulle qui contient un ramassi de séquences peptidiques aléatoires

23
Q

Quelles sont les trous méthodes possibles pour faire des peptides inconnus? Quel est le plus utilisé?

A
  • Séquence inverse (The best)
  • Séquence aléatoire
  • Nouvelles séquences
24
Q

Quel est le problème lié à la formation de peptides aléatoire dans la BD de faux-positif?

A

Ne prend pas en compte les patrons présents dans la fragmentation.

25
Q

Comment fonctionne la stratégie du target-decoy?

A

On crée une BD de séquences peptidiques qui n’existent pas vraiment. Le tout va former une distribution nulle, sur un graphe regroupant le score des peptides non-existant + les notres en fonction du PSM (peptide spectrum match). Puis on cherhce le seuil des scores pour lequel j’ai un minimum de faux-positif ET un minimum de faux-négatif.

26
Q

À quoi correspond le taux de découverte locale?

A

À la proportion de decoy / cible

27
Q

Expliquer le principe de Occam’s razor en inférence protéique.

A

Garder le plus petit ensemble de protéines qui explique tous les peptides

28
Q

Expliquer le principe de vrai Occam en inférence protéique.

A

Garder le plus petit ensemble de protéines avec annotation qui explique
tous les peptides. implique qu’on est des données biologiques sur le tout.

28
Q

Expliquer le principe de Anti-Occam en inférence protéique.

A

Garder toutes les protéines qui ont au moins un peptide

28
Q

Qu’est-ce que l’inférence protéique?

A

Deviner (parce que cela revient à quand même beaucoup de chance) les protéines preésentes dans un échantillons à partir d’un spectre.

29
Q

Quel est le plus gros déni de l’inférence protéique?

A

les isoformes et les paralogues

30
Q

à partir d’inférence protéique, est-ce possible d’avoir une résolution complète du problème?

A

Nop

31
Q

La liste des prot utilisé pour l’inférence est en fait une liste de groupe de protéines

A

La liste des prot utilisé pour l’inférence est en fait une liste de groupe de protéines

32
Q

Vrai ou faux? Une analyse de protéomique par spectrométrie de masse permet d’identifier toutes les protéines présentes
dans l’échantillon? pourquoi?

A

Faux, due aux limitations des connaissances de la BD utilisées et car plus une protéines est présentes plus l’échantillons contient de ses fragments.

33
Q

Qu’est-ce que la protéogénomique?

A

L’étude à large échelle des protéines
selon des données génomiques associées

34
Q

Quelles sont les limitations de la protéogénomique si on part de données de RNA-seq?

A
  • Probabilité d’expression
  • Mutations
  • Grosse BD
  • Seuil de détection du transcrit
  • inférence
  • protéines non-annotées
35
Q

Quelles sont les 3 étapes de la protéogénomiques?

A
  • Créer une BD
  • Stratégies de recherche pour une grande BD
  • Vérifier ses découvertes
36
Q

Quand j’analyse un spectre, est-ce que je favorise la présence d’ions y ou b?

A

La chimie dit y

37
Q

La protéogénomique est bien meilleure que la protéomique?

A

Cela dépend de ce que l’on veut / de ce que l’on recherche