Cours 5 - Introduction à l’analyse de données protéo(géno)miques Flashcards

Question 1

Q

Définir le terme protéomique

Answer

A

Étude à large échelle des protéines

Question 2

Q

Qu’est-ce qui en inclus dans le protéomes?

Answer

A

protéines + protéines modifiées

Question 3

Q

À quoi sert le pré-processing?

Answer

A

à simplifier et la clarifier le signal

Question 4

Q

Quelles sont les étapes de la production de spectres de protéines?

Answer

A

Données brutes
Sprectres réduits (filtration des pics / pré-processing)
Peptide-spectre (PSM) (moteur de recherche - assignation des spectres à un peptide)
Peptides (validation des peptides)
Protéines (inférence protéique)

Question 5

Q

Que fait-on exactement lors du lissage?

Answer

A

on retire le bruit de haute fréquence. Lisse le graph.

Question 6

Q

Quelles sont les étapes compris dans le pré-processing?

Answer

A

Lissage
Ajustement
Détection des pics

Question 7

Q

Que fait-on exactement lors de l’ajustement?

Answer

A

On retire le bruit de basse fréquence, unifie le signal en le mettant à zéro.

Question 8

Q

Que fait-on exactement lors de la détection des pics (pré-processing)?

Answer

A

On simplifie et on définie le signal

Question 9

Q

Niveau méthode, comment fait-on le pré-processing (point de vue manip)?

Answer

A

On utilise un logiciel avec les paramêtres désirés.

Question 10

Q

Quand on fait un spectre pour déterminer quelles protéines on a, est-ce que on analyse réellement les protéines présentes?

Answer

A

Non, on ne peut que ‘séquencer’ les peptides présents. On a donc aucune information sur la structures.

Question 11

Q

Lors de la digestion enzymatiques précédent un spectre, où est faite la coupure?

Answer

A

Coupe au niveau des a.a. positifs, soit lysine et arginine.

Question 12

Q

par spectre, peut-on différencier des a.a. de même poids moléculaire? Qu’est-ce que cela implique?

Answer

A

Non, on ne peut pas les différencier. Cela signifie que la leucine et l’isoleucine ne peuvent être différencié tout comme des modifications d’a.a. qui ne résultent pas en un changement de poids moléculaire.

Question 13

Q

que ce passe-t-il si la force de fragmentation dest mal ajustée?

Answer

A

possibilité de fragmenter les peptides à des endroits inabituels (presque impossible de nos jours)

Question 14

Q

Dans un monde idéal, à quoi ressemble un spectre ayant des fragments de direction b et y?

Answer

A

Il y a un fragment présent pour toutes a.a. donc pour un peptide de trois a.a. j’ai 1, 12, 123, 3, 32, 321.

Question 15

Q

donner trois raisons qui rendent l’annotation d’un spectre difficile

Answer

A

fragmentation incomplète de certains fragments (pi par défaut tu ne sais pas qui est mal fragmenté)
On ne sait pas quels fragments viennent d’un cote ou de l’autre (b VS y)
modifications port-traductionnnelles des a.a. .. on sait pas qu’est-ce qui est arrivé ou.

Question 16

Q

Est-ce qu’il est possible de lire un spectre sans liste prédéfinie de protéines connues?

Answer

A

Ben si tu veux une réponse non, pas vraiment. On a besoin d’une base de données pour comparer les spectre potentiels avec le spectre obtenu.

Question 17

Q

Quels sont les deux axes d’un spectre de masse?

Answer

A

Abondance en fonction de la masse / charge

Question 18

Q

Comment détemrine-t-on qu’un score de spectre est bon?

Answer

A

En fonction d’un seuil, si le score est différent du seuil c’est un bon score

Question 19

Q

Comment mon score de spectre est affecté si j’augmente le nombre de pics présents dans le spectre?

Answer

A

le score augmente aussi

Question 20

Q

À quoi correspond le score donné par le logiciel SEQUEST?

Answer

A

Système de score selon l’intensité. Fait la somme de l’intensité des pics du spectre théorique.

Question 21

Q

À quoi correspond le score donné par le logiciel MASCOT / andromeda?

Answer

A

Système de score selon le nombre de pics, score statistique. inclus la probabilité que un pic N corresponde à pic K aléatoire, donc est un p-value.

Question 22

Q

À quoi correspond le score donné par le logiciel X!Tandem?

Answer

A

Système de score hybride, somme des intensitées des pics associés et du nombre d’ions b et y associés, donc est un e-value.

Question 23

Q

Comment je fais pour choisir le logiciel adéquat pour l’analyse de mon spectre?

Answer

A

J’utilise un autre logiciel! SearchGUI / PeptideShaker, qui combiner les scores obtenus de divers locigiels

Question 24

Q

Comment analyse-t-on les chances d’avoir des faux positifs dans notre spectre?

Answer

A

On fait une distribution nulle qui contient un ramassi de séquences peptidiques aléatoires

Question 25

Q

Quelles sont les trous méthodes possibles pour faire des peptides inconnus? Quel est le plus utilisé?

Answer

A

Séquence inverse (The best)
Séquence aléatoire
Nouvelles séquences

Question 26

Q

Quel est le problème lié à la formation de peptides aléatoire dans la BD de faux-positif?

Answer

A

Ne prend pas en compte les patrons présents dans la fragmentation.

Question 27

Q

Comment fonctionne la stratégie du target-decoy?

Answer

A

On crée une BD de séquences peptidiques qui n’existent pas vraiment. Le tout va former une distribution nulle, sur un graphe regroupant le score des peptides non-existant + les notres en fonction du PSM (peptide spectrum match). Puis on cherhce le seuil des scores pour lequel j’ai un minimum de faux-positif ET un minimum de faux-négatif.

Question 28

Q

À quoi correspond le taux de découverte locale?

Answer

A

À la proportion de decoy / cible

Question 29

Q

Expliquer le principe de Occam’s razor en inférence protéique.

Answer

A

Garder le plus petit ensemble de protéines qui explique tous les peptides

Question 30

Q

Expliquer le principe de vrai Occam en inférence protéique.

Answer

A

Garder le plus petit ensemble de protéines avec annotation qui explique
tous les peptides. implique qu’on est des données biologiques sur le tout.

Question 31

Q

Expliquer le principe de Anti-Occam en inférence protéique.

Answer

A

Garder toutes les protéines qui ont au moins un peptide

Question 32

Q

Qu’est-ce que l’inférence protéique?

Answer

A

Deviner (parce que cela revient à quand même beaucoup de chance) les protéines preésentes dans un échantillons à partir d’un spectre.

Question 33

Q

Quel est le plus gros déni de l’inférence protéique?

Answer

A

les isoformes et les paralogues

Question 34

Q

à partir d’inférence protéique, est-ce possible d’avoir une résolution complète du problème?

Question 35

Q

La liste des prot utilisé pour l’inférence est en fait une liste de groupe de protéines

Answer

A

La liste des prot utilisé pour l’inférence est en fait une liste de groupe de protéines

Question 36

Q

Vrai ou faux? Une analyse de protéomique par spectrométrie de masse permet d’identifier toutes les protéines présentes
dans l’échantillon? pourquoi?

Answer

A

Faux, due aux limitations des connaissances de la BD utilisées et car plus une protéines est présentes plus l’échantillons contient de ses fragments.

Question 37

Q

Qu’est-ce que la protéogénomique?

Answer

A

L’étude à large échelle des protéines
selon des données génomiques associées

Question 38

Q

Quelles sont les limitations de la protéogénomique si on part de données de RNA-seq?

Answer

A

Probabilité d’expression
Mutations
Grosse BD
Seuil de détection du transcrit
inférence
protéines non-annotées

Question 39

Q

Quelles sont les 3 étapes de la protéogénomiques?

Answer

A

Créer une BD
Stratégies de recherche pour une grande BD
Vérifier ses découvertes

Question 40

Q

Quand j’analyse un spectre, est-ce que je favorise la présence d’ions y ou b?

Answer

A

La chimie dit y

Question 41

Q

La protéogénomique est bien meilleure que la protéomique?

Answer

A

Cela dépend de ce que l’on veut / de ce que l’on recherche