STS CM 6.2 Flashcards
Est ce que les données récupéré dans les différentes classes d’-omiques sont homogènes /hétérogènes ?
Elles sont hétérogènes et massives (LOGIQUE)
Comment a évolué le coût du séquençage ?
Très Bas de nos jours (0,1 $)
Quelle est la capacité de Séquençage de ces exemples et quel est leur génération :
Life
Illumina
Roche
Life : faible débit
Illumina : Moyen «
Roche : haut «
Qu’est ce que la loi de Moore
La capacité informatique augmente x 2 tout les 24 mois
Quelles sont les étape du séquencage
RAW Data Processing, Mapping genome, variant calling, Annotation, report , Archive
Quelles impacts a cette de Moore sur les technologies informatiques (hormis augmentation du stockage)
Avantages : Baisse coût, Augmentation efficacité
Inconvénient : Besoin (Bio)informatique,
Nécessite donc formation de Biologistes qualifiés
Problématique lié au stockage
Cas du HiSeq2500
beaucoup trop de données à stocker
Si 2 Runs /mois = 360To
Si 2 Runs // semaine = 28To
Comment évolue le stockage du NGS au HUS
Il augmente beaucoup
Quelle peuvent être les problématiques lié au transport de données ?
Et quelle est la solution :
Le temps de transfert lié à la quantité astronomique de données
L’intégrité des données
AVOIR LA FIBRE ptn
Comment vérifie t -on l’intégrité des données
Sommes des contrôles
Est ce que l’analyse d’un exome peut être très long
Oui c’est possible chaque étape dure plusieurs heures, répartition optimal des CPU pour un temps d’analyse correct ( je suppose )
Quelles sont les recommandations professionnelles pour savoir que stocker,… , …
ANPGM (Nationale) + groupe de travail
Que stocke t on ?
Dans le cadre légal on doit stocker le contre rendu de l’analyse biologique + le commentaire explicatifs pendant 30 ans
Contraintes des Labo = norme ISO 15189
Définir les 3 types de données
Brutes : données extraites
Primaires : séquences et valeurs de qualité
Secondaires : Analyse additionnelle
Quelles données recommande t on de stocker
Données primaires et secondaires