STS CM 6.2 Flashcards
Est ce que les données récupéré dans les différentes classes d’-omiques sont homogènes /hétérogènes ?
Elles sont hétérogènes et massives (LOGIQUE)
Comment a évolué le coût du séquençage ?
Très Bas de nos jours (0,1 $)
Quelle est la capacité de Séquençage de ces exemples et quel est leur génération :
Life
Illumina
Roche
Life : faible débit
Illumina : Moyen «
Roche : haut «
Qu’est ce que la loi de Moore
La capacité informatique augmente x 2 tout les 24 mois
Quelles sont les étape du séquencage
RAW Data Processing, Mapping genome, variant calling, Annotation, report , Archive
Quelles impacts a cette de Moore sur les technologies informatiques (hormis augmentation du stockage)
Avantages : Baisse coût, Augmentation efficacité
Inconvénient : Besoin (Bio)informatique,
Nécessite donc formation de Biologistes qualifiés
Problématique lié au stockage
Cas du HiSeq2500
beaucoup trop de données à stocker
Si 2 Runs /mois = 360To
Si 2 Runs // semaine = 28To
Comment évolue le stockage du NGS au HUS
Il augmente beaucoup
Quelle peuvent être les problématiques lié au transport de données ?
Et quelle est la solution :
Le temps de transfert lié à la quantité astronomique de données
L’intégrité des données
AVOIR LA FIBRE ptn
Comment vérifie t -on l’intégrité des données
Sommes des contrôles
Est ce que l’analyse d’un exome peut être très long
Oui c’est possible chaque étape dure plusieurs heures, répartition optimal des CPU pour un temps d’analyse correct ( je suppose )
Quelles sont les recommandations professionnelles pour savoir que stocker,… , …
ANPGM (Nationale) + groupe de travail
Que stocke t on ?
Dans le cadre légal on doit stocker le contre rendu de l’analyse biologique + le commentaire explicatifs pendant 30 ans
Contraintes des Labo = norme ISO 15189
Définir les 3 types de données
Brutes : données extraites
Primaires : séquences et valeurs de qualité
Secondaires : Analyse additionnelle
Quelles données recommande t on de stocker
Données primaires et secondaires
Quelle impact ont les recommandations de stockage :
Optimisation d’un facteur 10x
Quelles sont les caractéristiques du stockage et de l’archivage ?
Stockage = Bonne performance, sécurité ok et bonne disponibilité
Archivage : se concentre surtout sur la sécurité +++
Quelles sont les solutions locales de stockage (et archivage ) ?
Matériel fourni par fabricant
- adapté au débit faible
- Stockage NAS
Intégration au système de l’institution
-Mutualisation des coûts
-Collaboration interne
Quelles sont les solutions externes ?
CLOUD Computing (permet de certifier que les données sont protégés et pas stocker chez des entreprises américaines Ex : Amazon)
CLOUD Publique (solutions commerciales, payé des temps de calcul ou du stockage)
CLOUD privée (centre de données internes dans bâtiment en gros = mutualisation des données)
Plan assurance sécurité (permet de garantir l’intégrité des données la sécurité et la restitution des données en 3 points) :
- Transfert des données intégrité
-Exploitation : sécurité des données
-Réversibilité : restitution
Le dialogue est important pour certaines raisons comme :
-Toujours savoir si le projet est bien priorisé
-Connaître la ligne budgétaire
-Développer des partenariats avec des personnes qualifiées
- Mutualisation de différents servies pour entraide en gros