Génome Chap 2 Flashcards
Génome
- Chromosomes au sein de chaque organisme
- Pas même organisation chez eucaryotes / procaryotes / acaryotes
Génome chez eucaryotes
- ADN double brin
- Ex. ç mammifères
- Génome dans noyau et mito (+ chloroplaste si plantes)
Génome chez procaryotes
- ADN double brin
- Ex. Bactérie
- Similarités avec génome eucaryotes
Génome acaryotes
- ADN ou ARN (petits et longs), simple ou double brin
- Ex. bactériophage
Arbre de vie des pro/eucaryotes
- Organismes classés selon homologie génomique
- Génomes Homme /levure / maïs proches
- Construction possible car tous les organismes ont 1 organisation similaire du génome (ADN double brin)
Bactérie
- 1 seul chromosome circulaire
- ADN extra-chromosomique = plasmides = petites molécules ADN se répliquant indépendamment du chromosome bactérien
- Peuvent s’intégrer dans chromosome bactérien : vecteurs en biotechnologies
Ç eucaryote
- Plusieurs chromosomes nucléaires linéaires (à cycle variable : mitotique ou méiotique)
- ADN mitochondrial circulaire (ne suit pas la loi mendélienne de transmission à la descendance)
Maintien et expression des génomes
- ADN génomique sert à conserver l’info génétique
- Ç a recours à réplication semi-conservative amenant à “duplication” de l’ADN
- Info délivrée par ARN synthétisé par transcription par ARN pol ADN dép
- > ARN obtenu = complémentaire du brin matrice = anti-sens et non codant
- > ARN obtenu a la même séquence que l’autre brin = brin sens et codant
Double hélice d’ADN
- 2 brins d’ADN complémentaires et anti-parallèles liés par liaison hydrogène
- Succession de petits et grands sillons impliqués dans la liaison des prot
Virus
- Utilisent 1 ç (proc ou euc) pour se diviser et ↑ leur pop pour affecter d’autres ç
- Ex virus de proc : bactériophage T4 tête + queue + fibres permettent amarrage et stabilisation sur la bactérie
Virus de classe 1 : ADN, simple brin
- Parvo
- Circo
Virus de classe 1 : ADN, double brin
- Herpes
- Pox
- Papilloma
- Adeno
Virus de classe 2 : transcriptase inverse, ADN double brin
Hepadna
Virus de classe 2 : transcriptase inverse, ARN simple brin positif
- Direct traductible en prot virale
- Retro
Virus de classe 3 : ARN, simple brin positif
Flavi
Virus de classe 3 : ARN, simple brin négatif
Rhabdo
Virus des proc : ex du bactériophage T4
- Génome viral de type ADN encapsulé dans sa tête
- Ne rentre pas dans bactérie mais transperce paroi + MP pour injecter la totalité de son ADN viral
- Machinerie réplication/transcription/traduction de la bactérie puis celle-ci meurt en libérant néo-phages
Expression du génome viral
- Obtention prot virale -> passage par synthèse d’ARNm viral = brin positif = ARNm +
- Il faut matrice ADN - ou ARNm - complémentaire selon génome initial pour avoir ARN + qui sera traduit en prot
Virus des eucaryotes
- Tailles et compo différentes = modes d’infection variables
- Ex. virus Herpès (200 nm) et poliomyélite (30 nm)
NB : Ribosome = 20 nm
Comparaison taille génomes (ordre croissant)
- Virus : 10³-10⁵ pb = 1 à 100 microns
- Bactéries : 10⁶-10⁷ pb = 1 mm
- Levures : 1,2x10⁷ pb
- Plantes
- Homme : 3x10⁹ pb dans noyau (d = 6 microns) : 1m simple brin soit 2m double brin et 16 à 20x10³ pb dans chaque mito
Comparaison taille ç (ordre décroissant)
- Ç eucaryotes des plantes = 0,1 mm
- Ç eucaryotes des animaux = 10 microns
- Bactéries = 1 micron
- Virus
- Ribosomes = 20 nm
- Prot en nm
- Atomes : angström = 10⁻¹⁰
Banques de données généralistes
- Banques primaires
- Données expérimentales / primaires ou in silico
Banques de données spécialisées
Thème précis
Les banques primaires
- Collectionnent, gèrent et archivent données primaires obtenues expérimentalement ou in silico
- Mises à dispo sur internet
- Séquences nucléiques et protéiques (parfois obtenues à partir de séquences nucléiques qui permettent également de prévoir par ordinateur la structure 3D d’1 prot)
Banques nucléiques
(Banques primaires)
- Séquences nucléiques et leurs annotations
- Banques coopèrent et disposent d’1 structure identique en 4 parties :
1) Infos générales
2) Références bibliographiques
3) Annotations standardisées
4) Séquence nucléique
Gen Bank
(Banque nucléique)
- Banque américaine gérée par NCBI
- Banque de données de séquences génétiques issues du NIH
EMBL-ENA
(Banque nucléique)
- Banque européenne
- Base de données ENA gérée par l’EMBL appartenant à l’EBI
- Pour chaque séquence, protocole expérimental et mode de séquençage spécifiés (+ localisation et annotations fonctionnelles si possible)
DDBJ
(Banque nucléique)
Banque japonaise
Banques protéiques
- UNIPROT = ressource universelle de prot qui répertorie séquences + infos contenues dans les 3 banques (mais difficile de garantir la qualité car impossible d’avoir 1 traçabilité totale et d’éviter les redondances)
- PDB = Protéine Data Bank = autre banque spécialisée dans la structure ; archive et diffuse les données dispo en cristallographie des prot
- Il est imp de vérifier expérimentalement les résultats d’analyse in silico
Swiss-Prot
(Banque protéique)
- Banque européenne
- Excellente qualité d’annotations des données
- Favorise qualité des séquences au détriment de la quantité car chaque séquence est vérifiée (long)
- PAS in silico : que données brutes
TrEMBL/GenPept
(Banque protéique)
- PAS de données primaires = in silico
- Traduction automatique de séquences nucléiques stockées dans l’EMBL (pour TrEMBL) et GenBank (pour GenPept)
- Annotations automatiques non vérifiées car obj est d’avoir 1 couverture maximale
PIR
(Banque protéique)
- Banque américaine
- Propose classification de séquences protéiques par famille en fn de leur degré de similarité
- Réduit redondances et standardise annotations des prot
RefSeq du NCBI
(Banque spécialisée)
- Meilleure ressource exhaustive pour génomes complets
- Globale : ensemble de séquences génomiques non redondantes ré-annotées
Flybase
(Banque spécialisée)
Drosophile
Wormbase
(Banque spécialisée)
Vers C.elegans
MGI
(Banque spécialisée)
Souris
TAIR
(Banque spécialisée)
Arobidopsis thaliana
SGD
(Banque spécialisée)
Levure saccharomyces cerevisiae (champi uniç = levure boulangère)
CandidaDB
(Banque spécialisée)
Levure candida albicans (pathogène fongique)
N.B banques spécialisées
- Il existe des ressources + courtes car spécialisées dans génomes de procaryotes, animaux, plantes voire focalisées sur 1 organisme
- Organismes utilisés comme modèle en labo disposent de leur propre banque spécialisée
Familles de séquences : facteurs de transcription
Base pour pls espèces avec leurs sites + types de liaison à l’ADN
Familles de séquences : motifs protéiques
Base de motifs protéiques regroupe familles de prot, leurs structures et leurs sites fonctionnels
Familles de séquences : éléments mobiles
- Fragments d’ADN insérés dans le génome d’1 organisme
- Peuvent se déplacer d’1 pt à 1 autre du génome
- Existent chez proc et euc
Familles de séquences : éléments répétés
- De qq à pls 10zaines de nt de nature ≠
- Détection difficile mais imp
- Éléments transposables, répétitions simples (micro ou mini-satellites), gènes codant pour ARNr, ARNt et ARNn
- Existent QUE pour euc
Expériences à grande échelle
- Bases de données dédiées = les omix
- > regroupent différents termes terminant par “ome”
- Ces expériences permettent d’obtenir infos globales sur contenu ç d’1 type de molécule en particulier
Transcriptome
- Détection de tous les ARNm dans 1 type ç dans une condition précise
- Expériences sur des puces
- Techniques miniaturisée qui permet de récup valeurs quantitatives des ARNm présents
- Résultats informatisés du fait de la grande quantité de données et regroupés dans des banques dédiées
- But est de pouvoir comparer tous les transcriptomes entre eux
Protéome
- Technique qui permet de déceler et quantifier toutes les prots d’1 type çlaire dans des conditions précises
- Résultats informatisés du fait de la grande quantité de données et regroupés dans des banques dédiées
- But est de pouvoir comparer tous les protéomes entre eux
Interactome
Bases dédiées aux interactions protéine-protéine
Métabolomes
Dans des bases permettant de comparer les métabolites présents dans les ç
Bibliome
- Représente bases qui regroupent la littérature scientifique
- PubMed = base de données de réf pour l’archivage d’articles scientifiques (ne couvre pas tous les domaines) + accessible à tous et permet de trouver des articles sur sujets précis
Outil d’interrogation et de requête : Databank browsers
- Navigateurs de bases de données : regroupement hétérogène = unifie les données en les structurant dans 1 seule et même architecture (données peuvent être consultées à partir de mots-clés)
- Ex. SRS, Entrez et BioMart
Outil d’interrogation et de requête : Génomes Browsers
- Outils de navigation génomique destinés aux génomes complets
- Requêtes sur gène précis (localisation chromosomique = locus, expression, homologie éventuelle, propriétés)
Ex. Ensembl (qui intègre BioMart)