5. Organisation du genome Flashcards
Taille et complexité du génome
Mammifères: 3 milliards de paires de bases (3 Gb) , x 2 car diploïde.
donc 7 pg et 2 m d’ADN par cellule, et 10 11 cellules nucléées
Taille et complexité du génome
Taille du génome augmente globalement avec lévolution
Mais pas simplement linéaire:
taille variable au sein d’un même phyllum ou autre classe biologique :
quantité variable d’ADN non codant, de fonction inconnue
Chez vertébrés, pas de relation directe entre taille du
génome et complexité de lorganisme
Taille du génome
reflète complexité
de lorganisme chez les autres
Nb de chromosomes nest pas essentiel
mais bien la quantitié totale
d’ADN = 3.10^9 bp (x 2),
chez ces deux espèces
Fonctionnement du génome
= génomique fonctionnelle
• Séquences bien conservées, transcrites et traduites (<2% du total)
= gène codant les protéines
• Séquences bien conservées, transcrites
– ARN non codants, …
• Séquences bien conservées, non transcrites
– Promoteurs, enhancers
– ADN des centromeres et telomeres; ADN répété dispersé dans le génome; …
• Séquences peu conservées, non transcrites
– Rôle
Structure de lADN
• Double hélice, pentose et PO4
- à l’extérieur, bases azotées à
l’intérieur. Purines en face de pyrimidines, liaisons H • OH:
A === T G ººº C
• Orientée 5PO4 — 3OH, antiparallèle
• Séquence des bases A,T,G,C = message biologique
• Méthylation de certaines cytosines (épigénétique)
• Complémentarité des bases: tout le message est dans chaque brin
• Longueur physique de lADN : bp, kb, Mb, Gb
– 1 kb = 1000 bp dADN bicaténaire, ou 1000 b dARN monocaténaire par exple.
• Dénaturation par alcalinisation; par chaleur;
• Renaturation suivant HYBRIDATION MOLÉCULAIRE
orientation des hélices antiparallèles
Orientation des hélices: les brins d’acides nucléiques sont orientés :
Extrémité “gauche”: pentose libre en 5‘
Extrémité “droite”: pentose libre en 3‘
Par convention, les séquences sont écrites dans le sens
5’ à 3
Brin d’acide nucléique
5aagtcga 3
3ttcagct 5
Par convention, les séquences sont écrites dans le sens 5' à 3 – c'est le sens dans lequel les acides nucléiques sont synthétisés in vivo – c'est le sens dans lequel les ARN messagers sont lus par la machinerie de traduction – extrémité 5’ codante º extrémité amino-terminale du produit protéique. On écrit le brin codant au-dessus: TOP STRAND
Brin complémentaire inversé
5aagtcga 3
3ttcagct 5
Par convention, les séquences sont écrites dans le sens 5’ à 3
Séquence ci-dessus sécrit aagtcga
Son brin complémentaire sécrit tcgactt
= complémentaire inversé
Longueur du génome humaine (haploïde)
- 3 milliards de paires de bases (3 10 9 bp)
- 1 m
- 2 x 1 m dans chaque noyau cellulaire
- 2 x 10 11 m = 200 000 000 km
Cas particulier du dinucléotide CpG
• 5 CG 3 « CpG » • idem sur lautre brin ;-) • Beaucoup sont en clusters = « îlots CpG » • La cytosine dun dinucléotide CpG peut être méthylée ou non (sur les 2 brins) • Methyl-cytosine (met-C) = « 5e base de lADN «
DNA (hemi-)
methylation
• metC = 5th base of DNA • Methylated promoters inactive (usually) • Implication in gene silencing; imprinting. • Epigenetic heredity
réplication de l’ADN
chaque brin, complémentaire de l’autre, sert de
modèle (template) à la synthèse d’un nouveau brin complémentaire:
réplication semi-conservative
transcription de l’ADN
• L’ADN peut être TRANSCRIT en ARN. (transcription: ADN>ARN)
traduction de l’ADN
• L’ARN peut être TRADUIT en protéine.
(traduction: ARN > prot; = translation)
par la machinerie des ribosomes, et suit le code génétique:
chaque TRIPLET de nucléotides (= codon) correspond à un acide
aminé (ou à un signal stop induisant l’arrêt de la traduction).
• Un triplet de nt dans un ARN messager = un CODON.
code génétique
• Universel • Ancêtre 15 AA + 1 stop?? • Mitoch légèrement différent • NB: AA codé en 1 ou 3 lettres A = Ala = Alanine L = Leu = Leucine R = Arg = Arginine D = Asp = Aspartate E = Glu = Glutamate F = Phe = Phenylalanine K = Lys = Lysine
Expression des gènes, cellule animale
dia 25
génome
Génome = ensemble des gènes dun organisme, ou d’une cellule.
Plus généralement : ensemble de lADN dune cellule
génome nucléaire
Ø Génome nucléaire = tout lADN des chromosomes : 3 10^9 bp
– Gènes ; Séquences uniques intergéniques (y compris éléments
régulateurs: promoteurs, enhancers)
– ADN moyennement répétitif
– ADN hautement répétitif
« génome » sans plus de précision = génome nucléaire.
3 10^9 bp (génome haploïde)
Environ 1-2% encode protéines
Organisation générale du génome
[nucléaire]
• 2 x 23 molécules • Associées à protéines – Histones – Facteurs régulateurs de transcription ADN + protéines associées = chromatine • Chaque molécule, 1 – 23, occupe un domaine particulier du noyau • Chromatine se condense pour division cellulaire – Mitose; méiose
Organisation cellulaire rigoureuse pour :
- Faire rentrer 2m d’ADN dans un noyau de 5 μm de diamètre
- Exprimer les bons gènes au bon moment dans les bonnes cellules
- Réguler réplication de l’ADN en vue de division cellulaire
Domaines chromosomiques nucléaires
Noyau de cellule de poulet. La chromatinc de chaque chromosome apparait en
une couleur différente.
double hélice
2 nm > 10 nm > 30 nm
Nucléosome
• Octamere dhistones: (H2A, H2B, H3, H4)x2 = globular core • Linker DNA • ~200 bp en tout
Modifications des
histones
(sur queues N-term)
modifie leurs affinités
pour ADN
CHROMATINE OUVERTE
• Réduction des affinités
histones – ADN
• Relaxation de la chromatine
CHROMATINE FERMÉE
• Augmentation des affinités
histones – ADN
• Compaction de la chromatine
Organisation du génome humain
(génomique structurelle
dia 40
Génome, exome, mendeliome
3 10 9 bp (haploïde) – gènes codant protéines – Gènes non-codants – Séquences régulatrices – Autres séquences – Junk DNA • Tous les exons des 20000 gènes codant protéines • Exons des 5000 gènes codant protéines et impliqués dans maladies héréditaires = monogéniques = mendeliennes
génome nucléaire
- Séquences uniques (ou presque) (single copy)
- Séquences moyennement répétitives (low copy repeats: 10-10^6 copies)
- Séquences hautement répétitives (high copy repeats: >10^6 copies )
• Séquences uniques (ou presque) (single copy)
– Gènes de structure (unités transcriptionnelles) : 30% du génome
• Protéines (partie codante: 1-2% du génome); miRNA; lincRNA; …
– Séquences conservées non transcrites : 3% du genome
– Séquences non conservées et non transcrites (rôle = ?)
• Séquences moyennement répétitives (low copy repeats: 10-10^6 copies)
– Gènes redondants: histones; rRNAs; tRNAs…
– Transposons ; retrotransposons avec LTR , sans LTR: 45% du génome
• Séquences courtes (SINEs): ex: Alu,
• Séquences longues (LINEs)
– Minisatellites ; microsatellites (STRs)
• Séquences hautement répétitives (high copy repeats: >10^6 copies )
– ADN satellite (centromères, télomères) 5-10% du génome)