Genome Nucléaire Flashcards
Génome nucléaire
( Forme, copie, nb, codant, introns et éléments répétés)
Linéaire double brin
1 copie par cellule
3,2 x 10**9 pb en haploïde
Codant à moins de 2%
Gènes morcelés: 30% d’introns
Éléments répétés = plus de 50%
Séquences codantes ( types)
Gènes d’ARN
Gène des polypeptides
Famille de gènes
Séquences non codantes
= séquences ne codant pas pour des protéines ou des ARN fonctionnels
- CNG ( sequences uniques)
=> Conservées non géniques - séquences moyennement répétées dispersées ( LINE, SINE, retrotransposons à LTR, transposons)
- séquences hautement répétées regroupées ( = ADN satellite centromerique+ ADN mini satellite telomerique)
- séquences hautement répétées dispersées ( = ADN mini satellite hypervariable + ADN microsatellite)
- polymorphisme ( SNV = single nucléotide variant / microsatellites / CNV / îlots de CpG)
Mitochondrial
( Nb gènes, forme, copies, taille, codant, introns + répartition des gènes( nb) et caractéristiques )
37 gènes
Circulaire, double brin
5 à 10 copies par mitochondrie
Environ 16 000 pb
Codant à 93%
Gènes non morcelés (pas d’introns)
13 gènes protéines de la chaîne respiratoire (ARNm)
2 gènes → ARNr spécifiques (125 et 165)
22 gènes → ARNt
Réplication et transcription commandées par le génome nucléaire Transmission maternelle (mitochondries paternelles dégradées à la fécondation
Pas de crossing-over
Pas de compaction donc mutations élevées, accumulation, vieillissement, maladies génétiques mitochondriales
Gène codant des ARN
( Pour le 1er: précurseur, taille, clivage et lieu )
- ARN ribosomique (ARNr)
*Précurseur 45S: 13kb, donne par clivage du 5,8S, du 18S et du 28S
*transcrit dans le nucléole
*forment des blocs de 44kb avec un espaceur non transcrit qui fait 30kb - ARN 5S: petit gène, 2000 copies sur le chr1
- ARN de transfert (ARNt)
- Small nuclear ARN (snARN), small nucleolar ARN (snoARN) et small cytoplasmic ARN (SCARN)
- Micro-ARN (mi-ARN)
- Longs ARN intergéniques non codants (lincARN)
Gènes codant des polypeptides
( Nb, constitution d’un gène, taille variable et unité de transcription)
- Il en existe 20 000
- Un gène comprend: Région transcrite ( introns + exons) + seq régulatrices
- Taille variable ( taille moyenne: 27kb soit 1340pb d’exons / 9 exons + 8 introns, Exon moyen = 145pb, intron moyen = 3370pb, 1 gène tous les 100 kb)
- taille des introns conditionne la taille des gènes
- unité de transcription: toute la région transcrite sous forme d’ARN
Famille de gènes regroupés ( % pseudogènes + def cluster)
Gènes différents mais qui présentent un fort degré de similarité
- ils comprennent des pseudogènes, qui sont des gènes qui ne s’expriment pas mais qui font partie de la famille et qui représente 1% du génome
- gène fonctionnel + pseudogènes au même endroit = cluster
Homologues
Chaîne possédant une forte similitude de séquence
Gènes orthologues
Gènes homologues appartenant à des espèces différentes
Gènes paralogues
Gènes homologues présents dans le génome d’une même espèce
Exemple de cluster beta globine
( Chaînes protéiques + localisation chromosomes, nb gènes fonctionnels et pseudogènes
Dans l’hémoglobine, il y a 4 chaînes protéiques : 2 alpha et 2 beta
- Les gènes alpha sont situés au niveau du bras court du chromosome 16
- les gènes de la bêta-globine se trouve tous sur le bras court du chromoome 11
5 gènes fonctionnels et 1 pseudogène
Comme les conditions environnementales sont différentes, les propriétés d’hémoglobine sont différentes, c’est pourquoi ce ne sont pas les mêmes qui s’expriment au cours du temps. Ces gènes dérivent d’un même gène ancestral, modifié par duplication et accumulation de mutation. Chaque copie a ensuite évolué de son côté en accumulant plus ou moins de mutation donc on parle de divergence par mutation. Les gènes E et bêta donc 79,1% d’identité.
Séquences uniques CNG
( Def, nb, taille minimum et fonction)
CNG = Séquences conservées non géniques
Très conservées mais ne codent pas
Représentent 1% du génome
Au moins 100pb continues, non transcrites et ayant au moins 70% de conservation avec la souris
Fonction inconnue à ce jour ( certains régulent l’expression des gènes)
Séquences répétées % du génome
Plus de 50% du genome
Séquences moyennement répétées dispersées ( nb copies, def, nb d’exemplaires, % de séquences répétées et % du génome + rôle)
- ≈ 1 000 000 copies
- Séquence mobile dans le génome (= transposition même si très peu bougent vraiment car la plupart du temps la transposition laisse la copie originale dans son site initial = multiplication des séquences)
- 3 millions d’exemplaires ( 90% de séquences répétées, 45% du génome)
- utile pour la structuration du génome, brassage : nouveaux gènes
LINE
( Def, % du génome, taille élément complet, seule famille active + code pour…)
Long interspersed elements= éléments dispersés de grande taille
20% du génome
Élément complet = 6kpb
Seule famille active = L1 ( code pour la reverse transcriptase)