Genome Flashcards
Génome humain renvoie souvent au
Genome nucleaire (mitochondrial)
L’essentiel de l’information génétique provient du
la plus grande partie est traduite en
Genome nucleaire
En polypeptides sur les ribosomes cytoplasmiques
Le gène désigne
Le gène désigne l’ensemble des séquences d’acides nucléiques contenant l’information nécessaire pour la synthèse d’un ARNm et d’une protéine
Le terme génome désigne
Le terme génome désigne la totalité de l’information génétique ou encore le contenu en ADN des cellules humaines.
Bactérie d
Bactérie : être unicellulaire sans noyau(procaryote) mais avec la présence d’ADN
ADN des bactéries (procaryote) d3
Pas de structure aussi régulière que chez les eucaryotes
Présence de protéines qui ressemblent à des histones : protéines HU
Structure plus flexible et plus accessible que chez les eucaryotes (division cellulaire plus rapide)
ADN des bactéries (procaryote) Forme + contient
ADN sous forme d’un seul chromosome « circulaire » dans le cytoplasme
Plusieurs millions de nucléotides
Présence de plasmides = petits morceaux d’ADN circulaires, indépendants de l’ADN principal
Les virus contiennent + multiplication
Les virus contiennent des acides nucléiques mais ils sont incapables de se multiplier. Ils ont besoin de coloniser d’autres cellules
Cas de l’ADN des mitochondries
Forme,code genetique,transmission
ADN circulaire
Code génétique différent de l’ADN nucléaire
Transmission maternelle uniquement
Eucaryotes : ADN d
Eucaryotes : ADN dans le noyau
Plusieurs chromosomes avec ADN fortement
compacté et linéaire
Plusieurs milliards de nucléotides
ADN associé à des protéines
Adn procaryote et eucaryote
Structure et C
ADN Eucaryote
Structure régulière
+ Histones 🡪 chromatine
ADN Procaryote
Structure irrégulière
Protéines ≈ histones
Adn Eucaryotes / Procaryotes
Accessibilite et division C et flexibilité
Eucaryote :Moins accessible (nucléosomes)
Division cellulaire plus lente
Procaryote :Plus flexible et plus accessible
Division cellulaire rapide
Adn Eucaryotes / Procaryotes
origine de réplication
Transcription et traduction
Eucaryote :Nombreuses origines de réplication
Procaryote :1 seule origine de réplication
Transcription et traduction simultanées
Adn eucaryote /procaryote
Adn codant
Eucaryote :1,5% d’ADN codant
Procaryote : ADN codant +++
Le génome mitochondrial
Forme,brin,transmission,exprimé de quelle maniere
ADN bicaténaire circulaire (16 561 pb)
Est exprimé de manière complète et symétrique (un seul promoteur sur chaque brin)
Deux brins d’ADN avec une composition en bases significativement différente : brin lourd H riche en G et brin léger L riche en C.
Transmission est maternelle
Génome mitochondrial humain renferme X genes + leur R
Génome mitochondrial humain renferme 37 gènes (28 du brin H et 9 du brin L)
-13 des 37 gènes produisent 4 des 5 complexes respiratoires. - Le restant des gènes codent pour ARNt(22) et ARNr(2).
Les gènes mitochondriaux sont séparés par les gènes de tRNA
Les autres protéines mitochondriales humaines sont codées par le génome nucléaire
Les gènes mitochondriaux sont séparés par
les gènes de tRNA
Les autres protéines mitochondriales humaines sont codées par
Les autres protéines mitochondriales humaines sont codées par le génome nucléair
mito Constituants du système de la phosphorylation oxydative
Codé par le génome mitochondrial
13 sous –unités
moto Constituants du système de la phosphorylation oxydative
Codé par le génome nucléaire
> 80 sous –unités
Mito Constituants de l’appareil de synthèse des protéines
Codé par le génome mitochondrial
2 ARNr
22 ARNt
moto Constituants de l’appareil de synthèse des protéines
Codé par le génome nucléaire
Toutes les protéines mitochondriales ribosomales
Mito Autres protéines mitochondriales
Codé par le génome mitochondrial
Aucune
Mito Autres protéines mitochondriales
Codé par le génome nucléair
Toutes
L’information portée par les ARNm mitochondriaux utilise un code différent de celui des ARNm nucléaires.
2 codons Met au lieu d’un (AUA – Ile )
- 2 codons Trp au lieu d’un (UGA – Stop)
- AGA ne code plus pour Arg mais pour Stop
- AGG ne code plus pour Arg mais pour Stop
Donc 4 codons Arg au lieu de 6
4 codons Stop au lieu de 3
Le génome mitochondrial humain est entièrement exprimé %
Comment sont les gênes + contiennent
93%)
Les gènes ne contiennent pas d’introns et sont très compactés
Mito la densité génique
Boucle d
la densité génique est de 1 pour 0,45kb
La boucle D est la seule région qui ne présente pas de séquence codante et contient l’origine de réplication du brin H.
Mito les séquences codantes des gènes voisins sont
les séquences codantes des gènes voisins sont contiguës ou séparées par une ou deux bases non codantes
Mito les séquences codantes de certains gènes ( qui codent pour les 6° et 8° sous- unités de l’ATPase mitochondriale) sont
les séquences codantes de certains gènes ( qui codent pour les 6° et 8° sous- unités de l’ATPase mitochondriale) sont partiellement chevauchantes et traduites selon des cadres de lecture différents
Le génome nucléaire d4
Compaction de l’ADN dans le noyau
Dans le noyau, ADN n’est pas nu mais associé à des protéines (histones)
Ensemble constitue
la chromatine
Double hélice d’ADN
Nucléosome =
Nucléosome = structure de base de 100 A de diamètre: structure perlée ou en chapelet
Solénoide =
Solénoide = superstructure de 300 A de diamètre
Chromosomes = d
Chromosomes = forme la plus compactée de la chromatine, visible en métaphase
Chez tous les eucaryotes, l’unité de base de structure de la chromatine est
le nucléosome
histones d
d’histones, petites protéines basiques globulaires très conservées, les plus abondantes du noyau
L’extrémité N-terminale des histones,
L’extrémité N-terminale des histones, riche en AA basiques est saillante à l’extérieur du nucléosome
les 23 paires de chromosomes
Le classement des chromosomes se fait suivant
leur taille et dans une certaine mesure selon la position de leur centromère
Certaines techniques de coloration permettent de distinguer(chromos)
une succession de bandes colorées claires et sombres sur les chromosomes
Chromo Bandes sombres (bandes G)
Marquage
Riche/pauvre en
Sensibilite a la DNase
- fortement marquées par le Giemsa
- régions riches en AT
- insensibles à la DNase
- pauvres en gènes
- riches en répétition LINE
Chromo Bandes claires (bandes G)
Marquage
Riche/pauvre en
Sensibilite a la DNase
- marquées faiblement par le Giemsa
- riches en GC
- sensibles à la DNase
- riches en gènes
- riches en répétition Alu
La densité génique est variable entre ou et ou
Elevee ou
La densité génique est variable entre les régions chromosomiques et entre les chromosomes (coloration Giemsa)
Elle est élévée dans les régions subtélomériques
Les chromosomes au cours du cycle cellulaire
Durant l’interphase, l’essentiel de la chromatine est sous forme d’euchromatine les chromosomes ne s’individualisent qu’à la métaphase
Les régions d’hétérochromatine au cours du cycle cellulaire
Les régions d’hétérochromatine restent pratiquement inchangées au cours du cycle cellulaire (régions centromériques, plus grande compaction d’ADN, faible densité génique)
Structure d’un gène eucaryote
Decris le promoteur 3
Caat
Tata
Transcription start site
Structure d’un gène eucaryote
Codon aug
Caudon initiateur pour la synthese proteique
Codon qui termine la synthese proteique(traduction)
UGA. UAA. UAG
Structure d’un gène eucaryote
AAUAA
Une séquence de reconnaissance pour la coupure du transcrit primaire: signal de polyadénylation=séquence consensus AAUAAA (10- 30 nucléotides) avant site de terminaison
La région 5’ d
une séquence non transcrite, mais dont la présence est nécessaire pour que la transcription s’effectue normalement. Ces séquences sont à quelques kb et sont difficiles à délimiter de manière précise.
La région 5’
Vers – 100 kb du site d’initiation de la transcription
on a la région promotrice où se fixe la RNA polymérase II.
La région 5’
Vers -80 à -30,
Vers -80 à -30, se trouvent des séquences dispersées liant des facteurs de transcription (TATAA box, GC box, CAAT,)
Les promoteurs de certains gènes domestiques des eucaryotes n’ont pas de
boîte TATA mais une boîte GC
La séquence codante appelée ORF:
partie transcrite (exons et introns)
Exon d
on appelle exon, la séquence d’un gène qui est transcrite et non excisée, se retrouvant sur l’ARNm mature
Intron d
on appelle intron, la séquence d’ADN non codante qui est transcrite puis excisée.
Pas de séquence intronique sur l’ARNm mature.
La région 3’ d
La région 3’ très mal connue termine le gène et serait caractérisée par des séquences régulatrices.
L’épissage D
est un ensemble de réactions de maturation au cours desquelles les segments introniques sont éliminés tandis que les régions exoniques sont rattachées bout à bout pour donner l’ARN mature.
pas de relation directe entre la taille de la protéine et la longueur du gène qui code pour elle
la longueur du transcrit primaire définit la longueur de la région génique.
Chez l’homme, les gènes peuvent varier de
Chez l’homme, les gènes peuvent varier de quelques centaines de nucléotides à plusieurs mégabases.
La taille moyenne d’un exon est de
La taille moyenne d’un exon est de 100 à 200 pdb et est indépendante de la taille des gènes.
La densité génique moyenne du génome humain est environ de
1 pour 40 à 54 kb d’ADN.
Les gènes ont souvent des fonctions identiques ou très voisines. V ou F
V
Genes L
Leur localisation peut se faire sur des sites chromosomiques spécifiques ou dispersés à travers le génome.
Les gènes apparentés divergent au niveau de
Les gènes apparentés divergent au niveau de leurs introns.
On parle alors de famille génique
Exple: gène de la β- globine
certaines plantes et amphibiens ont 100 fois plus d’ADN qu’une cellule humaine classique.
V ou F
v
ADN GÉNIQUE :
D codant non codant et familles
ADN codant (exons)
code pour ARNm (Protéines)
ADN non codant
code pour ARNr et ARNt
séquences régulatrices
introns
Familles multigèniques
Pseudogènes
ADN EXTRAGÉNIQUE : D
Répétitif :
ADN transposé
ADN non transposé
Non Répétitif
Les différentes séquences de nucléotides d’une préparation d’ADN eucaryote se trouvent à
des concentrations différentes
Séquences d’ADN fortement répétées
Répétition parfaite ou non d’un fragment de longueur
Fragment court ( 5 à 100b): satellite (centromères)
Fragment long (14 à 500b):minisatellite
Fragment court (1 à 5b): microsatellite
- Représentent 3% du génome humain, 0,5% provenant des répétitions de dinucléotides (85% AC ou AT).
Séquences d’ADN modérement répétées
Séquences avec des fonctions codantes (ARN t, ARNr, histones)
Séquences dépourvues de fonctions codantes (SINE, LINE)
Les séquences répétées de type transposon représentent
Génome humain%
plus de 1/3 du génome des vertébrés
Génome humain: 45%
Les Séquences LINEs (Long Interspersed Nucleotides Element
% du genome humain
Arn line apres traduction
Le plus commun de ces éléments est
La transcription inverse s’interrompt souvent avant terme, créant
17% du génome humain (850.000 copies). Le plus commun de ces éléments est L1: 6kb
- Après traduction, l’ARN LINE s’assemble avec ses propres protéines et se déplace vers le noyau où l’ARN est reverse transcrit et s’insère dans le génome au niveau d’une coupure simple brin.
- La transcription inverse s’interrompt souvent avant terme, créant de nombreux inserts tronqués (la plupart en fait)
- Il y a en fait trois familles de LINE dans le génome humain
+celle active
LINE1, LINE2, LINE3), mais seule L1 est active.
- La machinerie LINE est responsable également de
La machinerie LINE est responsable également de la rétrotranscription des éléments SINE.
Les Séquences SINES ( Short Interspersed Nucleotides Elements
Contiennent,L,nbr et type
- Contiennent un promoteur pol-III mais pas d’ORF
–Vivent «sur le dos» des LINE
–13% du génome humain. 3 types: Alu, MIR et Ther2/MIR3.
–(1 500 000 SINEs par génome humain haploide, dont 1 000 000 Alu)
Les Séquences SINES ( Short Interspersed Nucleotides Elements) la plus connue d
La plus connue est ALU, la seule SINE active: 290bpconstitué de 2 répétitions en tandem de 130bp.
sine Ou on les trouve
Ou on ne les trouve pas
On ne trouve pas ces séquences dans les régions codantes, mais souvent dans l’unité de transcription, soit dans les introns, soit dans les parties non traduites des ARNm.
Les séquences d’ADN non répétées
D,contiennent,codent
Séquences en copie unique
Renferment la plus grande quantité d’information génétique
codent pour toutes les protéines en dehors des histones
La densité génique des régions riches en gènes est de
une extrapolation à partir du séquençage de grandes régions chromosomiques retient une valeur de
1 pour 20kb,
70 000 gènes.
L’analyse de restriction avec une enzyme sensible à la méthylation Hpa II rapporte un nombre total d’îlots CpG à
45000
Si l’on tient compte de l’estimation faite que 56% des gènes sont associés à des îlots CpG, on pense alors que le nombre total de gènes serait de
80 000
Analyse de EST (Expressed Sequence Tags) ou marqueurs de séquences exprimées
La comparaison de séquences EST humaines communes avec les séries de séquences codantes d’ADN humain déjà rapportées suggère un nombre total de 65 000 gènes.