Det humana genomet Flashcards
Vad är genomik?
- Läran om genomet
- Arvsmassan analyseras genom kartläggning, sekvensering och karakterisering av genom samt att ta reda på vilka delar av DNA:t som är gener och vilka som är icke-kodande sekvenser
- Målet är att förstå alla biologiska funktioner → första steget är att sekvensbestämma DNA
Redogör för kromosomuppsättningen och ange den ungefärliga storleken för det mänskliga genomet i baspar
Eukaryota celler → 22 kromosompar
Kromosompar 23 → könskromosomer → kvinnor har XX, män har XY
Totalt 46 kromosomer
Mänskligt haploid (enkel uppsättning kromosomer) genom → ca 3 miljarder baspar
Mänskligt genom (diploid) → 6 miljarder baspar i human cell
Vad är shotgun-sekvensering?
- DNA sönderdelas i mindre fragment helt slumpmässigt
- Varje fragment sekvensbestäms var och en för sig
- Datorprogram pusslar ihop de olika bitarna av sekvenser med varandra
Vad är hierarkisk shotgun-sekvensering?
- Gör en genom karta innan själva sekvenseringen → en minimal mängd fragment väljs ut för sekvensering
- Det amplifierade genomet delas in i mindre bitar → placeras i vektorer, t.ex. artificiella bakterie-kromosomer
- Använder sedan shotgun-sekvensering
- Letar sedan efter överlappningar som uppstår pga sekvenslikheter → kan bygga ihop en hel kromosom
→ Man klonar in en viss del av genomet i vektorer (blir flera olika vektorer för hela genomet) och utför sedan shotgun på de olika vektorerna var för sig/i olika prov.
Kan således bygga ihop en kromosom.
Redogör för next-generation sequencing. Varför är den effektivare än Sanger-metoden?
Enligt Illumina/Solexa-principen
- Dubbelsträngat DNA fragmenteras → s.k. adapters (känd sekvens) ligeras på ändarna på båda sidor om varje fragment
- Låter DNA-fragmenten binda till en yta med sekvenser KOMPLEMENTÄRA MOT ADAPTERS i en sekvenseringsmaskin → tillsätter PRIMERS och låter de amplifieras genom en PCR-lik process → får KLUSTER AV DNA, varje kluster kommer fungera som en egen sekvenseringsreaktion
- Flourescensmärkta nukleotider (ddNTPs), primers och polymeras tillsätts
- Tar bild på ytan → färgen avgör vilken bas den första nukleotiden har
- Terminatorer tas bort och ny nukleotid kan på så sätt adderas → tar ny bild. Processen upprepas många gånger. Dator kan sedan jämföra fotona
Vad är en gen och hur många gener finns i humana eller?
Gen = sekvens DNA som kodar för en sammanhängande uppsättning av potentiellt överlappande funktionella produkter (proteiner). Genom alternativ splicing kan olika protein fås från samma mRNA-molekyl
Ca 20 000 - 25 000 gener i humana celler
- 20 000 gener beräknas koda för proteiner
- 11,9% för transkriptionsfaktorer
- Ca 10,4% för receptorer
Vad är exon respektive intron? Hur mycket av respektive finns i humana celler?
Exon → kodande DNA-sekvens, DNA-sekvenser som ger upphov till ett funktionellt protein
UTRs → untranslated regions, finns på 3’ & 5’-änden i exoner i mRNA → translateras ej till ett protein
Intron → icke-kodande DNA-sekvens, måste klyvas bort genom splicing av mRNA-molekylen för att ett funktionellt protein ska genereras
- Tack vare många introner och alternativ splicing → kan få många olika produkter
98 % introner och 2 % exoner i humana celler
Ca 36 % av genomet består av protein-kodande gener (exon + intron)
Vad är regulatoriska element?
Enhancers
- DNA-sekvenser som ökar eller minskar uttrycket av vissa gener i en organism, kan finnas många 1000 bp bort
Vad menas med repetitiva element och vilka är de två huvudklasserna?
DNA-sekvenser som repeteras om och om igen, utgör drygt 50 % av mänskliga genomet
TANDEN/SATELLITE/SIMPLE REPEATS → upprepande DNA-sekvenser som utgör ca 8 % av genomet
INTERSPERSED REPEATS → DNA-transposon som utgör 3 % av genomet, samt retrotransposon som utgör mer än 40 % av genomet
Redogör för några av de mekanismer som bidrar till genom-evolution.
Följande aspekter kan påverka genomet negativt i en kort tidsaspekt, men bidra positivt till genomets evolution i det långa loppet:
- RETROTRANSPOSON bidrar till genomförändring och biologisk mångfald
- Förlust eller dubblering av gener vid replikation
- Polymeraser gör fel, t.ex. mis-incorporation eller slippage
- Kedjebrott i kromosom/-er
- Mutationer från t.ex. UV-strålning som ej repareras
Redogör för några av de mekanismer som bidrar till genetisk variation
SNP → single nucleotider polymorphism, strukturell variation av en enda nukleotid i en specifik position i humana genomet
Exempel: de flesta kanske har sekvensen TTCGACGT medan en liten population har sekvensen TTCGGCGT → finns en SNP i position 5 i denna sekvens
CNV → copy-number variations, fenomen i vilket sekvenser i genomet repeteras olika många gånger i en mänsklig population
Indels → mindre insertions eller deletions av baser i genomet ger upphov till variationer inom en population
Stora strukturella rearrangements i genomet kan också ge upphov till variationer
Exempel: translocation vid cancer → kan få förhöjd tillväxt av cancerceller
Vad är bioinformatik?
Forskningsfält som kombinerar datavetenskap, biologi, matematik, statistik och teknik för att hantera, analysera och tolka biologisk data
Vad är homologer, ortologer respektive paraloger?
Homologer → DNA-sekvenser med samma ursprung → har strukturella och funktionella likheter i antingen DNA:t eller aminosyrasekvensen i det protein DNA-sekvensen genererar genom transkription och translation
Ortologer → homologer MELLAN arter
Exempel: transkriptionsfaktor-proteiner FOXP2 i apor och människor, spelar viktig roll vid språkutveckling
Paraloger → homologer INOM en art
Exempel: immunoglobuliner hos människan
Vad är sekvensinpassning/alignment?
Sätt att arrangera olika DNA-, RNA- eller proteinsekvenser för att IDENTIFIERA LIKNANDE REGIONER, handlar om att lista ut HUR EN SEKVENS RELATERAR TILL EN ANNAN
- Kan vara vissa svårigheter pga variationer, t.ex. insertions, deletions och punktmutationer
- Annat problem → gaps pga splicing av mRNA → kommer inte passa in perfekt mot genomet
Vad är skillnaden mellan global och lokal sekvensinpassning?
Global → sekvensinpassning där man passar in hela sekvenser mot varandra
Lokal → sekvensinpassning där man vill identifiera ett delsegment som är lika mellan 2 sekvenser
Exempel: jämför 2 proteiner som har en viss domän som förväntas vara lik