Det Mänskliga Genomet Flashcards
Vad står genom för?
GEN+kromoSOM—> Genomet är stort och komplext ochbestår utav 2 * (3 miljarder bp uppdelat i 22 autosomerer och 1 könskromosom X/Y)
Vad är genomik?
Läran om genomet. Vilket innebär Attmar försöker förstå biologiska funktion som genomet kodar för.
Vad är genomik?
Läran om genomet. Vilket innebär Attmar försöker förstå biologiska funktion som genomet kodar för.
Vad är shotgun sequencing?
En metod för att sekvensera DNAt, dvs kartlägga genomet. Användes vid HUGO -projektet som kartlagdes 2004.
Den går till som följande:
- Fragmentera DNA i små bitar slumpmässigt
- Man sparar de mindre bitarna och sätter de i bakterier
- DNA fragmentets klonas
- Man sätter ihop fragment, efter ett flertal fragment kommer de att överlappa varandra
- Man jämför med Datorn
Vad är sanger sequencing?
En sekvensmetod som används flitigt inom forskning/klinik som är PCR-baserad där man får miljoner kopior av ett single stranded DNA templat.
- DNAt värms upp —> strängarna separeras
- Ena strängen fungerar som templat
- Primer binds in och DNA polymeras börjar syntetisera utifrån templatet
- I mixtuben finns dNTPs och infärgade ddNTPs. ddNTPs saknar -OH, vilket gör att DNA polymeraset inte kan fortsätta att syntetisera efter ddNTPs. Detta ger ett flertal DNA fragment med olika längd då replikationen terminernas vid insättandet av ddNTPs.
- Då man vet storlek och vilken kvävebas som är sist kan man analysera och få sekvens.
Beskriv NGS principle solexxa illumina
En mer effektiv metod för kvävebassekvensering där man använder sig utav 2d-ytor.
Metod:
1. Fragmentera sekvens till mindre bitar
2. Sätt på oligonukleotider med känd sekvens på ändarna som kan binda in till komplementär oligosackarider på en yta
3. Låter DNAt amplifieras med ”Bridge amplification” - en PCR metod med flouroserande dNTPs, primers och DNA polymeras.
Endast en bas kan syntetiseras åt gången där varje bas har en egen färg—> varje kluster får en egen färg—> första basen kan bestämmas—> fotas
4. Tillsätter reversibel terminator vilket gör att nästa bas kan upptäckas då proceduren börjar om från början —> ger sekvens
Vad kan man ta reda på genom att använda sig av bioinformatik från sekvensbestämning?
Utöver DNA-sekvensering kan man konvertera RNA—>DNA och mata in, RNA matas in mot genomet och undersöka frågeställningar såsom ex:
- Vad har splicats bort som introner?
- Hur mkt uttrycks genen?
- Hur binds proteinet till genomet?
Vad är Hi-C?
Metod för att få en 3D-struktur av genomet.
Metod:
- Klipp DNA
- Bitarna ligeras ihop
- Sekvensera de bitar som satts ihop —> kan se hur DNA:t förhåller sig till varandra i 3D-rummet
Vad är en gen?
En avgränsad region i genomet som kan ge en funktionell funktion.
Genomet består utav 20000 gener som kodar för proteiner. Vilket motsvarar ca 40% av genomet resten är ickekodande RNA.
Vad är ickekodande RNA?
Icke-kodande RNA är sekvenser som ej kodar för protein men som oftast har en viktig funktion i cellen, såsom regulering, spliceosom m.m. De klassas efter storlek.
- MicroRNAs (19-24 mb)
- piRNAs (26-31bp)
- snoRNAs och tRNAs (60-300 bp)
- rRNAs (2000-5000 bp)
- long ncRNAs (200-100000 bp)
Vad är CpG-öar?
CpG-öar är områden med -C-G-, alltså fosfodiesterbindning mellan C och G. Cytosin metyleras till metylcytosin som i sin tur deamineras lätt till tymin. Cytosin kan lätt deamineras till Uracil (reversibel) som i sin tur metyleras till T, vilket över tid ger en permanent ändring från -CG- till -TG-. Alltså finns det inte många -CG- kvar i DNA sekvenser där metylering finns. Runt promotorer förekommer inte så mkt metylering (om ens alls), vilket leder till att -CG- förblir -CG-. Så där man ser -CG- vet man att det är promotor nära kvävebaserna.
Vad är repetitiva element?
Repetitiva element är sekvenser (>50%) som kommer på flera ställen i genomet. Det finns två grupper av repetitiva element:
- Tandem (mini <10 nt) /satellit (micro 1-100nt) / simple repeats (>100 nt)
- utgöra 8% och sitter fast på sitt ställe, används till ex DNA matchning inom forensik.
- Interspeed Repeats (transponsoner)
- 3% DNA-transponsoner
- > 40% retro transponsoner (blir till RNA och sedan till DNA igen)
- LTR-typ retrovirus lik (8%)
- LiNE (21%)
- SINE (11%) - utspritt på genomet
- mobila element
Vad är transponens roll i genomik evolution?
Evolution är förändring i DNAt. Transponsoner hjälper till med detta genom:
- Mutagenes—>förändring av transkriptionen reglering
- Transduktion - Flanking DNA bärs med under transposition vilket leder till genetisk info flytas runt omkring i genomet.
- Alu exonisering - Alu SINE har splice signallik sekvens
Nämn olika förändringar som leder till evolution och genomvariationer
- Genduplikation/förlust vid replikering ex mikrosatellit repeats
- Polymeras fel
- Kromosom brott/fusion
- Ofixade mutationer från strålning/reaktiva syrearter
Vad räknas som genom variation?
- SNP´s - Single nucleotide polymorphisms, ofta ofarliga (ex A istället för C), ibland infertilitet
- Indels - mindre insertioner/deletioner - vissa ger hög risk för vissa sjukdomar
- CNV´s- copy number variants —> antal gener som finns i variabelt antal
- Large structural rearrangements - translokalisationer i cancer.
Vad menas med comparative genomics?
Att man utnyttjar att grundläggande biologiska processer är konserverade och återfinns i olika arter när man vill upptäcka funktioner i sekvenser.
Vad menas med homologer, orthologer resp paraloger?
Homologer sekvenser som liknar varandra och är besläktade sekvenser i strukturell, funktionell, primär aa/DNA.
Orthologer är homologer mellan arter, exempel apa och människa
Paraloger är homologer inom samma art ex immunoglobin, kollagener i människa
Vad menas med sekvensinpassning?
När man försöker lista ut hur en sekvens relaterar till en annan sekvens. Dvs se om sekvenserna är homologer eller ej. Sekvensinpassning försvåras av substitioner, insertioner och deletioner (InDels). Försvåras även a GAPs—> spliced mRNA är inte identiskt med genom.
Vad är DOTPLOT?
En matematisk utmaning där man lägger sekvenser på varsin axel i en matris och ser om de är homologer. Försvåras av Indels och substitioner
Vad gör en substitionsmatris?
Det ökar känsligheten och tar med i beräkning att vissa substitioner är vanligare än andra vilket ger en bättre sekvensinpassning.
Vad menas Global resp Local alignment?
Global sekvensinpassning är när hela sekvensen ska passa in medan Lokal sekvensinpassning är när endast en del av sekvensen ska matchas.
Vad är BLAST och UCSC browser?
BLAST är en enorm databas, ungefär som Google för biologiska sekvenser. Det poängsätter hur kompatibla sekvenserna är med ett E-värde som anger hur sannolikt svaret är en slump eller sanna homologer
UCSC browser är en databas som ger info om genen —> var genen finns, hur den regleras osv.