Humana genomet Flashcards
Vad är en organisms genom?
Summan av all genetisk information som en organism bär på
Vad är målet med genomik?
Att förstå alla biologiska funktioner som kodas i genomet
Vad kallas de mindre bitarna som vårt genom är uppdelat i..?
Kromosomer
Vad kallas de kromosomer som ej är könskromosomer?
Autosomer
Hur många olika proteinkodande gener kodar det mitokondriella genomet för?
13 stycken
Vad är lättast att kartlägga, en människas genom eller en mus?
Det är typ samma, nästan alla däggdjur har ett genom på ca 3 Gb…
Vad kallas den idag dominerande principen för att kartlägga genom?
Shotgun sequencing
Beskriv den översiktliga grundprincipen för shotgun sequencing?
Följande utförs bioinformatiskt:
- Genom fragmenteras slumpmässigt
- Bitarna sätts slumpmässigt ihop
- Bitarnas ihopsättning varieras, när bitarna passar ihop fogas de samman till längre sekvenser
- Upprepa
Vad innebär hierarkisk shotgun sequencing? Hur går det till?
Att man systematiskt utför en shotgun
- Genomet delas upp i mindre delar
- Delar sparas in i bakteriella kloner genom att föra in dem via vektorer in i bakterier
- Man gör därefter shotgun på varje liten bit av genomet
Vad är principen med Sangersekvensering?
Man använder ett polymeras och nukleotider där en liten del av alla nukleotiderna har manipulerats så att replikationen inte kan fortskrida efter inkoppling av dessa. Man har plockat bort en hydroxylgrupp på 3’ kolet på ribosringen
De manipulerade nukleotiderna är ofta flouroscenscinmärkta som vi kan detektera med kapillärelektroforers
Vilka två viktiga modifieringar har gjorts på nukleotider som används i NGS?
- De har modifierats och fått en blockerande grupp påkopplad - de kan inte bilda kedjor av nukleotider efter påkoppling utan bara en bas innan elongeringen stannar
- Nukleotiderna är flouroscenceinmärkta - varje bas flouroscerar en speciell färg
Beskriv de olika stegen i principen för NGS?
- Fragmentera DNA
- Sätt på adapter sequence (oligonukleotid med känd sekvens) genom att ligera samman den med DNA fragment
- Adapterkonjugerade DNA fragment tillåts binda in till en yta med oligonukleotider med bestämd sekvens som är komplementära till adapters ⇒ bra infästning
- Fragment binder glest in till ytor med komplementära oligos
- Inbundna fragment amplifieras med “bridge amplification” (som PCR på plats) ⇒ vi får clonal clusters. Allt DNA i dessa clusters är likadant
- Tillsättning av nukleotider, primers och polymeras. Replikering av DNA kluster börjar (pga nukleotiders modifiering förlängs sekvenser med bara en bas)
- Genom att fota efter inkorporering av ny bas kan man se vad som tillsattes ⇒ ny nukleotid i sekvensen blir känd
- Blockerande reversibla terminatorer tas bort och cykeln börjar om. Ny insatt nukleotid + foto ger oss till slut alla sekvenserna
Vad är dilemmat med att NGS utvecklat så sjukt fort på sistone?
Våra datorer hänger inte med!
Möjligheter till NGS ökar snabbare än datorers lagringskapacitet
Vad är en allel?
En genvariant, en alternativ variant av en gen eller nukleotidsekvens
Vilken metod används för att besvara frågan “vilka gener regleras av en viss transkriptionsfaktor?”
ChIP-seq
Vad är Hi-C?
Bestämning av ett genoms 3D-struktur
Vad är en gen?
En avgränsad genomisk region som kan ge upphov till en eller flera relaterade funktionella molekyler
Hur många proteinkodande gener har vi i vårt mänskliga genom?
ca 20.000
Rangordna följande icke-kodande RNA utifrån storlek (1-5), där 1 = minst och 5 = störst
- rRNA
- long ncRNA
- tRNA/snoRNA
- microRNA
- piRNA
- microRNA
- piRNA
- tRNA/snoRNA
- rRNA
- Long ncRNA
Vad är ett exon?
En genetisk sekvens som kodar för något (mRNA)
Varför tror man att exon/intron-strukturen hos gener uppkommit, varför har vi den?
- De ger möjliggör att generna kan ge upphov till många olika mRNA och då även olika proteiner
- Ger generna större sannolik möjlighet till att skapa nya gener. Lättare att klippa/klistra och flytta delar mellan gener tack vara denna struktur
Vad gör insulator-sekvenser?
De avskärmar genetiska sekvenser från varandra
Vilken spontan DNA-skada sker ofta på cytosin?
Deaminering
Vilken effekt fås från följande deamineringar:
- Deaminering av cytosin
- Deaminering av metylerat cytosin.
- Uracil, U (repareras lättare)
- Tymin, T (oftare mer permanent mutation)
Varför har vi mycket CpG-öar i promoter-regioner?
Vi ser mindre metylering här eftersom metylering verkar hämmande på genuttryck
Cellerna vill motverka metylering i dessa regioner
Historiskt har massa metylering skett på andra ställen i sekvensen så därför är just C och G vanligt förekommande i promoter-regioner. De har hållits intakta.
I vilka klasser delas repetitiva element i genomet in i?
- Tandem repeats
- Spridda (interspersed) repeats
Vad är tandem (satellit/enkla) repeats för något?
Repetitioner på plats i en sekvens
E.g. 4 specifika baser som återkommer på varandra igen och igen 100 gånger på samma plats
Vad är spridda repeats?
Repetitioner i sekvens som förekommer flera gånger i vårt genom men som är utspridda. När vi har samma sekvens som återkommer men som sitter utspritt på alla våra kromosomer
Ofta relaterat till transposoner
Vad finns det för olika klasser av transposoner?
- DNA transposoner
- Retrotransposoner
Vad finns det för olika klasser av retrotransposoner?
- LTR-type transposones
- LINE-transposoner, kodar för egna protein (RT/endonukleas tex) och ca 6 kb stora
- SINE - kodar ej för egna protein och är mindre än LINE-transposoner. Kan innehålla speciella SINE-element, alu-element
Vad har piRNA för uppgift?
piRNA har som roll att dämpa uttryck av transposoner och trycka ner transposonaktivitet
På vilka olika sätt kan transposoner påverka hur vårt genom utvecklas?
- Insertionell mutagenes - Transposonen sätter sig på ett visst ställe och ändrar funktionen av ett visst regulatoriskt element som ger nya egenskaper hos en organism. Ger ofta selektionsnackdel men kan ge selektionsfördel
- Alu exonisering - Alu = SINE element som liknar splice-signaler. När ett Alu element integreras i ett intron kan nya splice-signaler skapas vilket ger upphov till att nya gener kan skapas
- Transduktion - När transposonen flyttar runt genetisk information i vårt genom
Ge exempel på mekanismer som skapar genomisk variation?
- Gener dupliceras/förloras under replikation
- Polymeras-fel - felinsättningar, hopp
- Kromosomer som går sönder eller fuse:as samman
- Mutationer som ej repareras, e.g. från strålning eller syreradikaler (deaminering och depurinering)
Vad är indels?
Små insertioner/deletioner i genomet som kan vara relaterade till sjukdomar
Vad är en GWA-studie?
När man undersöker många personers genetiska variationer och försöker koppla dem till sjukdomsrisk
GWA = Genome wide associations
Hur kan vi genom att kolla på flera olika arters genom hitta funktionellt viktiga sekvenser? Vad kallas denna metod?
Vi kan försöka hitta sekvenser som är konserverade i flera arter, detta tyder på att den sekvensen är viktig. Det har funnits ett selektionstryck till att just den sekvensen inte ska förändras pga dess viktighet
Metoden kallas för komparativ genomik
Gällande sekvens-bioinformatik, vad innebär följande begrepp?
- Homologer
- Orthologer
- Paraloger
- Homologer = sekvenser som är besläktade och har utvecklats från samma förfader
- Orthologer = Homologer mellan arter, e.g. gen i människa som delas med ett annat däggdjur, tex mus eller apa
- Paraloger = Homologer inom en och samma art. Genfamiljer, gener som utvecklats från samma förfader inom en och samma art. E.g. kollagener, bindvävsproteiner som utvecklats tillsammans
Varför kan substitutionsmatris vara bra och ge ökad känslighet när man undersöker om sekvenser är relaterade till varandra i alignment-undersökningar?
Substitutionsmatrisen tar hänsyn till vilka substitutioner som är mest vanligt förekommande
Om en substitution resulterar i bildandet av en helt annat typ av aminosyra är det mindre troligt att den inträffar jämfört med en mindre förändring där en aminosyra av samma grupp istället bildas
Ger bättre alignment och känslighet
Vad står BLAST för?
Basic Local Alignment and Search Tool
(Google för bioinformatiska sekvenser 🤓)
Vad beskriver ditt E-värde som du får om du gör en BLAST och får upp en massa potentiella matchningar?
E-värdet beskriver hur osannolikt det är att den alignment är slumpmässig
Lågt E-värde = bra, 0 bäst