Hoorcollege 5: Genome mapping and sequencing Flashcards
How many kb can be placed in a P1 Artificial chromosome (PACs)?
Inserts up to 300 kb
How many kb can be placed in a Bacterial Artificial Chromosome? (BACs)
Inserts up to 300 kb
How many kb can be placed in a Yeast Artificial Chromosome? (YACs)
Inserts up to 2000 kb
Wanneer werd het humane genoom in kaart gebracht?
tussen 1990 en 2000
Wat was naast het genoom in kaart brengen het doel van HUGO?
Om het te sequencen met een error met minder dan een error in 10,000 base-paren en om hulpmiddelen te maken waarbij elk gen gesequenced an worden en om het economisch/high-throughtput aantrekkelijker te maken
What is a genomic library?
The entire collection of clones derived from a complete genome
Explain the process of hierarchical shotgun sequencing
This approach starts by fragmenting the genomic DNA into (still large) pieces. The pieces are cloned into DNA cloning vectors. Once cloned, each DNA fragment is corporate in bacteria/yeast. During cell division, the foreign DNA fragment is replicated along with the cell’s own DNA (=molecular cloning, to amplify)
Bij hierarchical shotgun sequencing worden fragmenten opgeknipt in stukken… hoe gaat dit proces?
Dit gebeurt willekeurig door het DNA mechanisch te breken (door het te soniceren of door een vernevelaar te gebruiken), een proces dat shearing wordt genoemd.
In hierarchical shotgun sequencing, a physical map of the genome is first constructed… why?
So that the position of each BAC clone is known
The combination of clones that have the least overlap between them is called .. ?
The shortest tiling path
Kunnen de BAC-klonen direct gesequenced worden?
Nee, de klonen zijn nog steeds te groot voor directe sequence en moet het eerst nogmaals ‘gesheared’ worden om kleinere stukken te produceren.
Als het DNA twee maal ‘gesheared’ is kan de sequence informatie geworven worden van veel verschillende individuele DNA fragmenten. Hoe wordt deze puzzel ook wel genoemd?
Een leg-puzzel
Wat is een contig?
Een set overlappende DNA-segmenten die samen een consensusregio van DNA vertegenwoordigen
Wat wordt bedoeld met ‘hierarchical’ shotgun sequencing
De fragmentatie van het genoom vindt plaats in twee hiërarchische stappen (eerst van het genoom naar een BAC-bibliotheek en vervolgens van een BAC-kloon naar fragmenten van kleine omvang)
Wat is er anders met whole-genome shotgun sequencing en hierarchical shotgun sequencing?
Bij whole-genome shotgun sequencing wordt het gehele genoom gelijk in kleinere fragmenten geknipt, bij hierarchical gaat dit in twee stappen.
Is whole-genome shotgun sequencing geschikt voor grote of kleine genomen?
Kleine(re) genomen, alhoewel tegenwoordig dit ook kan worden gebruikt voor het humane genoom
Hoe is een fysieke map anders dan een genetische map?
Een fysieke kaart drukt uit
de locatie van genen in basenparen, it
daarom is een directe weerspiegeling van de
DNA-sequentie. Een genetische kaart, drukt de locatie van genen in
centiMorgans (cM), een eenheid die is gebaseerd
op recombinatiefrequentie (Een cM
komt overeen met 1% recombinatie
frequentie)
Wat zijn genomische markers?
Genomische markers zijn korte sequenties op unieke locaties van het genoom die variatie vertonen binnen individuen van dezelfde soort
Markers met zeer hoge variatiefrequenties zijn zeer…
Polymorf
Wat zijn de 3 meest gebruikte type polymorfismen?
- RFLPs (restriction fragment length polymorphisms);
- SSLPs (simple sequence length polymorphisms, also called microsatellites) - SNPs (single nucleotide polymorphisms)
Wat zijn restriction fragment length polymorphisms (RFLP’s)?
RFLP’s zijn sequenties waarin de variatie ervoor zorgt dat een knipplaats van een restrictie-enzym verschijnt of verdwijnt. Deze variaties kunnen worden gedetecteerd door DNA-fragmenten te verteren met het overeenkomstige restrictie-enzym, waardoor banden van verschillende grootte ontstaan.
Wat is het principe vansimple sequence length polymorphism (SSLPs) ?
Dat ze bestaan uit korte repetities van sequences.
Wat zijn andere namen voor SSLPs? (3 antwoorden)
Simple sequence repeats (SSRs, simple tandem repeats (STRs) of microsatellites
Waarvoor wordt single nucleotide polymorphisms (SNPs) toegepast?
Variaties dat alleen een single nucleotide beïnvloeden
Wat is het voordeel van SNPs?
Dat er veel SNPs voorkomen in het menselijk genoom en dus kunnen ze een grote hoeveelheid marker op de fysieke map
Waar worden SNPs veel voor toegepast?
voor disease mapping
Wat is de eerste stap in grote-schaal sequencing?
Een ‘bibliotheek’ voor te bereiden van grote fragmenten van genetisch DNA
Wat is de meest gebruikte kloon-vector?
BACs en PACs
Waarom worden YACs niet vaak gebruikt ondanks ze veel meer kb’s kunnen ‘dragen’?
Omdat het lastig is om met ze te werken, zoals het isoleren en de instabiliteit.
Een sequentie wordt vaak ook gevonden in andere klonen.. hoe veel overlap heeft dat ongeveer?
5 tot 8 verschillende klonen
Wat is de tweede stap van grote-schaal sequencing?
Het fragment opdelen in kleinere stukken
De overlappende stukjes DNA die een gebied van het chromosoom overspannen, staan bekend als…
contigs (van continuous)
Wat is het minimum tiling path?
Voor een efficiënte sequentiebepaling is het doel om te beginnen met het kleinste aantal DNA-fragmenten die een aaneenschakeling vormen die het gebied van het chromosoom bedekt dat u wilt sequencen.
Er zijn verschillende manieren om contigs te genereren. Noem er 3.
- Southern blotting
- use of molecular markers
- analysis of restriction enzyme digests
Wanneer verschillende banden dezelfde grootte lijken te hebben in twee verschillende inzetstukken, geeft dit aan dat de twee fragmenten elkaar overlappen. Hoe heet dit proces?
“fingerprinting”
Hoe kan men voorkomen dat twee licht verschillende groottes fragmenten als dezelfde grootte wordt beschouwd?
Mbv high-resolution gel electrophoresis
Zelfs met hoge-resolutie gel electrophorese, kunnen er errors ontstaan in dit type van fysiek mapping. Noem er 2
Een dergelijke fout kan afkomstig zijn van twee restrictiefragmenten die dezelfde lengte hebben, maar die in feite afkomstig zijn van verschillende sequenties (1). Een ander veel voorkomend probleem is dat van repetitieve elementen die in de meeste genomen worden aangetroffen (2). Omdat de sequentie van deze elementen sterk geconserveerd is, hebben ze de neiging om dezelfde restrictieplaatsen in zich te hebben en dus dezelfde fragmentgroottes te genereren bij splitsing met restrictie-enzymen. Dit kan leiden tot de verkeerde overtuiging dat twee inserts afkomstig zijn van overlappende delen van het chromosoom, terwijl ze in feite slechts hetzelfde herhalende element bevatten.
Een andere methode is om beide uiteinden van een insert te isoleren. Elk van de eindstukken wordt vervolgens gelabeld en gebruikt om een genomische bibliotheek te onderzoeken in de vector. Inserts die hybridiseren met de eindprobes worden geïsoleerd. De uiteinden van deze nieuw geïsoleerde klonen worden vervolgens als probes gebruikt en het proces wordt herhaald. Hoe heet deze methode?
HybridiEnd hybridisation
Kan southern blotting gebruikt worden om een contig te genereren?
Ja
Wat is ‘positionele klonering’?
Een strategie om een gen te konen op basis van de mapped position op het chromosoom
Wat is een veelgebruikte methode voor positionele klonering?
Chromosoom lopen (walking)
Hoe kan je identificeren welke klonen jouw gen bevatten?
Bacteriële colonie hybridisatie
Restrictie enzymen knippen DNA op specifieke plekken. Wat voor sequences zijn dit vaak?
Palindromic sequences.
Hoe lang zijn vaak de overlappende fragmenten voor sequencing?
2-10 kb
Sanger methode maakt gebruik van…
Di-deoxysequencing
Wat zijn de 4 stappen van een vorm van NGS?
1) library preparation (fragmenting a gDNA sample and ligating specialized adapters to both fragment ends)
2. Cluster amplification (library is loaded into a flow cell and the fragments are hybridized tot he flow cell surface. each bound fragment is amplified into a clonal cluster through bridge amplification)
3. Sequencing (sequencing reagents are added, the flow cell is imaged and the emission from each cluster is recorded. the emission wavelength and intensity are used to identify the base)
4. Alignment and Data analysis (reads are aligned to a reference sequence with bioinformatics software)
Welke typen NGS technieken zijn er?
- Sanger-like fluorescence detection
- Light detection
- Proton detection
Wanneer ‘probes’ met eindfragmenten wordt gecombineerd met het zoeken naar overlappende restrictiefragmenten, wordt de resulterende procedure…
chromosoomwandelen
Wat zijn de stappen van chromosoomwandelen?
(1) Dit proces begint meestal met genetische mapping die identificeert dat een fysieke marker is gekoppeld aan een locus van belang (bijv. Een locus voor een ziektekenmerk). (2) Een kloon die de fysieke marker bevat, wordt vervolgens geïsoleerd en de uiteinden ervan worden gebruikt om een genomische bibliotheek te onderzoeken. (3) De hybridiserende klonen worden gezuiverd en vervolgens geknipt met restrictie-enzymen. (4) Vergelijking van de afmetingen van de restrictiefragmenten wordt gebruikt om het inzetstuk met de kortste overlap te identificeren (de overlap die zich het verst van het inzetstuk uitstrekt met de fysieke markering). (5) Van het uiteinde van deze kloon wordt vervolgens een sonde gemaakt die deze in de gewenste richting verlengt. (6) Deze sonde wordt gehybridiseerd met de genomische bibliotheek en het proces wordt herhaald.
Welke techniek wordt gebruikt voor automated sequencers?
vierkleuren / eenbaans sequencing met fluorescent gelabelde dyedeoxy-nucleotiden
Welke techniek wordt gebruikt voor high-throughput modellen?
capillaire elektroforese voor scheiding van de reactieproducten.
Wat is het doel van genoom annotation?
Genoomannotatie specificeert de locatie van genen in het genoom, hun exons en introns, regulerende sequenties zoals TATA-boxen en polyA-additieplaatsen en repetitieve elementen. Al deze informatie is cruciaal om te begrijpen welke sequenties in het genoom coderen voor eiwitten of functionele RNA-moleculen
wat is het aantal eiwitcoderende genen?
20,000
Hoe veel niet-eiwit coderend RNA is er?
24,000
Welke drie bronnen kunnen gebruikt worden als experimenteel bewijs om de functie van genen te voorspellen?
- Expressed sequence tags (ESTs)
- RNA sequencing
- Protein mass spectrometry
Welk proces wordt hier omschreven: De eerste stap in deze alternatieve benadering was om een cDNA-bibliotheek te maken van RNA dat was geëxtraheerd uit het weefsel of celtype van interesse. Vervolgens werden cDNA-klonen willekeurig geselecteerd en van een of beide uiteinden de sequentie bepaald. Belangrijk is dat er geen poging werd gedaan om de volledige sequentie van de kloon te verkrijgen; slechts een korte reeks van een van de uiteinden. Dit versnelt het proces en vergemakkelijkt zo de ontdekking van veel verschillende fragmenten
Expressed sequence tag
Wat is een library?
Een collectie clones
Wat is de ‘oude’ methode om een library te maken?
- isoleer mRNA (met poly-A-staart)
- maak cDNA mbv reverse-transcriptase
- clone DNA fragmenten = cDNA library
Wat is een genomische library?
Een collectie van plasmiden die stukjes genetisch DNA bevatten
Wat is een cDNA library?
Een collectie plasmiden die stukjes cDNA bevatten
Wat is het voordeel van EST sequencing tov genetische sequencing?
EST is relatief goedkoper om uit te vinden hoe onbekende genen worden expressed, en geeft een representatie van de expressie in de cel
Wat is het nadeel van EST sequencing?
Er is geen informatie over de upstream/downstream regulatorische sequenties, het bevat in totaal maar 6-% van de genen in het genoom en geeft geen informatie over de locatie van de sequentie
Is EST sequencing verouderd?
Ja, want inmiddels is het hele genoom al in kaar gebracht
What is the process of RNA sequencing?
Such a cDNA library is made by first extracting RNA from tissue . Using the enzyme reverse transcriptase, the RNA is copied into complementary DNA, or cDNA . The resulting cDNA fragments are cloned, giving rise to the cDNA library . A large number of cDNA fragments are subsequently sequenced
What does RNA sequencing represent (in the cell)
RNA sequencing provides a snapshot of all the sequences that are expressed as RNA at a given time in the tissue analyzed
What is the difference between RNA sequencing and ESTs?
In contrast to ESTs, RNA sequencing aims to identify the full sequence of each transcript