Ecologia Molecolare Flashcards

1
Q

Cos’è e a cosa può essere utile la TRASCRITTASI INVERSA?

A

La TRASCRITTASI INVERSA è un enzima capace di costituire una molecola di ssDNA complementare ad una molecola di RNA di partenza. Questo enzima è presente in diversi virus. La TRASCRITTASI INVERSA può essere utilizzata per ricavare il DNA d’ origine di una sequenza di RNA. Ad esempio, abbiamo un frammento di RNA e vogliamo sapere da quale molecola di DNA deriva, usiamo una TRASCRITTASI INVERSA, cosicché vadi a costituire un segmento ssDNA della molecola di RNA. A questo punto sfruttiamo una DNA POLIMERASI (aggiungendo primer e nucleotidi alla soluzione) per allungare il ssDNA, ottenendo un dsDNA (quello da cui deriverà l’ RNA d’ interesse), denominato cDNA (DNA COMPLEMENTARE). In questo modo possiamo creare delle librerie trascrittomiche di cDNA.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Cos’è l’ ELETTROFORESI SU GEL?

A

L’ elettroforesi su gel è una tecnica che permette di distinguere le diverse macromolecole (come DNA o RNA) in base alle loro dimensioni.
Struttura: Ad un polo dello strumento vi è un CATODO (carico positivamente) mentre all’ altro vi è l’ ANODO (carico negativamente). Tra i poli vi è una vasca contenente gel (spesso di agarosio). Nella porzione di gel in vicinanza dell’ anodo vengono creati dei pozzetti in cui verranno inserite le macromolecole di, ad esempio DNA. Il macchinario genererà un campo elettromagnetico.
Funzionamento: il campo elettromagnetico spingerà le molecole di materiale genetico dall’ anodo verso il catodo (poiché il materiale genetico presenta delle cariche superficiali negative, date dai gruppi fosfato). La velocità di spostamento sarà determinata dalla massa della molecola, qualora sia più grande, farà più fatica a spostarsi lungo le maglie di agar del gel, perciò si muoverà più lentamente. Alla fine della corsa si osserveranno delle bande a diversa altezza, che indicheranno la dimensione (la massa) della macromolecola.
Visualizzazione: la visualizzazione delle bande si ha grazie all’ aggiunta di sostanze che si legano al materiale genetico. Fino a poco tempo fa veniva utilizzato l’ ETIDIO BROMURO, il quale eccitato con la luce blu o UV emette fluorescenza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cosa sono gli ENZIMI DI RESTRIZIONE?

A

Sono degli enzimi che si sono riscontrati per la prima volta nei batteri. Essi li usano come forma di “sistema immunitario” nei confronti delle infezioni virali. Tali enzimi di restrizione, o endo/eso nucleasi di restrizione, riconoscono brevi sequenze nucleotidiche (5-12 pb) di una molecola di materiale genetico ed effettuano un taglio. Nelle endonucleasi di restrizione questo taglio è interno alla molecola, può essere tale da creare delle STICKY ENDS (dove vi è la protrusione di uno dei 2 filamenti di DNA) o BLUNT ENDS (dove non vi è la costituzione di estremità protrudenti).
Di enzimi di restrizione riconosciamo gli ISOSCHIZOMERI, cioè quelli che riconoscono la stessa sequenza di DNA e i NEOSCHIZOMERI, i quali riconoscono la stessa sequenza di DNA ma effettuano tagli differenti tra loro.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Come si effettua il CLONAGGIO del DNA?

A

Il CLONAGGIO del DNA è il processo con il quale è possibile creare copie di materiale genetico d’ interesse. Un metodo utile che veniva usato è quello di sfruttare delle COLONIE BATTERICHE.
CLONAGGIO: identifico un gene d’ interesse che voglio clonare. Prendo un vettore plasmidico (una molecola di DNA circolare, presente nei batteri, capace di autoreplicarsi). Uso enzimi di restrizione per effettuare un taglio sul plasmide, uso l’ enzima DNA LIGASI per permettere, assieme allo sfruttamento di ADATTATORI (molecole che facilitano il processo di ligazione), al gene da clonare di legarsi al plasmide. Ora si è costituito una molecola circolare di DNA ricombinante. A questo punto vado a inserire il plasmide in un batterio, il quale sarà posto in una piastra Petri, in un ambiente adatto alla crescita, maturazione e riproduzione assessuata per scissione binaria. Si sarà formata, dopo un tot di tempo, una colonia di batteri, i quali avranno replicato dentro di se i vettori plasmidici, contenenti il gene d’ interesse. A questo punto basta prelevare i plasmidi dai batteri. Abbiamo ottenuto tante copie dello stesso gene, le quali verranno recuperate tramite processi di purificazione del DNA.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Cos’è la PCR?

A

La polymerase chain reaction è una tecnica che permette di ottenere tante copie dello stessa molecola di DNA. Per ottenere ciò viene usato lo strumento noto come termociclatore.
Ingredienti utilizzati nella PCR: Acqua (come solvente), Buffer (un tampone usato per mantenere la soluzione ad un pH ideale per il funzionamento della DNA POLIMERASI, a diverse T), DNA STAMPO (anche detto tamplate, che è il DNA che si vuole riprodurre), PRIMER (sono piccole molecole di RNA di circa 5-7 Nt, che si legheranno al ssDNA, permettendo alla DNA POLIMERASI di iniziare il processo di replicazione del DNA, poiché ora vi è l’ estremità protrudenti 3’OH disponibile), NUCLEOTIDI (che sono i mattoncini per la sintesi di DNA), IONI Mg2+ (presente spesso nel buffer, fondamentale per il funzionamento della DNA POLIMERASI), DNA POLIMERASI (enzima usato per la replicazione del DNA, ad oggi vengono usate quelle TERMOSTABILI, cioè quelle che mantengono struttura e funzione anche ad alte T, come la TAQ POLIMERASI, isolata dal batterio Thermus aquaticus).
Processo: si divide in 3 fasi principali.
1)Denaturazione del dsDNA in 2 ssDNA, ciò viene fatto portando la T a 95°C.
2)ANNEALING dei primer ai ssDNA, diminuendo la T a 65 °C.
3)Estensione dei primer grazie all’ azione della DNA POLIMERASI, aumentando la T da 72 gradi in su.
Questi 3 passaggi compongono un ciclo del termociclatore, che per effettuare una analisi completa impiega in media 30 cicli, creando fino a 68 miliardi di copie della molecola di DNA.
La VISUALIZZAZIONE dei risultati della PCR si hanno tramite la colorazione dei campioni che vengono fatti correre sul gel di elettroforesi.
DESIGN DEI PRIMER: Per disegnare i primer adatti all’ ANNEALING bisogna conoscere la sequenza target. I primer vengono sempre disegnati in direzione 5–>3. Questi primer devono avere una T di melting tra loro simile. È meglio che i primer tra loro non siano complementari e che non contengano lunghe sequenze palindrome.
SCOPI DELLA PCR: Analisi forense, identificazione di cibi OGM, test di paternità, diagnosi e trattamento di malattie, conservazione della fauna selvatica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Cos’è la RT-PCR?

A

La Real-time polymerase chain reaction, è una tecnologia che sfrutta lo stesso concetto della normale PCR, solo che in questo caso è possibile osservare direttamente, mentre il processo avviene, la costituzione di molecole copia del DNA, quantificandole.
Per quantificare in tempo reale le molecole di DNA prodotte a fine di ogni ciclo, del termociclatore, si sfruttano 2 metodi:
1)INTERCALANTI FLUORESCENTI: in cui fluorofori come l’ etidio bromuro, SyBr green e l’ Eva Green, vengono intercalati alle molecole di dsDNA. Quando si formano i neo-filamenti alla fine del ciclo, essi vengono quantificati in base alla fluorescenza emessa dagli intercalanti.
2)SONDE DI IBRIDAZIONE FLUORESCENTI: alla molecola di dsDNA si lega una sonda composta da un fluoroforo e un colorante smorzante (detto quancher). Questa sonda è posta tra 2 primer (il forward e il reverse). Se la sonda è legata al dsDNA, la luce emessa da una sorgente, viene assorbita dal fluoroforo, che poi la riemette, questa però sarà subito assorbita dal quencher, non sarà quindi visualizzabile. Quando la DNA POLIMERASI agisce sul ssDNA (a partire dal primer), prima o poi incontrerà la sonda, e con la sua attività esonucleasica, la staccherà, allontanando il fluoroforo dal quencher, permettendo così la costituzione di fluorescenza misurabile. La quantità di fluorescenza è direttamente proporzionale al tasso di degradazione della sonda e quindi all’ attività della DNA POLIMERASI.
L’ intensità della luce emessa resce esponenzialmente man mano il proseguire dei cicli. Il ciclo nel quale si ha un aumento esponenziale del target è detto TRESHOLD CYCLE (ciclo soglia). Ad un certo punto si raggiungerà un plateau, ciò è dovuto o perché si sono esauriti i nucleotidi nel cocktail o perché la quantità di nuovo DNA va ad inibire la sintesi di ulteriore DNA.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Cos’è la T di melting?

A

La T di melting è la temperatura alla quale il 50% delle molecole di DNA in una soluzione risultano essere denaturate. Il processo di denaturazione avviene quando, ad alte T, i legami a idrogeno, che si formano tra 2 basi azotate tra 2 nucleotidi di differenti filamenti dello stesso DNA, si rompono. Molecole di dsDNA con un maggiore numero, in percentuale, di C-G, rispetto ad A-T, avranno una T di melting maggiore, questo è dovuto al fatto che i legami a idrogeno delle coppie C-G sono 3, mentre quelle A-T sono 2, sarà necessaria, perciò, più energia per romperli.
È possibile calcolare la T di melting attraverso la formula: 4(G+C)+2(A+T).
A modificare la T di melting è anche il parametro della salinità della soluzione in cui il DNA è posto. Maggiore è la salinità (più sali disciolti sono presenti) maggiore sarà la T di melting, questo perché gli ioni di sali disciolti tendono a stabilizzare la struttura del DNA a doppia elica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cos’è l’ IBRIDAZIONE?

A

È il processo per il quale è possibile fare appaiate tra loro filamenti ssDNA o di ssDNA con RNA. Questa metodica è utile per individuare sequenza specifiche d’ interesse, attraverso la complementarietà dei filamenti ibridati, nello specifico è utile per identificare i geni all’ interno di una libreria genomica e per il loro clonaggio.
Utilizzo un ssDNA o un RNA sonda (conosco bene la sua sequenza). Vado a denaturare il DNA che voglio indagare per vedere se vi è una corrispondenza con la mia sonda (aumento la T, spesso a 80°C). Ora abbasso la T, così da permettere l’ ANNEALING tra la sonda e le molecole di DNA. Vedremo che vi saranno molecole che si legheranno meglio o peggio con la sonda, andando a formare degli ETERODUPLEX. Quelle che meglio si legano alla sonda avranno un GRADO DI STRINGENZA più elevato. Ora andrò a filtrare i vari ETERODUPLEX a seconda dei loro gradi di STRINGENZA, andando a effettuare cicli di legame dell’ ETERODUPLEX a delle matrici solide seguite da dei lavaggi che elimineranno via via le molecole con grado di STRINGENZA sempre più elevato. Alla fine rimarranno quelle con il più alto grado di STRINGENZA, che identificheranno la mia molecola di interesse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Come si può ISOLARE il DNA?

A

Il processo di isolamento del DNA è utile per separare la macromolecola dal resto delle componenti organiche (purificazione del DNA).
In particolare è necessario prima di tutto lisare le cellule, così da liberare il contenuto citosolico in soluzione, quindi è necessario rompere le membrane cellulari (o se presenti la parete cellulari). Ora bisogna eliminare tutte quelle tipologie di proteine e altre molecole organiche che intralcerebbero il processo di purificazione del DNA, inoltre vengono eliminate le DNAsi endogene (appartenenti alla stessa cellula, ma che, quando rotta la cellula, e messe in potenziale contatto con il DNA, potrebbero attaccare il DNA stesso), ed infine evitare la frammentazione del DNA.
La rottura di pareti e membrane cellulari può avvenire meccanicamente o attraverso detergenti. La degradazione di proteine, lipidi, nucleasi endogene avviene grazie a vari detergenti. La separazione fisica del DNA da proteine e altre molecole avviene grazie a RNAsi, proteasi, matrici selettive e precipitazione in alcool.
AGENTI DENATURANTI usati: 1)detergenti ionici (come SDS) che distruggono legami a H e interazioni idrofobiche. 2)agenti caotropici (come l’ urea) che denaturano le proteine rompendo i legami a H. 3)agenti riducenti, che rompono i legami disolfuro. 4)sali (per cambiare il livello di solubilità delle proteine). 5)calore. 6)proteasi.
3 METODI PRINCIPALI PER LA PURIFICAZIONE DEL DNA:
A)ESTRAZIONI ORGANICHE: in tal caso si usa un solvente organico (cosicché, essendo il DNA polare, grazie alle cariche negative superficiali, non si solubilizzerà) aggiungendo fenolo:cloroformio (per denaturare proteine e aumentare la densità della fase organica). Ora si creano 2 fasi, quella più superficiale acquosa (contenente il DNA) e quella più in profondità, detta organica, contenente proteine, lipidi e altre molecole organiche. Ora estraggo la componente acquosa con il DNA, ci aggiungo sali (così che Na+ si leghi alle cariche - del DNA, rendendola più stabile) e alcool (etanolo o isopropanolo) che vanno a creare una schermatura alla macromolecola. Si forma il precipitato che raccolgo post-centrifugazione e che in fine riporrò in un minimo volume con una soluzione tampone.
B) SALTING OUT: basso pH in soluzione acida, così da far precipitare le proteine e mantenere in soluzione il DNA. Estraggo la fase acquosa col DNA, aggiungo etanolo per farlo precipitare e lo estraggo. Questo sistema permette di isolare grandi quantità di DNA.
C)LEGAME SU SUPPORTO SOLIDO: uso supporti di resina a scambio ionico o silicio. In presenza di agenti caotropici il DNA si lega a tali matrici. Successivamente, lavando con vari reagenti recupero il DNA isolato.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Come funziona il SEQUENZIAMENTO SANGER?

A

Questa tecnica era usata per sequenziare molecole di DNA (cioè conoscere l’ ordine dei nucleotidi di una sequenza di DNA). Il funzionamento si basa sull’ utilizzo dei ddNTP (DIDEOSSINUCLEOTIDI trifosfati) che non presentano il gruppo OH al C3, di conseguenza non possono formare legami fosfodiesterici, per questo, quando vengono incorporati dalla DNA POLIMERASI, l’ attività di quest’ultima viene interrotta.
PROCESSO: Si creano 4 soluzioni, in ognuna metto il DNA da sequenziare e dei primers, assieme alla DNA POLIMERASI. Nelle 4 diverse soluzioni metto dNTP diversi (in uno metto dATP, in un altra dGTP, ecc). Facendo lavorare le DNA POLIMERASI, si formeranno dei frammenti di DNA di diverse dimensioni (questo perché la DNA POLIMERASI si blocca in maniera casuale, quando va a incorporare un dNTP). I frammenti vengono fatti correre su gel elettroforesi, e si ricostruisce la sequenza del segmento di DNA osservando in che punto quei dNTP non sono stati incorporati.
È possibile mettere tutti e 4 i tipi di dNTP in una stessa soluzione. In tal caso ai diversi dNTP intercalo un diverso fluoroforo, che, una volto esposto a radiazione luminosa, emette una fluorescenza diversa. La sequenza di DNA è ricostruita osservando la sequenza di picchi di assorbimento da parte dei fluorofori dei diversi dNTP.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Come funziona il TEST DI HAMES?

A

Il test di HAMES è usato per quantificare il livello di mutagenicità di una sostanza (cioè la capacità che la sostanza ha di produrre mutazioni nel DNA).
PROCESSO: Prelevo una colonia batterica di Salmonella Hys- (il che vuol dire che non può sopravvivere in un ambiente privo di HYS, poiché da solo non è in grado di produrla). La trasferisco in un a Petri, con un ambiente nutrito con estratto di fegato di topo, privo di Hys (detto S9). Al centro della Petri metto un filtro. Nel filtro faccio scorrere la sostanza di cui si vuole indagare la mutagenicità. Se, dopo un tot di tempo, si nota che delle colonie di batteri sono prosperate, allora vorrà dire che la capacità mutagenica della sostanza è alta, ha alterato il DNA di modo che ora le cellule batteriche producano da sole HYS, così da non essere più dipendenti dall’ ambiente circostante.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Come funziona il sequenziamento ILLUMINA?

A

Tale processo di sequenziamento avviene all’ interno di un vetrino con delle corsie (la flow cell).
PREPARAZIONE: il campione di DNA da sequenziare è frammentato casualmente, per tagmentazione o per sonicazione. Successivamente le estremità vengono riparate (overhangs rimosse o riempite) e ad esse si aggiunge un A. Ai frammenti ottenuti si aggiungono degli adattatori, che permetteranno l’ ancoraggio di essi ad un supporto solido (in tal caso tale supporto è formato da oligonucleotidi che rivestono la flow cell).
PROCESSO DI SEQUENZIAMENTO:
La DNA POL si sposta lungo il filamento di DNA creando il suo complementare. Il filamento stampo ora viene lavato via, rimane solo quello complementare ancora legato al supporto. All’ estremità del complementare vi è un adattatore, questo lega un secondo oligonucleotide del supporto (tramite il ripiegamento del ssDNA)a lui complementare. Ora, di nuovo, la DNA POL si lega al filamento reverse, permettendo la sintesi del forward (dsDNA). Ora, attraverso l’ aumento di T, si ha la denaturazione del dsDNA, i filamenti però, ora separati, rimangono attaccati al supporto. Questo processo è il bridge amplification e avviene contemporaneamente su migliaia di cluster del flow cell. Si sono formati molti cloni. COME SI SEQUENZIA –> a fine amplificazione, tutti i filamenti reverse sono lavati via. Un primer si attacca all’ adattatore del forward, la DNA POL aggiunge un dNTP marcato con fluorescenza con un terminatore (un fluoroforo) che blocca la sintesi. Ogni ciclo aggiunge un solo dNTP, e la macchina registra quale base è stata aggiunta (a seconda del diverso segnale di fluorescenza). Poi il fluoroforo è lavato via e si può introdurre la base successiva. Alla fine della prima read, la polimerasi estende il filamento, diviene doppio, viene denaturato e quindi linearizzato, il forward è lavato via, rimane il reverse. Inizia la read 2, si introduce il primer, si ha lo stesso processo di sequenziamento, e, alla fine il read product viene lavato via. Ciò è ripetuto per migliaia di reads che rappresentano tutti i frammenti.
Tale processo permette di sequenziare entrambe le estremità di un frammento di DNA (PAIR END sequencing). Con illumina si possono sequenziare solo sequenze corte (50-250pb). Ha un accuratezza del 99%. Le piattaforme illumina attuali sono: Miseq, Nextseq500, Hiseq2500, HiseqX.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Come posso isolare l’ RNA?

A

Isolare l’ RNA ci permette di comprendere l’ attività di espressione geniche di un organismo esposto ad un ambiente.
Il metodo di isolamento è simile a quello per il DNA.
Processo: rompo cellule e tessuti. Inattivo rapidamente RNasi e cerco di evitare contaminazioni. Denaturo complessi acido nucleico-proteina che si possono formare. Separo l’ RNA da DNA e proteine.
ESTRAZIONE ORGANICA DELL’ RNA: liso/omogeneizzo le cellule, aggiungo fenolo:cloroformio:Isoamilalcol e centrifugo. Separo la fase acquosa (con il RNA) da quella organica (con lipidi e proteine). Dopo l estrazione della fase acquosa, aggiungo etanolo, centrifugo, ottengo una fase acquosa da scartare, mentre RNA precipita sul fondo. Risoapendo il pellet di RNA usando una soluzione acquosa con tampone.
Voglio estrarre mRNA dall’ RNA TOTALE:
l’ mRNA è riconoscibile grazie alla coda di poli(A), uso allora un BINDING con una sonda oligo(dT) legate a sferette di resina, che si appaiano alle A. Ora separo l’ mRNA dalla matrice con acqua o tampone.
Analisi di RNA: con elettroforesi e per misurare la concentrazione sfrutto lo spettrofotometro.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Come funziona il PYROSEQUENCING?

A

È il primo metodo di sequenziamento di nuova generazione (post-Sanger). Il sistema si basa sull’ uso di pirofosfato inorganico, il prodotto di scarto della DNA POL, e substrato dell’ enzima SULFURILASI, il quale produce ATP, la quale sarà prelevata dall’ enzima LUCIFERASI per ossidare la luciferina e produrre un segnale luminoso.
Quando la polimerasi incorpora un nucleotide, rilascia energia, che alimenta la reazione che genera il segnale luminoso. La presenza del segnale ci conferma l’ appartenenza del nucleotide alla tal posizione della catena, mentre l’ intensità del segnale sarà proporzionale al numero di ripetizioni della base lungo lo stesso filamento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cos’è il sequenziamento ION TORRENT?

A

Tipo di sequenziamento basato sulla rilevazione di ioni idrogeno rilasciati durante la polimerizzazione del DNA.
Si prepara, prima di tutto una libreria di DNA, in cui i frammenti della sequenza di DNA da indagare vengono legati a degli adattatori. Poi il materiale genetico viene amplificato (attraverso l’ EMULSION PCR, in cui si formano delle gocce, ognuna contenente una macromolecola di DNA, in cui sono anche presenti i reagenti di amplificazione. Alla fine si otterranno cloni dei frammenti amplificati, immobilizzati in queste gocce).
SEQUENZIAMENTO: Viene usato un chip semiconduttore, con milioni di pozzetti (microwells). Le gocce con le copie di frammenti si depositano nei vari microwells. Successivamente il chip viene sommerso da un unico tipo di nucleotide, se esso è complementare allo stampo, viene incorporato, causando il rilascio di un H+, che modifica il pH della soluzione nel pozzetto. Sotto al pozzetto vi è una componente del chip sensibile alla variazione di pH, che converte questa ∆pH in corrente. Il cambiamento di voltaggio viene registrato e ciò indica l’ inserimento di quello specifico nucleotide nel filamento copia.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cos’è il SINGLE MOLECULE REAL TIME SEQUENCING?

A

È un tipo di sequenziamento di terza generazione. Sviluppato dalla Pacifico Biosciences. Tale processo si basa sull’ imaging in continuo dell’ incorporazione di nucleotidi marcati, durante la sintesi di DNA.
METODO: Viene usato un film di metallo (100nm di spessore) in cui vi è un foro (ZMW,zero mode waveguide) di qualche decina di nn di diametro. Il film di metallo è depositato su di un substrato di diossido di silicone. Ogni ZMW diventa una camera di visualizzazione nanofotonica che fornisce un volume di rilevazione di 10^-21 L (zeptolitri), in cui l’ attività di una singola molecola può essere rilevata in un background di migliaia nucleotidi marcati in fluorescenza. Sulla ZMW si attacca una DNA POL, la quale progressivamente aggiunge al ssDNA copia i nucleotidi. Quando un nucleotide viene incorporato, esso perde il suo tag fluorescente, rilasciando un segnale che viene identificato dal rilevatore.
Tale sequenziamento consente di ottenere lunghe reads rapidamente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Come funziona il SOUTHERN BLOT?

A

Il SOUTHERN BLOT è una tecnologia che permette di identificare, post elettroforesi, una sequenza di DNA d’ interesse, tra quelle che hanno corso sul gel.
PROCESSO: Dopo la corsa in elettroforesi su gel, il DNA va denaturato (trasferisco i frammenti di DNA in una soluzione di NaOH per 15 minuti). Ora i frammenti di DNA denaturato sono trasferiti su di una membrana (sono ancora nel gel) al di sotto di essa viene posto un filtro, rivestito da carta assorbente. Le estremità della carta sono immerse in un tampone che viene aspirato per capillarità. Successivamente il gel viene coperto con un foglio di nylon e sopra sono posti una serie di fogli di carta assorbente, in cima ai quali si pone una lastra di vetro ed un peso di circa 500 g.
Nell’ arco di 12-24h, per capillarità, la soluzione tampone tenderà ad attraversare il gel, il foglio di nylon e tenderà a risalire nei fogli assorbenti. I frammenti di DNA sono trascinati in verticale dal flusso del tampone e si depositano sulla membrana instaurando legami elettrostatici.
Si separa poi la membrana dal gel, e si immerge in una soluzione contenente una sonda marcata, che può ibridare con i segmenti complementari sul foglio, permettendo in questo modo di identificarli. Dopo il lavaggio della membrana, si rimuove la sonda non ibridata , si fa una lastra autoradiografica che mette in evidenza le bande in cui la sonda ha legato il DNA genomico.
Dall’ alto al basso: peso, carta assorbente, filtro, gel, membrana di carta da filtro con le estremità nella soluzione tampone.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Cos’è il NANOPORE SEQUENCING?

A

Metodo di sequenziamento basato sull’ alterazione della conduttanza elettrica, nel momento in cui uno specifico nucleotide passa attraverso un nanoporo (proteina con diametro tra gli 1.5 e 2 nm), incastonato in una membrana sintetica.
In particolare il nanoporo permette il passaggio di un solo nucleotide alla volta, a seconda del tipo di nucleotide (cioè portante una determinata base azotata) osserveremo una specifica modifica della conduttanza elettrica.
Il sistema può leggere entrambi gli strand uno dopo l’ altro.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Cos’è l’ eDNA? Come si campiona ed analizza?

A

L’ eDNA è il DNA AMBIENTALE. Questo DNA è raccolto per effettuare analisi della biodiversità di un luogo (si identificano specie a seguito della raccolta del loro DNA nell’ ambiente). Questo DNA non viene estratto da tessuti ma è presente nell’ ambiente, sottoforma di lisati cellulari, mitocondri, DNA liberato dalle cellule ecc… .
Per l’ identificazione tassonomica di usa il BARCODE (per raggiungere diversi livelli: specie, genere, famiglia ecc…).
Il campione da raccogliere può essere di un singolo individuo, o appartenente a più specie (bulk sample), oppure proveniente dall’ ambiente (Environmental sample) in questo caso si campiona acqua, terra, aria, ecc… .
Prendo un campione (es. 1L di acqua da un lago). A seconda della specie o taxa che voglio ricercare sfrutto dei marcatori genici diversi: spesso si usa la COI (citocromo ossidasi I), presente sul mtDNA. Quando il gene è marcato attuo un amplificazione con PCR (con un numero di cicli maggiore del normale, anche 40-60). Posso effettuare rtPCR (usando la sonda Taqman). A seguito si applica il processo di sequenziamento e sua validazione attraverso un database (BOLD o GenBank).
Questa tecnica di sfruttamento dell’ eDNA permette di:
1) identificare specie rare, criptiche ed elusive.
2) individuare migrazioni o deposizioni.
3) monitorare l’ abbondanza delle specie nel tempo.
4)determinare gli insiemi di specie.
5)valutare azioni di gestione (come il controllo di specie invasive e processi di restauro ambientale).
6) acquisire dei record (archivio di campioni congelati o essiccati da analizzare in futuro).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Come è stato individuato il PROTEO nelle acque sotterranee carsiche?

A
Il Proteo (Proteus anguis) è un anfibio che abita le grotte carsiche. Questo organismo è protetto sotto varie convenzioni, poiché minacciato dall' agricoltura intensiva, dalla produzione di energia idroelettrica e dall' urbanizzazione. 
Per la determinazione della presenza del Proteo in diverse zone si è sfruttata l' analisi dell' eDNA:
1)Sviluppo di primer specie specifici (CR, ovvero control regione, e 16S di rDNA). 
2)Test della specificità dei primer.
3)Test dei limiti della rilevabilità del metodo (campione di 1/128 e 1/256 m^3 su 10 e 20L di acqua).
4)Test dell' utilità del metodo in natura: con SYBR chemistry o Taqman chemistry.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Cos’è la TRANSCRITTOMICA? Quali tipi di RNA sfrutta?

A

La TRANSCRITTOMICA è lo studio dell’ espressione genica.
Il sequenziamento dell’ RNA ci dà informazioni sull’ abbondanza e la sequenza delle molecole di RNA, si può anche studiare la variazione dell’ espressione di singoli geni (geni marcatori) a seguito di alterazioni ambientali che causano una variazione dell’ espressione di diverse proteine (e quindi di diversi RNA), [quest’ultimo processo si può fare solamente per organismi per cui si conosce il genoma (o la parte d’ interesse).
Il processo prevede:
1)estrazione dell’ RNA.
2)sua trasformazione in cDNA.
3)amplificazione con PCR.
QUALI RNA possono essere usati?
1)mRNA
2)RNA non codificante (come rRNA, tRNA, snRNA, snoRNA, miRNA, siRNA).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Tecnica dell’ RNA SEQUENCING.

A

1)isolo l’ RNA dal tessuto. Aggiungo inoltre delle DNAsi, così da eliminare il DNA di non interesse.
2)SELEZIONE dell’ RNA d’ interesse: RNA TOTALE, RNA impoverito di rRNA (che è il 90% dell’ RNA della cellula) che viene effettuato grazie al legame con delle sonde ssDNA, l’ ibrido risultante viene poi degradato da RNAsi; RNA CODIFICANTE (mRNA), tramite l’ aggiunta di poly-T i quali si legano al poly-A, il tutto poi si lega ad un substrato e gli RNA non codificanti vengono eliminati; RNA che si lega a specifiche sequenze.
3)Sintesi del cDNA, attraverso l’ uso della trascrittasi inversa. Ovviamente il RNA catturato viene prima frammentato, poi retrotrascritto, i frammenti risultanti di cDNA ora vengono uniti aggiungendo una adenina al 3’ e riparando il 5’. Alla fine si aggiungono degli adattatori.
4)Amplificazione del cDNA.
5)ANALISI delle sequenze.
Le informazioni che si possono ottenere da questo processo sono:
1)dati Qualitativi: identificazione di trascritti espressi, identificazione dei limiti di esoni ed interni, siti di inizio trascrizione e siti di poli-A.
2)dati Quantitativi: misura differenze nell’ espressione, splicing alternativo, poliadenilazioni alternative.
Il processo di sequenziamento prevede 2 tipologie:
1)SINGLE-END SEQUENCING con short reads (adatto per quando c’è un genoma o trascrittoma di riferimento).
2)PAIRED-END SEQUENCING con long reads (si usa per costruire un genoma di riferimento).
Non tutte le READS vanno bene, è necessario effettuare il TRIMMING (potatura) cioè la rimozione di dati con bassa qualità, attraverso la rimozione di adattatori e nucleotidi ambigui e lo scarto delle reads troppo corte.
Posso fare si che avvenga lo SPLICING ALTERNATIVO che permette la costituzione di trascritti differenti da quelli primari, cosicché siano codificanti per proteine diverse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Nella TRASCRITTOMICA, come calcolo l’ espressione genica?

A

-Confronto geni di uno stesso campione: il numero di reads varia in proporzione alla espressione genica ma anche a seconda della lunghezza del trascritto.
-Confronto 2 campioni: il numero di reads varia al variare del livello di espressione ma anche a seconda della profondità di sequenziamento.
In ultima analisi, i dati di espressione genica variano a seconda di 3 fattori: lunghezza del gene, conteggio dei reads, la profondità del sequenziamento.
L’ RNA SEQ può fornire variazioni solo su quantità relative (questo perché viene assunto che ogni cellula ha in sé la stessa quantità di RNA, cosa che nella realtà è un falso), quindi per il sequenziamento si attuano processi di normalizzazione:
1)Quantile normalization (sviluppata per microarray).
2)Upper quartile (basata solo sulle read counts).
3)Normalization by totals (basata solo su read counts).
4)RPKM/FPKM (read/fragment per kilobase of transcript, per milion mapped reads).
5)TPM (Transcripts per milion): gli RPKM di tutti i trascritti in un campione sono sommati e normalizzati, in modo che i valori di espressione siano in totale 1M.
Calcolo dell’ espressione differenziale.
Le sequenze vengono annotate in base alle similarità BLAST, in base alla ricerca di domini proteici conservati, test ipergeometrici o analisi Gene Set Enrichment per trovare processi significativamente sovra o sotto-rappresentati.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Perché molte specie sono a rischio di estinzione?

A

La biodiversità, sia intesa di specie che genetica, nell’ era moderna, sta subendo una netta riduzione. Molte specie sono minacciate dall’ attività antropica (distruzione e frammentazione degli habitat, sovrasfruttamento di risorse e territori, inquinamento e introduzione di specie aliene) e dal cambiamento climatico.
A causa di ciò il numero degli individui delle popolazioni di diverse specie selvatiche è in calo e ciò comporta una diminuzione, anche, della diversità genetica (maggiore possibilità di inbreeding).

25
Q

Concetto di SPECIE.

A

1)concetto BIOLOGICO di specie: individui capaci di incrociarsi e di dare progenie fertile.
2)concetto FILOGENETICO di specie: gruppo di organismi che condividono un progenitore comune.
Spesso si riscontrano organismi che fenotipicamente sono molto o del tutto simili ma che in realtà, a seguito di una analisi del genoma, si riscontra che appartengono a 2 specie diverse tra loro. È quindi utile sfruttare le analisi genetiche per valutare l’ appartenenza di un organismo ad una piuttosto che ad un altra specie.

26
Q

Cos’è il DNA BARCODING?

A

Il DNA BARCODING è un approccio tassonomico oggettivo, che si basa sull’ associazione di un BARCODE GENICO ad una specie.
Il BARCODE GENICO è una sequenza di DNA (o poche sequenze) che identificano in modo unico una specie. Questo BARCODE GENICO presenta in sé una variabilità elevata quanto basta per discriminarlo dai geni delle altre specie e allo stesso tempo una variabilità bassa a sufficienza per essere riscontrabile in tutti gli individui appartenenti alla specie specifica.
In BARCODE GENICO deve essere:
1) discriminatorio (unico per la specie ed identico per tutti i membri della specie).
2)universale (presente in tutte le specie da esaminare).
3)robusto (amplificandole con la PCR).
4)con un giusto compromesso tra variabilità e conservazione.
BARCODE UNIVERSALE per gli ANIMALI (nn tutti): COI (citocromo ossidasi I), in particolare un tratto di 600 pb. Questo gene codifica per l’ enzima utile, nel mitocondrio, per il trasferimento di e- nella fosforilazione ossidativa.
BARCODE UNIVERSALE per le PIANTE: rbcL e matK (2 elementi entrambi presenti nel cloroplasto).

27
Q

Concetto di UNITÀ CONSERVATIVE.

A

Nella GENETICA DELLA CONSERVAZIONE si parla di unità CONSERVATIVE, cioè di gruppi di individui di diverse o della stessa specie che vengono monitorati, con lo scopo di garantirne la conservazione.
1)MU (management units): popolazioni della stessa specie tra le quali vi è un tasso di migrazione bassissimo, tale che le rende geneticamente distinte.
2)ESU (Evolutionarily significance units): popolazioni che sono state isolate riproduttivamente per un periodo di tempo considerevole, durante il quale hanno seguito percorsi evolutivi diversi.
Le popolazioni di specie in pericolo sono spesso di piccole dimensioni. Esse perdono rapidamente diversità genetica soprattutto a causa della deriva genetica. Queste popolazioni poco numerose hanno elevati tassi di inbreeding (ciò causa una riduzione della fitness degli individui), poiché il tasso di crescita dell’ inbreeding è inversamente proporzionale alla grandezza della popolazione. Si parla di INBREEDING DEPRESSION quando il fenomeno di inbreeding porta alla riduzione della fitness della popolazione. Un altro rischio che corrono piccole popolazioni è l’ OUTBREEDING DEPRESSION, che è il fenomeno per il quale 2 popolazioni molto distanti geneticamente tra loro si ibridano, creando discendenti aventi una miscela di ibridi con alleli non adatti per gli ambienti di entrambe le popolazioni.
Al fine di evitare questi fenomeni di diminuzione di fitness e di individui delle già piccole popolazioni di organismi, si possono mettere in gioco diverse operazioni di controllo:
1)RECUPERO GENETICO: recupero della variabilità genetica all’ interno della popolazione e riduzione della depressione da inbreeding. Ciò lo si fa introducendo nuovi individui e quindi nuovi alleli nella popolazione (che hanno fitness maggiori).
2)TRASLOCAZIONI e PROGRAMMI DI BREEDING: ultima spiaggia per salvare le popolazioni di specie a rischio di estinzione. Breeding forzato tra individui o trasloco di individui in specifiche zone per consentire il breeding in loco.
Facendo ciò si va incontro all’ effetto del FONDATORE.

28
Q

Esempio di programma di conservazione di Austropotamobius pallipes italicus in FVG.

A

PROGETTO RARITY:
rafforzamento delle popolazioni native di A. Pallipes italicus, minacciato dal gambero della Louisiana (procambarus clarkii) e da altri fattori.
Si sono sfruttati come marcatori molecolari, per identificare la specie, la sua posizione e la sua filogenesi, COI, mentre per identificare la variabilità genetica intra-popolazione e il differenziamento inter-popolazione i MICROSATELLITI del DNA nucleare.
Si sono quindi identificate le MU e le ESU. Il differenziamento di popolazioni è causato principalmente dalla frammentazione degli habitat.
Dopo la valutazione della situazione si è costituito il programma di ripopolamento e re-introduzione: si sono cioè selezionati i riproduttori idonei dalle popolazioni selvatiche, si è verificata la compatibilità di essi con i siti di rilascio, si sono identificate le popolazioni prioritarie per la conservazione.

29
Q

Cos’è la METAGENOMICA?

A

Branca della biologia molecolare che sfrutta tecniche genomiche per lo studio di COMUNITÀ DI ORGANISMI direttamente nel loro ambiente naturale (evitando di dover isolare e coltivare in laboratorio le singole specie).
Questo tipo di applicazione si costituì studiando le comunità batteriche, sfruttando il BARCODING (in questo caso 2 sequenze appartengono a specie diverse se presentano più del 5% di variabilità).
Si distinguono 2 tipologie di METAGENOMICA:
1)METAGENOMICA GENE-CENTRIC: analisi di una comunità genomica con lo scopo di caratterizzarla a livello tassonomico grazie a DNA BARCODE (16s rRNA).
2)METAGENOMICA WHILE GENOME: sequenziamento completo di tutto il DNA microbico estratto da una nicchia ambientale. Questo permette di sequenziare geni, proteine e capire la loro attività biochimica e quindi ricostruire come lavora la comunità microbica.

30
Q

Come funziona la METAGENOMICA?

A

A seguito della raccolta del campione di DNA di comunità dall’ ambiente, si va a costituire una libreria di cloni, in seguito questi cloni venivano selezionati per il sequenziamento.
Il selezionamento avveniva seguendo 2 approcci:
1)FUNZIONALE: i geni estratti dall’ ambiente sono espressi in un ospite (es. E.coli) e sì sfruttano sofisticati screen funzionali per individuare i cloni che esprimono funzioni d’ interesse.
2)BASATO SU SEQUENZA: i cloni sono selezionati sulla base della presenza di geni di interesse.
Una volta avvenuta la selezione dei geni d’ interesse nei cloni, gli si estrae e si attua il SEQUENZIAMENTO WGS (Whole genome shotgun). Questo tipo di sequenziamento permette di:
1)valutare la diversità filogenetica e il polimorfismo intraspecifico.
2)studiare l’ interezza dei geni e i pathway metabolici della comunità.
3)ricostruire sequenze genomiche quasi complete.
4)scoprire nuovi geni.
5)scoprire eterologhi espressi in ospiti comuni.
6)studiare comunità virali.

31
Q

Quali sono le TECNICHE DEL SEQUENZIAMENTO AMBIENTALE?

A

1)Genomica della singola cellula.
2)Metagenomica: permette di accedere all’ intero potenziale di espressione sfruttando un campione ambientale. Permette di trovare la connessione tra l’ attività funzionale e la filogenetica degli organismi. Presenta degli svantaggi, quali: i costi elevati, spesso è una tecnica che si limita ad essere usata su un numero limitato di campioni, vi è una discreta difficoltà nel mettere assieme i dati, vi sono inoltre un gran numero di letture non classificabili.
3)SEQUENCE TAG SURVEYS: basata su singoli geni marker, per gli eucarioti si usa spesso rRNA 18S, mentre per i procarioti si usa 16S rRNA.
16S rRNA: forma parte dei cromosomi batterici, presenta parti altamente conservate ed altre estremamente variabili (soprattutto le anse e i loop). Ad oggi di 16S rRNA si sequenziano solo alcune sue porzioni come V3 e V4.
I TAG possono essere analizzati in 2 modi:
1)COMPOSITION BASED BINNING: confronto di caratteristiche in specie/genere/famiglia, condivise.
2)SIMILARITY BASED BINNING: richiede che le sequenze nel campione siano presenti in un database di riferimento, con cui vengono confrontate. La soglia per l’ identità è variabile in base alla risoluzione richiesta (es. Genere 90%, famiglia 80% e specie 97%).
Per la misurazione della DIVERSITÀ si sfrutta: l’ ALFA-DIVERSITÀ (che indica la diversità all’ interno di un campione) che ci indica il numero di specie e la loro distribuzione all’ interno del campione (indice di Simpson); e la BETA-DIVERSITÀ (che ci dice la diversità tra campioni diversi), sfruttiamo in questo caso l’ indice di Sorensen.

32
Q

Concetti di: SIMILARITÀ, OMOLOGIA, geni ORTOLOGHI e PARALIGHI.

A

1) SIMILARITÀ: Indica la misura quantitativa dei cambiamenti che avvengono tra 2 sequenze divergenti (a causa di sostituzioni, inserzioni e delezioni), espresso in %. Un alto livello di similarità può indicare una comune storia evolutiva o una funzione biologica simile.
2) OMOLOGIA: É la somiglianza che implica una relazione evolutiva. I geni omologhi sono quelli derivanti da un antenato comune.
3) GENI ORTOLOGHI: Geni che si sono differenziati a seguito di un evento di speciazione. Geni ORTOLOGHI sono presenti in specie diverse ma che hanno un antenato comune. Codificano per proteine con funzioni simili.
4) GENI PARALOGHI: Geni originatisi dalla duplicazione di un singolo gene. Solitamente svolgono funzioni diverse e nel tempo possono acquisire nuove funzioni.

33
Q

Cos’è la BIOINFORMATICA? Quali sono alcuni strumenti che vengono sfruttati in questo campo?

A

La BIOINFORMATICA sfrutta sistemi informatici per risolvere problemi biologici a livello molecolare.
Usata per lo studio di SEQUENZE: assemblaggio di sequenze, allineamento di sequenze, studio di espressione genica, predizione genica.
SEQUENCE ALIGNMENT: Procedura informatica in cui vengono messe a confronto ed allineate 2 o più sequenze primarie di AA, DNA o RNA. Questo processo permette di misurare la similarità tra regioni identiche e dedurre le loro relazioni funzionali, strutturali ed evolutive; oltre che a ricercare una sequenza in un database.
Per questa procedura riscontriamo il GLOBAL SEQUENCE ALIGNMENT (in cui si confronta l’ intera lunghezza delle sequenze allineate) o il LOCAL SEQUENCE ALIGNMENT (in cui si confrontano sequenze per trovare le regioni tra loro più simili, le regioni al di fuori dell’ allineamento non verranno considerate).
Per valutare il grado di similarità dell’ allineamento vengono usate le SCORING MATRICES (degli schemi che associano punteggi ai matching di AA o nucleotidi delle varie sequenze). Per i nucleotidi, queste matrici, hanno uno schema semplice: match (+2)/ mismatch (-3).
Per gli aa, sfrutto BLOSUM (Blocks substitution Matrix), qua la matrice cerca le differenze in regioni conservate di una famiglia di proteine (block) e calcola il punteggio in base agli allineamenti locali. In alternativa posso usare BLOSUM n: uno schema che viene costruito sfruttando sequenze che condividono non oltre n% di identità, quelle con n% superiore non vengono considerate nel cluster.
Più basso è n, meno le sequenze sono strettamente collegate, più elevato è n, più queste sono strettamente collegate.
BLOSUM:
1)90 (70-90% di similarità), utile per allineamenti brevi.
2)80 (50-60% di similarità) utile per trovare membri noti di una famiglia proteica.
3)62 (30-40% di similarità) migliore per trovare tutte le possibili similarità.
4)30 (<30% di similarità) allineamenti locali più lunghi e deboli.
GAPS: vengono usati per migliorare l’ allineamento tra 2 sequenze, hanno lo scopo di compensare per inserzioni e delezioni (rappresentano quindi degli eventi biologici). In media vi è un gap ogni 20 residui. Non ricevono punteggi match/mismatch.

34
Q

Cos’è e come funziona BLAST?

A

BLAST è BASIC LOCAL ALIGNMENT SEARCH TOOL.
È un algoritmo sfruttato per comparare sequenze di AA o nucleotidi tra loro. In particolare permette di identificare i livelli di somiglianza di una sequenza sconosciuta con altre sequenze già presenti nel database.
L’ algoritmo si divide in 3 fasi:
1)creazione di un elenco di parole di lunghezza W, della sequenza query.
2)ricerca della parola W nel database.
3)elongazione delle sequenze trovate (hit) e assegnazione di un punteggio.
Le sequenze prese in considerazione saranno quelle che avranno superato un punteggio soglia (HSP, High scores segment pair).
6-FRAME TRANSLATION: ogni codone è costituito da 3 nt. Processi di inserzioni e delezioni possono portare a 3 diversi frameshift. Ma siccome i filamenti del DNA sono 2, in totale saranno possibili 6 frame translation.
I Database disponibili sono diversi: envnr (per campioni ambientali), swissprot (sequenze proteiche), refseq (fornisce una singola sequenza di riferimento per ogni tipo di molecola, in modo non ridondante) ecc… .
OUTPUT:
1)Description: elenco delle sequenze del database che hanno prodotto allineamenti significativi.
2)Grafic summary: rappresentazione grafica della sequenza query e della similarità, da nero a rosso (da pessima a ottima similarità).
3)ALIGNMENT: allineamento delle sequenze.
E value (expected value): indica la probabilità di aver ottenuto quel livello di similarità per caso. 0 (impossibile), >10-3 indica che, per le proteine, vi è un certo grado di similarità, > 10-6 per gli acidi nucleici.
I diversi algoritmi variano la lunghezza della parola: BLASTn ha parola di lunghezza 11, MegaBLAST di 28 (aumentando la lunghezza della parola di aumenta la specificità ma si perde sensibilità).

35
Q

DNA EXTRANUCLEARE in piante e animali.

A

1)DNA MITOCONDRIALE in animali: DNA presente nel mitocondrio ereditato dalla linea materna (ad eccezione di alcuni casi, come in alcuni tipi, uccelli e alcuni bivalvi). In particolare sequenze di questo mtDNA, di interesse, sono COI, control region, Citocromo b, subunità della NADH deidrogenasi.
Il mtDNA è costituito da 15-20 kpb, contiene 13 geni per proteine, 22 per il tRNA e 2 per rRNA (tra cui 16S rRNA).
Perché usare il mtDNA? È utile poiché permette di studiare eventi come il COLLO DI BOTTIGLIA, EFFETTO DEL FONDATORE, permette studi di genetica di piccole popolazioni, il mtDNA viene trasmesso dalla madre alla prole e rimane, a livello di specie, piuttosto stabile (è quindi utile per il riconoscimento della specie), in alcune regioni, come la control region, presenta un elevato tasso di mutazioni (inserzioni e delezioni) maggiore di anche 10× quelle che avvengono nel nucleo.
2)mtDNA nelle piante: nelle angiosperme il mitocondrio a origine materna, mentre nelle gimnosperme, per lo più il mitocondrio ha origine paterna o e biparentale. Ha 400-500 Mila pb e subisce ricombinazione (dimensione e disposizione dei geni è variabile) ma il tasso di mutazione è molto basso. In questo contesto il mtDNA viene usato soprattutto per studi sulla DISPERSIONE.
3)DNA plastidiale nelle piante: usato il DNA del cloroplasto, ereditato dalla madre nelle angiosperme e dal padre nelle gimnosperme. In media a 150kpb, contiene molti geni e ha un elevato tasso di mutazioni. Il DNA plastidiale è scelto come marcatore nei vegetali.

36
Q

DNA dei CROMOSOMI SESSUALI.

A

Sono dei marcatori uniparentali (derivanti da un genitore). Nei mammiferi le femmine sono omogametiche (XX) mentre i maschi sono eterogametici (XY).
Il cromosoma Y nel mammifero contiene pochi geni (nell’ uomo sono circa 20), tra questi il gene SRY, che determina la cascata per lo sviluppo del sesso maschile. Il cromosoma Y è un marcatore perché varia ma non così tanto, ed è quindi utile per le ricostruzioni del passato.
Vi sono molte alternative a questa situazione:
1)molti organismi sono privi di cromosomi sessuali, il sesso viene determinato dalle condizioni ambientali.
2)in alcuni organismi la femmina è XX e il maschio è XO.
3)in molti organismi i gameti eterocromosomici sono della femmina (ZW) e quelli omocromosomici del maschio (ZZ), ad esempio in uccelli e lepidotteri.

37
Q

Quali fattori dobbiamo prendere in considerazione durante la scelta di marker molecolari per le analisi genetiche?

A

1) la VARIABILITÀ: marcatori molto variabili sono utili per studiare eventi ravvicinati nel tempo, mentre marcatori poco variabili sono utili per lo studio dell’ evoluzione di generi, famiglie, ecc… .
2) Fattori PRATICI (precisione e tempo a disposizione): saranno differenti a seconda del caso, possiamo usare MARCATORI DOMINANTI (permettono di identificare un singolo stato genetico per individuo, come l’ allele dominante), oppure i MARCATORI CO-DOMINANTI (permettono di identificare tutti gli alleli dello stesso locus analizzato, sono quindi utili per seguire l’ ereditarietà di un genitore e dell’ altro e dare informazioni più complete a livello di popolazione).

38
Q

Marcatori molecolari tradizionali.

A

Allozimi, RFLP, RAPD, AFLP, MICROSATELLITI o SSR, SNP.
1)ALLOZIMI: sono le varianti di una proteina, codificata da un diverso allele di uno stesso locus genico.
2)RFLP (Restiction fragment lenght Polymorphysm): misura delle differenze nella sequenza di DNA sulla base delle diverse lunghezze dei frammenti di DNA tagliati con enzimi di restrizione e poi ibridizzati con sonde marcate (in questo caso si analizza un solo locus genico).
3)RAPD (Random amplified polymorphic DNA): usati primer con sequenze variabili e non locus specifici, per amplificare il genoma. I primer si legano a regioni del genoma, si genera un amplicone (visualizzabile con delle bande). Si stima la similarità tra 2 individui sulla base del numero di bande in comune.
4)AFLP (amplified fragment lenght Polymorphysm): enzimi di restrizione digeriscono il DNA genomico, lasciando delle sticky ends, si aggiungono degli adattatori (cosicché tutti i frammenti terminino con la stessa sequenza), si inseriscono primers specifici che si legano alla sequenza dell’ adattatore. Il metodo sfrutta le variazioni nei siti di legame sul primer quando il DNA viene amplificato tramite PCR. La similarità tra 2 individui (o popolazioni) viene identificato dal numero di bande AFLP in comune.
5)MICROSATELLITI o SSR (simple sequence repeat) o STR (short tandem repeat): questi frammenti di DNA hanno elevati tassi di mutazione, a causa di “scivolamento della DNA polimerasi” o per crossing over non equo durante la meiosi.
Le mutazioni dei MICROSATELLITI che si possono generare sono:
1)SMM (stepwise mutation model), quando i microsatelliti mutano, acquisiscono o perdono una sola ripetizione, quindi alleli che si differenziano solo per una ripetizione sono più imparentati di alleli che si differenziano per più ripetizioni.
2)IAM (infinite alleles model), ogni mutazione può creare un qualsiasi nuovo allele in modo casuale.
Grazie all’ alto tasso di mutazioni possiedono un elevato livello di polimorfismo (il che vuol dire che possiedono molti alleli per locus), sono quindi utili per inferire eventi genici recenti.
Il marker sfrutta le variazioni in brevi sequenze ripetitive, usando dei primer specifici che si legano alla sequenza ripetitiva. Serve una previa conoscenza del locus.
6)SNP (single nucleotide Polymorphysm): singola coppia di basi lungo una sequenza di DNA che varia molto tra individui (in genere gli SNP hanno solo 2 stati alternativi). Sono caratterizzati da bassa variabilità ma sono molto frequenti nel genoma (questo compensa).
Tecnica RAD-SEQ (Restiction site associate DNA SEQUENCING): genoma digerito da enzimi di restrizione che riconoscono SNPs. Aggiungo adattatori ai frammenti di DNA tagliati e sequenzio. Effettuo allineamento multiplo delle sequenze appartenenti allo stesso locus, così da individuare similarità e differenze (identificare le varianti tra individui)

39
Q

Concetto di POPOLAZIONE.

A
In genetica, una popolazione è un insieme di individui tra cui possono avvenire scambi genetici (cioè individui che si incrociano tra loro).
 In teoria, la probabilità di incrocio tra individui all' interno della stessa popolazione è più elevate di quella di incrocio tra individui appartenenti a popolazioni diverse.
Diverse popolazioni, di diverse specie, hanno dimensioni del singolo individuo diverse, così come abbondanza di individui nelle popolazioni diverse (anche all' interno della stessa specie). 
Inoltre la probabilità di incrocio dei singoli individui, appartenenti ad una popolazione, con altri individui (della stessa popolazione) non per forza è identica per tutti (modello PANMITTICO), è molto più plausibile la situazione per cui vi siano delle sottopopolazioni (anche separate da barriere fisiche), di una METAPOPOLAZIONE, che hanno diversa probabilità di incrociarsi con altri membri della sottopopolazione. 
Alcune sottopopolazioni (DEMI) saranno più grandi di altre (più difficilmente si estingueranno) e da queste ci potrà essere un flusso migratorio genetico da e verso altre sottopopolazioni.
40
Q

Struttura genetica di una POPOLAZIONE.

A

Distinguiamo la FREQUENZA GENOTIPICA (la frequenza dei vari genotipi) dalla FREQUENZA ALLELICA (la frequenza dei vari alleli per ogni locus).
Gli individui possono essere omozigoti (stesso tipo di allele) o eterozigoti (con alleli diversi).
Se un una popolazione ci sono n alleli avremo che:
1)vi saranno n tipi di omozigoti
2)vi saranno n×(n-1)/2 tipi di eterozigoti.
3)il numero totale di genotipi sarà n×(n+1)/2.
Avendo 2 alleli A e a, le frequenze alleliche (p e q) saranno pA e qa, mentre le frequenze genotipiche saranno DAA, HAa, Raa. Deve essere che p+q=1 e D+H+R=1.
Inoltre p= D+(H/2).
Vi può essere la manifestazione del fenomeno della DOMINANZA, in questo caso, i fenotipi non sono 3, bensì 2 (quello dominante e quello recessivo), le cui frequenze saranno D e R, dove D=D+H.

41
Q

Legge ed equilibrio di HARDY-WEINBERG.

A

Secondo la legge di HARDY-WEINBERG, le frequenze dei genotipi possibili sono funzione diretta delle frequenze alleliche (quindi è sufficiente un solo parametro per descrivere la struttura genetica di una popolazione diploide).
Siamo in EQUILIBRIO di HARDY-WEINBERG se: le frequenze alleliche non cambiano nel tempo e le frequenze genotipiche sono diretta funzione delle frequenze alleliche secondo lo sviluppo binomiale: (pA+qA)^2= pApa + 2pAqa + qaqa.
Per essere in questo equilibrio di HARDY-WEINBERG si assume che:
1)si è in PANMISSIA (non vi è preferenza nella scelta dei partner e quindi non vi è una preferenza nella costituzione nella popolazione di specifici tratti, gli incroci sono CASUALI).
2)La frequenza di un allele nei gameti è uguale alla frequenza dell’ allele nella generazione parentale (p non cambia= non vi sono mutazioni, non vi è l’ azione della selezione naturale, non avvengono processi di immigrazione).
3)Le frequenze dei genotipi della generazione successiva sono pari alla probabilità di incontro dei diversi gameti (esclusione di variazioni dovute al caso).
Quindi p^2+2pq+q^2= 1.
Capire se una popolazione si trova in equilibrio di HARDY-WEINBERG è possibile attraverso il test del chi-quadro, che però non funziona per piccole popolazioni e per loci che presentano molti alleli.

42
Q

Quali sono le eccezioni agli assunti di HARDY-WEINBERG?

A

1)se si favoriscono gli accoppiamenti tra simili, gli eterozigoti diminuiscono e aumentano gli omozigoti: di conseguenza le frequenze genotipiche non sono uno sviluppo binomiale delle frequenze alleliche; inoltre se sono favoriti gli incroci tra dissimili, aumentano le frequenze degli eterozigoti e si può arrivare a frequenze alleliche di valore determinato.
2)le mutazioni e le migrazioni possono variare la frequenza degli alleli in una popolazione, così come l’ azione della selezione naturale.
Aumenterà la frequenza dell’ allele che avrà il tasso di mutazioni maggiore; se da una popolazione migrano costantemente individui verso una seconda popolazione, allora , col tempo la seconda popolazione avrà la stessa struttura genotipica della prima; la selezione naturale agisce in vario modo (contro un allele, a favore di un genotipo, contro un certo tipo di incroci ecc…).
3)tra una generazione e l’ altra possono verificarsi cambiamenti dispersivi della frequenza degli alleli (l’ entità di questi cambiamenti della frequenza allelica dipende dalle dimensioni della popolazione, tanto più è numerosa più esigui saranno questi cambiamenti).

43
Q

Cosa sono i MARCATORI GENETICI nella genetica di popolazione?

A

Strumenti utilizzati per studiare la VARIAZIONE GENETICA all’ interno o tra popolazioni.
La VARIAZIONE GENETICA si instaura se all’ interno della popolazione vi è più di un allele per locus genico.
Tali marcatori genetici permettono di capire quali alleli sono presenti nelle popolazioni (ciò si rivela utile per la biologia della conservazione, per costruire mappe genetiche per identificare i loci che influenzano caratteri complessi, stabilire la paternità, stabilire la fitness, determinare il flusso genico e la struttura della popolazione, studiare sistemi d’ incrocio).
La variabilità genetica a livello individuale è identificabile come la % di loci eterozigoti sul totale dei loci analizzati (eterozigosi), mentre a livello di popolazione è data dal POOL GENICO (cioè l’ insieme di genotipi) che è determinato dalla presenza di alleli con frequenza intermedia.
I marcatori genetici sono:
POLIMORFISMO: numero di loci polimorfici (con allele più comune con frequenza < di 0.99) sul numero totale di loci esaminati.
2) DIVERSITÀ ALLELICA (A): numero medio di alleli per locus su loci esaminati per popolazione.
3)ETEROZIGOSITÀ (Ho): numero di individui eterozigoti per un locus, sul totale degli individui.
4) ETEROZIGOSITÀ ATTESA (He): proporzione di eterozigoti attesa assumendo che la popolazione sia in equilibrio di HARDY-WEINBERG. Se c’è una differenza tra Ho e He bisogna identificare le cause (inbreeding, errore di campionamento, alleli non amplificati durante PCR, ecc).

44
Q

Quali sono gli strumenti statistici che possono essere usati per studiare la genetica di popolazione?

A

I dati che vengono raccolti possono essere:
1)DISCRETI: suddivisibili in gruppi distinti o classi, tutti i marcatori genetici identificano genotipi distinti, i quali sono dati discreti.
2)CONTINUI: distribuiti in maniera continua, senza tipologie definite.
3 tipi di analisi statistica:
A)c’è una differenza per alcuni caratteri continui tra 2 o più gruppi distinti? Sfrutto il t-test e analisi della varianza.
B)esiste una relazione tra 2 variabili continue? correlazioni e regressione.
C)Una popolazione può deviare da ciò che un determinato modello prevede? Uso test del chi-quadro.
In questi test statistici più il campione è ampio (maggiore individui presenta) più accurati saranno i risultati delle analisi, identificabili con il PVALUE (probabilità che la differenza o relazione possa essere stata prodotta dal caso), più piccolo è il PVALUE più siamo sicuri che le relazioni siano reali. Test con PVALUE <0.05 sono significativi.

45
Q

Geni legati al SESSO.

A

Nella specie umana, dove il cromosoma eterogametico è del maschio, osserviamo che la trasmissione da parte di un allele sul cromosoma X, avviene dalla madre sia al figlio maschio che alla femmina, mentre, il maschio lo trasmette solo alle figlie femmine (perché altrimenti trasferirebbe un Y e un quel caso si avrebbe un maschio).
Le femmine, per 2 alleli, sul cromosoma X possono avere 3 genotipi: AA, Aa e aa, i maschi solo 2: A e a.
La frequenza dell’ allele A nelle femmine è D+1/2H e nei maschi è S. Se prendiamo in considerazione una popolazione in cui il numero di maschi e femmine è uguale, la frequenza media dell’ allele A sarebbe: (2pfemmina +pmaschio)/3.
Nei maschi, nella generazione n (che ricevono l’ allele A solo dalla madre) la probabilità di ricevere tale allele è pfemmina n-1. Nelle femmine, invece, che ricevono l’ allele A sia dalla madre che dal padre, la probabilità, alla generazione n, di ricevere l allele A è (pmaschio, n-1 + pfemmina, n-1)/2.

46
Q

Come la MIGRAZIONE influenza la diversità genetica?

A

Migrazione: fenomeno di spostamento di individui da una popolazione ad un altra, ciò comporta un FLUSSO GENICO, che può alterare la struttura genica della popolazione ricevente i migratori. La migrazione può essere OCCASIONALE o SISTEMATICA (in quest’ultimo caso, con il tempo, la popolazione ricevente i migranti, tenderà ad uniformarsi geneticamente con la popolazione da cui i migranti derivano).
Viene identificato il parametro m (TASSO DI MIGRAZIONE), come la proporzione di individui che discendono da immigrati dell’ ultima generazione.
Di conseguenza si identifica come 1-m è la proporzione relativa alla popolazione originaria.
Frequenza relativa di un allele è q0 per la popolazione originaria e qm per la popolazione immigrata.
Dopo l’ immigrazione la frequenza dell’ allele q, sarà cambiata (da q0 a q1): q1= m×qm + (1-m)q0= m(qm-q0) + q0.
Quindi la variazione della frequenza allelica di q in una generazione sarà: ∆q= mq (di m) - mq (di 0).
L’ equilibrio si raggiungerà quando o non ci sarà più migrazione (m è 0) o quando la frequenza allelica nelle 2 popolazioni è uguale (qm=q0).
Il processo di migrazione andrà ad alterare anche la frequenza dei genotipi. Osserveremo in particolare che, rispetto ad una popolazione d’ origine, aumenterà il numero di omozigoti (se eravamo in una situazione di equilibrio HARDY-WEINBERG), tale effetto è detto WALHUND, e diminuirà quello di eterozigoti. Al cessare della migrazione il numero di omozigoti diminuisce e quello di eterozigoti aumenta.
Quindi, il flusso genico riduce le differenze genetiche tra le popolazioni che sono separate (aumentando la variabilità genetica al loro interno) mantenendo unità di popolazioni separate nell’ unità della stessa specie.

47
Q

Cosa si intende per SELEZIONE?

A

Selezione intesa come SUCCESSO RIPRODUTTIVO (FITNESS): opera a favore di individui che producono un maggior numero di individui di prole, con un genotipo simile al loro.
Esistono diversi tipi di selezione:
1) capacità di selezione dello zigote di trasformarsi in adulto (vitalità dello zigote e capacità di sopravvivenza degli stadi giovanili).
2)selezione sessuale (competizione con altri individui per la riproduzione).
3)competizione tra gameti (alcuni gameti possono essere prodotti in misura maggiore–> deriva meiotica).
La selezione può agire su un allele, su un genotipo o su strutture genotipiche di una popolazione.
Il coefficiente di adattamento (W) ha un valore max di 1, mentre il coefficiente di selezione (S) è uguale a 1- W.

48
Q

Tipi di SELEZIONE a COEFFICIENTI COSTANTI.

A

5 casi possibili:
1)SELEZIONE CONTRO UN ALLELE RECESSIVO: Solo un genotipo viene selezionato (nel caso di 2 alleli). Questa selezione causa una diminuzione della frequenza dell’ allele recessivo (a). Nella popolazione l’ equilibrio verrà raggiunto quando q=0 (scompare allele a) o p=0 (non esiste allele A). Il numero di generazioni necessarie per dimezzare la frequenza dell’ allele sarà: t= 1/q (inversamente proporzionale alla frequenza dell’ allele stesso, per basse frequenze di a diventa quindi inefficace, inoltre l’ allele a è contenuto negli eterozigoti (Aa) che non sono selezionati).
2) SELEZIONE CONTRO UN ALLELE DOMINANTE: un solo genotipo raggiunge adattamento (w)=1, mentre gli altri sono sottoposti ad una uguale selezione. In tal caso si osserva, anche qua, la scomparsa di a (il recessivo) ma ad una velocità maggiore.
3)SELEZIONE CONTRO UN ALLELE CHE PRESENTA DOMINANZA INCOMPLETA: anche qua si osserva la scomparsa del recessivo (a) con dinamiche che dipendono da S e H (eterozigoti).
4)SELEZIONE A FAVORE DELL’ ETEROZIGOTE: porta ad un equilibrio con un valore di q (frequenza dell’ allele a) compresa tra 0 e 1, che determina, nella popolazione, il mantenimento di omozigoti AA e aa, che sono meno adatti.
L’ adattamento massimo della popolazione si ha per una struttura genetica con la presenza di individui sfavoriti (q tra 0 e 1, non compresi, è sono punti di equilibrio stabile, mentre q=0 e q=1 sono punti di equilibrio instabile).
5)SELEZIONE CONTRO L’ ETEROZIGOTE: troveremo eterozigoti soltanto se la popolazione non è isolata, ma ad essa affluiscono per migrazione individui con struttura genotipica diversa. Qua di verifica effetto Wahlund.

49
Q

SELEZIONE A COEFFICIENTI VARIABILI.

A

In questo caso i coefficienti di selezione sono variabili. Ciò può essere causato da vari fattori, come la variazione della densità di popolazione, fattori ambientali che cambiano climaticamente, ecc… .
La selezione è più efficiente in popolazioni grandi, poiché è più forte della deriva genetica quando S > 1/N.
Probabilità di fissazione attraverso la selezione (Pfixation)= 2S/1-e^-4NS (cioè per una nuova mutazione neutrale in una popolazione di 1000, la probabilità di fissazione è di 1/2000.
Gli alleli neutrali, grazie al loro tempo di fissazione, contribuiscono maggiormente al polimorfismo di una popolazione.
TEMPO DI FISSAZIONE (per mut. Neutrali è 4N, per quelle selezionate è (2S)ln(2N).

50
Q

Cosa si intende per OMOGAMIA?

A

OMOGAMIA è il contrario di PANMISSIA, cioè gli incroci all’ interno di una popolazione, tra individui, non sono casuali.
L’ OMOGAMIA può essere NEGATIVA (sfavorisce l’ incrocio tra individui con lo stesso genotipo) e può essere TOTALE (in cui l’ incrocio può essere possibile solo tra individui geneticamente differenti (NO AA×AA o Aa×Aa o aa×aa). Se DR allora R diminuisce fino ad arrivare a 0, se D=R allora H è uguale a 1-2H0 e si fissa l’ allele.
Vi può essere l’ OMOGAMIA POSITIVA (in cui si favoriscono gli incroci tra individui con lo stesso genotipo) e può essere TOTALE (si incrociano individui che hanno lo stesso genotipo totale, con caso più estremo di autofecondazione), qui in una sola generazione gli eterozigoti si dimezzano, ma le frequenze alleliche non cambiano. Col tempo gli eterozigoti tenderanno a scomparire.
Si può avere una OMOGAMIA POSITIVA PARZIALE (qua l’ incrocio tra individui geneticamente identici non è l’ unico possibile), nel corso delle generazioni la perdita degli eterozigoti è più limitata rispetto al caso precedente, e non variano le frequenze alleliche.

51
Q

DERIVA GENETICA.

A

La deriva genetica è rappresentabile dall’ azione di eventi casuali (non riconducibili alle leggi di probabilità, bensì stocastiche), delle dispersioni casuali che influenzano la genetica delle popolazioni (in particolare una parte della variabilità genetica verrà persa).
Un effetto maggiore della deriva genetica si manifesterà in popolazioni più piccole.
Dentro popolazioni finite, a causa del processo stocastico di cambiamento della frequenza di un allele, osserveremo o una tendenza alla fissazione di un allele nella popolazione o la tendenza alla sua scomparsa (in entrambi i casi tende all’ omozigosi).
Po= probabilità di fissare l’ allele P.
1-Po= probabilità di perdere l’ allele P.
Questi fenomeni avvengono per ogni gene, di conseguenza, osserveremo che inizialmente vi sarà un allele con frequenza Po, dopo n generazioni, vi sarà una certa frazione di geni in cui l’ allele considerato si sarà fissato, un altra frazione in cui è stato perso e un altra frazione in cui persiste in eterozigosi (condizione che vede un calo in caso sia di perdita che di fissazione).

52
Q

Fenomeni del COLLO DI BOTTIGLIA ed EFFETTO DEL FONDATORE.

A

COLLO DI BOTTIGLIA: una specie con limitata variabilità genetica (probabilmente di una recente riduzione numerica).
EFFETTO DEL FONDATORE: quando un territorio viene colonizzato da pochi individui, la nuova popolazione, vedrà una riduzione della variabilità genetica portata dai fondatori.

53
Q

Dimensioni delle popolazioni: CENSITA ed EFFETTIVA.

A
DIMENSIONE CENSITA (N): insieme di individui censiti (ad esempio con marcatura e ricattura) in un certo istante.
DIMENSIONE EFFETTIVA (Ne): numero di individui che determinerebbero il grado di eterozigosi, inbreeding e varianza delle frequenze alleliche osservate (riproducendosi secondo i parametri di una popolazione costante, o ideale, dove: il numero di riproduttori si mantiene costante, il rapporto maschi:femmine è di 1:1, vi è PANMISSIA, l' effetto di migrazioni, mutazioni e selezione sono trascurabili, vi sono generazioni distinte, il numero medio di prole è 1). 
Per ogni generazione la variabilità genetica persa, per deriva genica, è 1/2Ne.
Solitamente Ne
54
Q

WHOLE GENOME SHOTGUN SEQUENCING.

A

Metodo più recente di sequenziamento, sfruttato per sequenziare il genoma umano.
PROCESSO:
DNA frammentato in modo casuale, in piccoli segmenti, i quali sono sequenziati attraverso il CHAIN TERMINATION METHOD, ottenendo le READS. Il processo è ripetuto più volte ottenendo multiple reads, sovrapposte del DNA target.
Sfrutto dei programmi per assemblare le READS in una sequenza continua.
Calcolo la COPERTURA, secondo il modello LANDER-WATERMAN è uguale a C= NL/G, dove N è il numero di frammenti (o letture), L è la lunghezza dei frammenti (conosciuta) e G è la lunghezza dell’ intero genoma; N×L identifica lo SFORZO DI SEQUENZIAMENTO.
Distinguo la costituzione di 2 tipi di librerie:
1)PICCOLE: dove i frammenti sono di 270 pb, di cui sequenzio solo 100 pb alle estremità (avrò 70 pb centrali non conosciute).
2)GRANDI: con frammenti di 4-8 Kb, di cui sequenzio solo 100 pb alle 2 estremità, quindi tutta la parte centrale sarà sconosciuta.
Unico tutte le sequenze derivanti da librerie grandi e piccole e le assemblo–> ASSEMBLARE IL GENOMA: ricostruire la sequenza della molecola originale di DNA utilizzando solo le READS, identificando le reads-overlap, cioè i “pezzi che stanno insieme”, la presenza di “pezzi mancanti” (SEQUENCING Bias) o “pezzi rovinati” (sequencing errors).

55
Q

Tecniche di assemblaggio del genoma.

A

1)Assemblaggio BASILARE: dall’ assemblaggio si ottengono dei contigs (o contigui, risultati dall’ unione di piccoli frammenti, creati tramite la digestione enzimatica). Essi vengono organizzati con il giusto orientamento, sovrapponendoli ai frammenti lunghi e corti ottenuti prima. Vengono identificati i CAPTURE GAP (dei contigui riuniti ma con dei “buchi” dove manca l’ informazione). Se le 2 sequenze forward e reverse dello stesso frammento di trovano su 2 contigs diversi, allora essi sono tra loro vicini e possiamo anche sapere quanto distano tra di loro. I buchi presenti tra 2 contigs (dovuti a sequenze ripetute) sono coperti/chiusi con sequenze NNN. N50 è il valore che indica la dimensione del contig che raggiunge la metà della dimensione stimata del genoma (maggiore è N50 migliore sarà l assemblaggio, poiché un minore numero di contig sono stati assemblati per raggiungere il 50% del genoma.
2)ASSEMBLAGGIO SCAFFOLDING: uso librerie PAIRED-END o MATE-PAIR per orientare ed unire coppie di contig in sequenze di lunghezza maggiore (le scaffold), come può essere un braccio di un cromosoma.
3)ASSEMBLAGGIO DE BRUJIN:
Converto le READS in KMERS (sottostringa di lunghezza k definita), e decostruisco il database di sequenze in parola più corte (KMERS). costruisco un grafo di De Brujin a partire dai KMERS, semplifico il grafo (eliminando le ridondanze), ottengo un grafo consensus.
KMERS: devo sceglierne la lunghezza (se sono troppo corti possono portare a troppe soluzioni, il che comporta un peggiore assemblaggio) (se sono troppo grandi portano all’ aumento degli edges nel grado e quindi aumentano la Memoria necessaria a conservare la sequenza di DNA).
Quando si incontrano KMERS che differiscono per una sola base, il processo cerca di andare avanti lo stesso, creando una BOLLA (una biforcazione nel grafo) in cui il percorso si divide in 2 modi e poi si riunisce in uno singolo. Per far collassare la bolla si sceglierà il percorso con la maggiore copertura di reads.
Una bolla può essere un problema quando ci sono tanti siti con errori sistematici vicini (se la distanza tra gli errori sistematici è minore della lunghezza del chimero), che permettono ai percorsi di unirsi, per evitare ciò si ingrandisce la bolla (però se troppo grande si rischia di costituire assemblaggi errati).

56
Q

Trasferimento di geni tra specie di batteri.

A

Tra batteri avvengono scambi di elementi genetici mobili, cioè geni che si trasferiscono orizzontalmente (da un individuo all’ altro, non da genitore a figlio), che, tra le varie cose, possono permettere un rapido adattamento a sostanze per loro letali (fenomeno dell’ antibiotico-resistenza).
Questo processo di scambio orizzontale di materiale genetico è detto TRASFORMAZIONE BATTERICA, esso causa una ampia variabilità genetica, anche tra individui appartenenti alla stessa specie.

57
Q

Sistemi di adattamento dei batteri in diverse condizioni.

A

Alcune specie di batteri possono sopravvivere e prosperare in habitat estremi (batteri estremofili), essi presentano un alta PLASTICITÀ METABOLICA.
Alcuni hanno la capacità del QUORUM SENSING, ovvero possono misurare la densità della popolazione della colonia batterica che li circonda (ma anche di altri individui competitori extra-colonia).
Molte popolazioni microbiche possono costituire dei BIOFILM, cioè popolazioni attaccate alle superfici (con proprietà morfologiche e fisiologiche particolari).
Molte specie batteriche hanno attività PROBIOTICA, il che vuol dire che divengono la flora batterica di altri organismi di maggiori dimensioni, funzionale al suo benessere quando controllata.

58
Q

Perché studiare geneticamente i batteri?

A

I batteri hanno da sempre occupato tutte le nicchie ecologiche ed hanno un ruolo fondamentale per la sopravvivenza di tutti gli organismi viventi.
Ad oggi, un genoma batterico può essere sequenziato in poche ore.
Lo studio del METAGENOMA è molto utile per evitare lunghi processi di coltivazione di colonie di batteri in laboratorio. Un marker molecolare fondamentale in questo caso è il 16S rRNA.
I Genomi di batteri o delle comunità può essere effettuato attraverso il Microbial Whole Genome Sequencing (ci permette di assemblare i vari genomi dei microbi di una comunità) o il De Novo Assembly (che ricostruisce solo le sequenze più rappresentate)