Nozioni Base Flashcards
Terminologia utile per la BIOINFORMATICA.
ALINEAMENTO DI SEQUENZE: procedura in cui sono messe a confronto ed allineate 2 o più sequenze di AA, DNA e RNA. Questo processo permette di evidenziare la similarità tra regioni identiche e dedurre le loro relazioni funzionali, strutturali ed evolutive. L’ allineamento può essere GLOBAL SEQUENCE ALIGNMENT (in cui confronto l’ intera lunghezza delle sequenze allineate) o LOCAL SEQUENCE ALIGNMENT (in cui confronto varie sequenze per trovare le regioni più simili, in tal caso non considererò le altre regioni al di fuori dell’ allineamento).
1) SIMILARITÀ: misura quantitativa dei cambiamenti che avvengono tra 2 sequenze divergenti a causa di mutazioni di vario tipo. Alta similarità può indicare una storia evolutiva simile o una somiglianza nella funzione biologica.
2)OMOLOGIA: la somiglianza che implica una relazione evolutiva.
3)OMOLOGHI: geni derivanti da un antenato comune.
4)ORTOLIGHI: geni che si sono differenziati a seguito di un evento di speciazione. Sono presenti in specie diverse ma correlate (che hanno un antenato comune) e quindi che codificano per proteine con funzioni simili.
5)PARALOGHI: geni che si sono originati dalla duplicazione di un singolo gene. Solitamente svolgono funzioni diverse e, nel tempo, possono acquisire nuove funzioni.
Le SCORING MATRICES sono degli schemi empirici che tengono in considerazione le caratteristiche chimico/fisiche/biologiche di AA e bp, utilizzando relativi punteggi, durante gli ALIGNMENT. Alcuni AA saranno più importanti di altri (in termini qui di di punteggio saranno diversificati): CYS/PRO sono importanti per struttura e funzione, alcuni si possono sostituire con altri senza che vi siano importanti ripercussioni (LYS/ARG), lo SCORING cambia anche a seconda della frequenza di comparsa dell’ aa nella catena.
Matrice: per i nucleotidi, match (+2), mismatch (-3). Per gli aa: sfrutto BLOSUM (blocks substitution Matrix), in cui vengono ricercate le differenze in regioni conservate di una famiglia di proteine, calcolando poi gli score su allineamenti locali. Tipi di matrici BLOSUM: 90-per allineamenti brevi , alta similarità (70-90%); 80-usata per trovare membri noti di una famiglia proteica (50-60%); 62-usata per trovare tutte le possibili similarità (30-40%); 30-per allineamenti locali più lunghi e deboli.
GAPS: usati per migliorare l’ allineamento tra 2 sequenze, servono a conservare inserzioni e delezioni, quindi rappresentano degli eventi biologici. Non devono essere molto numerosi, in media si sfrutta 1 GAP ogni 20 residui.
Differenze tra DNA e RNA.
Il DNA è una macromolecola costituita da 2 filamenti tra loro antiparalleli. Ogni filamento è una sequenza di nucleotidi. Ogni nucleotide è costituito da un gruppo fosfato (che conferisce la carica superficiale negativa al DNA, rendendolo acido), uno zucchero (deossiribosio, che manca del gruppo OH al C2) e una base azotata (A,T,C,G). Le basi azotate dei nucleotidi di un filamento si legano complementariamente alle basi azotate dei nucleotidi dell’ altro filamento (A-T/C-G).
L’ Rna è una molecola a singolo filamento, al posto del deossiribosio, come zucchero, presenta un ribosio (che ha il gruppo OH al C2), al posto della base azotata A vi è U (uracile). L’RNA può presentare dei ripiegamenti causati da legami secondari costituiti dall’ interazione con se stesso. Esistono vari tipi di RNA: mRNA (messaggero, che fa da intermedio tra il DNA e la proteina derivante), rRNA (che va a costituire la struttura ribosomale, insieme a varie proteine), tRNA (trasportatore di AA, esso svolge un ruolo chiave nella costituzione di catene polipeptidiche durante la traduzione), miRNA, smRNA.