Genomika Flashcards
genomika (definicja)
to nauka interdyscyplinarna łącząca w sobie biologię molekularną, robotykę i nauki obliczeniowe [informatykę].
Zajmuje się globalną wielkoskalową analizą wszystkich genów, transkryptów i białek w organizmie stosując automatyczne technologie biologii molekularnej o dużej przepustowości [high-throughput]
bioinformatyka (definicja)
to nauka interdyscyplinarna wykorzystująca narzędzia matematyczne i informatyczne do rozwiązywania problemów z dziedziny nauk biologicznych - biologii molekularnej.
- biologia molekularna dostarcza danych biologicznych takich jak dane dotyczące kwasów nukleinowych, białek, lipidów, węglowodanów i innych makrocząsteczek
- informatyka dostarcza narzędzi, metod i obliczeń komputerowych [nauki i techniki komputerowe, teoria informacji, matematyka stosowana, statystyka, teoria prawdopodobieństwa]
cele bioinformatyki (2)
- organizowanie i zarządzanie informacjami o makrocząsteczkach i innych danych biologicznych w formie cyfrowych zapisów - baz danych
- analiza tych danych przy pomocy różnych programów i narzędzi oraz metod i algorytmów
genomika, bioinformatyka - poziomy analiz (6)
- genom
- transkryptom
- proteom
- lokalizom
- interaktom
- metabolom
genom - poziom analiz bioinformatyki (przedmiot badań, dziedzina badań, temat badań)
- przedmiot badań - wszystkie sekwencje DNA lub RNA zawarte w organizmie, geny, sekwencje regulatorowe
- dziedzina badań - genomika
- temat badań - poszukiwanie sekwencji kodujących, regulatorowych i powtórzonych, rozpoznawanie eksonów i intronów, ogólna organizacja genomów (skład, rozmieszczenie genów), porównanie sekwencji
transkryptom - poziom analiz bioinformatyki (przedmiot badań, dziedzina badań, temat badań)
- przedmiot badań - wszystkie transkrybowane sekwencje RNA w organizmie
- dziedzina badań - transkryptomika, RNomika
- temat badań - analiza ekspresji genów w różnych tkankach i warunkach przy pomocy mikromacierzy oligonukleotydowych i cDNA
proteom - poziom analiz bioinformatyki (przedmiot badań, dziedzina badań, temat badań)
- przedmiot badań - wszystkie białka zawarte w organizmie
- dziedzina badań - proteomika
- temat badań - porównanie sekwencji, identyfikacja konserwowanych regionów (motywów i domen), przewidywanie struktury drugorzędowej i trzeciorzędowych, interakcje, obróbka, identyfikacja białek w komórce i tkankach
lokalizom - poziom analiz bioinformatyki (przedmiot badań, dziedzina badań, temat badań)
- przedmiot badań - subkomórkowe położenie białek w komórce
- dziedzina badań - lokalizomika
- temat badań - poszukiwanie specyficznych motywów w sekwencjach aminokwasowych oraz peptydów sygnałowych i tranzytowych kierujących sekwencje do odpowiednich przedziałów komórki
interaktom - poziom analiz bioinformatyki (przedmiot badań, dziedzina badań, temat badań)
- przedmiot badań - zależności i interakcje między białkami i innymi cząsteczkami w komórce
- dziedzina badań - interaktomika i biologia systemów
- temat badań - interakcje między białkami, które przedstawiane są za pomocą sieci zależności
metabolom - poziom analiz bioinformatyki (przedmiot badań, dziedzina badań, temat badań)
- przedmiot badań - wszystkie procesy, szlaki, substraty i produkty metaboliczne zachodzące w organizmie
- dziedzina badań - metabolomika i biologia systemów
- temat badań - określanie sieci i szlaków metabolomicznych, symulacje komputerowe
G
komputerowy zapis sekwencji nukleotydowej
G - guanina
A
komputerowy zapis sekwencji nukleotydowej
A - adenina
T
komputerowy zapis sekwencji nukleotydowej
T - tymina
C
komputerowy zapis sekwencji nukleotydowej
C - cytozyna
R
komputerowy zapis sekwencji nukleotydowej
puryna, czyli A - adenina lub G-guanina
Y
komputerowy zapis sekwencji nukleotydowej
pirymidyna, czyli C - cytozyna lub T - tymina
M
komputerowy zapis sekwencji nukleotydowej
A - adenina lub C - cytozyna
K
komputerowy zapis sekwencji nukleotydowej
G - guanina lub T - tymina
S
komputerowy zapis sekwencji nukleotydowej
silna interakcja - potrójne wiązanie, czyli C - cytozyna lub G - guanina
W
komputerowy zapis sekwencji nukleotydowej
słaba interakcja - podwójne wiązanie, czyli A - adenina lub T - tymina
H
komputerowy zapis sekwencji nukleotydowej
A - adenina, C - cytozyna lub T - tymina
B
komputerowy zapis sekwencji nukleotydowej
C - cytozyna, G - guanina lub T - tymina
V
komputerowy zapis sekwencji nukleotydowej
A - adenina, C - cytozyna lub G - guanina
D
komputerowy zapis sekwencji nukleotydowej
A - adenina, G - guanina lub T - tymina
N
komputerowy zapis sekwencji nukleotydowej
dowolna zasada
A - adenina, C - cytozyna, G - guanina lub T - tymina
format Staden / SEQ / “Normal” / “Sequence Only”
dozwolone małe, duże litery i spacje
tylko sama sekwencja
format FASTA / Pearson
linia definicji: “ >nazwa sekwencji | komentarz “
sekwencja: z małych liter, 60-80 znaków w linijce, gubienie sporej informacji o danej sekwencji
format GCG
linia opisu: identyfikator sekwencji, długość sekwencji, data wprowadzenia, suma kontrolna “..” - początek sekwencji
sekwencja: na początku każdej linijki numer początkowy nukleotydu w sekwencji, co 10ty nukleotyd spacja, maksymalnie 50 nukleotydów w linijce, duże litery
format NEWAT
linia opisu: “ TORIC nazwa sekwencji”
sekwencja: “PORIC numer pierwszego nukleotydu w linijce sekwencja”, co linijkę taki sam wzór, spacja co nukleotyd, maksymalnie 30 nukleotydów w linijce, z dużych liter
“ * “ po ostatnim nukleotydzie oznacza koniec sekwencji
format NBRF
linia opisu:
“ >identyfikator
nazwa sekwencji”
sekwencja: z dużych liter, “ * “ po ostatnim nukleotydzie oznacza koniec sekwencji