Bioinformática Flashcards
qué es la bioinformática
Área de la biología que conjunta a la informática con el objetivo de resolver problemas de interés biológico
menciona algunas de sus funciones
- Ensamblar genomas
- Perfil de expresión génica
- Estudios evolutivos
- Biología sintética
qué tipo de genomas puede ensamblar
- Humanos
- Bacterianos
- Virales
- DNA antiguo
funciones de la bioinformática en relación al perfil de expresión génica
- Transcriptoma
- Expresión diferencial (la expresión de genes en dos o mas contextos)
una aplicación de la biología sintética
Generar modelos biológicos teóricos para pasarlos a elementos en la vida real
donde se encuentra presente el gen 16rRNA
en todas las bacterias
utilización del 16rRNA en relación con la informática
Utilizado en estudios de filogenia y taxonomía bacteriana
regiones del gen 16s rRNA
- Conservadas
- Hipervariables
que son las regiones conservadas del gen 16s rRNA
son regiones idénticas en todas las bacterias
número total de regiones hipervariables
n=9
qué determina si las bacterias son filogenéticamente cercanas
si tienen las regiones hipervariables del gen parecidas
pasos para secuenciar el gen 16s rRNA
- obtener la muestra microbiana
- amplificar y secuenciar el gen (por 2da o 3ra generación)
- se obtendrán los OTUS
- clasificarlos e identificarlos
qué es un OTU
- Unidad operacional taxonómica
- Secuencia de amplicones iguales
qué indica el número total de OTUs
Abundancia
qué indica la presencia de diferentes OTUs
Diversidad
renglones en los que se distribuye FASTQ
- Identifier
- Sequence
- Sign and identifier
- Quality scores
qué indica el signo “+” del 3er renglón en FASTQ
que el siguiente renglón no son nucleótidos sino la calificación (calidad)
qué significa “NNNNN” en el 2do renglón de FASTQ
Secuencia no identificada
escala que se utliza para determinar la calidad de las secuencias en FASTQ
Escala Phred
valor mínimo, en escala de Phred , para que una secuencia sea de calidad
30
características del archivo de secuencia FASTA
- Solo tiene identificador seguido de la secuencia de nucleótidos
- se pone la secuencia completa y no tiene signos
- Se sustitiye el arroba por >
qué es FASTQ
- formato de archivo que contiene y organiza datos de secuencias de NGS
- incluye su calidad de lectura