Bioinformática Flashcards
Si una neurona de capa oculta en una red neuronal de tipo backpropagation cuya funcion de activacion es una funcion sigmoidea, recibe como parametro de entrada de dicha funcion el valor 0, cual es el comportamiento que probablemente se observa en la salida de la funcion?
a) que se comporte como una funcion lineal
b) Que el resultado sea 0,5
c)Que el resultado tienda 1
d) Que el resultado tiende a ser 0
b
(V/F) El navegador Google Chrome es una buena herramienta para interactuar con nuestro servidor Flask como cliente, ya que puede realizar de manera nativa consultas como REST de tipo GET y POST
FALSO
Cual de las siguientes invocaciones tienen mayor probabilidades de ser exitosa (teniendo en cuenta las caracteristicas con las que Flask levanta el servidor web local?
a) http://localhost:5001/api/labresult
b) http://localhost:8080/api/labresult
c) http://127.0.0.1:23/api/labresulta
d) http://localhost:5001/labresult/api
a) http://localhost:5001/api/labresult
Las APIs de tipo REST expuestas a traves de la libreria Flask en Python
a) Pueden admitir metodos de invocación de tipo GET, POST, PUT, entre otros
b) Solo admiten el protocolo de mensajeria web SOAP
c) Utilizan con maypr frecuencia el formato de mensajeria XML
a) Pueden admitir metodos de invocación de tipo GET, POST, PUT, entre otros
El proceso de generacion de un PROFILE de proteinas es similares en varios aspectos a:
a) El algoritmo de alineamiento multiple de tipo progresivo
b) El algoritmo de armado de arboles filogeneticos de tipo Maximun Parsimony
c)El algoritmo de alineamiento multiple de tipo iterativo
c) el algoritmo de alineamiento multiple de tipo iterativo
(V/F) Sobre redes neuronales: no es posible configurar diferentes funciones de activacion dentro de una misma hidden layer (por ejemplo, no puede una neurona de la capa 1 tener una funcion sigma mientras que su vecina en la misma capa tiene una funcion lineal)
Falso
Marque las afirmaciones que crea correcta sobre las funcionalidades de galaxy (pueden haber mas de una)
a) Los workflows una vez extraidos de la historia no puede modificar los inputs que le llegan a cada step
b) Las hitorias pueden publicarse independientemente de si se publica tambien el workflow o no
c) Al ejecutar un workflow, se generen automaticamente ina nueva historia desde cero con todos sus steps correspondientes
d) Al ejecutar un workflow se generan todos los step correspondientes en la historia actual (si ya habia steps generados, se concatenan)
e) Los steps pueden ser resultados en si mismos (intermedios o finales) los cuales pueden descargarse de manera independiente
b) Las hitorias pueden publicarse independientemente de si se publica tambien el workflow o no
d) Al ejecutar un workflow se generan todos los step correspondientes en la historia actual (si ya habia steps generados, se concatenan)
e) Los steps pueden ser resultados en si mismos (intermedios o finales) los cuales pueden descargarse de manera independiente
La siguiente afirmacion es la correcta sobre los contigs y los scafolds en ensamblaje genomico
a) Ambos tipos de secuencia se representan en archivos fastqc
b) Los contigs pueden utilizar heuristicas como asi tambien consultar bases de datos de referencia para validar concatenacion de reads
c) La cantidad de scaffolds suele ser menor que la cantidad de constigs
c) La cantidad de scaffolds suele ser menor que la cantidad de constigs
(la b estaria bien para scaffolds)
(la a esta mal porque el archivo de salida es un fasta)
El input sensitivity sociado a las neuronas de entrada de una red neuronal, nos da una idea de la importancia de cada neurona para entrenamiento de la red. A menor imput sensitivity, mayor relevancia de dicha neurona en el aprendizaje
(input sensitivity: es cuanto varia la salida de la red en funcion a cuanto varia entrada)
Falso (deberia ser a mayor input sensitivity mayor relevancia de la neurona)
(V/F) Es necesario contar previamente con un servidor SQLite en ejecucion para poder acceder a la base de datos correspondiente a traves de la libreria sqlite3 de python
Falso
A traves de la libreria Flask en Python es posible:
a) Montar un servidor de base de datos SQLite
b) Exponer APIs desde la nube
c)Levantar un servidor web de manera local
c)Levantar un servidor web de manera local
Ante una funcion de activacion de una neurona de tipo Relu, cual es el valor de salida despreciando el Biass, si el valor de entrada de la funcion es -2?
a) 0
b) -2
c) Muy cercano a 1
0
(La funcion Relu es como una rampa, devuelve el maximo entre 0 y x)
Durante el proceso de ensamblaje genomico, luego de ejecutar un step de filtrado en Galaxy utilizado Trimmomatic , la mejor forma de describir la cantidad de archivos de salidas:
a) Si se contaba con un archivo fastq: unpaired, el resultado es un unico archivo
b) Si se contaba con un archivo fastqc: paired, el resultado son 4 archivos
c) Si se contaba con dos archivos fastq: paired, el resultado son 3 archivos
b) Si se contaba con un archivo fastqc: paired, el resultado son 4 archivos
(V/F) Es el proceso de ensamblaje de un genoma de novo, la cantidad de scaffolds suele coincidir frecuentemenete con la cantidad de contigs
Falso (los scaffolds son uniones de contigs, entonces los scaffolds siempre son mas que los contigs)
Las siguientes son caracteristicas que pueden stribuirse a una proteina a partir del reconocimiento de un Motif:
a) Sitios de fosforilacion
b) Sitios de union al ADN (dedos de Zinc)
c) Dominios de estructuras secundarias Alfa Helice o Bet plegadas)
d) Sitios de union a un Primer
a) Sitios de fosforilacion
b) Sitios de unión al ADN (Dedos de zinc)
c) Dominios de estructuras secundarias Alfa Hélice o Beta plegadas
(V/F) En SQL (SQLite) al ejecutar una operacion de tipo UPDATE se actualicaran todos los registros de una o mas tablas
Falsa
(V/F) En Galaxy el orden normal de creacion de objetos es el siguiente, primero se crean los workflows, se definen las historias, y por ultimo se crean los steps
Falso (primero se genera la historia con los steps y por ultimo el workflow)
Sobre emboss:
a) es una suite de aplicaciones bioinfomaticas unicamente disponible disponible para Linux
b) La funcion Wossname permite conocer el lsitado y las caracteristicas de las distintas aplicaciones con las que contamos
c) El archivo de salida es un parametro obligatorio que debe explicitarse para poder ejecutar una aplicacion Emboss en su implementacion para Linux
b) La funcion Wossname permite conocer el lsitado y las caracteristicas de las distintas aplicaciones con las que contamos
(V/F) Al diseñar una base de datos relacional (SQL) es importante recordar que las relaciones son un objeto en si mismo que debe ser declarado y creado mediante la funcion correspondiente
Falso (no son un objeto en si mismo, los objetos son las tablas e indices (ID))
Al construir un perfil de proteinas, debemos reconstruir la matriz de sustitucion. Lo cual hace que el algoritmo sea similar al que se ejecuta al realizar un alineamiento multiple con una estrategia progresiva
a) Las secuencias no requieren de estar alineadas para poder construir el perfil
b) Las matrices de sustitucion de nucleotidos son un elemento clave
c) Ninguna de las anteriores respuetas es correcta
c) Ninguna de las anteriores respuetas es correcta
(porque la matriz que es importante es de aminoacidos)
A partir del siguiente conjunto de secuencia, determinar el motif que mejor las representa:
a) AGCXTYDAEF
b) AGCWTHDPEF
c) AGCVTHDGEK
d) AGCKTYDMEF
e) AGCXTYDSEF
f) AGCXTYDSEF
g) AGCWTYDTEF
h) AGCATHDLKF
a) AGC[AKWVX]T[YH]D[APGMSTL][APGEKMSTL][FK]
A partir del siguielte conjunto de secuencia alineadas, seleccionar la expresion regular que mejor representa el motif
a) AGCXTYD
b) AGCWTHD
c) AGCATHD
d) AGCKSYD
a) AGC[XWAK][TS][YH]D
Como una generalizacion, al hablar de proteinas podriamos decir que:
a) Todos los dominios son motifs, pero no todos los motifs son necesariamente dominios
b) los motifs respondesn a expresiones regulares
c)Ambas opciones son correctas
c
(V/F) El momentum y el learning rate son sinonimos dentro de lo que son los parametros de aprendizaje dentro de una red neuronal
Falso, el learning rate es la tasa o porcentaje qie yo le permito para el ajuste sobre la totalidad que habia que ajustarse, el momentum va ajustando el learning rate dependiendo del error y el leraning rate es que tanto ajustar la red dependiendo del error)
Al ejecutar un filtro de calidad sobre un archivo de tipo FASTQC
a) Si la media de calidad no supera el umbral configurado, se eliminan aquellas bases de menor calidad hasta alcanzar la media deseada
b) Si el read no cumple con la media de calidad minima seleccionada, se elimina todo el read
c)Solo pueden ejecutarse filtros de calidad basados en el leght del read
b) Si el read no cumple con la media de calidad minima seleccionada, se elimina todo el read
Un read dentro de un FASTQC puede tener varios fragmentos de secuencia, ya que se basa en la lectura de las secuencias fraccionadas luego de ejecutar una PCR
Falso, un read es una recuencia sola no pueden ser varios fragmentos, lo que si es verdadero es que surgen a partir de una PCR
Trimmommatic es una herramienta bioinfomatica para realizar:
a) El apareo entre archivos FASTQC
b)El filtro de los reads dentro de los archivos FASTQC, segun los parametros de calidad seleccionados
c) El ensamblaje de aquellos reads que hayan pasado exitosamente los filtros de calidad ejectuados previamente
b)El filtro de los reads dentro de los archivos FASTQC, segun los parametros de calidad seleccionados
(V/F) Ante el hallazgo de un valle (o un minimo local) durante el entrenamiento, la red se beneficia en primera instancia (como primer hiperparametro a modificar) de la inclusion de mas neuronas en la/s hiddel layer/s)
Falso, ante un valle se modifica el momentum y el learning rate y encima la red no siempre se beneficia de tener mas neuronas en las capas ocultas
(V/F) En los workflows construidos con Galaxy no es posible que el output de un mismo step sirva de input para mas de un step posteriores
Falso, la salida de un step si es posible usarla para otros steps
Los loss function nos habla del algoritmo que se encarga de ajustar los pesos de las aristas de manera retrograda una vez finalizada una ejecucion de un caso de prueba
Falso, con los casos de prueba no se ajusta nada es solo para calcular el error y ver como va la red
De la IA y las redes neuronales
a) la funccion de activacion de las neuronas de una red de tipo multipercepcion es quien representa el crecimiento de la red
b) Las neuronas son las unidades funcionales que almacenan informacion del aprendizaje de la red
c) El conocimiento se encuentra en los pesos de las aristas
C) el conocimiento se encuentra en los pesos de las aristas
Del ensamblaje y el secuenciamiento
a) los FASTQC son archivos de texto plano
b) los FASTQC son archivos de texto binario
c) Ninguna de las opciones
a) los FASTQC son archivos de texto plano
Sobre el diseño de una base de datos relacional:
a) Las PK y las FK son el pilar fundamental de las bases de datos relacionales, sin embargo afectan de manera negativa la performance de las busquedas
b) Al definir una PK en un campo determinado es responsabilidad del desarrollador definir tambien una constrain del tipo unique para evitar datos duplicados
c) Los indices permiten realizar busquedas mas eficientes, sin embargo hay que tener precaucion y elegir correctamente sobre que campos aplicarlos
(PK y FK son primary key y forain key)
c
La b es falsa porque al definir una primary key ya es unica asi que no hay que agregar el constrain de unicidad
Que hace la siguiente sentencia SQL?
cursor.execute(“UPDATE tabla SET nombre=?, version=?, secuencia=? WHERE id_number=?”,(nombre,version,secuencia, id_number))
a) Actualiza una tabla determinada, con parametros dados por el usuario
b) Actualiza datos entre ellos, una tabla que es parte de los parametros dados por el usuario
c)No hace nada, posee un error de sintaxis
a)
El siguiente script de SQL que hace?
cursor.execute(“INSERT INTO especie (id_individuo,id_especie) VALUES (?,?,?)”, (id_individuo,id_especie))
a) inserta un id_individuo y un id_especie en la tabla especie
b)inserta una proteina en la tabla especie
c)No hace nada, posee un error de sintaxis
c
Sonbre los perfiles de proteinas
a) Al construir un perfil de proteinas, debemos reconstruir la matriz de sustitucion, lo cual hace que el algoritmo sea similar
b) Las secuencias no requieren de estar alineadas para poder construir el perfil
c) Las matrices de sustitucion de nucleoricos son un elemento clave
d) Ninguna de las anteriores respuestas es correcta
d) Ninguna de las anteriores respuestas es correcta
(V/F) La propagacion del ajuste por error se da en la mayoria de los casos de manera retrograda
Verdadero
Cual de los siguientes es un cambio pos traduccional que puede sufrir un polipeptido
a) CAP-7-metil-guanosina
b) splicing alternativo
c) Forforilacion
d) Ninguno de los anteriores
Forforilacion
(V/F) El algoritmo Needleman-Wunsch es ul caso particular del algoritmo Smith-Waterman
Falso
Cual de las siguientes afirmaciones sobre el alogitmo ENDS-FREE es la que mejor lo define
a) Comienza a leer la matriz una vez completada desde la casita con el mayor valor posible
b) Es de primera eleccion para alinear una secuencia muy pequeña contra otra de mayor tamaño
c) Es un algoritmo de programacion dinamica y recursiva
d) Ninguna de las anteriores
c)
Las siguientes son tipos o caracteristicas de mutaciones de novo
a) SNP-estan presentes en padres e hijos-son de herencia recesiva
b) Pueden responder el grupo de enfermedades geneticas asociadas a la denominada herencia mendeliana
c) INDELS-MISSENSE-NONSENSE
d)siempre se asocian a fenotipias patologicas
b)
(V/F) Los exones codificantes siempre forman parte del ARN maduro
Falso
(V/F) Es la transcripcion aprticipan tanto la ARN polimerasa como la primasa
Falso, la primasa participa de la replicacion no en la transcripcion
(V/F) Los algoritmos iterativos de alineamiento multiple se basan en la recursividad y en la evaluacion progresiva de cada una de las secuencias de un conjunto, pero tienen la desventaja de arrastrar errores de alineamiento
Falso, estos son los progresivos
Cual de las siguientes asociaciones es correcta (marque todas las cque considere)
a) Clustlaw-Conjunto masivo de secuencias-Menor distancia evolutiva
b) PAM
c) UPGMA
a y c
(V/F) A diferencia de la duplicacion del ADN y de la transcripcion del ARN, el splicing alternativo tiene lugar en el citoplasma, justo antes de que el mensajero ingrese al ribosoma
Falso
En R la mejor estructura para representar elementos y atributos asociados es
a) Data frame
b) Matriz
c) Data Set
d) Objeto XML
a
Las mutaciones pueden no representar fenotipo si (marcar todas las correctas)
a) ocurre en un intron
b) ocurre en un exon
c) ocurre en un GEN de escasa utilizacion
d) Ocurre en un GEN del cromosoma X
e) Genera un codon redundante para el mismo AA
f) Genera un codon de stop que origina una proteina mas pequeña pero igual de funcionamiento
G) Ocurre en celulas en fase 0
a
c
f
e
La herencia recesiva se relaciona con
a) Una variante alelica que debe representarse en ambos genes ()
b) Poblaciones endogamicas
c) Una menor probabilidad de presentacion fenotipica de enfermedad
d) Todas son correctas
d
Las siguientes son tecnicas de secuenciamiento NGS
a) Sanger
b) Illumina
c) MicroArray
d) NanoPore
b c y d
Las matrices utilizadas por los algoritmos de alineamiento son de dimensiones NxN
a) Siempre
b) Nunca
c) Depende de las secuencias
d) No todos los algoritmos de alineamiento usan matrices de puntuacion
c
Los siguientes son tipos de ARN
a) Mensajero
b) De transferencia
c) De interferencia
d) MicroARNs
e) de potenciacion
a b c y d
(V/F) El proceso de transcripcion se da mayormente durante la fase S del ciclo celular
Falso
El ADN no codificante representa aprox en los humanos
a) Un 5% del total del genoma
b) un 90% del total del genoma
c) un 50% del total del genoma
d) Un 1% del total del genoma
b
Los siguientes son parametros que usa Blast para la puntuacion en los alineamientos
a) Gaps, mutaciones, matches, lenght de la secuencia
b) Gaps, mismatches, matches
c) Distancia evolutiva
b
(V/F) Los alineamientos locales encuentran y arrojan la mejor solucion posible, siempre y cuando las secuencias tengan un largo similar
Falso
Los dominios y los motivos son elementos identificables en
a) Transcriptos primarios
b) Transcriptos maduros
c) Genes
d) polipeptidos
d
Sobre el algoritmo de blast:
a)usa K-tuplas para subdividir la secuencia query el porciones mas pequeñas
b) Es un algoritmo de alineamiento de tipo dinamico y recursivo
c)permite extender la ventana de caracteres de un alineamiento local y eso lo hace mas optimo que el algoritmo Fasta que tiene ventanas fijas
d) Pertenece al grupo de los algoritmos de tipo iterativos
a
(V/F) En el metodo de secuenciacion Sanger se usaba GFP como marcador de los nucleotidos
Falso
La herencia recesiva se relaciona con la siguiente afirmacion
a) La variante alelica debe estar presente en ambos
b) Se da con maypr frecuencia en poblaciones endogamicas
c) Presenta una mayor probabilidad de expresion fenotipica de enfermedad
d) todas son correctas
a
Los siguientes son parametros que usa blast para calcular alineamientos de secuencias de NUCLEOTIDOS
a) matches mutaciones gaps largo de la secuencia
b) distancia evolutiva p value matrices de sustitucion
c) gaps matches micmatches
d) gaps matches mismatches matrices PAM/BLOSUM
c
la estructura cuaternatia de una proteina es un cambio postraduccional en donde podemos observar una estabilizacion de la estructura secundaria de la misma obtenida previamente por la apraicion de enlaces puente de hidrogeno o enlaces disulfuro, entre otros
Verdadero