Bioinformática Flashcards

1
Q

Si una neurona de capa oculta en una red neuronal de tipo backpropagation cuya funcion de activacion es una funcion sigmoidea, recibe como parametro de entrada de dicha funcion el valor 0, cual es el comportamiento que probablemente se observa en la salida de la funcion?
a) que se comporte como una funcion lineal
b) Que el resultado sea 0,5
c)Que el resultado tienda 1
d) Que el resultado tiende a ser 0

A

b

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

(V/F) El navegador Google Chrome es una buena herramienta para interactuar con nuestro servidor Flask como cliente, ya que puede realizar de manera nativa consultas como REST de tipo GET y POST

A

Verdadera

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cual de las siguientes invocaciones tienen mayor probabilidades de ser exitosa (teniendo en cuenta las caracteristicas con las que Flask levanta el servidor web local?
a) http://localhost:5001/api/labresult
b) http://localhost:8080/api/labresult
c) http://127.0.0.1:23/api/labresulta
d) http://localhost:5001/labresult/api

A

a) http://localhost:5001/api/labresult

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Las APIs de tipo REST expuestas a traves de la libreria Flask en Python
a) Pueden admitir metodos de invocación de tipo GET, POST, PUT, entre otros
b) Solo admiten el protocolo de mensajeria web SOAP
c) Utilizan con maypr frecuencia el formato de mensajeria XML

A

a) Pueden admitir metodos de invocación de tipo GET, POST, PUT, entre otros

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

El proceso de generacion de un PROFILE de proteinas es similares en varios aspectos a:
a) El algoritmo de alineamiento multiple de tipo progresivo
b) El algoritmo de armado de arboles filogeneticos de tipo Maximun Parsimony
c)El algoritmo de alineamiento multiple de tipo iterativo

A

c) el algoritmo de alineamiento multiple de tipo iterativo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

(V/F) Sobre redes neuronales: no es posible configurar diferentes funciones de activacion dentro de una misma hidden layer (por ejemplo, no puede una neurona de la capa 1 tener una funcion sigma mientras que su vecina en la misma capa tiene una funcion lineal)

A

Falso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Marque las afirmaciones que crea correcta sobre las funcionalidades de galaxy (pueden haber mas de una)
a) Los workflows una vez extraidos de la historia no puede modificar los inputs que le llegan a cada step
b) Las hitorias pueden publicarse independientemente de si se publica tambien el workflow o no
c) Al ejecutar un workflow, se generen automaticamente ina nueva historia desde cero con todos sus steps correspondientes
d) Al ejecutar un workflow se generan todos los step correspondientes en la historia actual (si ya habia steps generados, se concatenan)
e) Los steps pueden ser resultados en si mismos (intermedios o finales) los cuales pueden descargarse de manera independiente

A

b) Las hitorias pueden publicarse independientemente de si se publica tambien el workflow o no
d) Al ejecutar un workflow se generan todos los step correspondientes en la historia actual (si ya habia steps generados, se concatenan)
e) Los steps pueden ser resultados en si mismos (intermedios o finales) los cuales pueden descargarse de manera independiente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La siguiente afirmacion es la correcta sobre los contigs y los scafolds en ensamblaje genomico
a) Ambos tipos de secuencia se representan en archivos fastqc
b) Los contigs pueden utilizar heuristicas como asi tambien consultar bases de datos de referencia para validar concatenacion de reads
c) La cantidad de scaffolds suele ser menor que la cantidad de constigs

A

c) La cantidad de scaffolds suele ser menor que la cantidad de constigs
(la b estaria bien para scaffolds)
(la a esta mal porque el archivo de salida es un fasta)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

El input sensitivity sociado a las neuronas de entrada de una red neuronal, nos da una idea de la importancia de cada neurona para entrenamiento de la red. A menor imput sensitivity, mayor relevancia de dicha neurona en el aprendizaje
(input sensitivity: es cuanto varia la salida de la red en funcion a cuanto varia entrada)

A

Falso (deberia ser a mayor input sensitivity mayor relevancia de la neurona)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

(V/F) Es necesario contar previamente con un servidor SQLite en ejecucion para poder acceder a la base de datos correspondiente a traves de la libreria sqlite3 de python

A

Falso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

A traves de la libreria Flask en Python es posible:
a) Montar un servidor de base de datos SQLite
b) Exponer APIs desde la nube
c)Levantar un servidor web de manera local

A

c)Levantar un servidor web de manera local

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Ante una funcion de activacion de una neurona de tipo Relu, cual es el valor de salida despreciando el Biass, si el valor de entrada de la funcion es -2?
a) 0
b) -2
c) Muy cercano a 1

A

0
(La funcion Relu es como una rampa, devuelve el maximo entre 0 y x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Durante el proceso de ensamblaje genomico, luego de ejecutar un step de filtrado en Galaxy utilizado Trimmomatic , la mejor forma de describir la cantidad de archivos de salidas:
a) Si se contaba con un archivo fastq: unpaired, el resultado es un unico archivo
b) Si se contaba con un archivo fastqc: paired, el resultado son 4 archivos
c) Si se contaba con dos archivos fastq: paired, el resultado son 3 archivos

A

b) Si se contaba con un archivo fastqc: paired, el resultado son 4 archivos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

(V/F) Es el proceso de ensamblaje de un genoma de novo, la cantidad de scaffolds suele coincidir frecuentemenete con la cantidad de contigs

A

Falso (los scaffolds son uniones de contigs, entonces los scaffolds siempre son mas que los contigs)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Las siguientes son caracteristicas que pueden stribuirse a una proteina a partir del reconocimiento de un Motif:
a) Sitios de fosforilacion
b) Sitios de union al ADN (dedos de Zinc)
c) Dominios de estructuras secundarias Alfa Helice o Bet plegadas)
d) Sitios de union a un Primer

A

a) Sitios de fosforilacion
b) Sitios de unión al ADN (Dedos de zinc)
c) Dominios de estructuras secundarias Alfa Hélice o Beta plegadas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

(V/F) En SQL (SQLite) al ejecutar una operacion de tipo UPDATE se actualicaran todos los registros de una o mas tablas

A

Falsa

17
Q

(V/F) En Galaxy el orden normal de creacion de objetos es el siguiente, primero se crean los workflows, se definen las historias, y por ultimo se crean los steps

A

Falso (primero se genera la historia con los steps y por ultimo el workflow)

18
Q

Sobre emboss:
a) es una suite de aplicaciones bioinfomaticas unicamente disponible disponible para Linux
b) La funcion Wossname permite conocer el lsitado y las caracteristicas de las distintas aplicaciones con las que contamos
c) El archivo de salida es un parametro obligatorio que debe explicitarse para poder ejecutar una aplicacion Emboss en su implementacion para Linux

A

b) La funcion Wossname permite conocer el lsitado y las caracteristicas de las distintas aplicaciones con las que contamos

19
Q

(V/F) Al diseñar una base de datos relacional (SQL) es importante recordar que las relaciones son un objeto en si mismo que debe ser declarado y creado mediante la funcion correspondiente

A

Falso (no son un objeto en si mismo, los objetos son las tablas e indices (ID))

20
Q

Al construir un perfil de proteinas, debemos reconstruir la matriz de sustitucion. Lo cual hace que el algoritmo sea similar al que se ejecuta al realizar un alineamiento multiple con una estrategia progresiva
a) Las secuencias no requieren de estar alineadas para poder construir el perfil
b) Las matrices de sustitucion de nucleotidos son un elemento clave
c) Ninguna de las anteriores respuetas es correcta

A

c) Ninguna de las anteriores respuetas es correcta
(porque la matriz que es importante es de aminoacidos)

21
Q

A partir del siguiente conjunto de secuencia, determinar el motif que mejor las representa:
a) AGCXTYDAEF
b) AGCWTHDPEF
c) AGCVTHDGEK
d) AGCKTYDMEF
e) AGCXTYDSEF
f) AGCXTYDSEF
g) AGCWTYDTEF
h) AGCATHDLKF

A

a) AGC[AKWVX]T[YH]D[APGMSTL][APGEKMSTL][FK]

22
Q

A partir del siguielte conjunto de secuencia alineadas, seleccionar la expresion regular que mejor representa el motif
a) AGCXTYD
b) AGCWTHD
c) AGCATHD
d) AGCKSYD

A

a) AGC[XWAK][TS][YH]D

23
Q

Como una generalizacion, al hablar de proteinas podriamos decir que:
a) Todos los dominios son motifs, pero no todos los motifs son necesariamente dominios
b) los motifs respondesn a expresiones regulares
c)Ambas opciones son correctas

A

c

24
Q

(V/F) El momentum y el learning rate son sinonimos dentro de lo que son los parametros de aprendizaje dentro de una red neuronal

A

Falso, el learning rate es la tasa o porcentaje qie yo le permito para el ajuste sobre la totalidad que habia que ajustarse, el momentum va ajustando el learning rate dependiendo del error y el leraning rate es que tanto ajustar la red dependiendo del error)

25
Q

Al ejecutar un filtro de calidad sobre un archivo de tipo FASTQC
a) Si la media de calidad no supera el umbral configurado, se eliminan aquellas bases de menor calidad hasta alcanzar la media deseada
b) Si el read no cumple con la media de calidad minima seleccionada, se elimina todo el read
c)Solo pueden ejecutarse filtros de calidad basados en el leght del read

A

b) Si el read no cumple con la media de calidad minima seleccionada, se elimina todo el read

26
Q

Un read dentro de un FASTQC puede tener varios fragmentos de secuencia, ya que se basa en la lectura de las secuencias fraccionadas luego de ejecutar una PCR

A

Falso, un read es una recuencia sola no pueden ser varios fragmentos, lo que si es verdadero es que surgen a partir de una PCR

27
Q

Trimmommatic es una herramienta bioinfomatica para realizar:
a) El apareo entre archivos FASTQC
b)El filtro de los reads dentro de los archivos FASTQC, segun los parametros de calidad seleccionados
c) El ensamblaje de aquellos reads que hayan pasado exitosamente los filtros de calidad ejectuados previamente

A

b)El filtro de los reads dentro de los archivos FASTQC, segun los parametros de calidad seleccionados

28
Q

(V/F) Ante el hallazgo de un valle (o un minimo local) durante el entrenamiento, la red se beneficia en primera instancia (como primer hiperparametro a modificar) de la inclusion de mas neuronas en la/s hiddel layer/s)

A

Falso, ante un valle se modifica el momentum y el learning rate y encima la red no siempre se beneficia de tener mas neuronas en las capas ocultas

29
Q

(V/F) En los workflows construidos con Galaxy no es posible que el output de un mismo step sirva de input para mas de un step posteriores

A

Falso, la salida de un step si es posible usarla para otros steps

30
Q

Los loss function nos habla del algoritmo que se encarga de ajustar los pesos de las aristas de manera retrograda una vez finalizada una ejecucion de un caso de prueba

A

Falso, con los casos de prueba no se ajusta nada es solo para calcular el error y ver como va la red

31
Q

De la IA y las redes neuronales
a) la funccion de activacion de las neuronas de una red de tipo multipercepcion es quien representa el crecimiento de la red
b) Las neuronas son las unidades funcionales que almacenan informacion del aprendizaje de la red
c) El conocimiento se encuentra en los pesos de las aristas

A

C) el conocimiento se encuentra en los pesos de las aristas

32
Q

Del ensamblaje y el secuenciamiento
a) los FASTQC son archivos de texto plano
b) los FASTQC son archivos de texto binario
c) Ninguna de las opciones

A

a) los FASTQC son archivos de texto plano

33
Q

Sobre el diseño de una base de datos relacional:
a) Las PK y las FK son el pilar fundamental de las bases de datos relacionales, sin embargo afectan de manera negativa la performance de las busquedas
b) Al definir una PK en un campo determinado es responsabilidad del desarrollador definir tambien una constrain del tipo unique para evitar datos duplicados
c) Los indices permiten realizar busquedas mas eficientes, sin embargo hay que tener precaucion y elegir correctamente sobre que campos aplicarlos

(PK y FK son primary key y forain key)

A

c
La b es falsa porque al definir una primary key ya es unica asi que no hay que agregar el constrain de unicidad

34
Q

Que hace la siguiente sentencia SQL?
cursor.execute(“UPDATE tabla SET nombre=?, version=?, secuencia=? WHERE id_number=?”,(nombre,version,secuencia, id_number))
a) Actualiza una tabla determinada, con parametros dados por el usuario
b) Actualiza datos entre ellos, una tabla que es parte de los parametros dados por el usuario
c)No hace nada, posee un error de sintaxis

A

a)

35
Q

El siguiente script de SQL que hace?
cursor.execute(“INSERT INTO especie (id_individuo,id_especie) VALUES (?,?,?)”, (id_individuo,id_especie))
a) inserta un id_individuo y un id_especie en la tabla especie
b)inserta una proteina en la tabla especie
c)No hace nada, posee un error de sintaxis

A

c

36
Q

Sonbre los perfiles de proteinas
a) Al construir un perfil de proteinas, debemos reconstruir la matriz de sustitucion, lo cual hace que el algoritmo sea similar
b) Las secuencias no requieren de estar alineadas para poder construir el perfil
c) Las matrices de sustitucion de nucleoricos son un elemento clave
d) Ninguna de las anteriores respuestas es correcta

A

d) Ninguna de las anteriores respuestas es correcta

37
Q

(V/F) La propagacion del ajuste por error se da en la mayoria de los casos de manera retrograda

A

Verdadero