Tema 2: Tratamiento y cuidado de bases de datos Flashcards
Tratamiento y cuidado de bases de datos
La función mutate():
Genera una variable nueva.
La función mutate() nos permite generar una variable nueva a partir de contenido propio de la base de datos —como al calcular una variable «total» de un cuestionario—.
Si quiero cargar un archivo de SPSS usaré la función…
read_sav.
Relaciona…
A. recode()
B. na.omit()
C. summarise()
D. summary()
A. Función para recodificar
B. Función para eliminar valores
perdidos
C. Función para pedir estadísticos de
una columna
D. Función para pedir un resumen de
estadísticos de una base de datos
La siguientes líneas de código…
bbdd
summarise(Media = mean(long),
Varianza = var(long), Máximo = max(long), Mínimo = min(long))
Le falta el conector pipe.
Estas líneas de código tienen un problema, les falta el conector pipe %>% sin el cual lo único que haríamos sería llamar a la base de datos de la primera línea.
La siguiente línea: names(bbdd) <- c(id,long,sup,dosis)…
Da error pues faltan los “ “ en cada nombre
Esta línea nos permite cambiar los nombres de la variable pero solo si los nombres están entrecomillados.
La función str(bbdd):
Devuelve la estructura del objeto.
La función str nos informa del contenido de una lista u objeto. Esto nos puede servir para referenciar la parte que necesitamos extraer.
Relaciona…
A. rep(c(1,4), 2)
B. rep(1,4)
C. seq (1,4)
D. rep (4,1)
A. 1414
B. 1111
C. 1234
D. 4
Si quiero eliminar los sujetos con valores perdidos usaré la función:
na.omit()
La función na.omit() es la que elimina los sujetos con valores perdidos.
Si utilizo la función group_by():
Puedo pedirle al programa que ejecute una función a cada grupo.
La función group_by permite ejecutar lo que queramos a cada grupo por separado.
Si quiero seleccionar un grupo de personas mayores a 25 años en la variable edad…
Usaré un filtro con la función filter() especificando edad > 25.
La primera opción > 25 es la que selecciona los sujetos mayores de 25 años. Si fuese < 25 escogería a los menores de dicha edad. El conector lógico == solo escogería a los que tuvieran exactamente 25 y != a los que no tuviesen 25.