Estadística Flashcards

1
Q

¿Qué es más importante en la recopilación de datos?

A

Calidad de los datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué proceso es crítico para asegurar que los datos estén libres de errores?

A

Limpieza de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué problema puede surgir si los datos están sesgados?

A

Conclusiones erróneas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué son los silos de datos?

A

Departamentos que no comparten información

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué herramienta es útil para visualizar datos sin necesidad de programación avanzada?

A

Tableau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué sector puede verse afectado por la falta de compartir datos entre hospitales y clínicas?

A

Salud

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué proporcionan los informes?

A

Instantáneas de lo sucedido

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué es una limitación de las alertas?

A

No proporcionan soluciones

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué va más allá de los informes y alertas al proporcionar contexto y recomendaciones?

A

Análisis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué nivel de madurez analítica se centra en entender el pasado y el presente?

A

Descriptivo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué nivel de madurez analítica se centra en predecir el futuro basándose en datos históricos?

A

Predictivo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué nivel de madurez analítica se centra en tomar decisiones óptimas basadas en datos?

A

Prescriptivo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es esencial para una organización impulsada por datos?

A

Toma de decisiones basada en datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué empresa es conocida por realizar constantemente experimentos para optimizar sus procesos?

A

Google

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué es crucial para que los analistas comuniquen sus hallazgos de manera efectiva?

A

Contar una historia que resuene con los tomadores de decisiones

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Cuál es un obstáculo común para adoptar una cultura impulsada por datos?

A

Falta de comprensión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿Cómo se puede abordar la falta de habilidades en análisis de datos?

A

Capacitación interna

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Qué es importante para superar la resistencia al cambio en una organización?

A

Involucrar a todos los niveles de la organización

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

¿Qué empresa utiliza datos para recomendar contenido a sus usuarios?

A

Netflix

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

¿Qué empresa utiliza análisis predictivo para gestionar su cadena de suministro?

A

Walmart

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

¿Qué empresa utiliza datos para optimizar las tarifas dinámicas y predecir la demanda?

22
Q

¿Qué es crucial al recopilar datos de usuarios?

A

Obtener el consentimiento del usuario

23
Q

¿Qué debe hacer una organización para proteger los datos de los usuarios?

A

Implementar medidas de seguridad

24
Q

¿Qué no debe hacerse con los datos recopilados?

A

Usarlos para manipular o discriminar

25
¿Qué tipo de gráfico es útil para comparar cantidades entre diferentes categorías?
Gráfico de barras
26
¿Qué biblioteca de Python es útil para crear gráficos estadísticos complejos?
Seaborn
27
¿Qué tipo de gráfico muestra la distribución de un conjunto de datos?
Histograma
28
¿Qué método se utiliza para eliminar valores nulos en un DataFrame de pandas?
dropna()
29
¿Qué técnica se utiliza para rellenar valores nulos con la media de la columna?
fillna()
30
¿Qué técnica se utiliza para detectar valores atípicos en un conjunto de datos?
Rango intercuartílico (IQR)
31
¿Qué técnica se utiliza para convertir variables categóricas en columnas binarias?
Codificación One-Hot
32
¿Qué técnica se utiliza para transformar datos en un rango entre 0 y 1?
Normalización Min-Max
33
¿Qué técnica se utiliza para convertir datos con media 0 y desviación estándar 1?
Estandarización Z-score
34
¿Cuál es la primera etapa del proceso CRISP-DM?
Comprensión del negocio
35
¿Qué etapa del CRISP-DM implica la limpieza y transformación de los datos?
Preparación de los datos
36
¿Qué etapa del CRISP-DM implica la aplicación de algoritmos de aprendizaje automático?
Modelado
37
¿Qué dimensión de la calidad de los datos se refiere a la precisión de los datos?
Exactitud
38
¿Qué dimensión de la calidad de los datos se refiere a la ausencia de valores faltantes?
Completitud
39
¿Qué dimensión de la calidad de los datos se refiere a la coherencia entre diferentes sistemas?
Consistencia
40
¿Qué plataforma es ampliamente utilizada para el procesamiento de grandes volúmenes de datos?
Hadoop
41
¿Qué framework es adecuado para el procesamiento de datos en tiempo real?
Storm
42
¿Qué framework es un híbrido entre procesamiento por lotes y en tiempo real?
Spark
43
¿Qué es un modelo predictivo?
Un modelo que predice valores futuros
44
¿Qué técnica se utiliza para evitar el sobreajuste en los modelos de machine learning?
Validación cruzada
45
¿Qué es el overfitting en machine learning?
Un modelo que se ajusta demasiado a los datos de entrenamiento
46
¿Qué es crucial al utilizar algoritmos en la toma de decisiones?
Asegurarse de que los algoritmos no sean discriminatorios
47
¿Qué es importante al recopilar datos de usuarios?
Obtener el consentimiento informado
48
¿Qué no debe hacerse con los datos recopilados?
Usarlos para manipular a los usuarios
49
¿Qué herramienta es útil para la manipulación y análisis de datos en Python?
Pandas
50
¿Qué herramienta es útil para la visualización de datos en Python?
Matplotlib