Unidad 2 Flashcards

1
Q

Tabla

A

Es un esquema con datos organizados en filas y columnas que se utilizan cuando se quiere describir una distribución de frecuencias de una o varias variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qué permiten las tablas y gráficas?

A

Permiten detectar y describir patrones o tendencias en la distribución de los datos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Contenido de las tablas y gráficas

A
  • Título claro y conciso
  • Nombre de las variables
  • Escala de cada variable
  • Medidas de resumen o pruebas
    estadísticas
  • Nota al pie de página
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Tabla de frecuencia

A

En ella se muestra cómo se distribuyen los valores dentro de intervalos de clase o dimensiones de la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Cómo se grafican las variables cualitativas?

A
  • Gráfico de sectores
  • Diagrama de barras
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Cómo se grafican las variables cualitativas?

A
  • Histograma
  • Tallo y hojas (stem and leaf)
  • Polígono de frecuencias acumuladas
  • Gráfico de caja (box plot, box and whisker plot)
  • Gráficos de dispersión
  • Otros
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Gráfico de sectores

A
  • Presentan distribución.
  • Preferible para variables nominales.
  • Representan la totalidad.
  • Enfatizan proporciones en base al total.
  • Ideales para variables que representan todas las categorías.
  • Uso de “otros” para completar el 100%.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Gráfico de barras

A
  • Presentan distribución.
  • No necesariamente representan la totalidad.
  • Útiles para variables nominales y ordinales.
  • Enfatizan comparación entre categorías medidas.
  • Ideales para comparar frecuencias de las categorías de una variable.
  • Flexibles y fáciles de diseñar a mano.
  • Fáciles de interpretar
  • Pueden ser de diferentes tipos: de barras simples, de barras múltiples o de barras compuestas.
  • En el eje horizontal va la variable con sus modalidades y en el eje vertical va el número o porcentaje de cada uno
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Las medidas que se utilizan para resumir y analizar los datos de las variables cualitativas son

A
  1. Proporción
  2. Razón
  3. Tasa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Proporción (P) o porcentaje

A

Medida que expresa la frecuencia con la que ocurre un evento en relación con la población total.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Como se calcula la proporción?

A

Dividiendo el número de eventos ocurridos (n) entre la población en la que ocurrieron (d).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Razón (R)

A

Medida que expresa la magnitudes de la relación aritmética existente entre dos eventos en una misma población, o un solo evento en dos poblaciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Tasa

A

Medida que expresa la magnitud del cambio de una variable (enfermedad o muerte) por unidad de cambio de otra (usualmente el tiempo) en relación con el tamaño de la población que se encuentra en riesgo de experimentar el suceso.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que expresa el numerador en el calculo de la tasa?

A

El número de eventos sucedidos durante un periodo en un número determinado de sujetos observados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que expresa el denominador en el calculo de la tasa?

A

Expresa el tiempo durante el cual los sujetos estuvieron en riesgo de sufrir el evento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Histograma

A

Es el más común de los gráficos cuantitativos.
* Se utiliza para variables de tipo cuantitativo continuo.
* Presenta la distribución: forma, centro y dispersión!
* Utiliza agrupamientos de valores cercanos para crear clases (intervalos)
* Se diseña utilizando como base los intervalos de una distribución de frecuencia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Polígono de frecuencias

A
  • Se utiliza para las variables de tipo cuantitativo discretas o continuas.
  • Se crea colocando los puntos en medio de cada intervalo de clase, representado sobre el eje horizontal de la gráfica, conectándolos mediante líneas rectas.
  • Tiende a enfatizar la continuidad a lo largo de una escala.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Box-plots: Cajas y bigotes

A
  • Se utiliza para variables cuantitativas continuas y discretas.
  • Presenta la distribución de las variables en base al “resumen de 5 números”:
  • Min, Q1, Mediana, Q3, Max.
  • Permite calcular el RIC (IQR)
  • Excelente para detectar medidas extremas (outliers)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Gráfico de dispersión

A
  • Presenta la asociacion entre valores de dos variables cuantitativas, continuas o discretas (correlación)
  • Permite apreciar la dirección, forma, y fuerza de la asociación.
  • Permite identificar observaciones extremas (outliers).
20
Q

Medidas de resumen cuantitativas: Parámetros estadísticos

A

Sirven para sintetizar la información dada por una tabla o una gráfica.

21
Q

Tipos de medidas de resume

A
  • De centralización (Media, mediana y moda)
  • De dispersión (Desviación estándar, varianza, coeficiente de variación y rango)
  • De posición (Cuártales, quintiles, perceptibles y rango intercuartilo)
22
Q

Distribución normal (Campana de Gauss)

A

Representa la forma en la que se distribuyen en la naturaleza los valores numéricos de las variables continuas.

23
Q

Asimetría

A
  • Simétrica
  • Asimétrica
    * Positiva (cola a la derecha)
    * Negativa (cola a la izquierda)
24
Q

Curtosis

A
  • Leptocúrtica (estrecha)
  • Mesocúrtica (moderada)
  • Platicúrtica (ancha)
25
Q

Medidas de tendencia central nos indican…

A

Hacia donde se inclinan o se agrupan más los datos

26
Q

Media aritmética

A
  • Es el valor promedio de la distribución.
  • El valor se obtiene al sumar todos los datos y dividir el resultado entre el número
    total de datos.
27
Q

Ventajas e inconvenientes de la media

A
  • Viene expresada en las mismas unidades
    que la variable.
  • En su cálculo intervienen todos los valores de la distribución.
  • Es el centro de gravedad de toda la distribución, representando a todos los valores observados.
  • Es única.
  • Suprincipalinconvenienteesqueseve afectada por los valores extremadamente grandes o pequeños de la distribución.
28
Q

Mediana (Me)

A
  • Es la puntuación de la escala que separa a las mitades superior e inferior de la distribución (es decir, divide la serie de datos en dos partes iguales).
  • Sólo se puede calcular para variables cuantitativas.
29
Q

Ventajas e inconvenientes de la mediana

A
  • Es la medida más representativa en el caso de variables que solo admitan la escala ordinal.
  • Es fácil de calcular.
  • En la mediana solo influyen los valores centrales y es insensible a los valores extremos u “outliers ”.
  • En su determinación no intervienen todos los valores de la variable.
30
Q

Moda (Mo)

A
  • Es el valor más repetido en una distribución.
  • Es posible encontrar la moda de variables cualitativas y cuantitativas.
  • Si dos puntuaciones tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes
31
Q

Qué tantas modas puede tener un grupo de datos?

A
  • No moda (todas las puntuaciones tiene la misma frecuencia)
  • Una moda (unimodal)
  • 2 modas(bimodal)
  • 3+ modas(multimodal)
32
Q

Ventajas e inconvenientes de la moda

A
  • Su cálculo es sencillo.
  • Es de fácil interpretación.
  • Eslaúnicamedidade posición central que puede obtenerse en las variables de tipo cualitativo.
  • Ensudeterminaciónno intervienen todos lo valores de la distribución.
33
Q

Medidas de dispersión

A

Son esenciales para conocer hasta qué punto se encuentran dispersas las observaciones en relación con la media.
Miden la distancia entre los datos, considerados en conjunto.
Miden la variabilidad de un conjunto de datos.

34
Q

Que pasa con la medida de dispersión y los datos?

A

Si los valores de los datos son parecidos, las medidas de dispersión tienen valores pequeños.
Si los datos son muy diferentes entre sí, tienen valores grandes.

35
Q

Rango o recorrido

A

Es la diferencia entre los valores máximo y mínimo de los datos observados.

36
Q

Ventajas del rango

A
  • Relativamente sencilla de calcular.
  • Fácil interpretación
37
Q

Desventajas del rango

A
  • Considera sólo los valores extremos de un conjunto.
  • No proporciona mayor información respecto a los demás valores del mismo
  • Limitada utilidad para los distintos tipos de análisis estadísticos
38
Q

Desviación media

A

Es el promedio de las distancias (o diferencias) entre todas las observaciones y la media aritmética.

39
Q

Varianza (muestral)

A

Mide la dispersión de los datos alrededor del valor medio.
* Cuanto mayor es la varianza, mayor resulta la variabilidad.
* Cuanto menor es, más homogénea resulta la distribución.

40
Q

Desviación estándar

A

Es la raíz cuadrada positiva de la varianza.
Mide la variabilidad de los datos en las unidades en que se midieron originalmente.

41
Q

Coeficiente de variación (CV

A

Se utiliza para comparar la dispersión entre variables.
Es la razón entre la desviación típica (DE) y el valor de la media aritmética (Ẍ).
Se representa en porcentaje

42
Q

Medidas de posición: N-tiles

A

Se trata de un grupo de medidas descriptivas que divide al conjunto de datos en una cantidad determinada de grupos que tienen el mismo (o casi el mismo) número de datos.

43
Q

Terciles

A

2 parámetros que dividen al conjunto de datos en 3 partes iguales
* 33.3%-66.7%

44
Q

Cuartiles

A

3 parámetros que dividen al conjunto en 4 partes iguales
* 25%-50%-75%

45
Q

Quintiles

A

4 parámetros que dividen al conjunto en 5 partes iguales
* 20%-40%-60%-80%

46
Q

Deciles

A

9 parámetros que lo dividen en 10
* 10%-20%-30%-40%-50%-60%-70%-80%-90%

47
Q

Rango Interquartil (RIC o IQR)

A

diferencia entre el primero y el tercer cuartil es el recorrido intercuartílico:
* RIC = Q3 − Q1.
* Abarca 50% de los datos centrales.