Estadistica Descriptiva Flashcards

1
Q

Qué es estadística descriptiva

A

Es el conjunto de técnicas que facilitan la organización, resumen y comunicación de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Dentro de la estadística descriptiva se incluyen

A

1- Representación gráfica.

2- Síntesis de los datos.

3- Asimetría y curtosis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qué es la representación gráfica

A

La representación gráfica de los datos obtenidos en cualquier estudio facilita un análisis visual.

Según la naturaleza de las variables estudiadas, se utilizan diferentes tipos de representaciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que representaciones gráficas que utilizaremos para las variables cualitativas

A

1- Para las variables cualitativas, se emplean dos representaciones gráficas.

2- En ambos casos, se debe cumplir el principio de proporcionalidad de las áreas a las frecuencias absolutas:

  • Diagrama de barras: Los diagramas de barras tienen una base constante y una altura proporcional a la frecuencia absoluta correspondiente (también su área lo es a la frecuencia absoluta).
  • Diagramas sectorial o pastel: El ángulo central es proporcional a la frecuencia absoluta correspondiente, por lo que también lo es su área.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Cuáles son las representaciones gráficas que se utilizan en las variables cualitativas

A
  • Diagrama de barras.

- Diagramas sectorial o pastel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qué representación gráfica utilizamos en las variables cuantitativas discretas o no continuas

A

1- Variables cuantitativas discretas: Por ejemplo el número de episodios de asma, el número de hijos, número de mascotas.

2- Utilizaremos el diagrama de barras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qué es el diagrama de barras

A

1- Es un diagrama, sobre el valor que puede tomar la variable, se levante una barra cuya altura mira exactamente la frecuencia absoluta del valor.

2- También es posible representar la frecuencia relativa y/o los porcentajes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qué representación gráfica utilizaremos para las variables cuantitativas continuas

A

1- Variable Cuantitativa continua: por ejemplo la glucemia, la talla, el peso.

2- En esta variable se puede utilizar el histograma y el polígono de frecuencias.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qué representación gráfica se puede usar en las variables cuantitativas continuas

A

1- Histograma.

2- Polígono de frecuencia.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qué es el histograma

A

1- Es un gráfico que está formado por rectángulos adyacentes que tienen por base cada uno de los intervalos, y por altura las frecuencias absolutas.

2- La superficie de cada rectángulo es proporcional a la frecuencia de cada una de las clases, y el área total lo será al número de individuos en la muestra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qué es el polígono de frecuencias

A

Es una línea quebrada que une los puntos medios de las barras superiores de los rectángulos del histograma.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Síntesis de los datos en la estadística descriptiva

A

Para la síntesis de los datos usamos:

1- Medidas de localización o tendencia central.

2- Medidas de dispersión o variabilidad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Cuáles son las medidas de localización o tendencia central

A

Las medias de centralización indican alrededor de qué valores se agrupan los datos observados, se distinguen los siguientes:

1- Media aritmética.

2- Mediana.

3- Moda.

4- Parámetros de posición.

5- Media geométrica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qué es la media aritmética

A

1- Es una medida de localización o tendencia central.

• Es la medida de centralización más común.

2- Se calcula sumando los valores numéricos de todas las observaciones y dividiendo el total por el número de observaciones.

3- La media aritmética verifica la propiedad de equilibrar las desviaciones positivas y negativas de los datos respecto a su valor.

• Actúa por lo tanto como centro geométrico centro de gravedad para el conjunto de puntos puntos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cuál es la fórmula de la media aritmética

A

x= Suma de los valores numéricos de todas las observaciones/total del número de observaciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cuál es la medida de centralización más común

A

La media aritmética o promedio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qué es la mediana

A

1- Es una medida de localización o tendencia central.

2- Es el valor numérico que divide al conjunto de datos ordenados en dos partes iguales, es decir, el 50% de los datos será menor que ella y el resto, mayor.

3- En una distribución simétrica, la mediana coincide con la media aritmética, pero no así en una asimétrica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qué es la moda

A

1- La moda es una medida de localización o tendencia central.

2- Es el valor más corriente o el valor de la variable que se presenta con mayor frecuencia.

3- Puede existir distribuciones con más de una moda.

4- Puede tomar varios valores diferentes dentro de una misma distribución.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qué son los parámetros de posición

A

1- Son medidas de localización o tendencia central.

2- Suelen ser: cuartiles, deciles, percentiles. Son valores que dividen el conjunto de las observaciones en 4, 10 o 100 partes iguales, respectivamente.

• Por ejemplo: Q2 = D5 = Pc50 = mediana.

Es decir: El 50% de las observaciones será inferior al segundo cuartil, quinto decil o percentil 50.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qué es la media geométrica

A

1- Es una medida de localización o tendencia central.

2- Muy utilizado en microbiología y serología, cuyos datos tienen una marcada asimetría positiva es decir hacia la derecha.

3- Por ejemplo: títulos de anticuerpos.

21
Q

Aunque desde un punto de vista puramente descriptivo, las medidas descentralización proporcionan información complementaria, pero sus propiedades son muy distintas, cuáles son las propiedades de la media aritmética

A

1- La media aritmética utiliza todos los datos y es, por lo tanto, preferible si los datos son homogéneos.

2- Tiene el inconveniente de que es muy sensible a observaciones atípicas, y un error de datos o un valor anormal puede modificarla totalmente.

22
Q

Propiedades de la mediana

A

1- Por el contrario la mediana emplea menos información que la media, ya que sólo tiene en cuenta el orden de los datos y no su magnitud.

2- En contrapartida, no se ve alterada si una observación (o en general, una pequeña parte de observaciones) es extrema o contiene errores grandes de medida o de transcripción.

23
Q

En consecuencia y respecto a las características de la media aritmética y de la mediana se puede concluir que:

A

Siempre es recomendable calcular la media y la mediana, puesto que ambas medidas de pedirán mucho cuando la distribución sea muy asimétrica, lo que sugiere heterogeneidad de los datos.

24
Q

Cuáles son las medidas de dispersión o variabilidad

A

1- Rango o recorrido.

2- Desviación media.

3- Varianza.

4- Desviación típica o estándar.

5- Rango intercuartilico.

6- Coeficiente de variación o CV.

25
Q

Qué son las medidas de dispersión o variabilidad

A

Junto a las medidas de tendencia central, las medidas de dispersión o variabilidad completan la información sobre la distribución de la variable, indican si los valores de la misma están muy dispersos o se concentran alrededor de la medida de centralización.

26
Q

Qué es el rango o recorrido

A

Es una medida de dispersión o variabilidad.

Diferencia entre el valor máximo y el valor mínimo observado en una serie.

R= max - min.

27
Q

Qué es la desviación media

A

Es una medida de dispersión o variabilidad.

Es la media de las desviaciones respecto a la media aritmética.

28
Q

Qué es la varianza

A

La varianza es la medida del cuadrado de las desviaciones de los elementos respecto a la media aritmética.

Es una medida de dispersión o variabilidad.

29
Q

Qué es la desviación típica o estándar

A

1- Es una medida de dispersión o variabilidad.

2- Se define como la raíz cuadrada positiva de la varianza.

3- Es, junto con esta, la medida de dispersión más utilizada.

4- La desviación típica es una medida complementaria de la media aritmética; mientras que está da una idea de la magnitud general de la distribución, la desviación estándar muestra cómo se distribuyen los valores alrededor de la media.

30
Q

Qué es el rango intercuartilico

A

1- Es una medida de dispersión o variabilidad.

2- Es la diferencia entre el percentil 75 y el percentil 25.

3- Es junto con el rango, la medida de dispersión que se utiliza para los datos asimétricos.

31
Q

Qué medidas de dispersión o variabilidad utilizamos para los datos asimétricos

A

1- Rango intercuartilico .

2- Rango o recorrido

32
Q

Qué es el coeficiente de variación

A

1- El C.V. es una medida de dispersión o variabilidad.

2- Es una medida de dispersión adimensional. Se define como el porcentaje que representa la desviación estándar sobre la media.

3- Es el método de elección para comparar la variabilidad o dispersión relativa de variables que estén expresadas en las mismas o en diferentes unidades.

33
Q

Cuál es la fórmula del coeficiente de variación

A

CV= s/x x 100

34
Q

Qué medidas descentralización y medidas de dispersión utilizaré en una distribución homogénea

A

Si tengo una distribución homogénea, utilizaré como medida de centralización la media y como medida de dispersión la desviación típica o estándar.

35
Q

Si tengo una distribución asimétrica, qué medida de descentralización y qué medida de dispersión utilizaré.

A

Distribución asimétrica: usaré como medida de centralización la mediana, y como medida de dispersión utilizaré el rango intercuartilico.

36
Q

Cuáles son las propiedades de la media y la varianza

A

1- Si a todos los valores de una distribución se le suma una constante, su media queda aumentada en ese valor, mientras que su varianza no se modifica.

2- Si a todos los valores de una distribución se les multiplica por una constante, su media y su desviación típica quedan multiplicados por la constante, mientras que su varianza queda multiplicada por el cuadrado de esa constante.

37
Q

Cómo calculamos la asimetría

A

1- Para calcular la asimetría, una posibilidad es utilizar el coeficiente de Fischer.

2- El coeficiente de Fischer se representará como g1.

3- Según sea el valor de g1, se dirá que la distribución es asimétrica a derechas o positiva, a izquierdas o negativa, o simétrica, es decir:

  • Si g1 > 0: la distribución será asimétrica positiva o a derechas, es decir desplazada hacia la derecha.
  • Si g1 < a 0: la distribución será asimétrica negativa o a izquierdas, es decir desplazada hacia la izquierda.
  • Si g1 = 0: la distribución será simétrica.
38
Q

Qué es curtosis o apuntamiento

A

1- Es una medida que determina el grado de concentración que presentan los valores en la región central de la distribución.

2- Por medio del coeficiente de curtosis es posible identificar:

  • si existe una gran concentración de valores, leptocurtica.
  • si existe una concentración normal, mesocurtica.
  • si existe una baja concentración, platicurtica.

3- El coeficiente de curtosis se representa con el valor de g2.

39
Q

Cómo se interpreta el valor de g2 dos que representa al coeficiente de curtosis

A

1- Si g2 = 0: entonces la distribución es mesocurtica.

2- Al igual que la asimetría, es bastante difícil encontrar un coeficiente de curtosis de cero, por lo que se suele aceptar los valores cercanos a +/- 0,5 aproximadamente.

  • Si g2 > 0: la distribución será leptocurtica.
  • Si g2 < 2: la distribución será platicurtica.
  • Si g2 =0: la distribución será un mesocurtica.
40
Q

Cuando en la distribución de datos se denomina curva normal

A

Cuando la distribución de datos tiene un coeficiente de asimetría ( g1= +/- 0,5) y un coeficiente de curtosis (g2= +/- 0,5), se denomina curva normal.

41
Q

Ideas claves sobre la forma de representación gráfica

A

La forma de representación gráfica va a depender del tipo de variable:

1- Para las cualitativas y las cuantitativas discretas: se emplea el diagrama sectorial y el diagrama de barras.

2- Para las cuantitativas continuas: se utiliza el histograma y el polígono de frecuencia.

42
Q

Que se necesita para definir correctamente una variable en una muestra idea clave

A

1- Para definir correctamente una variable en una muestra, se necesitará un parámetro que sirva para aglutinar todos los valores de dicha muestra y otro que sirva para informar de los agregados o no que están los valores.

  • El parámetro que sirve para aglutinar todos los valores de dicha muestra es el parámetro de tendencia central.
  • El parámetro que sirve para informar de los agregados o no que están los valores es el parámetro de dispersión.
43
Q

Cuál es el tipo de distribución más frecuente

A

1- El tipo de distribución más frecuentes es la normal o de Gauss, que es simétrica.

2- En distribuciones simétricas acuérdate que se usará como parámetro de tendencia central la media, y de dispersión, la desviación típica.

44
Q

Qué parámetros se utilizan en las distribuciones asimétricas

A

1- Se emplea la mediana como parámetro de tendencia central.

2- Y el rango se utiliza como parámetro de dispersión

45
Q

En la distribución de Gauss qué es lo que coincide

A

En la distribución de Gauss, mediana, media y moda coinciden en el mismo valor.

46
Q

Qué es el coeficiente de variación

A

1- El coeficiente de variación es el parámetro que se emplea para decir si una distribución es homogénea o dispersa.

2- Además, informa de cual de entre dos distribuciones tiene una mayor variabilidad o dispersión.

3- Utilidad:

  • Establecer relación entre el tamaño de la media y la variabilidad de la variable.
  • Establecer comparaciones entre distintos casos por ejemplo Comparar la dispersión relativa del peso y talla de un grupo de sujetos.

4- También se llama coeficiente de variación de Spearman.

47
Q

qué es lo que la asimetría de una distribución mide

A

La simetría de una distribución mide la desviación “horizontal” desde la curva normal.

48
Q

Que mide la curtosis

A

Mide el apuntamiento de una distribución