3. Análisis estadístico Flashcards
-Análisis univariado y bivariado -Medidas de tendencia central: media, mediana, moda, parámetros de posición -Medidas de dispersión: rango o recorrido, desviación media, varianza, desviación típica o estándar, rango intercuartílico, coeficiente de variación -Medición de ocurrencia del desenlace: incidencia (incidencia acumulada), prevalencia, proporción caso – control, tasa. -Frecuencias y porcentajes: número, razón.
Análisis según las variables
Univariado: una sola variable
Bivariado: dos variables
Multivariado: tres o mas variables
Es la manera más simple de analizar datos, tiene el propósito de describir. Toma los datos, los resume y encuentra patrones
Análisis univariado
Son medidas de tendencia central
Media aritmética, mediana y moda
Son medidas de dispersión
Rango, varianza, máximo, mínimo, cuartiles, rango intercuartílico, desviación estándar.
En el análisis bivariado:
Se miden 2 variables en una sola unidad de observación para establecer la relación
- Es útil para predecir cuando va a ocurrir un evento
- -NO es lo mismo que el análisis simple de dos datos
Para qué sirven las medidas de tendencia central
PAra ubicar como se distribuyen los datos obtenidos
Es la medida de tendencia central más utilizada
Media aritmética se representa con una X testada
Es otra manera de llamar a la media airtmetica
El promedio de un grupo de datos
A qué es sensible la media aritmética
A VALORES EXTREMOS
Qué es la mediana?
Es el valor que divide la distribución por la mitad.
Refleja la posición intermedia de la distribución
50% abajo y 50% arriba
Cuándo es útil la mediana?
Cuando hay valores extremos en la distribución
Como se calcula la media en numeros nones
(numero de casos + 1 ) / 2
Como se calcula en numeros pares
(n/2)+(n/2+1) esto entre 2.. se toman los dos numeros y se dividen enrte 2
Qué es la moda?
Es la categoría o puntuacuón que ocurre con más frecuencia.
Como es un parametro de sesgo positivo
no es simetrica, la cola larga queda a la derecha y la
MEDIA es mayor que la MEDIANA (o sea el promedio es mas que la posicion intermedia de distribucion de datos)
Como es una curva sesgada de manera negativa
La cola izquierda es larga. El promedio (MEDIA) es menor que la MEDIANA (posicion intermedia de la distribución de datos).
Entonces lo que define el sesgo a la izquierda o derecha es
la media aritmetica (NOO MEDIANA ok)
Son parámetros de posicion
Cuantiles, percentiles, cuartiles, deciles
Qué son los cuantiles
Son medidas de dispersion que permiten reconocer otros puntos característicos en la distribución que no son centrales:
- Percentiles
- Cuartiles
- Deciles
- Quintiles
Como dividen los cuartiles a la muestra
Q1= Primer cuartil= Percentil= Cuantil 0.25
Q2=Segundo cuartil= Percentil 50= cuantil 0.5= mediana
Q3= Tercer cuartil= Percentil 75= cuantil 0.75
Son medidas de dispersion
Rango, desviacion media, varianza, desviacion estandar, rango intercuartilico, coeficiente de variación
Qué es la desviación media
Es la MEDIA aritmética de los valores absolutos de lo que se desvía cada valor respecto a la media
Como calculas la desviacion media
Primero sacas la media Despues restas cada numero menos la media y sumas el total de numeros dejas todo en numeros positivos lo divides y queda el resultado
Como se expresa la desviacion media
COMO los datos originales
Qué es la varianza
Mide la dispersión de los datos de una muestra calculando la media de los cuadrados de las distancias de todos los datos
Es la desviación estándar elevada al cuadrado
Varianza
Cómo se simboliza la varianza?
Como s^2.
A qué es sensible la varianza
a todos los puntajes en una distribución
Como se calcula diferente la muestra
Depende si los datos son de una muestra (n minuscula)
o si son de una población (N mayuscula)
Cuanddo se trata de una poblacion la simbolizacion de varianza es
sigma^2 al cuadrado para población
Qué simboliza mu?
La media de la población
Qué mide la desviación estandar?
El promedio de desviación de las puntuaciones respecto a la media
Cómos e le conoce a la desviación estándar
Desviación típica
Como se representa la desviacion estandar=
con s o sigma (NO VAN al cuadrado porque son la raiz cuadrada de la varianza
Si sacas la raíz cuadrada de la varianza se obtiene..
la desviación típica o estándar
Qué es el rango
Es la diferencia entre la puntuación mayor y menor
Indica la extensión total de los datos en la escala
De qué otra manera se le conoce al rango
Como recorrido
QUé incrementa el rango?
Malores extremos
POr qué el rango es poco sensible?
Porque 2 sets de datos diferentes pueden tener el mismo rango
1 1 1 1 9 vs 1 3 5 7 9
Qué es el rango intercuartílico
Es la diferencia entre el tercer y primer cuartil de un conjunto de datos
RI= P75-P25= Q3-Q1
QUé pasa con el rango intercuartílico cuando es pequeño
valores muy concentrados aalrededor de la mediana
Qué pasa con el rango intercuartílico cuando es grande
Hay una gran dispersión
Cómo se calcula el Rango intercuartilico
Ordenas numeros de menos a mas
multiplicas 0.25 por el numero de datos y aproximas al entero mayor
Multiplicas 0.75 por el numero de datos y aproximas al entero mayor
restas los rangos
Qué es el coeficiente de variación
Se usa para comparar la variabilidad o dispersión en conjutnos de datos con diferentes unidades de medida (para ver si los datos son homogéneos o heterogéneos) e.g. cariabilidad de la estatura y eso de una población
QUé unidades de medida usa el Coeficiente de Variación
No tiene unidades de medida
Es el resultado de la desviación estándar entre la media
Coeficiente de variación
Cómo se calcula el coeficiente de variación
La desviación estándar/ media
es igual si es poblacion o muestra pero cambia la simbologia
Formula de VC cuando es una población
sigma entre mu y al final se multiplica por 100
Formula de VC cuando es muestra
s/ media aritmetica y al final se multiplica por 100
Medición de ocurrencia del desenlace
Son la incidencia, prevalencia, proporcion caso- control y tasa
Qué es la inciedntcia?
El numero de casos nuevos que se presentan en una población en un tiempo determinado
Qué diferencia hay entre la incidencia acumulada y la dnesidad de incidencia
en la densidad se contabiliza el tiempo de exposiicón, mide la velocidad con la que se desarrolla una enfermedad
Qué es la prevalencia
Mide la proporción de personas que se encuentran enfermas al momento de evaluar el padecimiento en la población, no hay tiempo de seguimiento
P=A/A+B (enfermos/ Enfermos+sanos)
-QUé es una tasa
Relacion entre el numero de casos de una categoría y el número total de observaciones multiplicada por un múltiplo de 10 .
Comos e calcula la tasa
numero de eventos entre numero de eventos posible al final x 1000
Qué son las frecuencias
La cantidad de veces que se repite un valor de la variable
QUé es la razon
Es la relación entre dos categorías, donde el numerador no escá incluido en el denominador.