Segundo Parcial Flashcards
BIOESTADÍSTICA
Son la materia prima de la estadística, estos pueden ser números.
Dos tipos:
- el que se obtiene de MEDICIONES (de estudios)
- el que se obtiene de CONTEOS (de pacientes)
DATOS
los datos rutinariamente están rutinariamente disponibles en diferentes fuentes
Fuentes de datos
Registros de pacientes en hospitales, registros administrativos o bien financieros.
(En cajas, archivos)
Registros rutinarios
Son registros de información dirigida que se puede obtener por ejemplo de los pacientes que acuden a los servicios.
Encuestas
Características de los objetos de estudio que tienen valores que pueden medirse o clasificar
- Variable cualitativa
- Variable cuantitativa
VARIABLES
Mutuamente excluyentes. No asignan un orden o jerarquía. Ej: - Religion - Grupo sanguíneo: A, B y O. - Sexo: hombre y mujer. - Raza: blanco, negro y latino.
VARIABLE NOMINAL
Establecen un orden, puede ser creciente o decreciente.
No existe un intervalo número entre las categorías.
Ej:
- escolaridad: primaria, secundaria, bachillerato, etc.
- riesgo del caídas alto, medio y bajo
VARIABLE ORDINAL
Es aquella que toma valores aislados, es decir, no admite valores intermedios entre dos valores específicos.
Ej: el número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
- Edad
VARIABLE CUANTITATIVA DISCRETA
Es aquella que puede tomar valores comprendidos a entre dos números.
Ej: la altura entre los 5 amigos.
1.73, 1.82,
- Variable cuantitativa Continúa de razón: temperatura ambiental.
- Variable Cuantitativa continua de intervalo: temperatura corporal (porque no se toma en cuenta el 0).
VARIABLE CUANTITATIVA CONTINUA
Es una colección de entidades, por lo general son personas. Se puede definir como la colección más grande de entidades de interés en un momento en particular.
Pueden ser de dos tipos:
- FINITAS: población con un número ….
POBLACIÓN
Se puede definir como una parte de la población.
Porcentaje adecuado para obtener una muestra: 30%.
Si es menor no es válido aplicarlo a todos.
MUESTRA
Es el valor que tendría los datos de una serie numérica si ellos fueran de igual valor.
Fórmulas x= sumatoria de X / n.
MEDIA
Es la raíz cuadrada de la varianza. A su vez, la varían a equivale al promedio de las desviaciones o diferencias cuadráticas de cada valor de una serie con respecto al promedio de dicha serie.
Fórmula: s= raíz de sumatoria (x-x)2 diferencias cuadráticas / n
Procedimiento:
1. Para obtener el promedio de la serie de valores. Si la serie es simple se debe ocupar la fórmula: x= sumatoria X / n.
- Calcular la diferencia o desviación de cada valor en relación con el promedio de la serie; es decir obtener una serie de valores (x-x).
Ej: Que tanto se alejan o dispersan los niños con respecto a la media.
VARIANZA: La sumatoria entre las diferencias cuadráticas sobre n.
Desviación estándar: sacar raíz cuadrada a la varianza.
DESVIACIÓN ESTÁNDAR
CV= S/X
Coeficiente de variabilidad
La interpretación esta condicionada a la suposición de
que los valores tienen una distribución semejante a la curva normal
Interpretación:
Ejemplo de interpretación:
Se sabe que el 68.27 % de los valores de una serie que se distribuye
como la curva normal están agrupados alrededor del promedio si a éste
se le resta una vez y también se le suma una vez al valor calculado para
la desviación estándar.
Por lo tanto se puede decir que el 68.27 % de los niños tuvieron pesos
que fluctuaron desde 8.807 kgrs (9.285 menos 0.478 kgrs) hasta 9.763
kgrs (es decir: 9.285 más 0.478 kgrs).
Medidas de resumen para variables cuantitativas
en series agrupadas :
Moda y Amplitud,
Mediana,
Media ó Promedio y
Desviación Estándar
Medidas de resumen para variables cuantitativas
en series agrupadas :
Para agrupar un conjunto de observaciones se debe
seleccionar un conjunto de intervalos continuos que no se traslapen, para que cada valor en el conjunto de
observaciones pueda ser puesto en uno y sólo uno de los intervalos. Estos intervalos normalmente se identifican como
“intervalos de clase”
¿En Cuántos intervalos se deben incluir los datos?
Los expertos recomiendan no menos de 6 y no mas de 15 por que se pierden datos o bien no fueron resumidos
adecuadamente.
Se utiliza la fórmula de Sturges la cual se considera como una guía ya que no es definitiva.
Se enuncia así:
k = 1 + 3.322 (log10n)
Suponga que una muestra tiene 275 observaciones para
agrupar, si se aplica la formula entonces:
k = 1+ 3.322 (log de 275)
k = 1+ 3.322 (2.4393)= 9
Por lo que se utilizaran 9 intervalos de clase
Se enuncia así:
k = 1 + 3.322 (log10 n)
Suponga que una muestra tiene 275 observaciones para agrupar, si se aplica la formula entonces:
k = 1+ 3.322 (log de 275)
k = 1+ 3.322 (2.4393)= 9
Por lo que se utilizaran 9 intervalos de clase
Otra pregunta que se debe de responder se refiere a la amplitud del intervalo de clase. Los intervalos de clase generalmente deben ser de la misma amplitud, aunque algunas de las veces esto es imposible. La amplitud se determina dividiendo el rango R( el rango es la diferencia entre la observación más pequeña y la más grande dentro de un conjunto de datos), entre el intervalo k que es el número de intervalo de clase.
Se utiliza la siguiente formula:
w=R / k
Ejemplo: k = 1 + 3.322 (log10 n) Suponga que una muestra tiene 169 observaciones para agrupar, si se aplica la formula entonces: k = 1+ 3.322 (log de 169) k = 1+ 3.322 (2.27886705)= 8
Se utiliza la siguiente formula:
w=R k
w= R / k = 65 -18 / 8= 47 / 8 = 5.875 = 6
Es el valor que en una serie agrupada que se repite con mayor frecuencia.
Procedimiento: Se identifica la clase o intervalo con mayor frecuencia (Clase Modal) y en segundo lugar utilizar la siguiente formula:
MODA
Es la diferencia entre el mayor centro de clase y valor menor centro de clase de una serie agrupada.
Amplitud
Encontrar, por sustracción o resta, la diferencia entre el centro de clase más grande de la serie (x max) y el centro de clase más pequeño (x min).
Procedimiento
La diferencia entre el mayor y el menor es de 50”.
Interpretación
En una serie de valores agrupados en clases o intervalos, es aquel valor que divide en dos partes de igual tamaño a toda la serie; dicho de otra manera, es el valor por detrás del cual queda un 50% de los valores y por delante del cual queda el 50 % restante.
Procedimiento: En primer lugar, analizando una columna con porcentajes acumulados (como la columna E de la tabla anterior), identificar la clase en la que se acumula el 50 % de las observaciones. (identificación de la clase que contiene a la mediana).
Donde:
Md = Percentil a calcular.
L.Inf = Limite inferior de clase que contiene la media.
n = Número total de valores de la serie.
p = percentil buscado (en este caso 50)
FA = Frecuencia acumulada de la clase anterior a la que
contiene a la media.
tp = frecuencia simple de la clase que contiene a la media W = ancho de la clase que contiene a la media.
Mediana
Es el valor que tendría los datos de una serie agrupada numérica si ellos fueran de igual valor.
MEDIA o promedio
: Es la raíz cuadrada de la varianza. A su vez, la varianza equivale al promedio de las desviaciones o diferencias cuadráticas de cada valor de una serie con respecto al promedio de dicha serie.
Desviación estándar
Son los datos graficados mediante un histograma cuyo perfil de distribución semeja una campana. Esta distribución se le conoce con el nombre de Curva de Distribución Normal o llamada Campana de Gauss en reconocimiento a el matemático Carl Friedich Gauss. (1777-1855).
Características:
- El área total que se encuentra por debajo de la curva de la campana y por encima del eje horizontal es igual a 1.
- Su distribución es simétrica y la media la divide en dos partes iguales: 50 % a la derecha y 50 % a la izquierda.
- Cuando en el eje horizontal se traza una perpendicular, que llegue hasta donde la curva cambia de cóncava a convexa, la distancia desde la media hasta la perpendicular es igual a la desviación estándar.
- Existe una distribución diferente para cada valor de media y de desviación estándar.
- La curva teórica de una distribución normal va desde - hasta +
- Si en el eje horizontal, a cada lado de la media trazamos perpendiculares a una desviación estandar de la media el valor es del 68 %, a dos desviaciones estándar es aproximadamente 95 % y a tres es de 99.7 % del área total.
Curva de la Normalidad
✓Eje de las ordenadas “x” horizontal y las abscisas “y” vertical
✓Se realiza con un trazo continuo
✓Coinciden valores de media, moda y mediana
✓Es simétrica
✓Es asintótica
✓Es insesgada
✓La media siempre se considerará con valor de 0
✓El total bajo la curva vale 1 como probabilidad del total de valores
CARACTERÍSTICAS DE LA CURVA NORMAL
Es el grado de asimetría (DISTRIBUCIÓN) una serie de datos.
Una curva insesgada tiene sesgo cero.
Medimos en cuánto se aleja la distribución de una insesgada:
Si el polígono de frecuencias tiene la mayor acumulación a la izquierda, tiene sesgo positivo o a la derecha.
Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo negativo o a la izquierda
SESGO
Coeficiente de Asimetría
Sesgo
=0. No hay sesgo. La distribución es insesgada
>0. La distribución tiene sesgo positivo o a la derecha.
<0. La distribución tiene sesgo negativo o a la izquierda.
Sesgo
Simetría
Relación
Simétrica o insesgada
Moda = Mediana = Media
sesgo positivo o a la derecha
Moda > Mediana > Media
sesgo negativo o a la izquierda
Moda < Mediana < Media
Simetría - relación
Mayor acumulación a la izquierda La cola más larga a la derecha
Sesgo Positivo (a la derecha)
Mayor acumulación a la derecha La cola más larga a la izquierda
Sesgo Negativo (a la izquierda)
Definición: La curva debe ser simétrica y con sesgo de cero con relación a la media. Es un estimador del sesgo poblacional.
Sesgo
Sesgo < cero inclinada a la derecha.
Sesgo = cero curva simétrica.
Sesgo > cero inclinada a la izquierda.
Interpretación de sesgo
Mide qué tan “puntiaguda” es una DISPERSIÓN, con respecto a la Normal.
La distribución Normal se considera mesocúrtica, es el término medio
Las distribuciones mas puntiagudas que la Normal se llaman
leptocúrticas
Las distribuciones menos puntiagudas que la Normal se conocen como platocúrticas
CURTOSIS
Función Curtosis Curtosis =0. Mesocúrtica >0. Leptocúrtica <0. Platocúrtica
Función curtosis
Definición: Mide la amplitud de las colas y la altura de las observaciones en la muestra poblacional. Dependiendo de la media y su desviación estandar.
CURTOSIS
- El promedio, la mediana, y la moda coinciden.
- La curva es simétrica alrededor de promedio.
- Puede calcularse teóricamente el número de observaciones que se encuentran entre el promedio y + 1,2 ó 3 desviaciones estándar.
- Sirve para calcular probabilidades.
- Sirve para calcular inferencia estadística tratando de distribuir las muestras a lo normal. Se confirma conforme mas cercanos sean los valores de la media, mediana y moda.
VALOR Z
Distribución normal
Mide la probabilidad de los valores de xi por debajo de la curva normal. Dicha probabilidad se calcula convirtiendo el valor xi en valor z con la siguiente formula:
Z= xi-X / s
Ejemplo: El interés puede residir, por ejemplo en conocer la probabilidad de seleccionar en forma aleatoria a un sujeto que tenga una talla igual o menor a 120.94 cm. ó 140.3 cm. en una población. El promedio de talla para esa población 130.62 cm. con una desviación estándar de 9.68 cm.
Z= 120.94 – 130.62 = -1 (buscar valor en las tablas) 9.68
Z= 140.3 – 130.62 = 1 (buscar en las tablas)
Valor Z
Es la técnica estadística utilizada con mayor frecuencia para el análisis de conteo de datos o frecuencias.
Dentro del método estadístico se utiliza como una medida de asociación para variables cualitativas nominales y ordinales.
Permite comprobar hipótesis correlacionales.
NO SE UTILIZA PARA ASOCIACIONES CAUSALES.
Chi ó Ji Cuadrada:
De= (TMR) (TMC) / TT
DEBO CALCULAR FRECUENCIAS ESPERADAS