UD3 - Probabilidad Flashcards
¿Qué es la Ā?
El suceso complementario
Podemos obtener la p de A restando 1- Ā porque_________________
ambos son exhaustivos y mutuamente excluyentes ( si no ocurre A, lo hará su complementario)
¿Qué implica la independencia entre 2 variables?
Implica que la información que poseemos sobre una variable, no sirve en absoluto para predecir la otra.
Se llama función de probabilidad f(x) de una variable aleatoria discreta X, a ____________________
aquella función que asocia a cada valor de la variable la probabilidad de que ésta adopte ese valor.
La función de probabilidad cumple dos propiedades fundamentales:
- Para cualquier valor de x, siempre toma valores positivos o nulos.
- La suma de todas las probabilidades correspondientes a cada valor de x es igual a 1
Variable aleatorias
_________-: La variable sólo puede tomar números enteros.
Distribuciones discretas de probabilidad
________ La variable puede tomar infinitos valores.
Distribuciones continuas de probabilidad.
Discretas
Continuas:
Se llama **función de distribución acumulada **F(x) de una variable aleatoria discreta X, a aquella función que :
asocia a cada valor de la variable la probabilidad de que ésta adopte ese valor o cualquier otro inferior.
La función de distribución acumulada cumple varias propiedades fundamentales:
- F(x) siempre toma valores positivos o nulos:
- F(x) es nula para todo valor inferior al menor valor de la variable aleatoria:
- F(x) es igual a 1 para todo valor igual o superior al mayor valor
de la variable aleatoria: - F(x) es un función no decreciente.
- La probabilidad de que la variable aleatoria X tome valores superiores a x1 e inferiores o iguales a x2 es la diferencia entre los valores de la función de distribución correspondientes a su valor superior x2 menos los correspondientes a su valor inferior x1: P(x1<x≤x2)=F(x2)-F(x1)
El valor esperado de una variable, E(X), predice cómo esperamos que se comporte X en media.
Se basa en ______________
Coincide con el _____________-
- el cálculo del valor promedio teórico que tomaría la variable aleatoria X si se repitiese el experimento infinitas veces.
- centro de gravedad de la distribución.
En distribución binomial:
* La variable aleatoria en este caso es _____________________
* Los ensayos deben ser
- el número de veces que cada alternativa aparece en un número fijo de intentos n.
- Independientes entre sí
Modelo al que se ajustan frecuentemente las variables
Distribución normal o de Gauss
Modelos de gran aplicación como instrumentos estadísticos
Chi-cuadrado de Pearson T de Student
F de Snedecor-Fischer
En vez de calcular frecuencias de valores individuales, se
calculan frecuencias de ocurrencia de cada media muestral. A esto se le llama
distribución muestral de medias.
¿Qué es el error típico o estandar de la media?
medida de variabilidad de las medias muestrales
obtenidas de muestras de tamaño n.
Gráficos de normalidad (Q-Q Plot y P-P Plot)
Permiten evaluar
de manera gráfica si un conjunto de
datos se aproximan a la distribución normal.
En qué consisten los Gráficos de normalidad (Q-Q Plot y P-P Plot?
en representar los valores observados (datos originales o percentiles) contra los valores esperados/teóricos (z o percentiles z) que se obtendrían en una distribución normal perfecta
Si existe evidencia de linealidad, entonces se podrá asumir que los datos obtenidos se aproximan a una distribución normal.
pruebas de normalidad:
Son pruebas que calculan ….
cuál sería la probabilidad de encontrar la distribución de datos observada (o una todavía más alejada de la normalidad), si en la población de la que procede la muestra, esa variable siguiese una distribución normal perfecta.
Si p>0.05, se podrá asumir que la muestra procede de una población que sigue la distribución normal.
Si p<0.05, no se podrá asumir que la muestra procede de una población que sigue una distribución normal.
Para muestras de tamaño n≤50 cual test es más preciso?
Shapiro Wilk (SW) es más preciso que Kolmogorov Smirnov (KS)
Se utiliza bajo las mismas condiciones que la binomial, pero con un elevado número de ensayos y un valor de p muy pequeño.
Esta distribución puede considerarse como una forma límite de la distribución binomial cuando p es bajo y n alto.
Estima la probabilidad de que ocurran un número de eventos en un intervalo de tiempo o espacio determinados.
Ejemplos:
Número de casos anuales de un tipo de cáncer muy raro.
Poisson
Conjunto de todos los valores que puede tomar esa variable, junto con sus correspondientes frecuencias de aparición (probabilidades).
DISTRIBUCIÓN DE UNA VARIABLE
En estadística se conocen una serie de distribuciones de probabilidad que nos permiten determinar la probabilidad de que ocurra un suceso.
Función de probabilidad —>
Probabilidad teórica (población)
La varianza es una medida de dispersión que permite
determinar
la variabilidad que presentan los datos.
La variable aleatoria que permite realizar afirmaciones sobre la varianza poblacional se puede generar a partir de la cuasi-varianza. Esta se distribuye según una distribución Chi-cuadrado (χ2) con ______ grados de libertad
N-1
La distribución Chi-cuadrado se obtiene por
la suma de varias Z2. Se encontrará al elevar datos al cuadrado y dividirlo por varianzas.
T de student
La encontraremos en:
La encontraremos en la comparación de medias
muestrales y en regresión y correlación.
Se trata de una familia de distribuciones.
Cuando la T student converge hacia una z?
Converge hacia una Z cuando n (y los grados de libertad) tienden a infinito.
Distribución F de Fisher o F de Snedecor 🐟🐌
La encontraremos en la comparación de ______
muestrales, en los ANOVAs y en regresión. Se trata de una familia de distribuciones.
Es asimétrica positiva y siempre toma valores positivos (≥0).
Varianzas