Probabilidad Flashcards
En investigación, es importante que los resultados…
Se puedan generalizar a un colectivo más amplio, llamado población
La extensión de las conclusiones requiere…
Hacer una inferencia probabilística o formular una hipótesis que será aceptada o rechazada con una determinada probabilidad
El objetivo de la probabilidad es
Calcular la “posibilidad” de ocurrencia de un suceso
Según Laplace, la probabilidad de un suceso es igual a…
Concepto de probabilidad
el conciente entre el nº de casos favorables de que ocurra un suceso y el nº de casos posibles, en el supuesto de que todos los casos tengan la oportunidad de ocurrir.
En la práctica, se mide la
Probabilidad
Proporción de veces que ocurre un suceso
Al repetir un experimento muchas veces, se observa que…
Probabilidad
las frecuencias relativas tienden a estabilizarse en torno a un valor
Cuando nº de observaciones/repeticiones de un suceso tiende al infinito, la probabilidad empírica tiende a la…
teórica
Cuando nº de observaciones/repeticiones de un suceso tiende al infinito, la probabilidad empírica tiende a la…
teórica
Cuándo tiende la probabilidad empírica a la teórica?
Cuando el nº de observaciones/repeticiones tienden al infinito
Probabilidad de un suceso A(P(A)) viene dada por
Conceptos básicos
un nº real que asignamos al suceso A, tal que cumple las siguientes propiedades:
- Probabilidad es cuantificable numéricamente con número comprendido entre 0 y 1
- Probabilidad de suceso A puede obtenerse restando a 1 la probabilidad de suceso complementario
- Interdependencia
“la probabilidad es cuantificable numéricamente con números comprendidos entre 0 y 1”. Qué es 0, y qué es 1?
Conceptos básicos
- 0=suceso que no puede ocurrir nunca
- 1= suceso que se produce con seguridad
Por qué la probabilidad de un suceso se puede obtener restando a 1 la probabilidad del suceso complementario?
Conceptos básicos
Porque ambos sucesos son exhaustivos y mútuamente excluyentes (si no ocurre A, ocurrirá su complementario)
Propiedad de la interdependencia
Conceptos básicos
Información que poseemos sobre una variable no sirve para predecir otra variable
Si ser miope no va ligado con sexo, ser hombre no predice miopía
Propiedad de la interdependencia
Conceptos básicos
Información que poseemos sobre una variable no sirve para predecir otra variable
Si ser miope no va ligado con sexo, ser hombre no predice miopía
teorema de la suma
Conceptos básicos
Probabilidad de que ocurra A o B, es igual a (probabilidad de que ocurra A + probabilidad de que ocurra B)- probabilidad de que ocurran ambos
Probabilidad condicionada
Conceptos básicos
Cuando aparición de suceso A depende de aparición de suceso B. Cociente entre casos favorables (A y B) y casos posibles, dentro de aquellos que cumplen determinada condición (B).
- Probabilidad de A condicionada a B (o de A supuesto B) = probabilidad de ocurrencia simultánea de ambos sucesos A y B dividida por probabilidad de que ocurra suceso B.
Distribución de frecuencias viene dada por…
Distribuciones de probabilidad
frecuencia con la que se observan cada uno de los valores que puede tomar esa variable
Distribución empírica
Datos observados
La frecuencia relativa es
La probabilidad
Probabilidad empírica es
La frecuencia relativa de un suceso (en número grande de experimentos n)
Cuando n es grande, probabilidad teórica
Distribuciones de probabilidad
se aleja de probabilidad empírica
la distribución de probabilidad es
El conjunto de todos los valores que puede tomar esa variable, junto con sus correspondientes frecuencias de aparición.
Las distribuciones establecidas según los datos…
Distribuciones de probabilidad
Son muy variables
La mayoría de las distribuciones de probabilidad tienen relación con…
Alguna ley teórica de distribución, establecida a partir de los principios del cálculo de probabilidades.
En estadística, distribuciones de probabilidad permiten
Determinar probabilidad de que ocurra un suceso
A mayor número de observaciones, la distribución empírica
Se parece más a la teórica
La mayoría de funciones de probabilidad son descritas por
1 o más parámetros
media, desviación típica
En estadística, con mucha frecuencia se asume…
que una muestra procede de una población que sigue determinada distribución teórica de probabilidad
En estadística, con mucha frecuencia se asume…
que una muestra procede de una población que sigue determinada distribución teórica de probabilidad
Mayoría de pruebas estadísticas se basan en…
Diferencias encontradas entre lo observado y lo esperado (lo que esperaríamos encontrar según la distribución teórica de probabilidad)
Cuanto más variable es un suceso,
más dificil es apreciar un efecto sobre él
En la realidad, la distribución teórica
no se observa nunca, existe una variabilidad debida al azar
Experimento aleatorio
en el que no se puede predecir resultado con certeza
Experimento en el que no se puede predecir con certeza el resultado
Experimento aleatorio
Variables aleatorias son
una o varias variables de naturaleza discreta o continua que se definen para cada experimento
Para cada variable aleatoria
Se puede construir su función de probabilidad y de distribución acumulada
La función de probabilidad de la variable se construye mediante…
la obtención de valores numéricos que representen su tendencia central y su dispersión o variabilidad.
Variable aleatoria discreta
Variable que solo puede tomar números entreros (distribuciones discretas de probabilidad)
Variable aleatoria continua
Variable que puede tomar infinitos valores (distribuciones continuas de probabilidad)
Función de probabilidad f(x) (de variable aleatoria discreta x)
Función que asocia a cada valor de variable la probabilidad de que esta adopte ese valor
la función de probabilidad cumple 2 condiciones fundamentales
- Para cualquier valor de x, siempre toma valores positivos
- Suma de todas las proobablidades correspondientes a cada valor de x es igual a 1
la función de probabilidad cumple 2 condiciones fundamentales
- Para cualquier valor de x, siempre toma valores positivos
- Suma de todas las proobablidades correspondientes a cada valor de x es igual a 1
Función de distribución acumulada
Función que asocia a cada valor de la variable variable la probabilidad de que esta adopte ese valor o cualquier otro inferior
Función de distribución acumulada cumple ciertas propiedades
- f(x) siempre toma valores positivos o nulos
- f(x) es siempre nula para todo valor inferior al menor valor de variable aleatoria
- f(x) no es función decreciente
- Probabilidad de que X tome valores superiores a x1 e inferiores o iguales a x2 es diferencia entre valores de función de distribución correspondientes a su valor superior x2 menos los correspondientes a su valor inferior x1
Qué caracteriza a una distribución de probabilidad?
La media y la varianza de una variable aleatoria
Qué caracteriza a una distribución de probabilidad?
La media y la varianza de una variable aleatoria
Media y varianza de una variable aleatoria…
caracterizan a una distribución de probabilidad. Valor esperado de una variable x, predice cómo esperaríamos que se comporte X en media.
En qué se basa la media y varianza de una variable aleatoria?
En cálculo del valor promedio teórico que tomaría x si se repitiese el experimento infinitas veces
La media y varianza de una variable aleatoria coincide con
El centro de gravedad de la distribución
(revisar fórmulas de media, varianza, desviación típica) Página 2
En Ciencias Sociales es habitual dirigir atención a situaciones…
En las que se quiere investigar proporción de personas que presentan un síntoma, o que cumplen una determinada condición.
Para investigar proporción de personas que presentan un síntoma, o que cumplen una determinada condición, nos deberemos apoyar en…
Distribución muestral de proporción
Estadístico: p=x/n. Qué es x? Qué es n?
- x= nº de sujetos que cumplen la condición
- n= tamaño de la muestra
Distribución binomial
Cuando solo existen 2 alternativas (sí/ no; sobrevive/muere; varón/ hembra) con probabilidades p y 1-p respectivamente.
En distribución binomial, variable aleatoria es el nº de veces que…
Cada alternativa aparece en un número fijo de intentos n. Los ensayos deben ser independientes entre sí.
(en distribución binomial, estudiar fórmulas función de probabilidad y distribución acumulada), Qué es x? Qué es n? Qué es p?
- x= nº de veces que ocurre un suceso a evaluar
- n= nº de intentos
- p= probabilidad de ocurrencia del suceso
(estudiar media y varianza de distribución binomial)
Qué pasa si p=q=0.5?
Distribución es simétrica
En distribución binomial, a medida que n aumenta, asimetría y curtosis
tienden a 0 y distribución de variable pasa a ser aproximadamente normal
Distribución binomial se puede aproximar a normal cuando
n>20 aproximadamente.
Distribución binomial se puede aproximar a la normal cuando n>20 aproximadamente. La aproximación mejora cuando
p se aproxima a 0.5 y n es grande
Tablas de función de (1) probabilidad y (2) distribución binomial evitan cálculo de probabilidades a partir de
Ecuación de esa función. Se facilita su obtención
Para más de 20 ensayos…
Recurriremos de distribución binomial a normal
Distribución de Poisson
Se utiliza bajo mismas condiciones que la binomial, pero con elevado nº de ensayos y un valor de p muy pequeño
Distribución de Poisson se puede considerar como
Forma límite de distribución binomial cuando p es bajo y n alto
Distribución de Poisson estima…
Probabilidad de que ocurran un número de eventos en un intervalo de tiempo o espacio determinados
En ejemplo de número de casos anuales de un cáncer muy raro. Número de llamadas recibidas al cabo de una hora, se usa distribución
de Poisson
Modelos de distribución de una variable aleatoria continua utilizados en ciencias sociales y de la salud se dividen entre…
- Los que frecuentemente se ajustan las variables con las que trabajamos: Distribución normal o de Gauss
- Los que tienen gran aplicación como instrumentos estadísticos: Chi-cuadrado de Pearson, T de Student, F de Snedecor-Fisher
Una variable aleatoria continua puede tomar infinitos valores. Así, se habla de probabilidad de que…
Variable se encuentre en determinado intervalo de valores
Función de densidad de probabilidad
Función continua que suma 1 cuando se integra en todo su rango de valores.
En función de densidad de probabilidad, valores de probabilidad asociados a un rango de valores se corresponden con…
área que se encuentra por debajo de función de densidad de probabilidad comprendida entre rango de valores de estudio.
Distribución normal y Gauss responden a…
Tipo de distribución que siguen la mayoría de variables físicas y psicológicas (estatura, peso, CI).
Revisar fórmula matemática que define distribución normal y Gauss
Si una variable X tiene una distribución que se ajusta a fórmula anterior,…
se distribuye normalmente y se expresa por x–> N(μ, σ)
Si una variable X tiene una distribución que se ajusta a fórmula anterior,…
se distribuye normalmente y se expresa por x–> N(μ, σ)
Propiedades de distribución normal y de Gauss
- Área encerrada bajo curva vale 1 y representa probabilidad de valores de la distribución
- Es unimodal y simétrica (media, moda y mediana coinciden)
- Su asimetría vale 0 (g1= 0)
Forma de distribución normal y Gauss cambia en función de parámetros
μ, σ
En variable que sigue distribución normal, puntuación de la mayoría de individuos…
Está en torno a la media, y a medida que se aleja de esta, por su lado izquierdo y derecho, disminuye frecuencia
Independientemente de valor de σ y μ
Área comprendida entre μ+- σ es
aproximadamente 0.68
- el 68% de valores de variable normal están entre σ+-μ
Independientemente de valor de σ y μ
Área comprendida entre μ+- 2σ es
aproximadamente 0.95
- el 95% de valores de variable normal están entre 2σ+-μ
Independientemente de valor de σ y μ
Área comprendida entre μ+- 3σ es
aproximadamente el 0.997
- el 95% de valores de variable normal están entre 3σ+-μ
En distribución normal o de Gauss, casi todos los valores se encuentran alrededor de…
3 desviaciones estándar en torno a la media
Puntuaciones directas
Puntuaciones típicas
Comparaciones de puntuaciones directas de un sujeto en variables distintas pueden llevar a confusión.
Con puntuación directa no sabemos si un valor es alto o bajo porque
esto depende del promedio del grupo
Puntuaciones diferenciales (xi)
Puntuaciones típicas
Puntuación directa- media (xi= XI-X). Indican si puntuación coincide con media de su grupo, es inferior o superior a ella.
Proceso de obtener puntuaciones típicas se llama
Tipificación
Puntuaciones típicas permiten
Comparar (en mayor medida si las distribuciones de frecuencias de las variables son iguales):
- Puntuaciones de un mismo sujeto en pruebas distintas
- Sujetos distintos en 2 pruebas o variables distintas
Formula puntuaciones típicas indica el número de
desviaciones típicas que se aparta de la media una determinada puntuación
Propiedades de fórmula desviaciones típicas
- media es 0
- Varianza es 1
Puntuaciones típicas
- reflejan relaciones entre
- Permiten comparar…
- puntuaciones con independencia de la unidad de medida.
- distintos grupos e incluso distintas variables
(Interpretación de resultados)
ej: una puntuación de 22 frente a una media de 19. Puntuación diferencial es positiva (3), sujeto está por encima de la media.
Interpretación de puntuación diferencial depender-a de variablilidad de datos del grupo con el que se compare.
2 grupos σA= 2, σB= 4. Puntuación diferencial 3, significa más
en A que en B. Significación viene dada por puntiación típica
- zA= 3/2= 1,5
- zB= 3/4= 0,75
Puntuaciones típicas permiten
interpretación más completa
En psicología, una puntuación típica es traducible a
un porcentaje
Porcentaje permite calcular
cuántas personas del grupo de referencia se encuentran por debajo de ella
Distribución normal tipificada
Si a los valores de una variable normal se les resta su media μ y se dividen por su desviación típica, se obtiene otra variable normal (Z), que tiene media 0 y desviación típica 1
distribución normal tipificada, con variable normal (Z), propiedades
- Dentro de tabla de distribución normal hya percentiles
- Variable Z se distribuye como: Z–> N (0,1). Sigue distribución normal con media 0 y desviación típica 1. (Revisar fórmula)
- Tabla distribución acumulada
En tabla de distribución acumulada, valores de probabilidad equivalen a
el área a la izquierda del valor de z correspondiente en función de densidad de probabilidad.
En tablas de distribución acumulada, como es una distribución simétrica (y de media 0), se comprueba que
proporción que queda por debajo de z=0.25 es igual a proporción que queda por encima de z=0.25
En tablas de distribución acumulada, como es una distribución simétrica (y de media 0), se comprueba que
proporción que queda por debajo de z=0.25 es igual a proporción que queda por encima de z=0.25
Si tabla de distribución acumulada no recoge valor exacto de z deseado,
se emplea el que se encuentra más próximo en tabla
Si distribución no se aproxima a distribución normal,
no se puede usar tabla de distribución normal para ver cuántos individuos se encuentran por encima o por debajo de un valor.
en una distribución que no se aproxima a distribución normal, no sirve
calcular valores z ni usar tablas de función de distribución acumulada.
Teorema de límite central
Si muestra es grande y aleatoria, aunque valores que presenten individuos de la población sigan una distribución normal, distribución de estimadores que se obtengan en sucesivas muestras de la población sí que seguirán aproximadamente distribución normal.
Teorema de límite central
Si muestra es grande y aleatoria, aunque valores que presenten individuos de la población sigan una distribución normal, distribución de estimadores que se obtengan en sucesivas muestras de la población sí que seguirán aproximadamente distribución normal.
Teorema del límite central se cumple mejor cuanto
mayor es muestra n
Adaptación de teorema del límite central según n
- n>60
- n<x<60
- 30>n
- n>60: Adaptación muy buena
- n<x<60: Adaptación aceptable
- 30>n: Aparecen problemas
En teorema de límite central, en vez de calcular frecuencias de valores individuales, se calculan
frencuencias de cada media muestral–> Distribución muestral de medias
Distribución de medias muestrales sigue distribución normal si
el tamaño de la muestra es grande (n>30)
Distribución de medias muestrales sigue distribución normal si
el tamaño de la muestra es grande (n>30)
La media de medias muestrales coincide con
Media poblacional
Desviación estándar de medias
Es media de variabilidad de medias muestrales obtenidas de muestras de tamaño n. El 95% de medias calculadas en muestras están en intervalo +-2 errores estándar de media poblacional
Métodos paramétricos
Técnicas estadísticas más usuales realizan inferencias a partir de muestras, asumiend que variable sigue distribución normal. Así, se pueden realizar inferencias estadísticas basándose en propiedades de distribución normal
Métodos no paramétricos
Si no se puede presuponer distribución normal, se utilizan métodos no paramétricos, de “distribución libre”. No realizan ningún supuesto sobre la distribución teórica que siguen los datos.
Tamaño muestral y normalidad
Hay que tener en cuenta para tamaños de muestra menores de 10, no se puede estudiar ni asumir normalidad. Con tan pocos datos es difícil estimar forma de distribución–> emplear métodos no paramétricos.
Pasos de comprobación de normalidad
- Mirar el histograma de la variable y coeficientes de asimetría y curtosis
- Estadísticos descriptivos
- Gráficos de normalidad
- Pruebas de normalidad
Mirar histograma de variable y coeficientes de asimetría y curtosis
Tiene forma de campana? Es simétrica la distribución?
Estadísticos descriptivos
Presentan media, moda y mediana valores similares? 2/3 de valores de muestra entre 1 desviación típica alrededor de media? 95% de valores de muestra entre 2 desviaciones típicas alrededor de media?
Gráficos de normalidad
Evalúan gráficamente si conjunto de datos se aproxima a distribución normal. Representar valores observados (datos originales o perceptiles) contra valores esperados/ teóricos (z o percentiles z) que se obtendrían en distribución normal
en gráficos de normalidad, diferencia si hay linealidad vs si no hay linealidad
- Si hay linealidad: datos obtenidos se aproximan a una distribución normal
- si no hay linealidad: distribución de variable se aleja de normalidad
Las pruebas de normalidad…
calculan cuál sería la probabilidad de encontrar distribución de datos observada (o una más alejada todavía de normalidad) , si en población de la que procede la muestra, esa variable siguiese distribución normal perfecta.
en pruebas de normalidad,
- si p>0.05:
- si p<0.05
- p>0.05: muestra procede de distribución normal
- p<0.05: muestra no procede de distribución normal.
Algunas pruebas de normalidad…
- Test de Kolmogorov- Smirnov (KS)
- Test de Shapiro-Wilk (SK)
Para muestras n<50, es más preciso
test de Shapiro-Wilk (SW)
Pruebas de normalidad dependen mucho del
tamaño de muestra.
resultados de pruebas de normalidad, se deben interpretar
teniendo en cuenta tamaño de muestra. Si es grande (n>200), es fácil obtener valores de p<0.05, si hay pequeñas desviaciones de normalidad
Si hay pequeñas desviaciones de normalidad y muestra es grande (n>200), obteniendo valores de p<0.05…
Es aconsejable realizar pruebas de normalidad y representación gráfica de los datos para tomar una decisión razonada.
Si n>30, si se cumple teorema del límite central, es razonable asumir que
distribución muestral es normal
Si n>30, si se cumple teorema del límite central, es razonable asumir que
distribución muestral es normal
En distribución Chi- cuadrado, varianza
es medida de dispersión que determina variabilidad que presentan
Variable aleatoria que permite realizar afirmaciones sobre varianza profesional se puede generar a partir de
cuasi-varianza, que se distribuye según una distribución Chi- cuadrad (x2) con n-1 grados de libertad.
Distribución chi-cuadrado se obtiene por
suma de varias z2. Se encontrará al elevar datos al cuadrado y dividirlos por varianzas.
La distribución chi-cuadrado nunca adopta
valores menores de 0. Es asimétrica positiva, pero a medida que aumentan sus grados de libertad, se aproxima a distribución normal.
distribución t de student
se usa en comparación de medias muestrales y en regresión y correlación. Trata familias de distribuciones
Distribución T de student es …
simétrica, con media 0. Su forma es similar a distribución normal N(0,1), pero menos apuntada y con colas más pobladas.
Distribución t de student converge hacia z cuando
n (y los grados de libertad) tienden a infinito
Distribución t de student converge hacia z cuando
n (y los grados de libertad) tienden a infinito
Distribución F de fisher/Snedecor se usa en
comparación de varianzas muestrales, en los ANOVAs y en regresión. Trata familias de distribuciones-
Distribución F de fisher/Snedecor se usa en
comparación de varianzas muestrales, en los ANOVAs y en regresión. Trata familias de distribuciones-
Distribución F de Fisher/ Snedecor es…
asimétrica positiva y siempre toma valores mayores de 0
Distribución F de Fisher/ Snedecor es…
asimétrica positiva y siempre toma valores mayores de 0
Distribución F de Fisher/ Snedecor es…
asimétrica positiva y siempre toma valores mayores de 0
Distribución F de Fisher/ Snedecor es…
asimétrica positiva y siempre toma valores mayores de 0