Metodologia Cuantitativa Parcial 2 Flashcards
Definición de hipotesis estadistica
Una hipótesis estadística es un enunciado referido a la población que puede ser evaluado en función de la
información muestral, y ser considerado verdadero o falso en virtud de la evidencia que la muestra
proporciona. Las hipótesis estadísticas generalmente involucran una o más características de la
distribución, como la forma de una distribución, el valor de cierto parámetro o la independencia de la variable
aleatoria, entre otras. Las hipótesis son siempre enunciados relativos a la población o la distribución que se encuentra bajo estudio y no constituyen enunciados referidos a la muestra
Pasos para desarrollar una prueba de hipótesis
1 - Definición de una hipótesis inicial/hipótesis alterna.
2 - Recolección y organización de la información.
3 - Contraste de hipótesis. Nivel de significación.
4 - Conclusión.
Definición de hipotesis nula
La hipótesis que queremos contrastar. Es la hipótesis que el investigador asume como
correcta.
Caracteristicas:
a) Se va a considerar como cierta hasta que se tenga suficiente evidencia de lo contrario.
b) Es la base para el análisis estadístico de la prueba
Definición de hipotesis alternativa
La negación de la hipótesis nula (es lo que aceptamos
cuando rechazamos
la hipótesis nula)
a) Es lo contrario a la hipótesis nula.
b) Es la que define la dirección de la zona de rechazo.
Definición de nivel de significacion estadistica
la probabilidad de tomar la decisión de rechazar la hipótesis nula cuando ésta es verdadera, acción que se conoce como error de tipo I. La decisión se toma a menudo utilizando el valor p: si el valor p es inferior al
nivel de significación, entonces la hipótesis nula es rechazada. Cuanto menor sea el valor p, más significativo será el resultado.
el nivel de significación de un contraste de hipótesis es
una probabilidad p tal que la probabilidad de tomar la decisión de rechazar la hipótesis nula —cuando esta es verdadera— no es mayor que p.
Definición de valor p
El valor p es la proporción de veces que el estadístico de contraste (media, desviación estándar, varianza, proporción, etc.) toma un valor más extremo
(diferente) que el resultado del experimento realizado.
Otra forma de definirlo es la probabilidad de encontrar un valor del estadístico de contraste másalejado o de valor más extremo que lo observado en la muestra, si
repitiéramos el experimento en iguales condiciones de manera infinita.
Tipos y defincion de los errores
1 - Error tipo I: Cuando se rechaza H0 siendo
H0 cierta = α. También se lo conoce
como nivel de significancia.
2 - Error tipo II: No rechazar H0 al ser H0 falsa
= β
Definción de estadístico de prueba
Se adopta en función de los datos muestrales en los cuales se basará la decisión de rechazar o no la
hipótesis.
Definición de región de rechazo
Será el conjunto de todos los valores del
estadístico de prueba para los cuales
será rechazada
Condiciones para realizar un caso sin ningun tipo de error
El mejor de los todos los casos sería aquel en el que ningún tipo de error es posible de cometer. Pero esto solo podría alcanzarse si se realizara un examen de toda la población, lo cual resulta poco práctico, dada su complejidad y sus costos
Definición y uso del analisis de varianza
Para superar este problema y aclarar la interpretación del resultado, se necesita disponer de una prueba
estadística que mantenga constante el error de tipo I, al tomar una decisión global única acerca de la
existencia de una diferencia estadísticamente significativa. Este método estadístico se conoce como
análisis de varianza
Finalidades de una analisis de varianza
1 - Determinar si diferentes tratamientos muestran diferencias significativas o si, por el contrario, puede
suponerse que sus medias poblacionales no difieren
2 - Superar las limitaciones de hacer contrastes bilaterales por parejas, dado que se aprecia —por las
experiencias realizadas— que son un mal método para determinar si un conjunto de variables con n > 2
difiere entre sí.
Analisis de varianza
Al modelo estadístico adecuado para estimar la relación entre una o varias variables nominales
independientes respecto de una variable continua dependiente se lo conoce como modelo de análisis de
varianza. A las variables independientes se las llama también factores; estos y sus niveles suelen definirse
de manera experimental por el investigador. En cada factor hay, por lo menos, dos niveles o tratamientos que
se efectuarán
Clasficacion simple sobre la base de tres criterios
1 - El número de factores.
2 - El tipo de muestreo efectuado sobre los niveles de los factores.
3 - El tipo de aleatorización utilizada para seleccionar las muestras representativas de cada población y agrupar sus elementos (unidades experimentales) en los distintos grupos que se desea comparar
Condiciones para el analisis de varianza
1 - Independencia: Los individuos estudiados deben ser independientes unos de los otros.
2 - Aleatoriedad: Las muestras o grupos objeto
de estudio deben haberse obtenido de manera aleatoria.
3 - Normalidad: Las muestras o grupos analizados deben seguir una distribución normal.
4 - Homocedasticidad: Debe existir una igualdad de
varianzas en las muestras o grupos estudiados.
Definición del estadistico F, formula y caracteristicas
Dentro de la estrategia para verificar la hipótesis de igualdad de medias, se emplea el estadístico F, que
refleja el grado de parecido existente entre las medias que se están comparando.
F = Variacion entre las medias muestrales/Variación entre individuos de una misma muestra.
El estadístico F solo puede tomar valores positivos o cero. Será cero solo cuando todas las medias
muestrales sean idénticas y se hará mayor a medida que las medias muestrales están más separadas entre
sí. Los valores F grandes constituyen una buena evidencia en contra de la hipótesis nula H0 de que todas las medias poblacionales son iguales
De que dependen los grados de libertad del estadistico F
Los grados de libertad del estadístico F dependen del número de medias que comparamos y del número de
observaciones de cada muestra.
Definicion de relación entre variables
La relación entre variables consiste en que si una cambia, la otra cambiará también, y el cambio puede
ser positivo o negativo. Su efecto es absolutamente relevante, pero debe tenerse presente que la
correlación entre dos variables no implica necesariamente una causalidad entre ellas, sino quizás
simplemente una interrelación
Definicion y metodo de variables indendientes
La prueba de independencia permite establecer si existe o no relación entre variables.
Una de las pruebas más usadas para verificar la independencia o no de atributos o variables es la prueba Chi-cuadrado.
Definición chi-cuadrado
Es un método estadístico de carácter general que se utiliza cuando se desea determinar si las frecuencias absolutas obtenidas en una observación difieren significativamente o no de las que se estarían esperando, teniendo en cuenta, a su vez, una determinada hipótesis planteada de interrelación sobre las categorías de las variables consideradas
Aplicaiones del chi-cuadrado
Independencia:
Probar la supuesta independencia de dos variables cualitativas de una población.
Inferencia de proporción:
Realizar inferencias sobre más de dos proporciones de una población.
Inferencia sobre varianza:
Hacer inferencias sobre la varianza de la población
Prueba de bondad:
Realizar pruebas de bondad de ajuste a efectos de evaluar la credibilidad de datos muestrales, que provengan de una población cuyos elementos se ajusten a un tipo específico de distribución de probabilidad.
Procedimiento para elaborar una prubea de independiencia
1 - Obtener la frecuencia observada (F.O.), proveniente de la encuesta o del experimento.
2 - Resumir los datos obtenidos (F.O.), en un cuadro de contingencia.
3 - Calcular la frecuencia esperada (F.E). Se calcula con la fórmula: F.E = (totalCol - totalReg)/Gran Total
4 - Determinar el nivel de significancia (α), y los grados de libertad (gl), con la fórmula: gl = Nro.renglones - nro.columnas
5 - Plantear las hipótesis. H0= independencia H1= dependencia
6 - Construir las áreas de aceptación y rechazo.
7 - Calcular Chi-cuadrado: x.pot(2) = sigma(i=1,n) (F.O - F.E).pot(2)/F.E
8 - Tomar una decisión y emitir una conclusión en términos del problema.
Definición de analisis de correlación
El análisis de correlación es un procedimiento que busca evaluar la relación existente entre las diferencias
individuales según dos o más variables aleatorias estudiadas. Existirá una relación causal entre dos variables si la ocurrencia de la primera constituye la causa de la otra. La primera variable se llamará causa y la segunda variable se llamará efecto.
Un aspecto a tener en cuenta es que la correlación existente entre dos variables no implicará causalidad.
el método conocido como V de Cramer
Definición de v de Cramer
Se trata de un coeficiente, creado por el sueco estadístico Harald Cramer, que funciona como una medida de relación estadística que tiene su base en
Chi-cuadrado. Es decir, se lo emplea en relación con a este último para hacer una corrección del mencionado coeficiente Chi-cuadrado, a efectos de precisar la fuerza de asociación existente entre dos o más variables.
Es uno de los coeficientes más usados para analizar la asociación de las variables nominales cuando sus categorías son de dos o tres clases
distintas. Es decir, si la tabla de contingencia posee dos filas por dos columnas o tres filas por tres columnas, resultará válido aplicar este coeficiente..
Por lo tanto,
el 0 corresponderá a una ausencia de asociación y el 1 a una asociación perfecta. Dicho de otra manera, cuanto más próximo a 0 se encuentre el
valor V, más independientes serán las variables. Por el contrario, cuanto más próximo a 1 sea su valor, más asociadas estarán las variables que se estudien
Condiciones para aplicar la v de Cramer
Forma:
Una de las variables debe tener al menos dos formas posibles.
Chi-cuadrado:
Tener previamente una tabla Chi-cuadrado.
Tamaño:
Este coeficiente se puede utilizar en tablas de contingencia de cualquier tamaño.
Limiataciones para aplicar la v de Cramer
1 - Solo trabaja con variables de tipo nominal.
2 - Deberá realizarse el cálculo de Chi-cuadrado previamente para poder calcular V de Cramer
3 - No se podrá realizar un análisis sobre la dirección de la relación entre variables ya que el resultado será siempre positivo.
Interpretación del valor de la v Cramer
Por lo tanto, el 0 corresponderá a una ausencia de asociación y el 1 a una asociación perfecta. Dicho de otra manera, cuanto más próximo a 0 se encuentre el valor V, más independientes serán las variables. Por el contrario, cuanto más próximo a 1 sea su valor, más asociadas estarán las variables que se estudien
Grado de relación entre variables segun la v de Cramer
1 - 0 a 0,1: El grado de relación entre las variables es
despreciable.
2 - 0,1 a 0,3: El grado de relación entre las variables es mínimo.
3 - 0,3 a 0,5: El grado de relación entre las variables es mediano o moderado.
4 - 0,5 a 1: El grado de relación entre las variables es importante.
Notación y definición de las dos hipotesis en una prueba de hipotesis
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis inicial H0
(también llamada nula o de no cambio) y la hipótesis alternativa H1.
Criterio para rechazar una hipotesis
Si el valor p es menor que el nivel de significancia (denominado α o alfa), entonces puede rechazar la hipótesis nula. El nivel de significancia es el nivel de error tipo I que estamos dispuestos a aceptar
Definición de Hipotesis
Es un afirmación o conjetura acerca de un parametro de una o mas poblaciones y que está sujeta a verificación
Definición Hipotesis nula
Es cualquier hipótesis que se desea probar.
Se denota H0
Definición Hipótesis alternativa
Es la hipótesis que se acepta cuando se rechaza la hipotesis nula.
Se denota H1
Que representa la letra griega mu?
mu representa la media poblacional.
Principio para descartar la hipotesis nula
La hipotesis nula solo se rechaza si los datos ofrecern suficiente evidencia para no considerarla verdadera
Definción, función, notación y valores del nivel de significancia
Es la probabilidad de rechazar la hipotesis nula cuando es verdadera.
El nivel de significancia permite establecer un criterio para determinar si se tiene “suficiente evidencia” para descartar la hipotesis nula.
Se denota por alpha.
valores: 5% - 1 %
Definción error tipo 1
Se comete cuando se rechaza una hipotesis que es correcta.
Se denota alpha
Definición error tipo 2
Se comete cuando se acepta una hipotesis que es incorrecta.
Se denota Beta
Pasos para probar una hipotesis
1 - Se establece la hipotesis nula y la hipotesis alternativa
2 - Se selecciona un nivel de significancia para la prueba.
3 - Se identifica el estadistico de prueba
4 - Se formula una regla para tomar desiciones
5 - Se toma una muestra y se llega a una desición: se acepta o se rechaza la hipótesis nula