Ciclo 1- correlación, regresión, pruebas t, anova Flashcards
Ejemplos de preguntas en las que se comparen dos o más grupos
- ¿qué diferencias hay en (variable dependiente) según (grupos)?
- ¿Hay diferencias en (variable dependiente) entre (grupo 1) y (grupo 2)?
Ejemplos de preguntas que relacionen 2 o más variables:
- ¿Qué relación hay entre x1 y x2?
- ¿Qué tanto las variables x1, x2, x3, explican (la variable dependiente Y)?
Cuáles son las medidas de tendencia central
Media (promedio), moda, mediana
Cuáles son las medidas de dispersión
- Máx y min
-Desviación estandar - Varianza
- Rango inter-cuartil
La interpretación de Cohen para el r de pearson
Cohen:
- Un r bajo: 0.1
- Un r media: 0.3
- Alto: r: 0.5
Las correlaciones se hacen entre variables _______
Continuas
Cuál sería una pregunta de correlación
¿qué relación hay entre?
Si las variables independientes son categoricas se realiza:
Chi cuadrado.
Cuando las variables independientes están relacionadas (correlacionadas) entre sí es un problema de:
Multicolinealidad
Qué significa un puntaje z igual a cero
Implica que está dentro de la media.
Qué significa que exista una correlación alta (gráficamente)
Se acercan más a la línea.
Por qué no hablamos de x “afecta” y
Se habla de asociación entre variables, no significa causalidad.
Cuáles son las tres maneras en las que la correlación puede relacionar variables
- A causa b
- B causa a
- O hay una tercera variable que las relaciona
Qué significa el r de Pearson y qué valores puede tomar
forma de evaluar la magnitud o fuerza de la relación entre dos variables cuantitativas que están siendo correlacionadas.
No tiene que ver con la inclinación de la pendiente.
- Entre -1 y 1
- O no hay correlación
Qué pasa con las hipótesis cuando p es significativo en correlaciones
- p: significativo?
- H0: nula: correlación= 0
- Ha: alterna: correlación es diferente de cero.
Si es diferente de cero: rechazo la hipotesis nula.
P < 0.05, es decir
- P pequeño: es bueno: tengo muy poca probabilidad de equivocarme al decir que hay correlación.
- Qué tan probable es que aleatoriamente los datos se organicen de esa manera.
- P de lunares de rector: debe ser alto: porque es aletatorio.
- P < 0.05, es decir, la probabilidad menos del 5%: entonces rechazo la hipotesis nula. La relación es significativa entre estas dos variables.
Likert con más de cuatro ya lo hace continua. ¿Verdadero o falso?
Verdadero
Procedimiento para correlaciones
- Identificar tres variables continuas
- Preguntas de investigación: “qué relación hay entre (variables)”
- Hipotesis conceptuales de cómo se imaginan que va a dar esto: hipotesis conceptuales:
a. Me imagino que hay relación entre satisfacción y cantidad de créditos- Hacer tabla de correlaciones
- Dio significativo? X3
- Rx3, ¿dio bajo, medio o alto?
- Respuesta a preguntas de investigación
**No es no hay correlación, sino que no se encuentra. ¿Verdadero o falso?
Verdadero: es no se encuentra.
En regresión lineal, los verbos que se emplean son:
Predice, explica, correlaciona, relaciona, asocia,
Cómo se interpretaría un r=0.4 según Cohen
- Si por ejemplo es 0.4: está entre un puntaje medio y alto.
Cómo se interpreta un p=0.055
- P significativo: p= .055: se dice que es una tendencia que no alcanza a ser significativo. Se explica porque la muestra es pequeña.
Cómo se reporta una correlación
como puede verse en la tabla 1, se encontró una correlación positiva (+ o -), mediana (según cohen) y significativa (p<0.05) entre importancia de la religión y satisfacción con la vida (r=.262; p<.001)
Cómo se reporta una correlación que no es significativa
- Sin embargo, no se encontró una correlación significativa entre edad e importancia de la religión (r=0.22; p=0.719).
Ahí no se da más información sobre el resto de cosas porque realmente no importa.
Cuál es el método para encontrar el modelo en regresión lineal
Buscar la recta (modelo) que minimice la suma de errores cuadrados.
Qué significa el R cuadrado
el R cuadrado indica cuánta varianza en la variable dependiente puede ser “explicada” o “capturada” por el modelo de regresión. Varía en un rango de 0 a 1, o a veces se expresa en forma de porcentaje (0% a 100%).
Qué significa un R cuadrado = 0
Esto significa que el modelo de regresión no explica ninguna variabilidad en la variable dependiente. En otras palabras, el modelo no es útil para hacer predicciones o explicaciones.