Examen Final R Stats (Conceptos) Flashcards
Una característica que varía en su valor entre sujetos de una muestra o población.
variable
Medición categórica ordenada
ordinal
Medición categórica sin orden
nominal
Medición en la que los números representan una variable cuantitativa, y hay distancia específica entre cada valor.
intervalo
Variable en la que hay una cantidad infinita de valores entre intervalos.
continua
Variable que no se puede subdividir la cantidad.
discreta
Suma de observaciones dividio por número de observaciones, aka promedio.
media
Valor de en medio (o el promedio de los dos valores de en medio).
mediana
Sirve para visualizar la distribución de una variable categórica (factor).
gráfico de barras
Sirven para visualizar la distribución de una variable continua.
histograma y diagrama de caja
Cuando la pendiente de la nube de datos va hacia ARRIBA, la correlación de las variables es…
positiva
Cuando la pendiente de la nube de datos va hacia ABAJO, la correlación de las variables es…
negativa
Cuando los puntos se juntan alrededor de alguna línea, la correlación entre las variables es…
alta
Correlación negativa perfecta.
-1
Es el rango de valores que probablemente incluya el valor verdadero del parámetro.
intervalo de confianza
Un enunciado tentativo y falseable sobre el mundo.
hipótesis
Dos afirmaciones mutuamente excluyentes de una hipótesis.
nula y alternativa
Es la hipótesis que testamos directamente.
nula
Es la hipótesis contradice a la hipótesis nula.
alternativa
Es la probabilidad, computada bajo la hipótesis nula, de observar un valor del estadístico de test al menos tan extremo como el valor observado.
p valor
Pregunta que responde la desviación estándar.
en promedio, ¿qué tan lejos están las observaciones de la media?
Es la desviación estándar elevado al cuadrado.
varianza
Fórmula de desviación estándar.
raíz cuadrada de la suma de los valores menos su promedio elevado al cuadrado dividido el valor de datos menos uno.
Fórmula de error estándar.
desviación estándar dividido la raíz cuadrada del número de observaciones.
Fórmula de intervalo de confianza.
estimador más/menos valor crítico (Z) por la desviación estándar
La distribución arriba de la media es exactamente igual a la distribución debajo de la media.
distribución simétrica
¿Cuál es la relación entre el tamaño de la muestra y la distribución de esta?
entre más grande la muestra, más “normal” la distribución
¿Cuál es la relación entre el tamaño de la muestra y el error estándar?
entre más grande la muestra, menor el error estándar
Nos dice qué tan probable es que el efecto sea cero.
significancia estadística
Nos dice qué tan consecuente es el efecto.
significancia científica
Representa la proporción de la variación total en la variable dependiente explicado por la variable independiente.
R cuadrado
Intervalo de los valores que puede tomar R cuadrado.
entre 0 y 1
¿Demuestra R cuadrado la relevancia de la variable para explicar el resultado?
No, solamente la bondad de ajuste
Fórmula de regresión lineal.
El resultado es igual al intercepto (cuando Y = 0) + el coeficiente de pendiente multiplicado por el valor del predictor + error.
¿Qué pregunta pretende responder la correlación?
en promedio, ¿qué tanto se mueven dos variables juntas?
Son esencialmente la diferencia entre los valores observados reales del porcentaje de votos y los valores de respuesta que predijo el modelo en función de nuestras variables explicativas.
residuos