2 Flashcards
Muestras independientes
Dos muestras son independientes si los valores muestrales seleccionados de una población no están relacionados, pareados o asociados de alguna manera con los valores muestrales seleccionados de la otra población.
Muestras dependientes
Dos muestras son dependientes si los valores muestrales están pareados o asociados.
Correlación
Existe una correlación entre dos variables cuando los valores de una de ellas están relacionados de alguna manera con los valores de la otra.
Coeficiente de correlación lineal r
El coeficiente de correlación lineal r mide la fuerza de la relación lineal entre los valores cuantitativos pareados x y y en una muestra.
Ecuación de regresión
A partir un conjunto de datos muestrales pareados, la ecuación de regresión describe algebraicamente la relación entre las dos variables x y y.
Recta de regresión
La gráfica de la ecuación de regresión se denomina recta de regresión (o recta del mejor ajuste o recta de mínimos cuadrados).
Cambio marginal
Cuando se trabaja con dos variables relacionadas por una ecuación de regresión, el cambio marginal en una variable es la cantidad que esta se modifica cuando la otra variable cambia exactamente una unidad. La pendiente b1 en la ecuación de regresión representa el cambio marginal que ocurre en y cuando x cambia una unidad.
Residuo
Para una muestra de datos pareados x y y, un residuo es la diferencia entre un valor y muestral observado y el valor de y predicho por medio de la ecuación de regresión.
Propiedad de mínimos cuadrados
Una recta satisface la propiedad de mínimos cuadrados si la suma de los cuadrados de los residuos es la menor suma posible.
Gráfica de residuos
Una gráfica de residuos es un diagrama de dispersión de los valores (x, y) una vez que cada uno de los valores de la coordenada y se han reemplazado por el valor residual y - y (predicha ). Es decir, una gráfica de residuos es una gráfica de los puntos (x, y - y(predicha)).
Coeficiente de determinación
Es la cantidad de variación en y que se explica por la recta de regresión.
Intervalo de predicción
Un intervalo de predicción es una estimación del intervalo de un valor predicho de y.
Error estándar de estimación
El error estándar de la estimación, denotado con se , es una medida de las diferencias (o distancias) entre los valores muestrales observados de y y los valores predichos yN que se obtienen por medio de la ecuación de regresión.
Conclusión coeficiente de correlación
Como r 2 es la proporción de la variación total que está explicada, concluimos que aproximadamente el 97.6% de la variación total en las tarifas del metro se pueden explicar por los precios de una rebanada de pizza. Esto significa que el 2.4% de la variación total del precio del boleto del metro está explicada por otros factores y no por el precio de una rebanada de pizza.