Regresión Flashcards

1
Q

La regresión lineal multiple pretende

A

Formular una ecuación lineal que explique el comportamiento de una VD en función de varias VI, la cual sea más completa, se realiza una valoración conjunta y se averigua el peso que tiene cada una de las variables en el fenomeno

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En RLMultiple la nube de puntos es

A

Tridimensional que gallito, por lo q resulta poco intuitivo a la hora de analizar el comportamiento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

B0 es

A

El punto de origen de la recta o el valor esperado de vd cuando todas las vi toman por valor 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Los coeficientes de correlación parciales

A

No refleja el peso de las variables en la ecuación de regresion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Los coeficientes de regresión tipificados

A

Si q hablamos de un aumento o disminución de las desviaciones típicas en las puntuaciones por lo que hablamos de un peso en la recta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

La recta de regresión tipificada muestra un

A

Conjunto de variables y un interceptor de 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Para conocer la calidad de una ecuación de regresión tenemos que

A

Interpretar la correlación (Pearson) y el coeficiente de determinación que muestra la proporción de reducción de errores a causa del empleo del nuevo modelo(cuadrado de coeficiente de correlación), hay que mirar el corregido

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Para contrastar la hipótesis y ver si la relación entre variables es significativa

A

Hay q mirar si es significativo el p valor asociado al estadístico F

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

El MCE

A

Es el error típico de estimación de residuos y es el error medio cometido al efectuar pronósticos con la recta de regresión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Entre dos ecuaciones rivales elegiremos la que tenga un MCE

A

Menor, ya que se buscará que la variable disminuya la suma de errores cuadráticos medios en la recta propuesta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La significacion de los coeficientes de regresión

A

Se mira en la tabla de coeficientes del modelo el p valor para ver la significacion de cada uno. La no significacion implicaría que eliminar la variable no afectaría al ajuste del modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Cómo evaluamos el peso relativo de una variable

A

Depende de lo que entendamos por importancia de la variable.
Si la variable importante es la que más contribuye a explicar el cambio en la independiente se miran los coeficientes de regresión tipificados
Si lo q se busca con la variable es reducir el error del modelo (mayor contribución al ajuste global)vamos a mirar la R de Pearson del coeficiente de correlación semiparcial

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Como se suele elegir las variables que se van o se quedan

A

Lo más importante es mirar la hipótesis de partida del investigador.
Lo segundo sería tirar de lo que crees que aporta y luego se quita lo no significativo. Eso da problemas porq no se ve el comportamiento individual de las variables eliminadas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Estrategia jerárquica de elección

A

Es la misma estrategia que al principio pero los vas eliminando en orden los más chiquitos primero para ver que pasa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Principio de parsimonia

A

Cuantas menos variables mejor todo más limpito

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Principio de máximo ajuste

A

Intentemos meter todas las variables posibles pa explicar bn el comportamiento de la VD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

El problema de la estrategia jerárquica

A

Cuando no hay hipótesis de partida chilling pero cuando la hay al final eliges las variables que convienen que no siempre coinciden con la teoría por lo que es difícil ver hasta que punto el modelo ayuda a explicar el fenómeno de la investigación propuesta

18
Q

Para meter y sacar variables

A

Aumento en coeficiente de correlación múltiple y correlación parcial y reducción del error

19
Q

Que pasa si no se cumple linealidaf

A

Existe error de especificación, no se han elegido la VI al no relacionarse con la VD de forma lineal, lo que hace que los coeficientes de regresión estén sesgados

20
Q

Causas para que no se cumpla la linealidad

A

No se eligen bn las variables (inclusion de variables irrelevantes) o la relación que existe con la vd no es lineal

21
Q

Supuesto lineal simple

A

Vd y Vi
Tenemos dos gráficas
-diagrama de dispersión normal con la relación entre ambas variables(tenemos que ver un patrón ascendente o descendente)
-Diagrama de errores tienen que distribuirse de forma aleatoria a lo largo del eje

22
Q

Supuesto linealidad multiple

A

No gráficos de dispersion(mucho lio nene)Relaciones parcializadas
Diagrama de dispersión parcial para cada vi con la vd tienes que ver relación de tendencia lineal nada de cosas rectas:(
Tambn lo podemos ver más claro en la tablita de correlaciones parciales

23
Q

Supuesto de no colinealidad

A

Relación que existe entre las variables independientes, mucha colinealidad da muchos problemas al añadir variables, inestabilidad (suele haber poca)
FIV más de diez da problemas
Estadísticos de tolerancia menor de 0.10 da problemas

24
Q

Supuesto de independencia de los residuos

A

Estadístico durbin Watson 1.5-2.5
Mira la significacion en las p de esa tabla
Si es significativo no se cumple p menos que a no son independientes
Por debajo menor de 2 correlación positiva y mayor de 2 negativa
Suele ponerte la autocorrelacion

25
Q

Supuesto de normalidad

A

Miramos el histograma, qq plot y Shapiro wilk
Mirar gráficos
Histograma de residuos ves la asimétria (donde ves más claro)
En qq plot todo se distribuye por la linea

26
Q

Supuesto de homocedasticidad

A

Miramos un diagrama de dispersión tiene que situarse todo entorno al eje
Horizontal tiene que mantenerse muy constante
Errores residuos y pronosticos

27
Q

Casos atipicos

A

Residuo estándar mayores que 3 es caso atipico
Distancia de Cook mayor que 1

28
Q

La varianza explicada la buscamos en

A

R2

29
Q

La varianza explicada la buscamos en

A

R2

30
Q

RMSE

A

Cantidad de error entre conjuntop de datos. Comparando el valor predicho con el observado

31
Q

R2 ajustado

A

El porcentaje de errores que nos permite reducir

32
Q

Siempre para elegir un modelo hay q tener en cuenta primero

A

Si es significativa independientemente de r2

33
Q

Para ver la variable mas peso

A

Siempre te fijas en el tipificado no directo

34
Q

Importancia relativa

A

Sin intercepto significativa

35
Q

Independencia

A

Entre 1.5 y 2.5
Mas p mayor q alfa es independiente

36
Q

La media hay q fujarse en la

A

Vd que estq en el intercepto del nulo

37
Q

Variable criterio

A

VD (Y)

38
Q

Variable predictora

A

VI(x)

39
Q

Minimos cuadrados

A

Metodo oara seleccionar la funcionnen el diagrama de dispersion que menor error de pronostico tenga

40
Q

B1 nuncqnva a reflejar la

A

Intensidad de relacion solo si esta es positiva o negativa

41
Q

Si no hay relacion lineal B1 es igual a

A

0