Stat 6 Flashcards

1
Q

Quand utilise-t-on la régression linéaire ?

A

Quand on veut expliquer la variation d’une variable dépendante (issue) continue à partir de certaines caractéristiques des patients.

Pour expliquer la relation entre une variable dépendante continue et une autre variable indépendante (continue ou catégorique)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Condition pour faire une régression linéaire

A

Variable d’intérêt continue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

La variable dépendante est toujours _________

A

continue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

La variable indépendante peut être ________ ou _________

A

continue ou catégorique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que suppose-t-on sur la relation entre les variables dépendantes et indépendantes quand on fait une régression linéaire ?

A

Que la relation entre les deux variables est linéaire.
Que l’échantillon est aléatoire et donc par conséquent que les sujets sont indépendants les uns des autres.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle est la fonction d’une régression linéaire ?

A

La moyenne de la variable dépendante est une fonction de la variable
indépendante.
y = f(x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La régression linéaire est une généralisation de?

A

La régression linéaire est la généralisation de la comparaison de deux moyennes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que le modèle de régression linéaire estime comme droite ?

A

Le modèle de régression linéaire estime la droite qui décrit le mieux la relation entre les 2 variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que représente B1 dans une régression linéaire ?

A

La différence de moyennes de la variable Y (dépendante) pour des sujets qui ont une différence de un pour la variable X (indépendante).

Représente la pente de la droite de régression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que représente B0 dans une régression linéaire ?

A

Représente la moyenne de la variable dépendante lorsque X=0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les 2 méthodes pour estimer les bêtas ?

A
  1. Méthode des moindres carrés
  2. Méthode du maximum de vraisemblance.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel paramètre en B1 et B0 doit-on estimer en premier ?

A

B1 avant B0
pas l’inverse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quoi faire avant de faire des prédictions avec le modèle de régression ?

A

Calculer un intervalle de confiance pour B1
ou
Tester si B1 est différent de 0, soit s’il existe bel et bien, dans la population, une différence entre X et Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hypothèses du test d’hypothèse pour B1

A

H0 : B1 = 0
Ha: B1 n’égale pas 0

T suit une loi de Student avec n-2 degrés de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que le coefficient de corrélation (r) ?

A

Mesure de la relation linéaire entre X et Y. Estimateur du coefficient de corrélation p(rho) de la population

n’a plus d’unité (vs bêta 1), mais est affecté par le signe + ou - de la pente (b1)
Sa valeur est comprise entre -1 et 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Le r est l’estimateur de quel coefficient de corrélation ?

A

Estimateur du coefficient de corrélation p(rho) de la population

17
Q

r = 0 si et seulement si

A

b1 = 0

18
Q

r = 1 si et seulement si

A

tous les points se situent sur une droite de pente positive

19
Q

Quel est le but de la régression linéaire multiple ?

A

Quand on veut expliquer une variable dépendante à l’aide de 2 variables indépendantes ou plus

20
Q

Comment sont les variables dépendante et indépendantes dans une régression linéaire multiple ?

A

Variable dépendante : continue !!!
variable indépendante : continue ou catégorique

21
Q

Peut-on faire une régression linéaire avec une variable dépendante catégorielle?

A

Non.
c’est de la régression logistique

22
Q

Quel modèle de régression linéaire comporte le moins de biais ?

A

multiple

23
Q

Vrai ou faux : dans une régression linéaire multiple, on calcule 1 seul IC valide pour tous les bêta

A

Faux.
Pour chaque bêta, on calcule un intervalle de confiance

24
Q

Qu’est-ce que le F-test ?

A

Le test de Fisher qui vérifie s’il y a au moins 1 variable indépendante qui est associée à la variable dépendante.
Il teste l’égalité des moyennes

25
Q

Quelles sont les hypothèses du F-test ? (Fisher Test)

A

H0 : tous les bêta sont les mêmes et sont égal à 0
donc : la variable Y est indépendante des variables Xj

Ha : au moins un des bêta est non nul
donc : la variable Y est dépendante d’au moins une des variable Xj

26
Q

Quelle est la statistique du test F ?

A

t = bi/Si
t suit une loi de Student avec n-p-1 degré de liberté

27
Q

Comment interpréter un bêta dans une régression linéaire multiple ?

A

𝑏1 représente la différence de moyennes de Y pour une différence de 1 unité pour X1, en supposant que toutes les autres variables incluses dans le modèle sont distribuées également entre les patients qui ont une valeur de X1 = x et ceux qui ont une valeur de X1 = x+1

𝑏2 représente la différence de moyennes de Y pour une différence de 1 unité pour X2, en supposant que toutes les autres variables incluses dans le modèle sont distribuées également entre les patients qui ont une valeur de X2 = x et ceux qui ont une valeur de X2 = x+1

28
Q

L’effet observé avec un bêta dans une régression linéaire multiple est-il indépendant ou dépendant de d’autres bêta ?

A

C’est l’effet indépendant d’un bêta. Les autres bêta (variables indépendantes) ne viennent pas le confondre.
L’effet du bêta est ajusté pour l’effet des autres bêtas pour limiter la confusion.

29
Q

Quelle est la mesure d’ajustement du modèle de régression linéaire

A

R^2

30
Q

Qu’est-ce le R^2 dans un modèle de régression linéaire ?

A

C’est la proportion de la variance Y expliquée par les variables indépendantes. Explique la proportion de la variabilité dans le modèle.

31
Q

Quelles valeurs peut prendre R^2?

A

Entre 0 et 1

32
Q

Comment savoir si un modèle de régression linéaire est bon ?

A

Lorsque R^2 est grand, plus le modèle explique la variable dépendante Y.

Quand R^2 est près de zéro, le modèle explique peu/pas la variabilité de Y.

33
Q

Quels sont les présupposés du modèle R^2 ?

A
  1. Y suit une loi normale
  2. Les observations provenant de l’échantillon sont indépendantes.
  3. La variance de Y ne varie pas en fonction des Xi (on vérifie ça avec un logiciel)
  4. Une relation linéaire entre Y et chacun des Xi pour les X continue.