Cours 6 : Inférence statistique Flashcards

1
Q

À quoi servent les tests d’hypothèses statistiques?

A

Dans les sciences de la nature, le chercheur est appelé à prendre des décisions sur la
base de résultats expérimentaux, en étant conscient qu’il y a un risque d’erreur lié à
l’incertitude des observations ou des résultats expérimentaux. Avant de prendre une telle
décision, il testera une hypothèse statistique correspondant à son problème biologique.
L’issue de ce test statistique indiquera quelle décision biologique il convient de prendre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lorsqu’on dit “Hypothèse biologiques”, en général, on parle de combien d’hypothèses?

A

au moins deux solutions possibles,
mutuellement exclusives, entre lesquelles il faut décider. Alors 2 hypothèses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que devons-nous faire si les résultats expérimentaux nous pousse à rejeter l’hypothèse nulle?

A

On peut accepter l’hypothèse contraire qui est au moins plausible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Est-ce qu’on peut prouver que l’hypothèse H1 est vraie? Pourquoi?

A

Attention: en statistique, on ne peut pas prouver que l’hypothèse H1
, qui représente le
contraire de l’hypothèse principale, est vraie. On doit toujours garder à l’esprit le risque
d’avoir rejeté l’hypothèse principale à tort

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que signifie un rejet de H0 au final? Qu’est-ce que ça permet d’assumer?

A

Dans tous ces cas on ne teste que l’hypothèse principale (que l’on rejettera ou non).
Pour résumer, un rejet de H0
ne nous autorise pas toujours à accepter l’une des solutions
“contraires” plutôt qu’une autre, ni à accepter que le mécanisme invoqué dans la formulation
de l’hypothèse contraire soit responsable de la relation observée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que détermine si un test est unilatéral ou bilatéral?

A

C’est la formulation de l’hypothèse contraire, H1
, qui détermine si un test est
unilatéral ou bilatéral.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nommer un exemple ou on réaliserait un test bilatéral?

A

Lorsqu’on cherche une différence entre deux groupes, une estimation et une valeur donnée par l’hypothèse et qu’on ne se soucie PAS du signe de la différence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pourquoi utiliser un test bilatéral? Que cherche-t-on?

A

Dans le cas où l’on étudierait s’il existe une relation entre deux variables, le test
est bilatéral si on cherche simplement à démontrer que ladite relation existe, sans égard au
signe de la corrélation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi réaliser un test unilatéral?

A

On réalise plutôt un test unilatéral (“one-tailed test”) lorsque notre hypothèse
biologique ne s’intéresse qu’aux différences ou aux relations ayant un signe donné

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi dit-on que les test unilatéraux sont “unilatéraux”

A

. Les tests
de ce type sont dits unilatéraux parce que la zone de rejet de H0
se situe à une seule
extrémité de la distribution de probabilités qui nous sert de référence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que réalisons-nous en testant l’hypothèse principale?

A

Étant conscient de la variabilité naturelle, inhérente en particulier au matériel
biologique, on soumet l’hypothèse principale (H0
) à une épreuve de vérité afin de déterminer
si les résultats obtenus expérimentalement sont conformes, ou non, à ce que laisserait
prévoir l’hypothèse principale, en laissant place aux erreurs dues à l’échantillonnage ou à
l’expérimentation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Est-ce possible de tester PLUS que l’hypothèse principale?

A

Il est important de se rappeler constamment que c’est uniquement
l’hypothèse principale que l’on teste; NON

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quel test statistique employons-nous généralement pour déterminer s’il existe une différence entre deux groupes?

A

Statistique test t de student

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que permet le statistique test t de student?

A

Nous pouvons employer la
statistique t de Student pour mesurer l’écart entre ces deux groupes; cette statistique est
essentiellement la différence des moyennes, divisée par une valeur qui tient compte de la
variance des deux groupes et qui rend la statistique pivotale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

La valeur de la statistique t sera-t-elle grande ou petite si l’hypothèse H0 est confirmée?

A

Grande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

La valeur de la statistique t sera-t-elle grande ou petite si l’hypothèse H1 est confirmée?

A

Petite

17
Q

Que veut-on dire par distribution de la variable auxiliaire?

A

Distribution de la variable auxiliaire (statistique du test); autrement dit, quelle serait la
distribution de la statistique-test t si H0
était vraie?

18
Q

Qu’est-ce que la règle de décision utilisée pour faire la décision statistique?

A

Si la valeur observée de la variable-test t est si élevée qu’elle est plus grande que la
plupart des valeurs obtenues en simulant l’hypothèse H0
, ou encore si elle est si
fortement négative que peu des valeurs obtenues en simulant H0
sont aussi fortement
négatives, alors on ne peut pas croire que les résultats expérimentaux sont compatibles
avec l’hypothèse nulle et on rejette H0
.
* Si au contraire la valeur observée de la variable-test t se trouve vers le centre de la
distribution des valeurs obtenues sous H0
, cela montre qu’une telle valeur aurait très
bien pu être obtenue au hasard de l’échantillonnage d’une population ayant subi un
traitement unique et on admet donc que les données ne sont pas incompatibles avec
l’hypothèse principale.

19
Q

Quelles sont les principales conditions d’applications (en général) que nous pouvons retrouver chez les test statistiques pour les utiliser?

A
  • La distribution doit être normale
  • Variances doivent être égales (test t)
  • Indépendance des observations
20
Q

Quelle est la condition d’application qui se retrouve dans tous les tests et que signifie-t-elle?

A

Indépendance des observations : chaque valeur observée doit être non influencée par les autres valeurs observées.

21
Q

Comment peut-on passer par dessus la condition de normalité de distribution des données?

A

On peut utiliser la méthode de permutation

22
Q

Qu’est-ce qu’une erreur de type I?

A

Si à l’issue d’un test statistique on rejette une hypothèse H0
qui n’aurait pas dû être
rejetée, on dit que l’on commet une erreur a, appelée aussi erreur de type I ou de première
espèce. “Faux positif”

23
Q

Qu’est-ce qu’une erreur de type II?

A

Par contre, si
on ne rejette pas une hypothèse H0
qui aurait dû être rejetée, on commet une erreur b,
appelée aussi erreur de type II ou de deuxième espèce (tableau 4). Selon la même analogie,
une erreur de type II est un “faux négatif”.

24
Q

Qu’est-ce que l’’erreur a?

A

L’erreur a est le risque de déclarer que la relation biologique existe alors qu’elle
n’existe pas (par exemple: qu’il existe des différences entre deux groupes alors qu’il n’y en a
pas).

25
Q

Est-ce que le chercheur connait la valeur d’erreur a?

A

chercheur connaît toujours la valeur de a puisque c’est lui qui l’a déterminée

26
Q

Comment un test statistique peut-il être valide?

A

Un
test statistique est valide si son erreur de type I n’est pas supérieure au seuil de signification
a, et ce pour toute valeur de a.

27
Q

Quelle est la probabilité d’erreur a qu’un chercheur est plus souvent prêt à tolérer? (seuil de signification)

A

seuils de signification a = 0,05 (résultat significatif)

28
Q

Que signifie vraiment un seuil de 0.05 ou un seuil de 0.01?

A

Si on décide de réaliser un test au seuil a = 5% par exemple, cela signifie que l’on se
donne 5 chances sur 100 de rejeter H0
même si H0
est vraie et ne devrait donc pas être
rejetée

29
Q

Le seuil a doit être choisi en fonction de quoi?

A

Ceci montre bien que le seuil a doit être choisi en fonction de la gravité des
conséquences que l’on encourra si on est amené, par le test, à prendre la mauvaise décision

30
Q

Qu’est-ce que la zone de non-rejet de H0 ou d’acceptation de H0?

A

La zone dite “de non-rejet de H0
” (souvent qualifiée abusivement de “zone
d’acceptation”) est l’intervalle des valeurs de la statistique-test dans lequel les différences
observées peuvent être attribuées aux variations dues à l’échantillonnage. L

31
Q

Qu’est-ce que la zone de rejet de H0?

A

La zone de rejet
est au contraire la zone dans laquelle la statistique-test prend une valeur trop extrême pour
qu’on puisse l’attribuer à une variation aléatoire prévisible sous l’hypothèse nulle (H0
); dans
ce cas, on rejettera H0
avec, bien sûr, un risque d’erreur égal à la valeur a choisie par le
chercheur.

32
Q

Quelle est la distinction entre des échantillons indépendants et appariés?

A

Lors de la formation des différents groupes entre lesquels on cherchera des différences, si on
a sélectionné les objets devant faire partie de chacun des groupes indépendamment des
objets de l’autre ou des autres groupes, on a alors constitué des échantillons indépendants
(“independent samples” en anglais). Par contre, si on a prélevé (aléatoirement) des paires,
des triplets ou un plus grand nombre d’objets, et non des objets séparés, on a constitué des
échantillons (groupes) appariés (“related samples” ou “paired samples” en anglais, ou
encore “matched pairs” ou “before-after comparisons”). Les échantillons appariés
permettent de réaliser des tests statistiques plus puissants que les échantillons indépendants.

33
Q

Qu’est-ce qui détermine si notre échantillon est apparié ou indépendant et pourquoi la distinction est importante?

A

La distinction entre les échantillons indépendants et appariés devient importante lors
des comparaisons d’échantillons (test t, test U, analyse de variance, etc.) puisque la façon de
réaliser le test varie selon l’appariement ou le non-appariement des échantillons. C’est le
plan d’échantillonnage ou d’expérience qui détermine si les observations sont indépendantes
ou appariées. Attention — le mot indépendant peut être employé dans au moins trois autres
sens en statistique: variables indépendantes = non corrélées; variables indépendantes
(= prédictives) d’un modèle de régression; observations indépendantes = non autocorrélées.