3 - Modèles non paramétriques Flashcards

1
Q

Qu’est-ce qu’un test non paramétrique?

  • Explique c’est quoi
  • ils sont valides même dans quelle situation, donne un exemple
A

Tests que l’on peut appliquer lorsqu’on ne connaît pas les paramètres de la population.
Plus précisément, ces tests sont valides même si les postulats vus au dernier cours sont violés.
Exemple : quand on a des données aberrantes qu’on veut pas supprimer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un test non paramétrique?

  • Plusieurs personnes prétendent que ces tests ont quel désavantage ?
  • C’est le cas seulement dans quelle situation?
  • Lorsque les ____ ne sont pas respectés, on ne peut pas calculer la ____
A

Plusieurs personnes prétendent que ces tests sont « moins puissants ».
C’est seulement le cas lorsque la distribution des données est normale.
Lorsque les postulats ne sont pas respectés, on ne peut pas calculer la puissance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’un test non paramétrique?

Logique des tests non paramétriques
- Tous les tests reposent sur la même logique en lien avec les données, explique la

A

Au lieu de tester les données brutes, les données sont transformées en rang

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’un test non paramétrique?

Logique des tests non paramétriques :
- quELS sont les 2 avantages des tests non paramétriques

A

Peu importe l’écart en terme grandeur entre mes valeurs, c’est irrelevant de faire des corrections pour les données aberrantes
Pas besoin de vérifier les postulats de base

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wilcoxon rank-sum & Mann-Whitney test

Concepts principaux :
- Équivalent non paramétrique de quel test?
- Utile pour faire quoi?

A

Équivalent non paramétrique du test-t indépendant.
Utile pour comparer deux groupes composés d’individus distincts (pas les mêmes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wilcoxon rank-sum & Mann-Whitney test

Exemple d’étude :
Mesurer l’effet dépresseur de certaines drogues.
Deux groupes :
Prend de l’ecstasy le samedi soir
Prend de l’alcool le samedi soir

  • explique à quoi ça ressemble pour deux échantillons tirés d’une même population, qu’on considère comme une population seulement (pas séparÉ)
A

On devrait retrouver un nombre similaire de rangs faibles et élevés dans les deux échantillons, donc quand calcul la somme, ça devrait être pas mal identique
Si pas de différence dans échantillons, pas de différence significative donc ça reste la même population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wilcoxon rank-sum & Mann-Whitney test

Exemple d’étude :
Mesurer l’effet dépresseur de certaines drogues.
Deux groupes :
Prend de l’ecstasy le samedi soir
Prend de l’alcool le samedi soir

  • explique à quoi ça ressemble pour deux échantillons tirés d’une même population, mais qu’on sépare en 2 échantillons
A

Si une différence existe entre les deux échantillons, on observe une répartition différente des rangs dans les deux groupes, donc on peut parler de deux échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wilcoxon rank-sum & Mann-Whitney test

Exemple d’étude :
Mesurer l’effet dépresseur de certaines drogues.
Deux groupes :
Prend de l’ecstasy le samedi soir
Prend de l’alcool le samedi soir

  • Explique les rangs liés à cela
A

Deux scores avec la même valeur reçoivent le même rang.
Ce rang correspond à la moyenne de leurs rangs potentiels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wilcoxon rank-sum & Mann-Whitney test

Comment rapporter les résultats :
- Pour le Mann-Whitney
- Pour le Wilcoxon rank-sum
- Quelle est la particularité des tests NP?
- Qu’est ce qui doit être calculé à la main?

A
  • Mann-Whitney: Au deuxième jour du festival, le niveau d’hygiène des femmes (Mdn = 0.89) était significativement plus élevé que celui des hommes (Mdn = 0.67), U = 10271.5, z = 3.22, p = 0.001, r = 0.2.
  • Wilcoxon rank-sum : Au deuxième jour du festival, le niveau d’hygiène des femmes (Mdn = 0.89) était significativement plus élevé que celui des hommes (Mdn = 0.67), Ws = 23151.5, z = 3.22, p = 0.001, r = 0.2.
  • Particularité des tests NP : au lieu de rapporter la moyenne (moyenne pas représentatif car distribution pas normale), donc on rapporte la médiane car représente le point milieu
  • Tailles d’effet doivent être calculées à la main
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wilcoxon signed-rank test

  • QUel est son Équivalent paramétrique
  • Utilisé pour comparer quoi?
A

Équivalent paramétrique : Test-t pairé.
Utilisé pour comparer les mêmes participants dans deux conditions distinctes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wilcoxon signed-rank test

Logique du test
- Basé sur la différence entre…
- Ces différences sont transformées en ____
- La statistique est la ____ des rangs ____

A

Basé sur la différence entre les scores dans les deux conditions comparées.
Ces différences sont transformées en rangs.
La statistique est la somme des rangs positifs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wilcoxon signed-rank test

Théorie
Comment déterminer si c’est significatif?
- La distribution de la somme des rangs positifs suit une forme pouvant être approximée par quoi?
- Et comment estimer la probabilité d’avoir une valeur aussi élevée?

A

une distribution normale
Puisque la statistique s’approche de la distribution normale, on peut ensuite transformer en scores Z pour estimer la probabilité d’avoir une valeur aussi élevée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wilcoxon signed-rank test

Comment rapporter les résultats. (2)

A

Le niveau d’hygiène au jour 2 (Mdn = 0.79) ne différait pas significativement de celui au jour 3 du festival (Mdn = 0.76), T = 4129, p = 0.138, r = 0.13.
OU: Le niveau d’hygiène au jour 2 (Mdn = 0.79) ne différait pas significativement de celui au jour 3 du festival (Mdn = 0.76), z = 1.48, p = 0.138, r = 0.13.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Kruskal-Wallis test

Concepts principaux
- quel est son équivalent paramétrique
- utilisé pour quoi
- basé sur quoi
- La statistique ____ est ensuite calculée à partir de ____

A

Équivalent paramétrique : ANOVA simple.
Utilisé pour comparer plusieurs groupes composés d’individus distincts.
Basé sur la somme des rangs dans chaque groupe (dénotée R).
La statistique H est ensuite calculée à partir de R.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kruskal-Wallis test

Comment déterminer si c’est significatif?

A

La statistique H a une distribution de forme chi-carré avec k-1 degrés de liberté (k = nombre de groupes).
Si on regarde dans la table Chi-carré, la valeur critique est de 7.82… ce qui nous mènerait à un rejet de l’hypothèse nulle.
Que veut dire un rejet de l’hypothèse nulle dans ce cas-ci?
Indique un effet du groupe sur notre VD.
Dans le cas de l’exemple présenté sur la consommation de soya: indique un impact général du groupe (consommation de soya) sur la qualité du sperme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Kruskal-Wallis test

Dire si c,est significatif
- Quelle info ça donne pas quand on rejette l’hypothèse nulle? explique

A

Mais on ne sait pas entre quels groupes la différence s’observe (dit si la variance est au sein des groupes, mais pas au sein de quel groupe spécifiquement)

17
Q

Kruskal-Wallis test

Mais on ne sait pas entre quels groupes la différence s’observe (dit si la variance est au sein des groupes, mais pas au sein de quel groupe spécifiquement)
Nécessité de faire des analyses supplémentaires
- Nomme les 2

A
  1. Comparaisons a posteriori
    OU
  2. Méthode Step-down
18
Q

Kruskal-Wallis test

Mais on ne sait pas entre quels groupes la différence s’observe (dit si la variance est au sein des groupes, mais pas au sein de quel groupe spécifiquement)
Comparaisons a posteriori
- Quelle analyse on fait et comment?
- que faut il faire attention a? Explique ce qu’il faut faire
- ainsi, que faut il pour que ce soit considéré comme significatif?

A

On fait six Wilcoxon rank-sum ou Mann-Whitney tests : Prendre comparaison individuelles et faire un man whitenet sur les combinaisons
Par contre, attention: il faut faire une correction de Bonferroni pour contrôler la probabilité de faire l’erreur alpha (familywise error rate) (car chances plus élevée de faire une erreur puisqu’une analyse supplémentaire)
Ici, cela voudrait dire que pour être considéré significatif, le p pour chacun des tests devrait être inférieur à 0.008 (p=0.05/6).

19
Q

Kruskal-Wallis test

Mais on ne sait pas entre quels groupes la différence s’observe (dit si la variance est au sein des groupes, mais pas au sein de quel groupe spécifiquement)
Méthode step-down
- explique cela

A

D’abord, mettre en ordre la somme des rangs
Dans l’exemple présent, l’ordre serait:
7x semaine; 1x semaine; 4x semaine; 0x semaine

20
Q

Kruskal-Wallis test

Step down
Tailles d’effet
- Typiquement, on rapporte seulement pour quelle analyse?
- Donc de la même façon que vu dans quelle section
- explique un exemple de différence signif vs non signif
- quel est l’avantage du step down

A
  • Typiquement, on rapporte seulement pour les comparaisons a posteriori.
  • Donc de la même façon que vu dans la section sur le test Wilcoxon rank-sum & Mann-Whitney
  • Avantage du step down : pas faire des comparaisons qui pourraient être inutiles, plus de comparaisons = plus intéressant, permet de maximiser la variance
21
Q

Friedman’s ANOVA

  • Quel est l’équivalent paramétrique
  • utilisé pour quoi?
  • On trouve quoi?
  • on calcul quoi ensuite?
  • La statistique ____ est ensuite calculée à partir de ____
A

Équivalent paramétrique : ANOVA à mesures répétées.
Utilisé pour comparer les mêmes individus soumis à plusieurs conditions différentes.
On trouve, séparément pour chaque sujet, le rang de chacune des conditions.
On calcule ensuite la somme des rangs par condition (R).
La statistique F est ensuite calculée à partir de R.

22
Q

Friedman’s ANOVA

Comment déterminer si c’est significatif?

A

La statistique F a une distribution de forme chi-carré avec k-1 degrés de liberté (k = nombre de conditions).
Si on regarde dans la table Chi-carré, la valeur critique est de 5.99… ce qui nous mènerait à un non-rejet de l’hypothèse nulle.
Si rejet de l’hypothèse nulle
Tout comme avec le test Kruskal-Wallis, il y a nécessité de faire des analyses supplémentaires. 1. Comparaisons a posteriori
OU
2. Méthode Step-down