Tests non paramétriques (6) Flashcards
Quel est le problème avec le calcul de l’accord inter-juge en % d’Accord%
Notre pourcentage d’accord ne nous aidera pas à déceler certaine supercherie : en utilisant la même stratégie
douteuse, les deux juges obtiendront «par hasard» un bon pourcentage d’accord.
Comment caclcule-t-on l’accord inter-juge avec le Kappa (k)?
- Raisonnement similaire au Khi-carré: on calcule les fréquences attendues si les juges classent les participants au hasard
2.Formule du Kappa - k= % accord inter-juge en incluant la possibilité que l’On observe certains accords du au hasard
Quelle est la formule du Kappa?
k=Somation de (fo)-Sommation de (fa) / N- sommation de fa
fo: fréquences observées
fa:fréqences attendues
N: nb accords potentiels (nb observation)
Au numérateur : le nombre d’accords moins ceux qu’on aurait eus si on avait procédé au hasard.
Au dénominateur : le nombre total de jugements moins les accords qu’on aurait eu par pur hasard.
On a donc le ratio du nombre d’accords sur le nombre total de jugements, moins l’effet attendu du hasard dans les deux cas.
V/F En d’autres mots, la mesure d’accord inter-juge par Kappa se résume à la proportion d’accords si on exclut tous ceux qui seraient obtenus par hasard
VRAI
Explique la mesure d’accord interjuge du coefficient de concordnace de Kendall (W) (concordance des rangs)
Principe: Si les juges sont d’accords, la variance entre les scores des différents films serait grande. Si les juges ne sont pas d’accords, la variance ne sera pas particulièrement grande.
Donne la formule du W de kendall (mesure accord inter-juge de la concordance des rangs)
W= variance des totaux des colonnes/ varaince maximale possible des totaux de colonnes
W = (12 Sommation de Tj2 / k2 N (N2-1)) - 3(N+1)/N-1
Sommation de Tj2 : somme des totaux de colones au carré
K: nb de juges
N: nb d’objets a classer
V/F Le W obtenu dans la mesure d’accord a une signification particulière.
FAUC, Pas vraiment de signification qui soit très intuitive, mais on peut transformer le W de Kendall en rs de Spearman.
Comment transforme-t-on un W en rs de spearman?
Avec cette formule:
rs= kW -1/k-1
V/F Si on faisait faisait toutes les paires de juges possibles, et que l’on calculait ensuite le rs de Spearman pour chacune de ces paires, on pourrait ensuite calculer le en rs de Spearman moyen.
VRAI
Lorsqu’on fair une mesure d’accord interjuge avec la concordance des rang, que doit-on rapporter?
Le W et le rs (que l’on doit interpréter)
Qu’est-ce que la médiane
Le point auquel (ou sous lequel) on retrouve 50 % des scores, lorsque ceux-ci sont placés en ordre numérique.
Position: N+1/2
**lorsque scores placés en ordre
N: nb de scores
Qu’est-ce que la moyenne?
Somme des scores divisée par le nombre de score
Pour trouver position: Somation des scores/ nb de scores
Quels sont les avantages et inconvénients de la médiane?
Avantages:
- Pas influencée par les scores extrêmes.
- N’implique pas (contrairement à la moyenne) que les données sont sur une échelle d’intervalle.
Inconvénients:
-Ne s’utilise pas facilement dans des équations.
-Pas aussi stable que la moyenne d’un échantillon à l’autre.
Quels sont les avantages et inconvénients de la moyenne?
Avantages:
-Peut faire l’objet de manipulations algébriques et être utilisée facilement dans des équations.
-Plus stable que la médiane d’un échantillon à l’autre
Inconvénients:
-Pour que la moyenne soit interprétable, on doit avoir une confiance minimale que les données sont sur une échelle d’intervalle.
-Sensible aux données extrêmes
Comment calcule-t-on un score Z?
Z= (score-moyenne)/écart-type
Explique le concept de limitte
Score Z au dela duquel les résultats sont jugés trop improbables pour êtres observés sous Ho (du au hasard). Conclusion que ces scores appartiennent a une autre population (H1)
Les limites peuvent aussi êtres vues comme un intervalle de confiance
Quelle est la formule/ la façon de présenter un intervalle de confiance?
IC.%deconfiance = (différence de moyenne) +- (tcritique x Érreur standar.différence de moyennes)
Résume le test t (tet de student) pour échantillon indépendant
- on exrime la différence entre 2 valeurs en quantité d’erreur standard
t=Valeur1-Valeur2/ erreur standard
-Quand probabilité d’observer une valeur de t est plus petite que le seuil fixé (alpha), conclusion qu’il y a une différence significative
Quelle esr la principale différence entre les différentes versions du test t?
La manière de calculer l’erreur standard
La plupart des tests statistiques les plus communs impliquent (2)…
La plupart des tests statistiques les plus communs impliquent :
1. D’estimer un ou plusieurs paramètres
2. D’avoir une distribution normale dans nos données
Défini un test non paramétrique (2)
-Ils ne sont pas basés sur des conditions d’application liées à l’estimation de paramètres ou sur des conditions liées à des distributions.
-Ou encore ces conditions sont beaucoup plus générales.
Nomme 3 avantages des tests non-paramétriques
- Dans certains contextes, utiliser un test paramétrique sans remplir ses conditions d’application fera en sorte que ce test soit moins puissant que le test non paramétrique correspondant.
- Plusieurs tests non paramétriques sont plus sensibles aux médianes qu’aux moyennes. Si la médiane nous intéresse plus que la moyenne, il s’agit d’un avantage.
- Certains tests non paramétriques permettent de tester des hypothèses sur nos données même en la présence de données extrêmes.
Nomme deux inconvénients des tests non-paramétriques
- On prétend parfois que les tests non paramétriques sont moins puissants que les tests paramétriques correspondants.
- Il faut donc de plus grands échantillons avec les tests non paramétriques, pour avoir une puissance comparable aux tests paramétriques.
Explique la confusion qui subsiste quant à la puissance des tests non-paramétriques
- Même lorsqu’il y a des écarts importants aux conditions d’application des tests paramétriques, ceux-ci sont parfois quand même plus puissants que les tests non paramétriques.
- On a aussi montré que pour certains ensembles de données, les tests non paramétriques pourraient avoir une puissance à celle des tests paramétriques.
- Généralement, on ignore malheureusement à quel moment le test non paramétrique sera plus puissant