Accord inter-juges, rééchantillonnage et tests non paramétriques Flashcards
Quels sont les mesure d’accord inter-juge ?
Le kappa (k): 2 juges
Le coefficient de concordance de Kendall (W): + que 2 juges
Comment trouver le kappa ?
Chaque juges (2) ne connait que ses propres scores. Il calcule les scores attendus et les compare aux scores otenues. Puis utilise formule du kappa k=fo-fa/N-fa (formule retire tout se qui est du au hasard). Puis interprète.
Comment trouver le coefficient de concordance de Kendall (W) ?
Formule du W=variance des totaux de colonnes/variance maximale possile des totaux de colonnes. Peut aussi rapporter le Rs et interpréter.
Quels sont les avantages et les inconvénients de la médiane ?
+: Pas influencé par scores extrêmes, n’impliquent pas que les données sur une échelle d’intervalle
-: S’utilise pas facilement dans équation, pas aussi stable que moyenne
Quels sont les avantages et les incovénients de la moyenne ?
+: Objet de manipulations algériques et être utilisée facilement dans équations, plus stable que médiane
-: Sensible aux données extrêmes, esoin d’une confiance minimale que les données sont sur un échelle d’intervalle
Quelles sont les limites ?
Intervalle de confiance
Quel est la formule des intervalles de confiance ?
IC=(différence de moyennes)+-(tcritique x ESdifférence de moyennes)
Qu’est ce qu’une intervalle de confiance
Si on répétait cette même expérience pleins de fois, on sait que la valeur est d’être à l’intérieur de l’intervalle 95% du temps.
Qu’est ce qu’implique les tests statistiques les plus communs ?
D’estimer un ou plusieurs paramètres
D’avoir une distriution dans nos données
Qu’est ce qu’un test non paramétriques ?
Pas basé sur conditions d’application liées à l’estimation de paramètres ou conditions liées à des distriutions ou encore ces conditions sont bcp plus générales.
Utilise quand condition d’application des test paramétriques ne sont pas rempli
Quels sont les avantages des tests non paramétriques ?
Dans certains contextes, utiliser un test paramétrique sans remplir ses
conditions d’application fera en sorte que ce test soit moins puissant que le test non paramétrique correspondant.
Plusieurs tests non paramétriques sont plus sensibles aux médianes qu’aux moyennes. Si la médiane nous intéresse plus que la moyenne, il s’agit d’un avantage.
* Certains tests non paramétriques permettent de tester des hypothèses sur nos données même en la présence de données extrêmes.
Quels sont les incovénients des test non paramétriques ?
Certains disent qu’ils sont moins puissants que tests paramétriques, il faut donc de plus grands échantillons pour avoir une puissance comparable aux test paramétriques
Qu’est ce que le bootstrap ?
Permet d’étalir un intervalle de confiance autour de la médiane (et quand les conditions d’application des tests paramétriques sont pas rempli).
Quel est la logique du bootstrap ?
Suppose que la popu est répartit pareil que l’échantillon.
1. Calcul la médiane de pleins d’échantillons
2. Distriution de fréquence de ces médianes
3. Trouve les limites qui correspond à 2,5% des médianes observées de chaque côté de la distribution.
Se demander si notre intervalle inclu 0.
Pourquoi vondrait-on calculer des intervalles de confiance ?
Permet d’aller au-delà d’une simple valeur p (et n’empêche pas de faire des tests d’hypothèse nulle, si on le souhaite)
Permet de visualiser l’incertitude associée à nos données (+ intervalle est grande=+ on se rend compte que notre estimation d’un paramètre pourrait être loin de la vérité, et inversement)
Qu’est ce que le test de la somme des rangs de Wilcoxon ?
Test non paramétrique équivalent du test t sur deux échantillons indépendants.
H0: les deux échantillons ont été prélevés aléatoirement de populations identiques.
Vérifie si la somme des rangs du plis petit groupe est plus petite que la plus petite somme des rangs qu’on s’attendrait à obternir au hasard. On obtient valeur critique de la distribution W.
Pour les n < 25, le test est basé directement sur une distribution W
Pour les n > 25, on peut exploiter que la forme de la distribution s’approche d’une normale. On peut calculer z et
utiliser la distribution normale pour obtenir une valeur p.
Qu’est ce que le test des rangs pour échantillons pairés de Wilcoxon ?
H0 : les deux échantillons pairés proviennent soit de populations qui sont identiques, soit de populations qui sont symétriques et qui ont la même moyenne.
n < 50, le test est basé directement sur une distribution T
n > 50, on peut exploiter que la forme de la distribution s’approche d’une normale, calcul z et utiliser la distribution normale pour obtenir une valeur p
Quels sont d’autres tests non paramétriques ?
Analyse de variance à un critères de classification de Kruskal-Wallis (équivalent d’ANOVA à un facteur)
Test des rangs de Friedman pour K échantillons non indépendants (équivalent ANOVA à un facteur à mesures répétés)
Quels sont les problèmes des tests d’hypothèse nulle à l’aide de valeurs p ?
Mal comprise: La valeur p représente la proabilité d’observer des données aussi extrêmes que celles que l’on observe si l’hypothèse nulle est vraie
Encourage la pensée dichotomique
Degré de signification peut être confondu avec taille d’échantillon
Certains en font mauvais usages
Quelles sont les solutions des problèmes des tests d’hypothèse nulle à l’aide de valeurs p ?
Rapporter les tailles d’effet
Rapporter les intervalles de confiance
Méta-analyses: permet d’agréger les tailles d’effet de plusieurs études pour mieux estimer l’effet réel
Méthodes statistiques bayésiennes, de plus en plus populaires