Métho II (examen 2) Flashcards
que permet une anova
comparer plusieurs groupes entre eux pour voir s’ils diffèrent
quelle est la logique des anova
comparaison de la variance inter-groupe à la variance intra-groupe
3 conditions application de l’Anova
- homogénéité des variances à travers les conditions (groupes)
- normalité de l’erreur = données sont distribuées normalement pour chaque conditions (provienne de la même population)
- indépendance des observations (pas d’influence entre les conditions)
différence entre variance inter-groupe et intra-groupe
- intra = quantifie la dispersion des données autour de leur propre moyenne de groupe
- inter = évalue la dispersion des moyennes des groupes autour de la moyenne globale
quel est le seul aspect qui n’est pas contrôlé dans les estimés de variance pour les anovas
- variance inter groupe soit ici à quel point les groupes ont des moyennes différentes des autres
quel type de variance peut détecter lorsque les groupes dans mon Anova ne proviennent pas de la même population
- celle inter, car elle prend en compte l’appartenance aux groupes
que sont des carrés moyens
se sont nos variances intra et inter
quels sont les synonymes pour somme des carrés inter et intra
- inter = traitement
- intra = erreur
comment prendre la décision si oui ou non mes groupes dans mon Anova diffère significativement ou non
- trouver F critique (valeur inter est mon numérateur et dl mon dénominateur)
- si mon f trouvé est plus grand que mon f critique = mes groupes diffèrent significativement donc appartiennent probablement à une autre population
est-ce que l’Anova permet de savoir si ma valeur est plus haut ou plus bas comme dans les tests t
- non, elle permet seulement de savoir si c’est rare ou non
vrai ou faux, l’Anova est une procédure robuste
vrai
quel aspect influence la robustesse de l’Anova
- si les échantillons sont de taille inégales, car les variances ne seront plus homogènes
le test du f permettant de savoir si nos groupes sont différents significativement ou non ne nous permets pas de savoir la différence se trouve entre quels groupes, quoi faire pour trouver cette différence
- comparaisons multiples = comparer les différentes moyennes les unes aux autres pour trouver quelles moyennes diffèrent
quel est un grand risque des comparaisons multiples
- plus on fait de tes plus on risque de se tromper et faire une erreur de type 1 soit dire qu’il y a un effet alors que non
comment trouver la probabilité dans mes comparaison multiples de faire au moins une erreur de type 1
1 - probabilité aucun test significatif
comment contrôler le fait que les comparaisons multiples nous mettes à risque de faire des erreurs de type 1
utiliser des procédure de contrôle du taux d’erreur
dans quel contextes veut-on faire des comparaisons multiples
pour multiples groupes ou mesures = pour vérifier s’il existe des différences entre plusieurs groupes sur un certain nombre de mesures
différence entre 3 types de stratégies de contrôle du taux d’erreur
- par comparaison
- par famille
- par expérience
- comparaison = je fais seulement 1 seule Anova
- famille = j’ai 3 groupes dans mon Anova donc je fais 3 comparaison entre moyennes
- expérience = vérifier si dans toute mon étude, même si différents types analyses, ,pm taux n’est pas trop élevé
quel est le type de stratégies de contrôles du taux d’erreur que l’on utiliser
- taux d’erreur de l’ensemble = par famille + par expérience
3 exemples de stratégies de contrôle du taux d’erreur
- test-t multiples
- Bonferroni
- Sidak-Bonferroni
quelle est le méthode du test-t multiples et son type de contrôle
- méthode = faire une série de test t en comparant les moyennes par paires + aucune modification niveau alpha
- contrôle = par comparaison
quelle est le méthode du bonferroni et son type de contrôle
- méthode = séries de tests statistiques avec un seuil alpha diminuant pour chaque test
- contrôle = ensemble
inconvénients test bonferroni
- peut produire des seuils alpha très petits = très conservateur
- devient encore plus conservateur lorsque les mesures sont corrélées les unes aux autres
quelle est le méthode du sidak-bonferroni et son type de contrôle
- méthode = modification du bonferroni pour le rendre plsu libérale
- contrôle = ensemble
inconvénient test sidak-bonferroni
- à peine moins conservateur que Bonferonni
quels est le risque avec la diminution de l’erreur de type 1 des stratégies de contrôle du taux d’erreur
- diminué erreur de type 1 augmente le risque d’erreur de type 2 (dire pas d’effet alors que oui)
solution pour éviter de trop augmenter les erreurs de type 2 avec les stratégies de contrôle du taux d’erreur très stricte
- contrôle du taux de fausses découvertes
quels sont les deux types de contrôle du taux de fausses découvertes
- Holm-Bonferonni
- Benjamin-Hochberg
en gros les deux consiste a diminué le seuil alpha jusqu’à ne plus obtenir de différence significative
devrait-on contrôler le taux d’erreur
question personnelle
- si chercheur préfère contrôle erreur 1 = stratégie contrôle du taux d’erreur
- si chercheur préfère contrôle erreur 2 = contrôle du taux de fausses découvertes
comment éviter d’avoir à utiliser les stratégies du contrôle du taux d’erreur
- choisir un nombre limité de variables d’intérêt, étant corrélées entre elle et déterminées à l’avance
dans quel condition préférable faire contrôle du taux de fausse découverte
- si grand nombre de test
différence entre anova à plan simple et anova à plan factoriel
- simple = les participants sont classés selon 1 seul critère telle que l’appartenance à un traitement
- factoriel = les participants sont classés selon plusieurs critères de classification tel que l’âge et traitement
synonyme factoriel
variable catégorielle
2 avantages des anova à plan factoriel
- elles sont économiques = car au lieu de faire une anova pour chaque groupe il aurait fallu le double de participants pour avoir la même puissance
- permet interprétation plus riche = permet de voir les interactions entre les variables indépendantes
qu’est-ce que l’effet principal
se rapporte aux effets observés par les moyennes marginales soit la différence entre les différents niveaux d’un facteur
qu’est-ce qu’une interaction
- observations faites en regardant l’effet d’un facteur selon les niveau d’un autre = je prends les personnes de plus de 18 ans et regarde différence selon les traitements
dans l’anova à plan factoriel, la somme carré total est = à quoi
somme carré cellules + somme carré erreur
dans l’anova à plan factoriel, la somme carré cellules est = à quoi
somme carré valeur indépendante 1 + somme carré valeur indépendante 2 + somme carré valeur indépendante
qu’est-ce que la somme carrés d’erreur dans l’anova à plan factoriel
- je l’utilise si me résultats varient encore en dehors de mes somme de carrés de mes variables indépendantes
- mesure de la variabilité des données ne s’expliquant pas par le modèle
dans les anovas à plan factoriel quel est un synonyme de la somme carré erreur
somme carré intra
dans les anovas à plan factoriel, comment trouver nos effets principaux pour chaque variable indépendantes et pour leur interaction
- trouver notre f car f = effet principal
- f = cm pour une variable indépendante / cm erreur
comment savoir si dans mon anova à plan factoriel il y a une interaction
- interaction = une variable dépend de l’autre
- sur un graphique mes droites ne sont pas parallèles
- pour être significative = nécessite un écart important
comment interprété une interaction
utilisé le contexte
pouvons-nous utilisé des comparaison multiples dans les anavos à plan factoriel
oui
que permette les test d’effet simple
savoir quand nos interactions sont significatives
comment interprété test effet simple
= trouvé f = si a un étoile il est significatif et plus sa valeur est grande plus la différence est grande
si je veux par exemple, dans mon anova à plan factoriel, seulement la proportion de la variabilité expliqué par ma variable dépendante âge je fais quoi
je vais prendre sa somme carrée
à quoi il faut faire particulièrement attention avec les anovas à plan factoriel
les cellules de tailles inégales = demandera de modifier les calculs pour les SC et les tailles d’effets
que représente partial eta squared
taille effet partiel au carré
quel test est souvent utilisé pour vérifier l’homogénéité des variances avec les anovas simples
test de levene
si les conditions d’utilisation de l’ANOVA sont respectées et que toutes les observations proviennent de la même population qu’est-ce que l’on observera
- la variance intra est égale à celle inter
quel est l’objectif principal d’un test d’hypothèse dans le cadre d’une ANOVA
- savoir à quel point il est probable d’observer une certaine valeur F si tous les groupes proviennent d’une même population
différence entre sommes des carrés et les carrés moyens dans un tableau ANOVA
- SC représente la variation totale des données
- CM est la SC ajustée selon les degrés de liberté pertinents pour chaque source de variation
que représente un résultat significatif dans l’ANOVA
- il existe une différence significative entre au moins deux des moyennes des groupes
quel est le principal indicateur de la taille d’effet utilisé en anova plan simple pour mesurer l’ampleur de la différence entre les groupes
- l’êta carré
Comment interprète-t-on une taille d’effet η2 de 0.05 dans le contexte d’une ANOVA ?
5% de la variance totale est expliquée par les différences entre les groupes
Pourquoi y a-t-il un plus grand risque d’erreur de type 1 si celui-ci n’est pas contrôlé dans les comparaisons multiples après une ANOVA ?
Parce que l’augmentation du nombre de tests augmente la probabilité de trouver au moins un résultat significatif par chance, même si l’hypothèse nulle est vraie pour tous les tests.
Qu’est-ce que le contrôle du taux d’erreur de l’ensemble (EE) dans le contexte d’analyses statistiques multiples ?
minimiser le risque d’erreurs de type I lorsqu’on effectue plusieurs comparaisons de moyennes
Quelle méthode de contrôle du taux d’erreur ajuste le seuil alpha de façon variable pour chaque test, basé sur le rang des valeurs p ?
La méthode de Holm-Bonferroni.
Quelle est la principale différence entre le taux d’erreur de l’ensemble (EE) et le taux de fausses découvertes (FDR) dans le contexte des comparaisons multiples ?
- EE = contrôler la probabilité de commettre au moins une erreur de Type I sur l’ensemble des tests
- FDR vise à contrôler la proportion d’erreurs de Type I parmi les tests déclarés significatifs.
pourquoi il est préférable de faire des taux de fausses découvertes aux taux d’erreur de l’ensemble
par ce que FDR est moins conservateur et augmente ainsi la puissance statistique des tests
Quels sont les avantages principaux de la méthode de Benjamini-Hochberg par rapport à la méthode de Bonferroni ?
- moins conservatrice
- permet de contrôler le taux de fausses découvertes plutôt que le taux d’erreur de Type I global.
comment décrire correctement une ANOVA à plan factoriel dans un rapport de recherche
« Une ANOVA 2 (enfants vs adultes) × 3 (thérapie cognitive vs médication vs thérapie plus médication) a été conduite sur les scores au GAD-7. »
qu’indique la présence d’une interaction significative dans une anova à plan factoriel
que l’effet d’un facteur sur la variable dépendante change selon les niveaux de l’autre facteur
Quels types d’effets une ANOVA à plan factoriel permet-elle d’examiner ?
- Les effets principaux de chaque facteur
- les interactions entre ces facteurs.
Quelle est la principale différence entre les interactions et les effets principaux dans le contexte d’une ANOVA factorielle
- effets principaux = concernent la comparaison des moyennes globales de chaque niveau d’un facteur, sans tenir compte des niveaux des autres facteurs
- interactions = examinent comment la combinaison spécifique des niveaux de deux facteurs ou plus affecte la variable dépendante
Dans une ANOVA, si le êta carré partiel pour l’âge est de 0.35, comment interpréteriez-vous cette valeur ?
35 % de la variance totale de la variable dépendante est attribuable à l’âge.
différence entre anova à plan factoriel et à mesures répétées
- plan factoriel = participant participe à seulement 1 condition
- répétées = participants participent à plus d’une condition
objectif général d’une ANOVA
estimer quelle portion de la variance est due aux conditions et quelle proportion est due à l’erreur
différence par rapport à la variance due à l’erreur entre ANOVA standard et celle à mesures répétées
- standard = la variance intra-groupe est considérée comme de la variance due à l’erreur
- répétées = puisque plusieurs mesures pour chaque participant on enlève la variance intra-groupe ce qui diminue l’erreur
qu’est-ce que la condition d’application de l’ANOVA à plan simple à mesures répétées nommée la symétrie composée de la matrice des covariances
- les variances (diagonale) doivent être constantes
- les covariances (hors diagonale) doivent être constantes
qu’est-ce que la covariance
degré auquel 2 variables varient ensemble
si nous faisons des covariance dans le cadre d’une ANOVA avec des groupes indépendants qu’est-ce que l’on observe
les covariances seront de 0
la condition de la symétrie composée de la matrice des covariances est dite trop stricte, on la remplace par quoi
sphéricité qui s’intéresse à la variance des différences entre traitements plutôt que la covariance entre les traitements
quel test de sphéricité est utilisé et quel résultat on veut
- Mauchly
- non significatif car cela indique que la sphéricité est respectée
dans les ANOVAS factoriel à mesures répétées il y a deux SC erreur lesquels
- facteur inter-sujet
- facteur temps x inter-sujet
dans ANOVA factoriel à mesures répétées à quoi est égal la variabilité inter-sujet
variabilité groupe + variabilité intra-groupe
dans ANOVA factoriel à mesures répétées à quoi est égal la variabilité intra-sujet
variabilité temps + variabilité temps x groupe + variabilité temps x intra groupe
pourquoi pour trouver le f dans une ANOVA factoriel à mesures répétées nous avons fait CM groupe / CM intra-groupe
car permet de trouver l’effet du groupe sur l’intra-groupe