Métho II (examen 2) Flashcards

Question

inconvénient test sidak-bonferroni

Answer 1

- à peine moins conservateur que Bonferonni

Answer 2

- diminué erreur de type 1 augmente le risque d'erreur de type 2 (dire pas d'effet alors que oui)

Answer 3

- contrôle du taux de fausses découvertes

Answer 4

- Holm-Bonferonni - Benjamin-Hochberg en gros les deux consiste a diminué le seuil alpha jusqu'à ne plus obtenir de différence significative

Answer 5

question personnelle - si chercheur préfère contrôle erreur 1 = stratégie contrôle du taux d'erreur - si chercheur préfère contrôle erreur 2 = contrôle du taux de fausses découvertes

Answer 6

- choisir un nombre limité de variables d'intérêt, étant corrélées entre elle et déterminées à l'avance

Answer 7

- si grand nombre de test

Answer 8

- simple = les participants sont classés selon 1 seul critère telle que l'appartenance à un traitement - factoriel = les participants sont classés selon plusieurs critères de classification tel que l'âge et traitement

Answer 9

variable catégorielle

Answer 10

- elles sont économiques = car au lieu de faire une anova pour chaque groupe il aurait fallu le double de participants pour avoir la même puissance - permet interprétation plus riche = permet de voir les interactions entre les variables indépendantes

Answer 11

se rapporte aux effets observés par les moyennes marginales soit la différence entre les différents niveaux d'un facteur

Answer 12

- observations faites en regardant l'effet d'un facteur selon les niveau d'un autre = je prends les personnes de plus de 18 ans et regarde différence selon les traitements

Answer 13

somme carré cellules + somme carré erreur

Answer 14

somme carré valeur indépendante 1 + somme carré valeur indépendante 2 + somme carré valeur indépendante

Answer 15

* je l'utilise si me résultats varient encore en dehors de mes somme de carrés de mes variables indépendantes * mesure de la variabilité des données ne s'expliquant pas par le modèle

Answer 16

somme carré intra

Answer 17

- trouver notre f car f = effet principal - f = cm pour une variable indépendante / cm erreur

Answer 18

- interaction = une variable dépend de l'autre - sur un graphique mes droites ne sont pas parallèles - pour être significative = nécessite un écart important

Answer 19

utilisé le contexte

Answer 20

savoir quand nos interactions sont significatives

Answer 21

= trouvé f = si a un étoile il est significatif et plus sa valeur est grande plus la différence est grande

Answer 22

je vais prendre sa somme carrée

Answer 23

les cellules de tailles inégales = demandera de modifier les calculs pour les SC et les tailles d'effets

Answer 24

taille effet partiel au carré

Answer 25

test de levene

Answer 26

- la variance intra est égale à celle inter

Answer 27

- savoir à quel point il est probable d'observer une certaine valeur F si tous les groupes proviennent d'une même population

Answer 28

- SC représente la variation totale des données - CM est la SC ajustée selon les degrés de liberté pertinents pour chaque source de variation

Answer 29

- il existe une différence significative entre au moins deux des moyennes des groupes

Answer 30

- l'êta carré

Answer 31

5% de la variance totale est expliquée par les différences entre les groupes

Answer 32

Parce que l'augmentation du nombre de tests augmente la probabilité de trouver au moins un résultat significatif par chance, même si l'hypothèse nulle est vraie pour tous les tests.

Answer 33

minimiser le risque d'erreurs de type I lorsqu'on effectue plusieurs comparaisons de moyennes

Answer 34

La méthode de Holm-Bonferroni.

Answer 35

- EE = contrôler la probabilité de commettre au moins une erreur de Type I sur l'ensemble des tests - FDR vise à contrôler la proportion d'erreurs de Type I parmi les tests déclarés significatifs.

Answer 36

par ce que FDR est moins conservateur et augmente ainsi la puissance statistique des tests

Answer 37

- moins conservatrice - permet de contrôler le taux de fausses découvertes plutôt que le taux d'erreur de Type I global.

Answer 38

« Une ANOVA 2 (enfants vs adultes) × 3 (thérapie cognitive vs médication vs thérapie plus médication) a été conduite sur les scores au GAD-7. »

Answer 39

que l'effet d'un facteur sur la variable dépendante change selon les niveaux de l'autre facteur

Answer 40

- Les effets principaux de chaque facteur - les interactions entre ces facteurs.

Answer 41

- effets principaux = concernent la comparaison des moyennes globales de chaque niveau d'un facteur, sans tenir compte des niveaux des autres facteurs - interactions = examinent comment la combinaison spécifique des niveaux de deux facteurs ou plus affecte la variable dépendante

Answer 42

35 % de la variance totale de la variable dépendante est attribuable à l’âge.

Answer 43

- plan factoriel = participant participe à seulement 1 condition - répétées = participants participent à plus d'une condition

Answer 44

estimer quelle portion de la variance est due aux conditions et quelle proportion est due à l'erreur

Answer 45

- standard = la variance intra-groupe est considérée comme de la variance due à l'erreur - répétées = puisque plusieurs mesures pour chaque participant on enlève la variance intra-groupe ce qui diminue l'erreur

Answer 46

- les variances (diagonale) doivent être constantes - les covariances (hors diagonale) doivent être constantes

Answer 47

degré auquel 2 variables varient ensemble

Answer 48

les covariances seront de 0

Answer 49

sphéricité qui s'intéresse à la variance des différences entre traitements plutôt que la covariance entre les traitements

Answer 50

- Mauchly - non significatif car cela indique que la sphéricité est respectée

Answer 51

- facteur inter-sujet - facteur temps x inter-sujet

Answer 52

variabilité groupe + variabilité intra-groupe

Answer 53

variabilité temps + variabilité temps x groupe + variabilité temps x intra groupe

Answer 54

car permet de trouver l'effet du groupe sur l'intra-groupe

Answer 55

- participants = regardé la ligne inter-sujet +1 - groupe = regardé la ligne groupe + 1 - temps = regardé ligne temps +1

Answer 56

diminuer le nombre de degrés de liberté ce qui rend le test plus sévère et donc plus difficile d'être significatif

Answer 57

- simple = prédire un critère avec un seul prédicteur - multiple = prédire un seul critère avec plusieurs prédicteurs

Answer 58

par quel chiffre on doit multiplier les valeurs pour que lors de leur addition on arrive le plus proche possible de la variable prédite

Answer 59

- le b minimisant les espaces entre les points et la ligne = diminué l'erreur de prédiction soit le résidu

Answer 60

- simple = proportion variable de notre critère expliquée par notre prédicteur - multiple = proportion de la variabilité de notre critère expliquée uniquement par les différents critères = soit pas expliqué par plusieurs critères (pas de chevauchement)

Answer 61

- première ligne du tableau dans la section corrélation de person

Answer 62

- regarder les lignes sous la première, on veut que nos corrélations soient faibles, car on veut observer les contributions uniques (il aurait trop de chevauchement)

Answer 63

ils sont des coefficients indiquant de combien le critère varie pour un changement d'une unité sur un prédicteur donné

Answer 64

un changement de 1 correspondant à une changement de 1 écart-type = ce qui permet de faire des comparaisons soit en regardant les scores beta de trouver le prédicteur le plus important = plus bêta est grand plus il est important

Answer 65

- regarder colonne sig. et si .001 cela est significatif - veux dire que si la personne côte 0 partout ailleurs elle ne coterait pas 0 à ces endroits

Answer 66

prend en compte tout les prédicteurs qu'on a et à quel point ils nous permettent de prédire y

Answer 67

R2 augmente toujours lorsque l'on ajoute un prédicteur ainsi il a tendance à être plus grand qu'il ne devrait ainsi le r2 ajusté corrige ce biais

Answer 68

- ratio cas : prédicteur - absence de données extrêmes ou aberrantes - absence de multicolinéarité et de singularité - normalité, linéarité et homoscédasticité des résidus - indépendance des erreurs - absence de données extrêmes ou aberrantes dans la solution

Answer 69

- allé dans la colonne statistique VIF et si inférieur 10, il n'y a pas de problème

Answer 70

Durbin-Watson

Answer 71

- standard - pas à pas (séquentielle par élimination OU régression pas à pas)

Answer 72

- entré tous les prédicteurs dans l'équation en une seule étape

Answer 73

On entre tous les prédicteurs dans l’équation et on les retire une à une en commençant par celles qui contribuent le moins à l’équation de régression = maximiser r2

Answer 74

- On entre les prédicteurs un à un dans le modèle, en commençant par celui qui a la corrélation la plus élevée avec le critère. - jusqu’à ce que plus aucun ajout de variable n’apporte d’augmentation significative au R2

Answer 75

- surtout continus ou approximativement continus - catégoriels

Answer 76

- médiation = notre prédicteur et notre VD ont un lieu qui existe à cause d'un médiateur - modération = la valeur M modifie l'association entre 2 variables

Answer 77

- prise indépendamment les 3 corrélations doivent être présentes et significatives - la relation entre le VI et la VD disparait ou est fortement réduite quand on contrôle statistiquement l'effet de la variable médiatrice

Answer 78

- a = relation entre VI et médiateur - b = relation entre médiateur et VD - c = relation entre VI et VD quand on a enlevé tout associé à a et b - c' = relation entre VI et VD en présence de a et b

Answer 79

- effet total = c = a*b+c' - effet direct = c' - effet indirect = a*b = c-c'

Answer 80

si toutes mes corrélations sont significatives = ont des étoiles

Answer 81

- regarder si la corrélation entre VI et VD est significative (première ligne) - regarder la deuxième ligne du tableau où on vient contrôler pour l'effet avec la variable médiatrice, vérifier si c'est toujours significatif, si non alors pas d'effet unique de la VI

Answer 82

la corrélation entre VI et VD lorsque l'on contrôle pour la variable médiatrice soit qu'on enlève son effet

Answer 83

- ne quantifie pas l'effet indirect (a*b) - aucun test statistique n'est fait sur l'effet indirect - utilise plusieurs test statistiques alors qu'on pourrait en utiliser qu'un - peu puissant car augmente risque erreur type 2

Answer 84

- assouplir la condition 4 des médiations soit que si enlève médiateur le lien entre VI et VD disparaît - permet de quantifier l'effet indirect et son degré de signification (a*b)

Answer 85

t = BaBb/S Ba Bb = coefficient de a * coefficient de b / erreur standard du lien combiné de a et b

Answer 86

- donne une valeur t pouvant être transformé en score z qui sera comparé avec un score z critique significatif pour seuil alpha - permettra de savoir si l'effet indirect est significatif

Answer 87

- méthode de Preacher et Hayes

Answer 88

- permet de générer une distribution d'échantillonnage de l'effet indirect - ce qui permet de tester et quantifier l'effet indirect - en plus de diminuer erreur de type 2 car elle fait 1 test seulement

Answer 89

- bien qu'il y ait des structure causale on ne peut pas inférer de liens de cause à effet - difficile de justifier le modèle choisi car les variables médiatrices sont définies par la littérature

Answer 90

- la régression logistique a une variable dépendante dichotomique (oui ou non, noir ou blanc) - multiple = 1 critère mais plusieurs prédicteurs

Answer 91

- prédicteur pas besoin d'être distribué normalement, ni avoir relation linéaire avec VD, ni de variance égale dans chaque groupe - les prédicteurs peuvent être autant dichotomique, continu que catégorielle - VD peut avoir 2 ou plus catégories et ces catégories peuvent avoir un ordre

Answer 92

probabilité que chaque participant appartienne aux différentes catégories de la VD en fonction de son patron de réponse

Answer 93

- notre variable prédite pour le maximum de notre VD peut dépassé notre barème dichotomique ce qui est impossible - la droite n'est pas linéaire elle est sigmoide - notre valeur de y ne peut pas prendre n'importe quelle valeur car elle est dichotomique = données censurées

Answer 94

un score continu est converti en score dichotomique

Answer 95

- transformer nos données = de probabilité à chance et après de chance en log chance

Answer 96

- car en faisant ces transformations la fonction redevient linéaire

Answer 97

- on fait les chances pour chaque condition = p / 1-p - ensuite on divise nos résultats obtenus par l'autre

Answer 98

ln(p/1-p) = loge (chances) = ln (chances)

Answer 99

log4(16) = quel exposant je dois donné à 4 (base) pour obtenir 16 (argument) = 2

Answer 100

constante utilisée fréquemment soit 2,718281

Answer 101

- on calcule 2 modèle = un sans prédicteur soit seulement la constante qui est l'ordonnée à l'origine et un avec tous les prédicteurs - on vérifier si un modèle avec tous les prédicteur est meilleur que celui sans prédicteur = comparer les table de classification en regardant le pourcentage overall - Nagelkerke = r2 = si ma valeur est plus grande cela veux dire que le modèle explique davantage de variation dans la VD - vérifier si significatif avec un Wald équivalant à un chi-carré

Answer 102

- un bon ration cas:prédicteur - relation linéaire - absence multicolinéarité - absence données extrêmes dans solution - indépendance des erreurs

Answer 103

de trouver la proportion d'accords si on exclut tous ceux qui seraient obtenus par hasard

Answer 104

mesure d'accord inter-juge

Answer 105

- 0 à 20 = aucun - 21 à 39 = minime - 40 à 59 = faible - 60 à 79 = modéré - 80 à 90 = fort - 90 et plus = presque parfait

Answer 106

variance des totaux de colonnes / variance maximale possible de totaux de colonnes

Answer 107

- il faut d'abord le transformer en rs de spearman - ensuite le rs de spearman plus il est proche de 1 plus la relation monotone positive entre les positives - si le rs est proche de 0 il n'y a aucune relation monotone entre les variables

Answer 108

- médiane = point où se trouve 50% des scores lorsque placé en ordre numérique - moyenne = somme divisé par nombre

Answer 109

barèmes en dehors desquels on rejetterait n'importe quel score z

Answer 110

1. écart-type * valeur z (1,96) 2. moyenne - valeur obtenue en 1 = limite côté négatif 3. moyenne + valeur obtenue en 1 = limite côté positif

Answer 111

ce que j'observe dans mon projet est susceptible d'être à l'intérieur de l'intervalle 95% du temps lorsque l'on répète la procédure un grand nombre de fois

Answer 112

mon intervalle de confiance à 95% se situe entre 8.3 et 15.7

Answer 113

- permet de savoir à quel point il y a de l'incertitude dans nos résultats - permet de faire un test d'hypothèses sans un test t et tout de même obtenir l'intervalle de confiance

Answer 114

- paramétrique = implique des conditions d'application liées à certains paramètres (population) et des distributions - non paramétrique = pas conditions et plus générale

Answer 115

- parfois plus fors que ceux paramétriques n'ayant pas remplis leurs conditions - plus sensible aux médianes qu'aux moyennes - permet tester hypothèses sur nos données même s'il y a des données extrêmes

Answer 116

- ils sont moins puissants que ceux paramétriques donc il faut avoir des échantillons plus grands pour atteindre la même puissance

Answer 117

- calculer un intervalle de confiance pour des médianes - échelle intervalle ou présence de données extrêmes - non normalité de la distribution

Answer 118

- je prends aléatoirement des scores dans mon échantillon A pour les mettre dans mon échantillon B - le score que j'ai pris en A reste là mais ira aussi dans B - calcule médiane pour chaque échantillon - regarde à quel fréquence j'obtiens un échantillon avec cette médiane - trouve mes limites pour IC.95 ou le plus proche possible de 95% - prendre les valeur incluse dans le 95 = intervalle de confiance

Answer 119

permet de savoir quelle proportion des données que l'on doit retrancher pour avoir notre intervalle de confiance

Answer 120

- si dans mon hypothèse nulle il y a une valeur qui se retrouve dans mon intervalle de confiance je ne peux pas la rejeter

Answer 121

- permet d'aller au-delà d'une valeur p et donc on peut faire des tests hypothèse nulle - permet de visualiser l'incertitude associée à nos données (on veut le plus petit intervalle car permet d'avoir beaucoup de certitude en nos données)

Answer 122

- équivalent du test-t sur deux échantillons indépendants - on met nos données standards en rang = on prend nos scores et les mets en rang du plus petit au plus grand

Answer 123

vérifie si la somme des rangs du plus petit groupe est plus petite que la plus petite somme qu'on s'attendrait à obtenir au hasard

Answer 124

- test équivalent à la somme des rang de Wilcoxon - relation linéaire parfaite entre les deux = permet de les convertir entre eux

Answer 125

- équivalent du test-t sur deux échantillons pairés ou dépendants - utilise soit toujours les mêmes participants ou des populations qui sont symétriques avec le même moyenne

Answer 126

on fait la différence de rang avant et après par exemple et si le score t obtenu est positive (il y a une amélioration) versus s'il est négatif (il y a une diminution de la condition du participant) *à vérifier avec le contexte)

Answer 127

- difficulté de compréhension une grande valeur p ne signifie pas nécessairement un grand effet - encouragent pensée dichotomique (les groupes sont différents ou pas) - confusion entre degré signification et taille échantillon - p haking et p harking

Answer 128

- haking = ajout de participant après les analyses - harking = prétendre qu'une hypothèse faite après collecte données

Answer 129

- rapporter taille d'effet = magnitude - rapporter intervalles de confiance - méta analyse et méthode bayésienne

Answer 130

- corrélation entre VI et médiatrice - médiatrice affecte VD - lien VI et VD diminue avec inclusion médiateur

Answer 131

elle utilise un test statistique pour évaluer l'effet indirect

Answer 132

Preacher et Hayes

Answer 133

Elle fournit des intervalles de confiance pour l'effet indirect.

Answer 134

Il décrit l'effet de la variable indépendante sur la variable dépendante avant l'introduction du médiateur.

Answer 135

elle est flexible

Answer 136

La probabilité qu'un événement se produise divisée par la probabilité qu'il ne se produise pas.

Answer 137

rapport des odds de survenue d'un événement entre deux groupes.

Answer 138

Le groupe pratiquant l'exercice a trois fois plus de chances de présenter une amélioration de la santé mentale comparé au groupe sans exercice.

Answer 139

La probabilité prédite de l'occurrence de l'événement.

Answer 140

Assurer la fiabilité de la procédure de sélection des participants

Answer 141

Pour prendre en compte la possibilité d'accord par hasard.

Answer 142

Non, l'accord inter-juge confirme seulement que les juges sont cohérents entre eux dans la classification des stimuli.

Answer 143

0 (Kappa évalue l'accord au-delà du hasard; un accord aléatoire devrait conduire à un Kappa de 0)

Answer 144

Le coefficient de concordance de Kendall évalue l'accord sur des échelles ordinales tandis que le kappa évalue l'accord sur des échelles nominales.

Answer 145

Une concordance parfaite donne un coefficient de 1. L'accord entre les juges est complet et tous les objets sont classés identiquement par chaque juge.

Answer 146

Augmenter N et k augmente la fiabilité de W.

Answer 147

Pour simplifier l'interprétation des résultats. Transformer en rho de Spearman peut aider à simplifier l'interprétation en fournissant une mesure plus familière et comparable.

Answer 148

ordonnant les valeurs et en sélectionnant celle au milieu

Answer 149

- moyenne requiert des données sur une échelle d'intervalle pour être interprétable car elle implique des calculs qui supposent une équidistance entre les valeurs. - médiane, étant simplement le point médian des données classées, est suffisante pour les données sur une échelle ordinale où le classement est significatif mais pas la distance exacte entre les rangs

Answer 150

tests non paramétriques sont basés sur moins d'hypothèses sur la distribution sous-jacente des données

Answer 151

données sont parfaitement normales. Les tests paramétriques tendent à être plus puissants que les tests non paramétriques lorsque les conditions d'application des tests paramétriques (comme la normalité des données) sont satisfaites

Answer 152

- utilise un grand nombre de réplications pour estimer la distribution de la médiane - ne repose pas sur des postulats de normalité - utilise le rééchantillonnage pour simuler la distribution asymétrique

Answer 153

scores observés dans un certain pourcentage des cas dans l'échantillon sont représentatifs de ce même pourcentage dans la population

Answer 154

données montrent des valeurs extrêmes et que la distribution de l'échantillon est asymétrique

Answer 155

tirages sont effectués avec remise pour permettre la réplication exacte de la distribution de l'échantillon

Answer 156

signifie que le coefficient de corrélation est significativement différent de zéro, suggérant une corrélation significative entre les variables

Answer 157

La taille de l'effet est statistiquement significative. Si l'intervalle de confiance pour une taille d'effet (p. ex. un coefficient de corrélation r) ne comprend pas zéro, cela signifie que l'effet est statistiquement significatif

Answer 158

test t pour échantillons indépendants

Answer 159

Les deux échantillons ont été prélevés aléatoirement de populations identiques, au-delà de la simple égalité des moyennes

Answer 160

cette approche permet de calculer un score Z et d'utiliser la distribution normale pour obtenir une valeur p, facilitant ainsi l'interprétation statistique

Answer 161

premier compare deux échantillons indépendants, tandis que le second compare deux mesures appariées ou sur les mêmes sujets

Métho II (examen 2) Flashcards

(198 cards)