Métho II (examen 2) Flashcards

1
Q

que permet une anova

A

comparer plusieurs groupes entre eux pour voir s’ils diffèrent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

quelle est la logique des anova

A

comparaison de la variance inter-groupe à la variance intra-groupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

3 conditions application de l’Anova

A
  • homogénéité des variances à travers les conditions (groupes)
  • normalité de l’erreur = données sont distribuées normalement pour chaque conditions (provienne de la même population)
  • indépendance des observations (pas d’influence entre les conditions)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

différence entre variance inter-groupe et intra-groupe

A
  • intra = quantifie la dispersion des données autour de leur propre moyenne de groupe
  • inter = évalue la dispersion des moyennes des groupes autour de la moyenne globale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

quel est le seul aspect qui n’est pas contrôlé dans les estimés de variance pour les anovas

A
  • variance inter groupe soit ici à quel point les groupes ont des moyennes différentes des autres
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

quel type de variance peut détecter lorsque les groupes dans mon Anova ne proviennent pas de la même population

A
  • celle inter, car elle prend en compte l’appartenance aux groupes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

que sont des carrés moyens

A

se sont nos variances intra et inter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

quels sont les synonymes pour somme des carrés inter et intra

A
  • inter = traitement
  • intra = erreur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

comment prendre la décision si oui ou non mes groupes dans mon Anova diffère significativement ou non

A
  • trouver F critique (valeur inter est mon numérateur et dl mon dénominateur)
  • si mon f trouvé est plus grand que mon f critique = mes groupes diffèrent significativement donc appartiennent probablement à une autre population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

est-ce que l’Anova permet de savoir si ma valeur est plus haut ou plus bas comme dans les tests t

A
  • non, elle permet seulement de savoir si c’est rare ou non
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

vrai ou faux, l’Anova est une procédure robuste

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

quel aspect influence la robustesse de l’Anova

A
  • si les échantillons sont de taille inégales, car les variances ne seront plus homogènes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

le test du f permettant de savoir si nos groupes sont différents significativement ou non ne nous permets pas de savoir la différence se trouve entre quels groupes, quoi faire pour trouver cette différence

A
  • comparaisons multiples = comparer les différentes moyennes les unes aux autres pour trouver quelles moyennes diffèrent
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quel est un grand risque des comparaisons multiples

A
  • plus on fait de tes plus on risque de se tromper et faire une erreur de type 1 soit dire qu’il y a un effet alors que non
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

comment trouver la probabilité dans mes comparaison multiples de faire au moins une erreur de type 1

A

1 - probabilité aucun test significatif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

comment contrôler le fait que les comparaisons multiples nous mettes à risque de faire des erreurs de type 1

A

utiliser des procédure de contrôle du taux d’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

dans quel contextes veut-on faire des comparaisons multiples

A

pour multiples groupes ou mesures = pour vérifier s’il existe des différences entre plusieurs groupes sur un certain nombre de mesures

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

différence entre 3 types de stratégies de contrôle du taux d’erreur
- par comparaison
- par famille
- par expérience

A
  • comparaison = je fais seulement 1 seule Anova
  • famille = j’ai 3 groupes dans mon Anova donc je fais 3 comparaison entre moyennes
  • expérience = vérifier si dans toute mon étude, même si différents types analyses, ,pm taux n’est pas trop élevé
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

quel est le type de stratégies de contrôles du taux d’erreur que l’on utiliser

A
  • taux d’erreur de l’ensemble = par famille + par expérience
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

3 exemples de stratégies de contrôle du taux d’erreur

A
  • test-t multiples
  • Bonferroni
  • Sidak-Bonferroni
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

quelle est le méthode du test-t multiples et son type de contrôle

A
  • méthode = faire une série de test t en comparant les moyennes par paires + aucune modification niveau alpha
  • contrôle = par comparaison
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

quelle est le méthode du bonferroni et son type de contrôle

A
  • méthode = séries de tests statistiques avec un seuil alpha diminuant pour chaque test
  • contrôle = ensemble
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

inconvénients test bonferroni

A
  • peut produire des seuils alpha très petits = très conservateur
  • devient encore plus conservateur lorsque les mesures sont corrélées les unes aux autres
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

quelle est le méthode du sidak-bonferroni et son type de contrôle

A
  • méthode = modification du bonferroni pour le rendre plsu libérale
  • contrôle = ensemble
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

inconvénient test sidak-bonferroni

A
  • à peine moins conservateur que Bonferonni
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

quels est le risque avec la diminution de l’erreur de type 1 des stratégies de contrôle du taux d’erreur

A
  • diminué erreur de type 1 augmente le risque d’erreur de type 2 (dire pas d’effet alors que oui)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

solution pour éviter de trop augmenter les erreurs de type 2 avec les stratégies de contrôle du taux d’erreur très stricte

A
  • contrôle du taux de fausses découvertes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

quels sont les deux types de contrôle du taux de fausses découvertes

A
  • Holm-Bonferonni
  • Benjamin-Hochberg
    en gros les deux consiste a diminué le seuil alpha jusqu’à ne plus obtenir de différence significative
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

devrait-on contrôler le taux d’erreur

A

question personnelle
- si chercheur préfère contrôle erreur 1 = stratégie contrôle du taux d’erreur
- si chercheur préfère contrôle erreur 2 = contrôle du taux de fausses découvertes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

comment éviter d’avoir à utiliser les stratégies du contrôle du taux d’erreur

A
  • choisir un nombre limité de variables d’intérêt, étant corrélées entre elle et déterminées à l’avance
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

dans quel condition préférable faire contrôle du taux de fausse découverte

A
  • si grand nombre de test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

différence entre anova à plan simple et anova à plan factoriel

A
  • simple = les participants sont classés selon 1 seul critère telle que l’appartenance à un traitement
  • factoriel = les participants sont classés selon plusieurs critères de classification tel que l’âge et traitement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

synonyme factoriel

A

variable catégorielle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

2 avantages des anova à plan factoriel

A
  • elles sont économiques = car au lieu de faire une anova pour chaque groupe il aurait fallu le double de participants pour avoir la même puissance
  • permet interprétation plus riche = permet de voir les interactions entre les variables indépendantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

qu’est-ce que l’effet principal

A

se rapporte aux effets observés par les moyennes marginales soit la différence entre les différents niveaux d’un facteur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

qu’est-ce qu’une interaction

A
  • observations faites en regardant l’effet d’un facteur selon les niveau d’un autre = je prends les personnes de plus de 18 ans et regarde différence selon les traitements
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

dans l’anova à plan factoriel, la somme carré total est = à quoi

A

somme carré cellules + somme carré erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

dans l’anova à plan factoriel, la somme carré cellules est = à quoi

A

somme carré valeur indépendante 1 + somme carré valeur indépendante 2 + somme carré valeur indépendante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

qu’est-ce que la somme carrés d’erreur dans l’anova à plan factoriel

A
  • je l’utilise si me résultats varient encore en dehors de mes somme de carrés de mes variables indépendantes
  • mesure de la variabilité des données ne s’expliquant pas par le modèle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

dans les anovas à plan factoriel quel est un synonyme de la somme carré erreur

A

somme carré intra

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

dans les anovas à plan factoriel, comment trouver nos effets principaux pour chaque variable indépendantes et pour leur interaction

A
  • trouver notre f car f = effet principal
  • f = cm pour une variable indépendante / cm erreur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

comment savoir si dans mon anova à plan factoriel il y a une interaction

A
  • interaction = une variable dépend de l’autre
  • sur un graphique mes droites ne sont pas parallèles
  • pour être significative = nécessite un écart important
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

comment interprété une interaction

A

utilisé le contexte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

pouvons-nous utilisé des comparaison multiples dans les anavos à plan factoriel

A

oui

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

que permette les test d’effet simple

A

savoir quand nos interactions sont significatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

comment interprété test effet simple

A

= trouvé f = si a un étoile il est significatif et plus sa valeur est grande plus la différence est grande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

si je veux par exemple, dans mon anova à plan factoriel, seulement la proportion de la variabilité expliqué par ma variable dépendante âge je fais quoi

A

je vais prendre sa somme carrée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

à quoi il faut faire particulièrement attention avec les anovas à plan factoriel

A

les cellules de tailles inégales = demandera de modifier les calculs pour les SC et les tailles d’effets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

que représente partial eta squared

A

taille effet partiel au carré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

quel test est souvent utilisé pour vérifier l’homogénéité des variances avec les anovas simples

A

test de levene

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

si les conditions d’utilisation de l’ANOVA sont respectées et que toutes les observations proviennent de la même population qu’est-ce que l’on observera

A
  • la variance intra est égale à celle inter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

quel est l’objectif principal d’un test d’hypothèse dans le cadre d’une ANOVA

A
  • savoir à quel point il est probable d’observer une certaine valeur F si tous les groupes proviennent d’une même population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

différence entre sommes des carrés et les carrés moyens dans un tableau ANOVA

A
  • SC représente la variation totale des données
  • CM est la SC ajustée selon les degrés de liberté pertinents pour chaque source de variation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

que représente un résultat significatif dans l’ANOVA

A
  • il existe une différence significative entre au moins deux des moyennes des groupes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

quel est le principal indicateur de la taille d’effet utilisé en anova plan simple pour mesurer l’ampleur de la différence entre les groupes

A
  • l’êta carré
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

Comment interprète-t-on une taille d’effet η2 de 0.05 dans le contexte d’une ANOVA ?

A

5% de la variance totale est expliquée par les différences entre les groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

Pourquoi y a-t-il un plus grand risque d’erreur de type 1 si celui-ci n’est pas contrôlé dans les comparaisons multiples après une ANOVA ?

A

Parce que l’augmentation du nombre de tests augmente la probabilité de trouver au moins un résultat significatif par chance, même si l’hypothèse nulle est vraie pour tous les tests.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q

Qu’est-ce que le contrôle du taux d’erreur de l’ensemble (EE) dans le contexte d’analyses statistiques multiples ?

A

minimiser le risque d’erreurs de type I lorsqu’on effectue plusieurs comparaisons de moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
59
Q

Quelle méthode de contrôle du taux d’erreur ajuste le seuil alpha de façon variable pour chaque test, basé sur le rang des valeurs p ?

A

La méthode de Holm-Bonferroni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
60
Q

Quelle est la principale différence entre le taux d’erreur de l’ensemble (EE) et le taux de fausses découvertes (FDR) dans le contexte des comparaisons multiples ?

A
  • EE = contrôler la probabilité de commettre au moins une erreur de Type I sur l’ensemble des tests
  • FDR vise à contrôler la proportion d’erreurs de Type I parmi les tests déclarés significatifs.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
61
Q

pourquoi il est préférable de faire des taux de fausses découvertes aux taux d’erreur de l’ensemble

A

par ce que FDR est moins conservateur et augmente ainsi la puissance statistique des tests

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
62
Q

Quels sont les avantages principaux de la méthode de Benjamini-Hochberg par rapport à la méthode de Bonferroni ?

A
  • moins conservatrice
  • permet de contrôler le taux de fausses découvertes plutôt que le taux d’erreur de Type I global.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
63
Q

comment décrire correctement une ANOVA à plan factoriel dans un rapport de recherche

A

« Une ANOVA 2 (enfants vs adultes) × 3 (thérapie cognitive vs médication vs thérapie plus médication) a été conduite sur les scores au GAD-7. »

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
64
Q

qu’indique la présence d’une interaction significative dans une anova à plan factoriel

A

que l’effet d’un facteur sur la variable dépendante change selon les niveaux de l’autre facteur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
65
Q

Quels types d’effets une ANOVA à plan factoriel permet-elle d’examiner ?

A
  • Les effets principaux de chaque facteur
  • les interactions entre ces facteurs.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
66
Q

Quelle est la principale différence entre les interactions et les effets principaux dans le contexte d’une ANOVA factorielle

A
  • effets principaux = concernent la comparaison des moyennes globales de chaque niveau d’un facteur, sans tenir compte des niveaux des autres facteurs
  • interactions = examinent comment la combinaison spécifique des niveaux de deux facteurs ou plus affecte la variable dépendante
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
67
Q

Dans une ANOVA, si le êta carré partiel pour l’âge est de 0.35, comment interpréteriez-vous cette valeur ?

A

35 % de la variance totale de la variable dépendante est attribuable à l’âge.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
68
Q

différence entre anova à plan factoriel et à mesures répétées

A
  • plan factoriel = participant participe à seulement 1 condition
  • répétées = participants participent à plus d’une condition
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
69
Q

objectif général d’une ANOVA

A

estimer quelle portion de la variance est due aux conditions et quelle proportion est due à l’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
70
Q

différence par rapport à la variance due à l’erreur entre ANOVA standard et celle à mesures répétées

A
  • standard = la variance intra-groupe est considérée comme de la variance due à l’erreur
  • répétées = puisque plusieurs mesures pour chaque participant on enlève la variance intra-groupe ce qui diminue l’erreur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
71
Q

qu’est-ce que la condition d’application de l’ANOVA à plan simple à mesures répétées nommée la symétrie composée de la matrice des covariances

A
  • les variances (diagonale) doivent être constantes
  • les covariances (hors diagonale) doivent être constantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
72
Q

qu’est-ce que la covariance

A

degré auquel 2 variables varient ensemble

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
73
Q

si nous faisons des covariance dans le cadre d’une ANOVA avec des groupes indépendants qu’est-ce que l’on observe

A

les covariances seront de 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
74
Q

la condition de la symétrie composée de la matrice des covariances est dite trop stricte, on la remplace par quoi

A

sphéricité qui s’intéresse à la variance des différences entre traitements plutôt que la covariance entre les traitements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
75
Q

quel test de sphéricité est utilisé et quel résultat on veut

A
  • Mauchly
  • non significatif car cela indique que la sphéricité est respectée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
76
Q

dans les ANOVAS factoriel à mesures répétées il y a deux SC erreur lesquels

A
  • facteur inter-sujet
  • facteur temps x inter-sujet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
77
Q

dans ANOVA factoriel à mesures répétées à quoi est égal la variabilité inter-sujet

A

variabilité groupe + variabilité intra-groupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
78
Q

dans ANOVA factoriel à mesures répétées à quoi est égal la variabilité intra-sujet

A

variabilité temps + variabilité temps x groupe + variabilité temps x intra groupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
79
Q

pourquoi pour trouver le f dans une ANOVA factoriel à mesures répétées nous avons fait CM groupe / CM intra-groupe

A

car permet de trouver l’effet du groupe sur l’intra-groupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
80
Q

à partir des degrés de libertés comment trouver
- nb total participants
- nb de groupes
- nb temps de mesures

A
  • participants = regardé la ligne inter-sujet +1
  • groupe = regardé la ligne groupe + 1
  • temps = regardé ligne temps +1
81
Q

si la sphéricité n’est pas respecté il y a deux corrections possibles à faire, en quoi elles consistent

A

diminuer le nombre de degrés de liberté ce qui rend le test plus sévère et donc plus difficile d’être significatif

82
Q

différence entre régression linéaire simple et celle multiple

A
  • simple = prédire un critère avec un seul prédicteur
  • multiple = prédire un seul critère avec plusieurs prédicteurs
83
Q

quel est l’explication derrière la formule de la régression linéaire multiple

A

par quel chiffre on doit multiplier les valeurs pour que lors de leur addition on arrive le plus proche possible de la variable prédite

84
Q

que cherchons nous dans les régressions linéaires multiples

A
  • le b minimisant les espaces entre les points et la ligne = diminué l’erreur de prédiction soit le résidu
85
Q

dans les régression linéaires ont cherche la proportion de variabilité mais quelles sont les différences entre celle linéaire simple et celle multiple

A
  • simple = proportion variable de notre critère expliquée par notre prédicteur
  • multiple = proportion de la variabilité de notre critère expliquée uniquement par les différents critères = soit pas expliqué par plusieurs critères (pas de chevauchement)
86
Q

dans mon tableau de corrélations de pearson de régression linéaire multiple quelle ligne je regarde pour vérifier mes corrélation

A
  • première ligne du tableau dans la section corrélation de person
87
Q

comment vérifier mes colinéarité dans mon tableau spss de régression linéaire multiple

A
  • regarder les lignes sous la première, on veut que nos corrélations soient faibles, car on veut observer les contributions uniques (il aurait trop de chevauchement)
88
Q

que représente les B rapporté par SPSS dans mon tableau pour régression linéaire multiple

A

ils sont des coefficients indiquant de combien le critère varie pour un changement d’une unité sur un prédicteur donné

89
Q

que représente les scores beta dans tableau SPSS pour régression linéaire multiple

A

un changement de 1 correspondant à une changement de 1 écart-type = ce qui permet de faire des comparaisons soit en regardant les scores beta de trouver le prédicteur le plus important = plus bêta est grand plus il est important

90
Q

comment trouver dans mon tableau SPSS pour ma régression linéaire multiple, quels prédicteur sont significatifs et que cela veux dire

A
  • regarder colonne sig. et si .001 cela est significatif
  • veux dire que si la personne côte 0 partout ailleurs elle ne coterait pas 0 à ces endroits
91
Q

que représente r2 dans ma régression linaire multiple

A

prend en compte tout les prédicteurs qu’on a et à quel point ils nous permettent de prédire y

92
Q

qu’est-ce que l’on remarque avec le r2 ajusté

A

R2 augmente toujours lorsque l’on ajoute un prédicteur ainsi il a tendance à être plus grand qu’il ne devrait ainsi le r2 ajusté corrige ce biais

93
Q

est-ce que la constante a un bêta

A

non

94
Q

est-ce qu’habituellement on utilise des corrections pour les régressions linéaires multiples

A

non

95
Q

quelles sont les 6 conditions application de la régression linéaire multiple

A
  • ratio cas : prédicteur
  • absence de données extrêmes ou aberrantes
  • absence de multicolinéarité et de singularité
  • normalité, linéarité et homoscédasticité des résidus
  • indépendance des erreurs
  • absence de données extrêmes ou aberrantes dans la solution
96
Q

comment avec un tableau SPSS pour régression linéaire multiple, vérifier qu’il n’y a pas de multicolinéarité

A
  • allé dans la colonne statistique VIF et si inférieur 10, il n’y a pas de problème
97
Q

quelle statistique on utilise pour vérifier l’indépendance des erreurs

A

Durbin-Watson

98
Q

quelles sont les 3 méthodes d’entrée des variables dans une régression linéaire multiple

A
  • standard
  • pas à pas (séquentielle par élimination OU régression pas à pas)
99
Q

à quoi ressemble la méthode standard d’entrée de variables pour les régressions linaires multiples

A
  • entré tous les prédicteurs dans l’équation en une seule étape
100
Q

à quoi ressemble la méthode séquentielle par élimination d’entrée de variables pour les régressions linaires multiples

A

On entre tous les prédicteurs
dans l’équation et on les retire une à une en commençant par celles qui contribuent le moins à l’équation de régression = maximiser r2

101
Q

à quoi ressemble la méthode régression pas à pas d’entrée de variables pour les régressions linaires multiples

A
  • On entre les
    prédicteurs un à un dans le modèle, en commençant par celui qui a la
    corrélation la plus élevée avec le critère.
  • jusqu’à ce que plus
    aucun ajout de variable n’apporte d’augmentation significative au R2
102
Q

la régression linéaire multiple est utilisé avec quels types de prédicteur

A
  • surtout continus ou approximativement continus
  • catégoriels
103
Q

différence entre médiation et modération

A
  • médiation = notre prédicteur et notre VD ont un lieu qui existe à cause d’un médiateur
  • modération = la valeur M modifie l’association entre 2 variables
104
Q

est-ce que le médiateur peut avoir un effet négatif et positif

A

oui

105
Q

quelles sont les 4 conditions pour que l’on puisse parler de médiation

A
  • prise indépendamment les 3 corrélations doivent être présentes et significatives
  • la relation entre le VI et la VD disparait ou est fortement réduite quand on contrôle statistiquement l’effet de la variable médiatrice
106
Q

que représente dans la médiation selon la méthode des étapes causales de Baron les lettres suivantes : a, b, c et c’

A
  • a = relation entre VI et médiateur
  • b = relation entre médiateur et VD
  • c = relation entre VI et VD quand on a enlevé tout associé à a et b
  • c’ = relation entre VI et VD en présence de a et b
107
Q

comment trouvé dans une médiation
- effet total
- effet direct
- effet indirect

A
  • effet total = c = a*b+c’
  • effet direct = c’
  • effet indirect = a*b = c-c’
108
Q

dans mon tableau de corrélation SPSS pour une médiation que dois-je vérifier

A

si toutes mes corrélations sont significatives = ont des étoiles

109
Q

comment avec une sortie spss pour médiation venir vérifier si j’ai un effet unique de la VI

A
  • regarder si la corrélation entre VI et VD est significative (première ligne)
  • regarder la deuxième ligne du tableau où on vient contrôler pour l’effet avec la variable médiatrice, vérifier si c’est toujours significatif, si non alors pas d’effet unique de la VI
110
Q

qu’est-ce que la corrélation semi-partielle

A

la corrélation entre VI et VD lorsque l’on contrôle pour la variable médiatrice soit qu’on enlève son effet

111
Q

quelles sont les 4 critiques de la méthode des étapes causales de Baron

A
  • ne quantifie pas l’effet indirect (a*b)
  • aucun test statistique n’est fait sur l’effet indirect
  • utilise plusieurs test statistiques alors qu’on pourrait en utiliser qu’un
  • peu puissant car augmente risque erreur type 2
112
Q

à quoi sert la méthode de Sobel

A
  • assouplir la condition 4 des médiations soit que si enlève médiateur le lien entre VI et VD disparaît
  • permet de quantifier l’effet indirect et son degré de signification (a*b)
113
Q

à quoi ressemble la formule de la méthode de Sobel

A

t = BaBb/S Ba Bb = coefficient de a * coefficient de b / erreur standard du lien combiné de a et b

114
Q

comment utiliser le résultat de ma méthode de Sobel

A
  • donne une valeur t pouvant être transformé en score z qui sera comparé avec un score z critique significatif pour seuil alpha
  • permettra de savoir si l’effet indirect est significatif
115
Q

quelle est une alternative plus puissante que la méthode de Sobel

A
  • méthode de Preacher et Hayes
116
Q

que permet la méthode de Preacher et Hayes

A
  • permet de générer une distribution d’échantillonnage de l’effet indirect
  • ce qui permet de tester et quantifier l’effet indirect
  • en plus de diminuer erreur de type 2 car elle fait 1 test seulement
117
Q

critique des analyses de médiation

A
  • bien qu’il y ait des structure causale on ne peut pas inférer de liens de cause à effet
  • difficile de justifier le modèle choisi car les variables médiatrices sont définies par la littérature
118
Q

différence entre régression multiple et régression logistique

A
  • la régression logistique a une variable dépendante dichotomique (oui ou non, noir ou blanc)
  • multiple = 1 critère mais plusieurs prédicteurs
119
Q

est-ce que dans la régression logistique, la variable indépendante soit prédicteurs peuvent être continus (salaire, âge) ou catégoriels (marque voiture, animal pref)

A

oui

120
Q

est-ce que dans la régression logistique je peux avoir une VD catégorielle à plus de 2 catégories

A

oui

121
Q

pourquoi la régression logistique est plus flexible que d’autres analyses semblables

A
  • prédicteur pas besoin d’être distribué normalement, ni avoir relation linéaire avec VD, ni de variance égale dans chaque groupe
  • les prédicteurs peuvent être autant dichotomique, continu que catégorielle
  • VD peut avoir 2 ou plus catégories et ces catégories peuvent avoir un ordre
122
Q

que nous donne la régression logistique

A

probabilité que chaque participant appartienne aux différentes catégories de la VD en fonction de son patron de réponse

123
Q

quels sont les 3 problèmes avec la régression logistique

A
  • notre variable prédite pour le maximum de notre VD peut dépassé notre barème dichotomique ce qui est impossible
  • la droite n’est pas linéaire elle est sigmoide
  • notre valeur de y ne peut pas prendre n’importe quelle valeur car elle est dichotomique = données censurées
124
Q

que sont des données censurées

A

un score continu est converti en score dichotomique

125
Q

quelle est la solution au fait que la courbe de régression logistique ne soit pas linéaire mais sigmoide

A
  • transformer nos données = de probabilité à chance et après de chance en log chance
126
Q

pourquoi est-ce que l’on transforme nos données dans la régression logistique

A
  • car en faisant ces transformations la fonction redevient linéaire
127
Q

comment se trouve les chances

A

p / 1 - p

128
Q

comment trouver les odds ration

A
  • on fait les chances pour chaque condition = p / 1-p
  • ensuite on divise nos résultats obtenus par l’autre
129
Q

synonyme log chances

A

logit

130
Q

à quoi est égale log chances

A

ln(p/1-p) = loge (chances) = ln (chances)

131
Q

qu’est-ce qu’un log

A

log4(16) = quel exposant je dois donné à 4 (base) pour obtenir 16 (argument) = 2

132
Q

dans loge que représente e

A

constante utilisée fréquemment soit 2,718281

133
Q

quelles sont les étapes des tests inférentiels pour la régression logistique

A
  • on calcule 2 modèle = un sans prédicteur soit seulement la constante qui est l’ordonnée à l’origine et un avec tous les prédicteurs
  • on vérifier si un modèle avec tous les prédicteur est meilleur que celui sans prédicteur = comparer les table de classification en regardant le pourcentage overall
  • Nagelkerke = r2 = si ma valeur est plus grande cela veux dire que le modèle explique davantage de variation dans la VD
  • vérifier si significatif avec un Wald équivalant à un chi-carré
134
Q

quelles sont les 5 limites à la flexibilité de la régression logistique

A
  • un bon ration cas:prédicteur
  • relation linéaire
  • absence multicolinéarité
  • absence données extrêmes dans solution
  • indépendance des erreurs
135
Q

que nous permets la formule du Kappa

A

de trouver la proportion d’accords si on exclut tous ceux qui seraient obtenus par hasard

136
Q

le Kappa est quoi

A

mesure d’accord inter-juge

137
Q

avec ma réponse au kappa comment savoir le degré d’accord entre juges

A
  • 0 à 20 = aucun
  • 21 à 39 = minime
  • 40 à 59 = faible
  • 60 à 79 = modéré
  • 80 à 90 = fort
  • 90 et plus = presque parfait
138
Q

si les juges ne sont pas d’accord la variance devrait être comment

A

petite

139
Q

comment trouver mon coefficient de concordance de Kendall (w)

A

variance des totaux de colonnes / variance maximale possible de totaux de colonnes

140
Q

comment interpréter mon w

A
  • il faut d’abord le transformer en rs de spearman
  • ensuite le rs de spearman plus il est proche de 1 plus la relation monotone positive entre les positives
  • si le rs est proche de 0 il n’y a aucune relation monotone entre les variables
141
Q

différence entre médiane et moyenne

A
  • médiane = point où se trouve 50% des scores lorsque placé en ordre numérique
  • moyenne = somme divisé par nombre
142
Q

entre la médiane et la moyenne laquelle est la plus sensible aux scores extrêmes

A

moyenne

143
Q

entre la médiane et la moyenne laquelle est la plus stable

A

moyenne

144
Q

que sont des limites

A

barèmes en dehors desquels on rejetterait n’importe quel score z

145
Q

comment trouver les valeurs de mes limites

A
  1. écart-type * valeur z (1,96)
  2. moyenne - valeur obtenue en 1 = limite côté négatif
  3. moyenne + valeur obtenue en 1 = limite côté positif
146
Q

que sont des intervalles de confiance

A

ce que j’observe dans mon projet est susceptible d’être à l’intérieur de l’intervalle 95% du temps lorsque l’on répète la procédure un grand nombre de fois

147
Q

que veux dire IC.95 = (8.3, 15.7)

A

mon intervalle de confiance à 95% se situe entre 8.3 et 15.7

148
Q

pourquoi est-ce important des intervalles de confiance

A
  • permet de savoir à quel point il y a de l’incertitude dans nos résultats
  • permet de faire un test d’hypothèses sans un test t et tout de même obtenir l’intervalle de confiance
149
Q

différence entre test paramétrique et non paramétrique

A
  • paramétrique = implique des conditions d’application liées à certains paramètres (population) et des distributions
  • non paramétrique = pas conditions et plus générale
150
Q

avantages tests non paramétriques

A
  • parfois plus fors que ceux paramétriques n’ayant pas remplis leurs conditions
  • plus sensible aux médianes qu’aux moyennes
  • permet tester hypothèses sur nos données même s’il y a des données extrêmes
151
Q

inconvénient des test non paramétriques

A
  • ils sont moins puissants que ceux paramétriques donc il faut avoir des échantillons plus grands pour atteindre la même puissance
152
Q

bootstrap est utile dans quelles conditions

A
  • calculer un intervalle de confiance pour des médianes
  • échelle intervalle ou présence de données extrêmes
  • non normalité de la distribution
153
Q

qu’est-ce que la méthode de bootstrap basé sur les percentiles

A
  • je prends aléatoirement des scores dans mon échantillon A pour les mettre dans mon échantillon B
  • le score que j’ai pris en A reste là mais ira aussi dans B
  • calcule médiane pour chaque échantillon
  • regarde à quel fréquence j’obtiens un échantillon avec cette médiane
  • trouve mes limites pour IC.95 ou le plus proche possible de 95%
  • prendre les valeur incluse dans le 95 = intervalle de confiance
154
Q

que permet la méthode de bootstrap basé sur les percentiles

A

permet de savoir quelle proportion des données que l’on doit retrancher pour avoir notre intervalle de confiance

155
Q

quelle est une particularité de la méthode de bootstrap basé sur les percentiles avec le rejet de l’hypothèse nulle

A
  • si dans mon hypothèse nulle il y a une valeur qui se retrouve dans mon intervalle de confiance je ne peux pas la rejeter
156
Q

pourquoi voudrait-on calculer des intervalles de confiance avec boostrap

A
  • permet d’aller au-delà d’une valeur p et donc on peut faire des tests hypothèse nulle
  • permet de visualiser l’incertitude associée à nos données (on veut le plus petit intervalle car permet d’avoir beaucoup de certitude en nos données)
157
Q

qu’est-ce que le test de la somme des rangs de Wilcoxon

A
  • équivalent du test-t sur deux échantillons indépendants
  • on met nos données standards en rang = on prend nos scores et les mets en rang du plus petit au plus grand
158
Q

que vérifie le test de la somme des rangs de Wilcoxon

A

vérifie si la somme des rangs du plus petit groupe est plus petite que la plus petite somme qu’on s’attendrait à obtenir au hasard

159
Q

qu’est-ce que la statistique U de Mann-Withney

A
  • test équivalent à la somme des rang de Wilcoxon
  • relation linéaire parfaite entre les deux = permet de les convertir entre eux
160
Q

dans quelle situation est-ce que l’on utilise le test des rangs pour échantillons pairés de Wilcoxon

A
  • équivalent du test-t sur deux échantillons pairés ou dépendants
  • utilise soit toujours les mêmes participants ou des populations qui sont symétriques avec le même moyenne
161
Q

que fait-on avec le test des rangs pour échantillons pairés de Wilcoxon

A

on fait la différence de rang avant et après par exemple et si le score t obtenu est positive (il y a une amélioration) versus s’il est négatif (il y a une diminution de la condition du participant)
*à vérifier avec le contexte)

162
Q

problèmes des tests hypothèse nulle avec valeur p

A
  • difficulté de compréhension une grande valeur p ne signifie pas nécessairement un grand effet
  • encouragent pensée dichotomique (les groupes sont différents ou pas)
  • confusion entre degré signification et taille échantillon
  • p haking et p harking
163
Q

qu’est-ce que le p haking et p harking

A
  • haking = ajout de participant après les analyses
  • harking = prétendre qu’une hypothèse faite après collecte données
164
Q

solutions pour problèmes des tests avec valeur p

A
  • rapporter taille d’effet = magnitude
  • rapporter intervalles de confiance
  • méta analyse et méthode bayésienne
165
Q

Selon Baron & Kenny (1986), quelles sont les conditions requises pour établir une médiation?

A
  • corrélation entre VI et médiatrice
  • médiatrice affecte VD
  • lien VI et VD diminue avec inclusion médiateur
166
Q

Comment la méthode de Sobel diffère-t-elle des étapes causales de Baron & Kenny?

A

elle utilise un test statistique pour évaluer l’effet indirect

167
Q

Quelle approche permet d’évaluer l’effet indirect en se basant sur le rééchantillonnage?

A

Preacher et Hayes

168
Q

Quel est un avantage de la méthode de Preacher & Hayes par rapport à celle de Baron & Kenny?

A

Elle fournit des intervalles de confiance pour l’effet indirect.

169
Q

Dans le contexte d’une analyse de médiation, quel est le rôle de l’effet total?

A

Il décrit l’effet de la variable indépendante sur la variable dépendante avant l’introduction du médiateur.

170
Q

Quel est l’avantage principal de la régression logistique ?

A

elle est flexible

171
Q

Que sont les chances ?

A

La probabilité qu’un événement se produise divisée par la probabilité qu’il ne se produise pas.

172
Q

que sont les Odds Ratio?

A

rapport des odds de survenue d’un événement entre deux groupes.

173
Q

Dans une étude évaluant l’effet de l’exercice sur la santé mentale, on mesure le bien-être chez un groupe pratiquant de l’exercice à un groupe sans exercice. En assumant que l’exercice est bénéfique pour la santé, comment interpréteriez-vous un Odds Ratio de 3 ?

A

Le groupe pratiquant l’exercice a trois fois plus de chances de présenter une amélioration de la santé mentale comparé au groupe sans exercice.

174
Q

Dans l’équation Ŷi = eu / (1 + eu), que représente Ŷi ?

A

La probabilité prédite de l’occurrence de l’événement.

175
Q

Quel est le but principal d’utiliser deux cliniciens indépendants pour évaluer les participants dans l’étude sur l’anxiété sociale ?

A

Assurer la fiabilité de la procédure de sélection des participants

176
Q

Pourquoi utiliser le coefficient Kappa au lieu de simplement utiliser un pourcentage d’accord ?

A

Pour prendre en compte la possibilité d’accord par hasard.

177
Q

L’accord inter-juge permet-il de savoir si les jugent classent correctement les stimuli présentés ?

A

Non, l’accord inter-juge confirme seulement que les juges sont cohérents entre eux dans la classification des stimuli.

178
Q

Si les deux juges avaient évalué les participants de manière complètement aléatoire, quelle valeur le Kappa aurait-il théoriquement atteinte ?

A

0 (Kappa évalue l’accord au-delà du hasard; un accord aléatoire devrait conduire à un Kappa de 0)

179
Q

Quelle est la principale différence entre le coefficient de concordance de Kendall et le coefficient kappa ?

A

Le coefficient de concordance de Kendall évalue l’accord sur des échelles ordinales tandis que le kappa évalue l’accord sur des échelles nominales.

180
Q

Quelle serait la valeur du coefficient de concordance de Kendall si tous les juges étaient d’accord avec l’ordre du premier juge ?

A

Une concordance parfaite donne un coefficient de 1. L’accord entre les juges est complet et tous les objets sont classés identiquement par chaque juge.

181
Q

Quel est l’impact du nombre d’objets (N) et du nombre de juges (k) sur la fiabilité du W de Kendall ?

A

Augmenter N et k augmente la fiabilité de W.

182
Q

Pourquoi pourrait-on vouloir transformer le W de Kendall en rs de Spearman

A

Pour simplifier l’interprétation des résultats. Transformer en rho de Spearman peut aider à simplifier l’interprétation en fournissant une mesure plus familière et comparable.

183
Q

Comment la position de la médiane est-elle déterminée dans un ensemble de données ?

A

ordonnant les valeurs et en sélectionnant celle au milieu

184
Q

explique correctement pourquoi l’échelle de mesure est cruciale dans le choix entre la médiane et la moyenne comme mesure de tendance centrale ?

A
  • moyenne requiert des données sur une échelle d’intervalle pour être interprétable car elle implique des calculs qui supposent une équidistance entre les valeurs.
  • médiane, étant simplement le point médian des données classées, est suffisante pour les données sur une échelle ordinale où le classement est significatif mais pas la distance exacte entre les rangs
185
Q

mesure de tendance centrale est généralement plus affectée par l’ajout ou la suppression de valeurs dans l’échantillon

A

médiane

186
Q

raison principale pour laquelle on pourrait préférer un test non paramétrique à un test paramétrique dans une étude statistique

A

tests non paramétriques sont basés sur moins d’hypothèses sur la distribution sous-jacente des données

187
Q

quel contexte un test non paramétrique pourrait-il être considéré moins puissant qu’un test paramétrique correspondant

A

données sont parfaitement normales. Les tests paramétriques tendent à être plus puissants que les tests non paramétriques lorsque les conditions d’application des tests paramétriques (comme la normalité des données) sont satisfaites

188
Q

pourquoi la méthode de Bootstrap est-elle particulièrement utile pour estimer l’intervalle de confiance de la médiane dans des données asymétriques

A
  • utilise un grand nombre de réplications pour estimer la distribution de la médiane
  • ne repose pas sur des postulats de normalité
  • utilise le rééchantillonnage pour simuler la distribution asymétrique
189
Q

principe sous-tend l’approche Bootstrap

A

scores observés dans un certain pourcentage des cas dans l’échantillon sont représentatifs de ce même pourcentage dans la population

190
Q
A
191
Q

scénario approprié pour utiliser le Bootstrap plutôt que les méthodes paramétriques traditionnelles

A

données montrent des valeurs extrêmes et que la distribution de l’échantillon est asymétrique

192
Q

Bootstrap pour estimer des statistiques, comment les tirages sont-ils effectués à partir de l’échantillon original

A

tirages sont effectués avec remise pour permettre la réplication exacte de la distribution de l’échantillon

193
Q

Comment doit-on interpréter un intervalle de confiance issu d’une méthode Bootstrap pour un coefficient de corrélation qui n’inclut pas zéro

A

signifie que le coefficient de corrélation est significativement différent de zéro, suggérant une corrélation significative entre les variables

194
Q

Que signifie un intervalle de confiance qui n’inclut pas zéro pour une taille d’effet

A

La taille de l’effet est statistiquement significative. Si l’intervalle de confiance pour une taille d’effet (p. ex. un coefficient de corrélation r) ne comprend pas zéro, cela signifie que l’effet est statistiquement significatif

195
Q

test de la somme des rangs de Wilcoxon est une alternative à quel test

A

test t pour échantillons indépendants

196
Q

l’hypothèse nulle du test de la somme des rangs de Wilcoxon pour deux échantillons indépendants

A

Les deux échantillons ont été prélevés aléatoirement de populations identiques, au-delà de la simple égalité des moyennes

197
Q

dans le test de la somme des rangs de Wilcoxon, passe-t-on à une approximation normale lorsque la taille de l’échantillon est grande, pourquoi

A

cette approche permet de calculer un score Z et d’utiliser la distribution normale pour obtenir une valeur p, facilitant ainsi l’interprétation statistique

198
Q

différence entre le test de la somme des rangs de Wilcoxon et le test des rangs pour échantillons pairés de Wilcoxon

A

premier compare deux échantillons indépendants, tandis que le second compare deux mesures appariées ou sur les mêmes sujets