Examen 2 (8-11) Flashcards

1
Q

Quelle est l’utilité du test du chi-2 ?

A

Vérifier si les variables sont indépendantes (différences entre groupes à l’étude) et si la différence observée est statistiquement significative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

À quoi sert le tableau croisé ?

A

Montre la distribution des effectifs des 2 variables lorsque combinées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les conditions nécessaires pour réaliser le test du chi-carré ?

A

2 variables qualitatives

Minimum de 5 effectifs théoriques par cellule

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les étapes pour réaliser le test du chi-2 ?

A
  1. H1
  2. Test stat (respect postulat)
    a. 5 effectifs théoriques par cellule
  3. Rejet ou non de H0 (signification du Khi-2)
  4. Si rejet
    a. Précisez direction de la relation (différences de groupes observés avec tableau croisé)
    b. Précisez valeur de la relation: tableau des mesures symétriques
  5. Présentation et interprétation des résultats
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment faut-il faire l’interprétation pour le test du chi-2?

A

Test d’indépendance du chi-2 indique la présence d’une relation statistiquement significative entre la VI et la VD (x2 (ddl) = Valeur du khi-2 de Pearson, niveau de signification). Possible de rejeter l’hypothèse nulle, selon laquelle il n’existe aucune relation statistiquement significative entre les variables à l’étude, et conclure à la véracité de l’hypothèse de recherche de la présente étude. En effet, les résultats démontrent que… (faire ressortir 2 groupes de % les + saillants). La force de cette relation est… (valeur de l’indice de force)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quel indice de force utiliser pour le test du khi-2 ?

A

Phi: Tableau 2x2
C de contingence: tableau dont nbr de colonnes = nbr de rangées
Gamma: 2 variables ordinales
V de Cramer: tous les autres types de tableau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est le symbole pour le khi-2

A

X au carré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel est le but et l’utilité du test de moyenne et test t ?

A

Comparer des groupes (moyennes de 2 groupes sont statistiquement différentes?)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont les variables à l’étude pour le test t ?

A

VI: Variable nominale dichotomique
VD: Variable continue (quantitative)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Nommez les symboles et terminologie pour le test t ?

A
Moyenne population: u1 et u2 (mu)
Écart-type population: σ1 et σ2
Grosseur population: N1 et N2
Moyenne échantillon: X1 et X2
Écart-type échantillon: s1 et s2
Grosseur échantillon: n1 et n2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quels sont les 2 scénarios possibles quant au test t ?

A
  1. Aucune différence quant à la moyenne des populations/groupes à l’étude. On ne distingue qu’une seule courbe
  2. Réelle différence quant à la moyenne des populations/groupes à l’étude. On distingue 2 courbes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dans quel cas le seuil de signification est-il de 0.025 ? Pourquoi ?

A

Lorsqu’on veut savoir uniquement s’il y a une différence entre les groupes, on utilise un test bilatéral. On doit donc tester pour les deux côtés de la courbe et le seuil de signification est divisé en 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Pour un test bilatéral, quand rejette-t-on H0 ?

A

Quand la valeur du t est plus petite que la valeur du t critique négative, ou plus grande que la valeur du t critique positif (dessin courbe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dans quels cas utilisons nous un test bilatéral ? Et unilatéral ?

A
  • Bi: On veut savoir s’il y a une différence entre les groupes
  • Uni: On veut prédire la direction du résultat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pour le test de moyenne, quels sont les tests paramétriques ? Et les non-paramétriques ?

A
Para: 
- Test t pour échantillons indépendants
- Test t pour échantillons appariés
Non-para:
- Test du U de Mann-Whitney: Basé sur médiane plutôt que moyenne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les conditions nécessaires pour le test t pour échantillons indépendants ?

A
  1. VI dicho et VD continue
  2. Distribution normale de la VD (moins problématique si n50 et min. de 15-30 cas par groupe)
  3. Homogénéité de la variance (homoscédasticité): Test de Levene
    a. Levene non-significatif (p>0.05)
    b. Levene significatif (p<0.05)
    Doit être non-significatif pour respecter le postulat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Pour le test d’échantillons indépendants, dans quels cas une distribution anormale de la VD est moins problématique

A

Si il y a au moins 50 cas et si il y a un minimum de 15-30 cas par groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Que signifie un Levene non-significatif ? Et un significatif ?

A

N.S: 2 groupes apparemment différents, avec des variances similaires. La variance est homogène donc on respecte le postulat et on peut lire la 1e ligne du tableau
S: 2 groupes apparemment différents mais avec des variances significativement différentes. La variance est hétérogène donc on ne respecte pas le postulat et il faut lire la 2e ligne du tableau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelle est la procédure pour le test t pour échantillons indépendants ?

A
  1. H1
  2. Effectuez test statistique (respect des postulats)
    a. Si p plus grand ou égal à 0.05Levene (significatif): non-respect du postulat, lecture 2e ligne du tableau
    b. Si p>0.05 Levene (non-significatif): respect du postulat, lecture de la 1 ligne
  3. Rejet ou non de H0, selon seuil de signification bilatéral
  4. Si rejet
    a. Sens de la relation/différences de groupes (moyenne dans tableau Statistiques de groupe permet de comprendre/interpréter différences de groupes existantes)
    b. Force de la relation (Êta carré)
  5. Présentation et interprétation des résultats
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que l’Êta-carré ?

A
  • Il indique la force de la relation
  • Il représente le % de la variance de la VD qui est expliqué par la VI
  • Le % d’explication de la VI sur la VD
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Comment présente-t-on les résultats pour le test t ?

A

Les résultats du test t pour échantillons indépendants (Tableau X) permettent de constater qu’il existe une différence au niveau de la VD, en fonction de la VI (t (ddl) = valeur du t, seuil de signification). Il est donc possible de rejeter l’hypothèse nulle selon laquelle il n’existe aucune relation entre les variables à l’étude et de confirmer l’hypothèse de recherche de la présente étude. En effet (présentez les moyennes et é.-t. de chaque groupe). L’Êta-carré indique une relation … et permet de constater que (pourcentage) de la variance de la VD peut peut être expliquée par la VI (Êta-carré = ) Si postulat d’homogénéité non-respecté: Il est toutefois important de noter que le postulat d’homogénéité de la variance n’est pas respecté (test de Levene: p<0.05). Les résultats de la présente analyse ne sont donc pas aussi robustes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelle est l’utilité du test de corrélation ?

A
  • Permet de savoir s’il existe une association entre 2 variables quanti (+ force et sens)
  • Étape nécessaire avant de faire une analyse multivariée: aussi utilisée pour connaitre l’association entre les VI à l’étude (colinéarité)
23
Q

Donnez un exemple d’hypothèses de recherche pour le test de corrélation

A

H1: Il existe une association entre Vi et VD. Plus précisément, plus la VI est…, plus la VD sera…
H0: Il n’existe aucune association entre la VI et la VD

24
Q

Quelle variable faut-il utiliser pour un test de corrélation ?

A

2 variables quantitatives

25
Q

Quels sont les postulats d’utilisation du test de corrélation ?

A
  1. Distribution normale (aplatissement, asymétrie, histogramme)
  2. Absence de valeurs extrêmes
  3. Linéarité de la relation (diagramme de dispersion)
  4. Min. de 30 effectifs/cas par variable
26
Q

Quel est le symbole pour le test t ?

A

t

27
Q

Pour le test de corrélation, dans quel cas utiliserait-on le rho de Spearman

A

Si l’un des postulats n’est pas respecté

28
Q

Qu’est-ce que le rho de Spearman et le r de Pearsons ?

A

Rho:
- Utilisation du rang des observations plutôt que des valeurs
- Permet de détecter l’existence et le sens d’une relation, peu importe sa “forme”
- Perte d’information
- Examine s’il existe une relation entre le rang des observations
R
- Calcul basé sur la somme des écarts à la moyenne pour valeurs des variables X et Y
- Examine comment les variables co-varient
- Nécessite respect des 4 postulats

29
Q

Quelles sont les étapes d’un test de corrélation ?

A
  1. Respect postulat
  2. Réaliser test de corrélation et vérifier les effectifs
  3. Vérifier s’il existe une relation significative (seuil de signification)
  4. Si relation significative
    a. Vérifier sens et force avec le coefficient de corrélation
    b. Varie de -1 à 1. Interpréter valeur du coefficient
  5. Présentation et interprétation des résultats
30
Q

Que signifie le signe avant le coefficient de corrélation r ou rho ?

A

C’est le sens de la relation, si c’est une relation négative ou positive

31
Q

Comment présente-on les résultats pour le test de corrélation ?

A

Une analyse de corrélation fut effectuée pour déterminer si une association existait entre la VI et la VD. Les résultats permettent de constater qu’il existe une association significative entre ces deux variables (rho ou r (ddl) = valeur du coefficient, seuil de signification). Il est donc possible de rejeter l’hypothèse nulle selon laquelle il n’existe aucune association entre les 2 variables à l’étude et de valider l’hypothèse de recherche de la présente étude. Plus précisément, il existe une relation (sens) et (force) entre la VI et la VD. En effet, plus…, plus …

32
Q

Comment est calculé le degré de liberté pour le test de corrélation ?

A

ddl = n-2

33
Q

Quels sont les postulats pour la régression simple ?

A

Même que ceux de la corrélation:

  1. Distribution normale (aplatissement, asymétrie, histogramme)
  2. Absence de valeurs extrêmes
  3. Linéarité de la relation (diagramme de dispersion)
  4. Min. de 30 effectifs/cas par variable
34
Q

Quelle est l’utilité de la régression simple ?

A
  • Représenter graphiquement la relation entre 2 variables par une droite
  • Permet de faire des prédictions (équation linéaire)
  • Permet de connaitre la force explicative de la VI sur la VD (coefficient de détermination)
35
Q

Quelle variable faut-il utiliser pour une régression simple ?

A

2 variables quanti

36
Q

Quelle est l’équation de régression ?

A

Y = a + b (x) + e
Y: valeur prédite de la VD
X: (prédicteur) valeur de la VI
A: ordonnée à l’origine/constante (valeur moyenne de x lorsque y=0)
B: la pente (changement de Y associé au changement d’une unité de X; informe sur degré de la pente)
E: Résidus, terme d’erreur

37
Q

Où se trouve le a et le b dans SPSS ?

A

Le a est la constante, le b est en dessous

38
Q

Comment sait-on si le modèle de régression est un bon ou un modèle faible de prédiction ?

A

Faible: Les points sont éloignés de la droite
Fort: Les points sont rapprochés de la droite

39
Q

Quel est l’intérêt de la régression multiple ?

A
  • Un phénomène est rarement expliqué par une seule variable/prédicteur
  • Il permet de connaitre l’effet combiné de plusieurs variables, et des variables tierces ?
40
Q

Quelle est l”‘utilité de la régression linéaire multiple ?

A

Améliore la prédiction de la VD en prenant en considération l’effet de plusieurs VI

  • Permet de connaitre leur effet unique ET leur effet combiné sur la VD
  • Permet d’inclure des variables contrôles
  • Permet de faire un modèle de prédiction
41
Q

Quelle est l’équation de la régression multiple ?

A

Y = a + b1 (x1) + b2 (x2) + b3 (x3) + … + e

42
Q

Quel type de régression faut-il utiliser pour une variable quantitative, dichotomique et catégorielle ?

A

Q : Régression linéaire multiple
D : Analyse de régression logistique
C: Analyse de régression logistique multinominale

43
Q

Quelles variables faut-il utiliser pour faire une régression linéaire multiple ?

A

VD: Quantitative
VI: Quantitative ou dichotomique

44
Q

Quels sont les postulats d’utilisation pour la régression linéaire multiple ?

A
  1. Min. de 20 cas/effectifs par variables
  2. Normalité de la distribution des variables quanti
    a. Analyse univariée et inspection de l’histogramme
  3. Linéarité de la relation entre les variables quanti
    a. Inspection du diagramme de dispersion
  4. Absence de colinéarité et multicolinéartié (indépendance des VI entre elles)
    a. Matrice de corrélation: Coefficient de corrélation ne doit pas dépasser 0.8
    b. Indice de tolérance doit être supérieur à 0.3
45
Q

Qu’est-ce que la multicolinéarité ?

A
  • Modèle de régression est plus puissant lorsque chaque VI est fortement associées à la VD, mais que chaque VI est indépendante des autres VI
  • Lorsque 2 VI partagent le même % de variance expliquée de la VD, sa contribution n’est pas unique
  • Indice de tolérance varie de 0 à 1 et est problématique lorsque supérieur à 0.3
46
Q

Quelle est la différence de l’hypothèse pour la régression linéaire multiple ?

A

On teste pour la signification d’un modèle (plusieurs variables) et non pour la signification entre une VI et une VD
ex.: Le modèle mesurant… permet de prédire… Plus particulièrement…

47
Q

Quelles sont les étapes d’un test de régression linéaire multiple ?

A
  1. Respect des postulats
    a. Toutes les variables quanti ou dicho
    b. Pour quanti: normalité et linéarité
    c. Matrice de corrélation (colinéarité entre VI?)
  2. Réaliser régression linéaire multiple
    a. Vérification indice de tolérance (multicolinéarité)
    b. Minimum des effectifs par variables respectés (20)
  3. Vérifier si modèle est significatif (=effet combiné de VI sur VD)
    Si p<0.05 (tableau ANOVA)
    a. Vérifier la force du modèle
    b. Vérifier la force de la relation (tableau récapitulatif des modèles) avec le R2 (varie de 0 à 1)
    c. Vérifier seuil de signification et effet unique de chaque VI
    Parmi celles significatives:
  4. Vérifier sens et force de la relation
    a. Coefficients standardisés (Bêta)
    Quels sont les meilleurs prédicteurs ?
  5. Présenter et interpréter les résultats
    a. Matrice des corrélation
    b. Tableau avec le B et le bêta pour chaque VI et la constante
48
Q

Pour le test de corrélation, qu’est-ce qui indique la force de la corrélation ?

A

Le coefficient de corrélation r ou rho

49
Q

Pour la régression linéaire multiple, qu’est-ce qui indique la force de la relation ? Lequel on utilise ?

A

R: Coefficient de corrélation entre modèle de prédiction et la VD
R2: Variation de la VD expliquée par les VI inclues dans le modèle (%)
- Similaire à l’Êta-carré, mais implique une relation linéaire
- Varie de 0 à 1 (100%)
R2 ajusté: Ajuste pour le nbr de variables inclues dans le modèle
- Nbr + élevé de VI fera baisser la valeur du R2 ajusté
On utilise le R2

50
Q

À quoi servent les coefficients standardisés bêta ?

A

Informent sur le sens et la force de la relation pour chaque VI (effet unique) ; permettent de comparer l’importance de chaque VI dans le modèle de prédiction
Déterminent les meilleurs prédicteurs du modèle

51
Q

Comment on interprète une régression linéaire multiple &

A

Une analyse de régression linéaire multiple fut effectuée pour déterminer si (concept VI) permet de prédire (concept VD) mesurée par (VD). Les résultats de cette analyse multivariée (tableau avec les bêta) permettent de constater que (concept VI), tel que mesuré dans la présente analyse, permet de prédire significativement (concept VD) (F (ddl régression, résidus) = valeur du F, p< , R2 = valeur du R2). Il est donc possible de rejeter l’hypothèse nulle selon laquelle le modèle actuel mesurant (concept VI) ne permet pas de prédire (concept VD) et de confirmer l’hypothèse de recherche de la présente étude. Les indicateurs d’implication dans un mode de vie criminel retenus expliquent environ (R2 en %) de la variation de la VD. Il est à noter qu’aucun problème de colinéarité et de le multicolinéarité n’a été constaté et que tous les postulats du test furent respectés.

Parmi les 3 indicateurs inclus dans le modèle de la présente étude, seulement 2 d’entre eux d’avèrent être des prédicteurs significatifs de la VD: les nommez + valeur du bêta. Par contre, ces 2 prédicteurs n’ont pas le même type d’effet sur la réussite criminelle. En effet, les résultats indiquent que + … est tardif, + … diminuent (relation négative force). Par contre, un … + élevé est quant à lui associé à … + élevé (relation positive force). Offrir une explication à ces résultats. À cet effet, le (une des VI) est le meilleur prédicteur du (VD).

52
Q

Que ferions-nous de différent dans l’interprétation s’il y avait une variable dicho ?

A

Parmi les 3 indicateurs inclus dans le modèle de la présente étude, seulement 2 d’entre eux d’avèrent être des prédicteurs significatifs de la VD: les nommez + valeur du bêta. Il appert donc que (groupe de la VI), et donc à un … plus tardif, ont un … plus faible que ceux (autre groupe de la VI).

53
Q

Lorsqu’on utilise une variable indépendante dichotomique dans une régression multiple, laquelle est prédite ?

A

Le 1

54
Q

Comment remplir la formule de régression multiple ?

A

Avec les coefficients non standardisés (B): a et b - constante et pente.