Examen 2 Flashcards

1
Q

Variables qualitatives

A

fait référence à des qualités et s’exprime en modalités (ou catégories, attributs)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variables qualitatives nominales

A

Catégories sans ordre particulier, pas de hiérarchie (ex: couleur, genre, etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Variables qualitatives ordinales

A

Catégories ordonnées de manière à refléter un gradient, une progression. (ex: estime de soi)
Peut renvoyer à une échelle: niveau d’accord avec un énoncé.
Peut renvoyer à des étendues (revenu entre 90k et 100k, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Les variables quali doivent être…

A

Exclusifs : un individu ne peut pas se retrouver dans plusieurs niveaux

Exhaustifs : tous les individus doivent pouvoir être catégorisés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Variables quanti (2)

A

Cardinales: quantités, valeurs
Peuvent être subdivisés infiniment (distance, longueur)

Discrètes: ne peux pas être subdivisé à l’infini (ex: revenu, nombre d’enfant, etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Fréquence

A

nb d’observations associées à une valeur ou catégorie (niveau de modalité)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Fréquence cummulée

A

nb d’observations associées à une valeur X ou cagétorie X précédente

Ex: femme 10
homme 10
iels 5
fréquence cummulée h-f 20
fc tout 25

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Proportion

A

Fréquence divisée par le nombre total d’observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourcentage

A

proportion rapportée à un groupe de 100 observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Rapport / ratio

A

Relation entre deux qte qu’on veut comparer
Ex: 6 H pour 7 F = rapport 6/7

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Proportion

A

Les deux qte sont liées (numérateur est un sous ensemble du dénominateur)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Taux

A

Processus dynamique, on observe un changement dans le temps
Ex: dénominateur exprimé en personne-temps, c.-à-d qu’on attribue chq personne un poids selon la durée de son observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Histogramme de fréquences

A

Grosses lignes verticales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Graphique en courbe

A

Tite ligne horizontale qui monte et descend

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Histogramme et polygone de fréquence

A

Grosses lignes verticales avec une courbe mais permet de voir la distribution de l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Distribution

A

Propriété d’une population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Tendance centrale

A

Ce qui est typique de la population ; se qui se passe en moyenne

Valeurs autour desquelles la distribution est centrée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Mesures de la tendance centrale

A

Moyenne, moyenne pondérée, médiane, mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Moyenne

A

Somme des observations divisée par le nb d’observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Moyenne pondérée

A

Toutes les observations n’ont pas le même poids, permet de modifier la contribution relative des observations

Ex: les notes (un travail qui vaut 30% de 100%)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Médiane

A

Sépare la distribution entre deux groupes égaux.
Moins affectée que la moyenne par les valeurs extrêmes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Mode

A

Catégorie ou valeur ayant la fréquence la plus élevée. Le mode est approprié pour les variables nominales et ordinales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Mesures de dispersion

A

Ce qui est typique pt plus ou moins fréquent dans une population: variabilité autour de la tendance centrale.
- Décrit la variabilité autour de la tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Cette variabilité autour de la tendance centrale peut être décrite de différentes façons:

A

étendue, écart moyen, écart type, coefficient de variation, variance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Étendue

A

Différence entre les valeurs minimales et maximales de la distribution
Ex: Min 13 et max 44
44 - 13 = 31

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Écart moyen

A

Comment, en moyenne, chq des observations est éloignée de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Variance

A

Moyenne des carrés des écarts à la moyenne

Produit des mesures difficiles à interpréter car très élevé (écarts à la moyenne sont au carré)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Écart-type

A

Racine au carré de la variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Coefficient de variation

A

Variabilité par rapport à la moyenne

Plus le CV est petit, plus les valeurs de la distribution tendent à être proche de la moyenn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Forme de la distribution

A

Peuvent aussi être décrites selon leur forme (comparaison avec la distribution normale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

On décrit l’écart à cette distribution selon 2 dimensions

A

Asymétrie et aplatissement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Asymétrie

A

Décalage vers la gauche ou la droite de la courbe

Négative: moy < méd
Positive: moy > méd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Aplatissement

A

Concentration des fréquences autour de la moyenne
Négative: plate
Normale: normale
Positive: bandé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Mesures de position

A

Tendance centrale et dispersion sont des caractéristiques de la distribution

Mesure de position: situer une valeur relativement à l’ensemble de la distribution
p.e: centile, quartile, etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Centiles

A

100 groupes composés chacun de 1% des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Quartiles

A

4 groupes composés chacun de 25% des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Q1, Q2, Q3

A

Q1: milieu de la 1ere moitié
Q2: médiane
Q3: milieu de la 2e moitié

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Tendance central, dispersion et position: boîte à moustache

A

Représentation graphique d’une distribution qui intègre différentes mesures
Permet de comparer des groupes
Voir photo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Score Z

A
  • Exprime un écart à la moyenne qu’on met en relation avec la variabilité (dispersion) dans la population.
  • Exprime l’écart à la moyenne en unités d’écart-type
  • Permettent de relativiser les valeurs de distribution différentes

Ex: utilisés pour comparer des étudiants dont la performance est mesurée dans des contextes différents
Étudiant A
note: 91, moyenne 80
écart-type: 10
écart à la moyenne: 11
score Z 11/10 = 1,1

Étudiant B
note: 70, moyenne: 50
écart type: 20
écart à la moyenne: 20
20/20 = 1,0
Perfo relativement similaires dans des groupes différents

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Échantillon

A

Sous ensemble de la population composé d’individus qui ont été choisis au hasard.

Le hasard peut faire varier la composition

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Échantillonage - échantillon probabiliste

A

Dans celle-ci, on s’appuie sur des lois de probabilité pour estimer la variabilité théorique des statistiques issues de notre échantillon

La probabilité D’un évènement X est la proportion de X dans toute la population d’évènements !! P(X)= X / N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Si on repétète l’échantillonnage, les différentes moyennes suivraient…

A

Une distribution normale

C-à-d que certaines moyennes seraient obtenues plus fréquemment que d’autres.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Erreur type

A

Écart type de la moyenne d’échantillonnage. Plus l’échantillon est petit, plus le truc est élevé
Ex: échantillon de 27, erreur type de 10

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Distribution normale centrée et réduite - Qu’est-ce que la courbe décrit?

A

Distribution des fréquences
- Permet de prévoir probabilités
- Sert de base à l’inférence statistique !!
- Possède certaines caract. importantes (moyenne est de 0, écart-type -1 et symétrique)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Distribution normale centrée et réduite - on peut associer… (table de Z!!)

A

Parce que la courbe couvre l’ensemble des évènements possibles, on peut associer des probabilités à l’aire sous la courbe

Ex: probabilité d’observer une valeur entre -1,34 et 1,34? 82%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Intervalle de confiance

A

Mesure de précision de l’estimation obtenue à partir d’un échantillon (estimation d’une moyenne ou d’une proportion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Intervalle de confiance: vise à…. avec quel truc (2)

A

Vise à identifier les bornes qui représentent les valeurs probables de la moyenne de la population autour de la moyenne estimée par l’échantillon
Avec score Z et erreur type !!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Le score Z pour le calcul de l’IC dépend du…

A

Niveau de certitude souhaité
90%, 95%, 99%

49
Q

Variables nominales à 2 catégories on utilise quoi pour décrire l’échantillon

A

On va utiliser une proportion pour décrire l’échantillon

50
Q

Proportion

A

Forme particulière d’une moyenne
Somme des mesures binaires (0,1) = fréquence de valeur 1
Erreur-type d’une proportion pas calculé comme celui d’une moyenne

51
Q

Tests d’hypothèses

A

Permet l’inférence en évaluant si une condition est vraie ou non
- Démarche qui permet de prendre une décision concernant l’hypothèse statistique
- La démarche porte sur H0
Si rejet de H0 = condition est vraie.

52
Q

Erreur de type I

A

Rejet de H0 alors qu’elle est vraie (notée @)

53
Q

Erreur de type II

A

Accepter H0 alors qu’elle est fausse (notée B)

54
Q

Erreur de type I explications

A

Liée au hasard: variabilité inhérente à l’échantillonnage
Seuil @ comparé à la valeur p du test
Seuil @: risque consenti à l’avance de rejeter à tort H0
Valeur p: probabilité qu’une différence soit attribuable au hasard

55
Q

Erreur de type II explications

A

Liée à la puissance statistique (1-B) de l’étude
Capacité à prendre une décision statistique (à détecter une différence réelle)

56
Q

Test Z

A

Test d’hypothèse qui utilise la valeur Z pour associer une probabilité à une condition décrite par H0.
Permet de comparer une moyenne observée à une moyenne connue
EX: votre client a il réellement des relations plus fréquentes que la moyenne

57
Q

Valeur Z

A

Permet d’évaluer la probabilité que la moyenne de notre échantillon est réellement supérieure à la moyenne de la population

58
Q

Valeur p

A

Renseigne la probabilité que H0 soit vraie.

59
Q

Test Z quelle échantillon

A

Approprié pour les échantillons de grande taille parce que l’écart type de l’échantillon (s) est considéré comme étant un bon estimateur de l’écart-type de la population

60
Q

Test t - échantillon

A

Lorsque l’écart-type de l’échantillon n’est pas un bon estimateur de l’écart type de la population
Échantillon de petite taille !

61
Q

Test t: plus la taille de l’échantillon augmente, plus…
+ rejet du H0 = (…)

A

Comme pour le Z, utilisation d’une table
Plus la taille de l’échantillon augmente, plus les valeurs de t et Z tendent à se ressembler.
- Même manière que Z
- Rejet de H= t calculé > t critique

62
Q

DL: qu’est-ce que ça décrit? Et déduit?

A

Degrés de liberté, décrivent le nb d’observations qui peuvent varier dans le calcul d’une stat
À partir d’une moyenne, capable de déduire la valeur d’une observation si on connait la valeur de toutes les autres observations

63
Q

Test t - DL - Avec 1 ou 2 échantillon, le nb d’observations qui peuvent varier est

A

1 échantillon: n - 1
2 échantillons: (n1+n2) -2

64
Q

l’IC permet de…

A

Comparer des groupes

65
Q

Test t pour échantillons indépendants

A

Comparaison de deux groupes indépendants
ex: groupe expérimental VS groupe contrôle

66
Q

Test t pour échantillons appariés

A

Un seul groupe à deux temps de mesure

67
Q

Test t - échantillons indépendants (variation)

A

t tend à augmenter lorsque :
- Différence entre les moyennes augments
- La variance diminue
- La taille des échantillons augments

68
Q

Covariance des deux échantillons, décrit la relation entre…

A

COVx1x2
Décrit la relation entre les deux distributions

69
Q

ANOVA

A

Permet de comparer plus de 2 groupes
La comparaison est faite en comparant les variances inter-groupes (à quel point ya de fortes variabilité entre les groupes)

70
Q

ANOVA - dl

A

dl inter = nb de groupe 1
dl intra = nb total d’observations - nb de groupes

F augments quand variance inter-groupe > variance intra-groupe
Donc, plus les groupes sont différents entre eux, plus F augmente!

71
Q

Hypothèses anova

A

h0= tous les groupes sont pareils
h1= un des groupes est différent

72
Q

Quel test on fait? 1 moyenne vs une valeur attendue n= >30

A

Test Z ou test t à 1 échantillon

73
Q

Quel test on fait? 1 moyenne vs une valeur attendue n= <30

A

test t à 1 échantillon

74
Q

Quel test on fait? 2 moyennes échantillons indépendants

A

test t à 2 échantillons indépendants

75
Q

Quel test on fait? 2 moyennes échantillons appariés

A

test t à 2 échantillons appariés

76
Q

Quel test on fait? plus de 2 moyennes

A

ANOVA

77
Q

Décision statistique: rejet de H0 si… (2)

A
  • p < a
  • |valeur calculée| > |valeur critique| (si val cal supérieure, on rejette H0 ça revoie à la même chose)

***Les hypothèses doivent faire référence à une différence et pas une association

78
Q

Corrélation

A

Comment les changements observés sur un facteur sont-ils liés aux changements observés sur un autre facteur?
**Évalue la co-variation entre le X et Y, à quel point il existe une corrélation entre deux variables.

79
Q

Nuage de point

A

Représentation graphique pour décrire une relation entre deux variables cardinales
**Évalue la co-variation entre le X et Y, à quel point il existe une corrélation entre deux variables.

80
Q

Quelle est la mesure la plus courante dans les variables cardinales?

A

Coefficient de corrélation de Pearson

81
Q

Coefficient de corrélation de Pearson (r) est utilisé pour…

A

Utilisé pour analyser l’association entre deux variables quanti
Corrélation de Pearson = variables cardinales

82
Q

Coefficient de corrélation de Pearson (r) permet d’évaluer… (2)

A

La force et la direction de la relation
- Force: haut r = association forte
r = 1 ou -1 corrélation parfaite
r vers 0 = pas d’association

  • Direction
    r+ = association positive (un aug, l’autre aug)
    r- = association négative
83
Q

Coefficient de détermination (r2)

A

Indique la proportion de la variance d’une variable qui est exprimée par l’autre variable
À quel proportion la variable Y est expliquée par X: 0 pentoute, 0,99, à 99%, 1 au complet

84
Q

Comment savoir ce qui influence quoi quand le r2 est élevé?

A

Le devis de l’étude est le seul qui permet d’établir le sens de la relation
Association n’est PAS une causalité !!!

85
Q

Khi-deux (X2) permet de..

A

Décrire l’association entre deux variables ordinales ou nominales

86
Q

Le test du Khi-deux (X2) compare…

A

Les fréquences observées à des fréquences attendues sous l’hypothèse d’absence d’association

87
Q

Quel test doit être utilisé?
On souhaite savoir si le score d’anxiété est associé au score de satisfaction sexu.
Résultat: p = 0,02 et 2 = -0,54 ( r2 = 0,292)

A

Corrélation
Rejet de H0 (p<0,05) ; association négative modérée: le score d’anxiété augmente lorsque le score de satisfaction sexuelle diminue. 29,2% de la variance du score d’anxiété s’explique par la variation du score de la satisfaction sexu et inversement ( r2 = 0,292)

88
Q

Quel test on doit utiliser?
Une équipe de recherche souhaite évaluer l’association entre la législation des pays (légal ou partiellement légal, criminalisé, absence de loi) et le statut de séropositivité (positif/négatif) des travailleurs.ses du sexe
Résultats: X2 = 4,259 (x2 critique = 5,991)

A

Khi deux
Acceptation de H0; pas d’association; la répartition des personnes séropositives ne varie pas significativement selon la législation

89
Q

Régression permet…

A

Permet d’évaluer une association entre une VI et une VD en contrôlant l’effet des autres VI

90
Q

Régression - contrôle et ajustement

A

Élimine l’effet d’une autre variable (confusion) sur l’association observée

91
Q

Formule régression

A

Y = mx+b
Y: variable dont les valeurs sont prédites par celles de X
m et b: paramètres qui définissent la relation entre Y et X
b: valeur qu’aura Y lorsque X sera égal à 0 (ordonnée à l’origine)

92
Q

Régression:
si Y = 1,15 +0,282X
X = 25

A

8,2
deux variables cardinales

93
Q

Régression linéaire

A

On quantifie la relation entre deux variables: plus c’est élevé plus une relation est forte et l’inverse

94
Q

Coefficient de régression décrit…

A

La pente de la droite des moindres carrés (la droite qui minimise le carré des écart entre les valeurs prédites par la droite et les valeurs réelles, observées)

95
Q

Coefficient de régression est une mesure de…

A

Co-variation
Il indique dans quelle mesure la variation de X s’accompagne d’une variation sur Y.

96
Q

Vrai ou faux: Il peut y avoir plusieurs co-variables (x) dans une régression

A

Vrai: il peut y avoir plusieurs co-variables dans une régression, ce qui permet l’ajustement de plusieurs facteurs de confusion.
Décrit l’association de X et Y indépendamment des autres co-variables

97
Q

Variable muette quand?

A

Lorsque VI (x) catégorielle est une variable factice ou muette (dummy)

98
Q

Variable muette permet de….

A

indique la présence ou l’absence d’une caractéristique ou d’une catégorie spécifique. Si une variable a plus de 2 catégories, une variable factice peut être créée pour chaque catégorie, excluant une catégorie de référence.

99
Q

Exemple variable muette
Fréquence conso porn: jamais, occasionnellement, souvent. On veut que la ref soit “jamais”

A

Jamais (0), occasionnellement (1), souvent (1)
On créer deux nouvelle variables:
Porn occasionnelle: 0 = non, 1 = oui
Porn souvent: 0 = non; 1 = oui
On obtient: occasionnellement VS jamais et souvent VS jamais

100
Q

Une équipe souhaite analyser les liens entre l’adhésion à des valeurs
conservatrice (score) et l’âge à partir duquel il est perçu comme normal
d’avoir des relations sexuelles pour un garçon. Résultats:
Intercept: B = 16,21 ; valeur p = 0,000
Conservatisme: B = -0,21 ; valeur p = 0,045
Quoi conclure?
D’après ce modèle, quel est l’estimation de l’âge considéré comme normal pour une personne ayant un score pour conservatisme = 3 ?

A

Rejet de H0 ; le score mesurant l’adhésion aux valeurs conservatrice est négativement associée à l’âge considérée comme normal pour avoir des relations sexuelles pour un garçon (β=-0,21 ; SE=0,10 ; p=0,045).
Y = 𝛽0 + 𝛽1X1 16,21 + (-0,21 x 3) = 15,58

101
Q

Régression logistique (3)

A
  • Permet l’utilisation d’une variable dépendante dichotomique
  • Facile d’utilisation
  • Produit directement des rapports de cotes (odds, ratio, OR)
102
Q

Régression - Risque relatif (RR)

A

Similaire à un rapport de cotes
RRi = (cas1/pop1) / (cas2/pop)
RR = 1,2 : Les personnes non pratiquantes ont un risque d’avoir une syphilis 1,2 fois plus grand que les personnes pratiquantes

103
Q

RR rapport à 1

A

RR > 1 : risque plus grand du groupe au numérateur
RR < 1: risque plus petit du groupe au numérateur
RR = 1 : no diff

104
Q

Un rapport de cotes compare… (différence avec RR)

A

Cotes et non des risques
Cotes = comparaison de probabilités
RC = 1,22: les personnes non pratiquantes ont une COTE d’avoir une syphilis 1,22 plus grande que les personnes pratiquantes.
cote PAS risque
risque = probabilité
cote = probabilité d’un évènement  probabilité d’un non évènement
RC = exp(β) !

105
Q

Estimation de paramètres - estimation ponctuelle

A

Valeur de la statistique d’un échantillon:
- mesures de tendance centrale
- mesures de dispersion

106
Q

La moyenne décrit un échantillon à partir de variables…

A

Cardinales

107
Q

Comment s’intéresser à des variables catégorielles dichotomiques ?

A

En utilisant des proportions

108
Q

l’intervalle de confiance (IC) mesure..

A

Précision de l’estimation obtenue à partir d’un échantillon (estimation d’une moyenne ou d’une proportion)

109
Q

Mesure

A

Description des propriétés d’un concept

110
Q

Opérationnalisation

A

Passage du concept à la mesure

111
Q

Biais:

A

Écart entre ce qu’on observe ou conclu et la réalité. « Toute influence ou action pouvant fausser les résultats d’une étude » (F&G, p. 171)

112
Q

Biais de confusion

A

Erreur susceptible d’intervenir dans l’interprétation de l’association entre le VD et la VI en raison de l’interférence d’autres variables qui n’ont pas été considérées

113
Q

Inférence

A

Porter un jugement sur l’ensemble de la population à partir d’un sous-ensemble (échantillon)

114
Q

Représentativité

A

Capacité d’un échantillon à présenter les mêmes caractéristiques que la population

115
Q

Intervalle de confiance

A

Mesure de précision de l’estimation obtenue à partir d’un échantillon (estimation d’une moyenne ou d’une proportion)

116
Q

Puissance statistique

A

Capacité d’une étude à prendre une décision statistique (p. ex. se prononcer sur la présence d’une différence ou d’une association)

117
Q

Variable

A

Expression d’un concept par le biais d’une mesure.

118
Q
A