Cours 1 Flashcards
Qu’est-ce qu’une population?
Ensemble des évènements, des individus ou des objets qui nous intéressent, pour lesquels on fait une recherche
-> Le plus souvent, il s’agit d’un ensemble vaste
Pourquoi on fait des statistiques?
Pour contrôler l’effet du hasard, de la variabilité naturelle
Qu’est-ce qu’un échantillon représentatif?
Aussi appelé aléatoire/probabiliste
Sous-ensemble de la population constitué de manière pleinement aléatoire
Pourquoi utilise-t-on des échantillons représentatifs et non la population? (3)
1) Il est difficile de mesurer une population en entier
2) Il est plus économique et efficace qu’un recensement
3) Les caractéristiques de l’échantillon reflètent les caractéristiques de la population
Qu’est-ce qu’une unité d’observation?
Un échantillon est constitué d’un ensemble d’unités d’observation
-> Ex: Des participants humains, des plans de maïs, etc.
Les caractéristique de l’échantillon aléatoire reflètent les caractéristiques de la […]
Les caractéristique de l’échantillon aléatoire reflètent les caractéristiques de la population
Que permet l’étude d’un échantillon? (3)
1) De tirer des conclusions sur la population
2) D’estimer des caractéristiques de la population
3) Déterminer la précision des estimations
-> SEULEMENT si l’échantillon est aléatoire et représentatif; si chacun des membres de la population à la même chance d’être sélectionné
L’importance d’un échantillon ALÉATOIRE est une question de […]
L’importance d’un échantillon ALÉATOIRE est une question de validité externe
Qu’est-ce que la validité externe?
Capacité à généraliser les résultats échantillonnaux à la population
Quels sont les types d’échantillons non aléatoires? (3)
1) Non représentatifs
2) Échantillons opportunistes
3) Répartition aléatoire
Qu’est-ce qu’un échantillon non représentatif?
Exemple: Le stress chez les étudiants universitaires (population) avec un échantillon d’étudiants volontaires de premier cycle en psychologie
Qu’est-ce qu’un échantillon non représentatif peut entraîner?
1) Perte de validité externe
2) Baisse de la capacité à généraliser à d’autres individus, événements ou objets
Qu’est-ce qu’un échantillon opportuniste?
Échantillons constitués de “volontaires” ou d’unités d’observation qui ne sont sélectionner au hasard
Qu’est-ce qu’une répartition aléatoire?
Procédure (aléatoire) d’assignation des unités d’observation à différents groupes ou conditions (groupe témoin/contrôle)
Quelle est la procédure qui garantit la validité interne (les questions)?
1) Est-ce que les résultats dépendent de ce que nous avons manipulé?
2) Avons-nous mesuré ce que nous prétendons mesurer?
3) Assuré par la méthode expérimentale (manipulation d’une seule variable qui assure la validité interne)
Il y a une perte de validité interne lorsqu’on utilise des groupes […] (p.e. Homme-femme-autre, chômeurs-travailleurs) ou […] (p.e. comparer un groupe d’utilisateurs de drogue dans un centre de traitement à un groupe de participants témoins)
Il y a une perte de validité interne lorsqu’on utilise des groupes invoqués (p.e. Homme-femme-autre, chômeurs-travailleurs) ou opportunistes (p.e. comparer un groupe d’utilisateurs de drogue dans un centre de traitement à un groupe de participants témoins)
VRAI ou FAUX.
Plus la validité externe augmente, plus la validité interne augmente
FAUX
Plus la validité externe augmente, plus la validité interne diminue
Classer en ordre décroissant les méthodes de recherche en fonction de leur validité externe
1) Méthodes corrélationnelles et étude en milieu naturel (p.e. observation directe)
2) Méthodes quasi expérimentales
3) Méthodes expérimentales (en laboratoire)
Classer en ordre décroissant les méthodes de recherche en fonction de leur validité interne
1) Méthodes expérimentales (en laboratoire)
2) Méthodes quasi expérimentales
3) Méthodes corrélationnelles et étude en milieu naturel (p.e. observation directe)
Qu’est-ce qu’une variable?
Valeur (souvent numérique) qui représente une caractéristique des unités d’observation (objets qui nous intéressent)//résultat d’une mesure
Qu’est-ce qu’une variable discrète?
Variable prenant un nombre limité de valeurs: Niveau d’étude (primaire, secondaire, universitaire), échelles de Likert (en 7 points, réponses binaires)
Qu’est-ce qu’une variable continue?
Valeur numérique qui représente la magnitude d’une caractéristique: âge, score de motivation, résultat scolaire, un indice de dépression
Qu’est-ce qu’une donnée qualitative?
Caractéristique représentée par une catégorie
Qu’est-ce qu’une donnée quantitative?
Données numériques quantifiées, le plus souvent continues
Qu’est-ce qu’une variable indépendante ?
Aussi appelé variable endogène
- > Ce qui est manipulé par le chercheur, les prédicteurs
- > Ex: Dosage d’une drogue, traitement
Qu’est-ce qu’une variable dépendante?
Aussi appelé exogène
- > Ce qui est mesuré ou prédit
- > Ex: Nombre ou intensité des symptômes, perte de poids, le rendement d’un plan de maïs
Qu’est-ce qu’une statistique descriptive?
Description d’une caractéristique d’un ensemble de données
- > p.e. moyenne, écart-type, distribution de fréquence, qui caractérisent sur un échantillon
- > Analyse exploratoire des données
Qu’est-ce qu’une inférence statistique?
Procédé qui vise à tirer une conclusion sur la population à partir des résultats d’un échantillon
- > Ce n’est pas juste une technique/test statistique. C’est un ensemble qui vise à donner des conclusions sur la population
- > C’est le procédé qui vise à accumuler de l’information sur une population pour créer une conclusion
Qu’est-ce qu’un paramètre?
Caractéristique d’une population
-> p.e. la moyenne d’âge de la population
Qu’est-ce qu’un estimateur (d’un paramètre)?
Caractéristique d’un échantillon qui vise à inférer une caractéristique de la population
-> p.e. la moyenne d’âge échantillonnale
La statistique inférentielle constitue la plus grande partie des études […]
La statistique inférentielle constitue la plus grande partie des études statistiques
Quelles sont les différentes propriétés des estimateurs?
1) Suffisance: Utilise toutes les informations disponibles sont utilisées
- > p.e. Moyenne vs Mode
2) Biais: Lorsqu’il n’y a pas de biais, la valeur de l’estimateur s’approche systématiquement de la valeur du paramètre - elle tend vers le paramètre
3) Efficacité: L’estimateur a la plus petite variance
4) Robustesse: Propriété d’un estimateur qui n’est pas affecté par des données aberrantes ou “anormales
Quelle méthode statistique est fortement sensible aux données anormales?
Régression statistique
Qu’est-ce qu’est la propriété d’estimateurs “Biais”?
Le biais correspond à la différence entre la moyenne des estimés (si on utilise une infinité d’échantillons) et le paramètre dans la population
-> Un estimateur biaisé est un estimateur qui va nous donner systématiquement une valeur à côté de la vraie
Un bon estimateur est […], […] et […]
Un bon estimateur est non biaisé, efficace et robuste
Qu’est-ce qu’est la propriété d’estimateurs “Efficacité”?
Estimateur qui minimise la variance autour de la valeur du paramètre (avec un grand nombre d’échantillons)
Quels sont les différentes échelles de mesure?
1) Échelle nominale
2) Échelle ordinale
3) Échelle d’intervalle
4) Échelle des rapports
Qu’est-ce qu’une échelle nominale?
1) Étiquettes sans ordre particulier
2) Pas vraiment une échelle
- > Ex: Genre (femme, homme, autre), couleurs des cheveux, statut matrimonial, niveau d’étude
Qu’est-ce qu’une échelle ordinale?
Les objets sont classés suivant un continuum ordonné
-> Ex: L’ordre d’arrivée dans une course: échelle de Likert
Qu’est-ce qu’une échelle d’intervalles?
Différences fixes entre les points de l’échelle
-> Ex: Les degrés Celsius: 15C - 10C = 30C - 25C, mais il ne fait pas deux fois plus chaud quand on passe de 10C à 20C
Qu’est-ce qu’une échelle de rapport?
Présence d’un vrai zéro (non arbitraire)
-> Ex: 2kg = 2 fois 1kg et 0Kg représente le poids zéro, c’est l’absence de matière
Les mesures en psychologies donnent le plus souvent une échelle […] ou […], rarement […], très très rarement […]
Les mesures en psychologies donnent le plus souvent une échelle nominale ou ordinale, rarement intervalle, très très rarement ratio
Les échelles de mesure vont nous aider à déterminer quel type de […] doit être utilisé pour répondre à notre question de recherche
Les échelles de mesure vont nous aider à déterminer quel type de test statistique doit être utilisé pour répondre à notre question de recherche
VRAI ou FAUX
Généralement, la distinction entre variable discrète et continu est suffisante
lorsqu’on tire des conclusions, surtout en science sociale
VRAI
Quels sont les trois types de fichiers possible avec SPSS?
1) Fichiers de données (.sav)
2) Fichiers de syntaxe ou commandes (.sps)
3) Fichiers de sortie (.spo ou .spv)
Comment représente-t-on une variable dans une équation statistique?
Lettre majuscule
-> ex: X; Y
Que veut-dire X = {42, 45, 23, 51}
Ensemble des valeurs prises par X pour quatres unités d’observation
Que veut-on dire par Xi (petit i)?
Valeur particulière de la variable X pour l’unité d’observation i
Quand utilise-t-on un double indice/double sommation?
Lorsqu’on a deux variables
Quelles sont les différentes mesures de tendance centrale?
1) Moyenne
2) Mode
À quoi sert la tendance centrale?
Indique la position de la distribution des données sur l’axe des valeurs possibles
Qu’est-ce que le mode?
Le score le plus fréquent d’une distribution
- > Lorsqu’il n’y a qu’un seul mode, on dit que la distribution est unimodale
- > Lorsqu’il y a plus d’un mode, la distribution est bimodale/multimodale
Quelles sont les différentes mesures de variabilité ou de dispersion?
1) Étendue
2) Percentiles
3) Écart interquartile
4) Variance
5) Écart-type
6) Coefficient de variation
7) Indice graphique
Qu’est-ce qu’une étendue?
La différence entre le score brut le plus élevé et le score le moins élevé de la distribution des données
Qu’est-ce qu’un percentile?
Consiste à mettre les données en ordre croissant et à déterminer les valeurs correspondant à chacun des pourcentages
Qu’est-ce qu’un écart percentile?
La valeur de l’écart entre le 25e percentile et le 75e percentile
Qu’est-ce que la variance?
C’est la moyenne des écarts à la moyenne mis au carré
VRAI ou FAUX
Il existe de formules différentes de la variance, un pour un échantillon à une variable et un pour un échantillon à deux variables
FAUX
Il existe de formules différentes de la variance, un pour un échantillon et un pour une population
Qu’est-ce qu’un écart-type?
Racine carrée de la variable
Pourquoi utilise-t-on l’écart-type au lieu de la variance?
Parce que presque tous nos calculs reposent sur la distribution normal et l’écart-type permet de nous donner une idée directe de la position de nos variables
Quand on connaît l’écart-type et la moyenne, tout de suite on sait si on a affaire à une donnée […] en regardant nos résultats.
Quand on connaît l’écart-type et la moyenne, tout de suite on sait si on a affaire à une donnée non probantes en regardant nos résultats.
Quelle est l’équation du coefficient de variation?
Écart-type/moyenne * 100
Qu’est-ce que le diagramme en forme de boîte (box plot)?
Un indice graphique
-> Diagramme qui représente la médiane, percentile. Il nous donne une bonne idée de la distribution de nos valeurs et des extrêmes. Permet visuellement de voir la distribution de nos données
Afin d’éviter les erreurs de transcription, toujours commencer par les […], les […] et les […] afin de visualiser les données.
Afin d’éviter les erreurs de transcription, toujours commencer par les moyennes, les écart-types et les graphiques afin de visualiser les données.
Qu’est-ce qu’un degré de liberté?
Nombre de variables (ou de statistiques) qui peuvent être déterminées (calculées) par une équation - c’est e nombre de valeurs indépendantes qui peuvent être calculées avec un échantillon de grandeur
Degré de liberté:
Pour un ensemble de N observations indépendantes, il y a […] degrés de liberté
Degré de liberté:
Pour un ensemble de N observations indépendantes, il y a N-1 degrés de liberté
VRAI ou FAUX.
Chaque fois que l’on calcule une nouvelle valeur (p.e. une moyenne, une variance), nous utilisons (perdons) un degré de liberté
VRAI
-> Si j’ai 10 informations, je ne peut pas faire 12 calculs statistiques. Il ne peut pas avoir plus de variable que d’unité de variation
Qu’est-ce qu’une transformation linéaire?
Opération qui consiste à modifier l’unité de mesure de façon à l’exprimer dans une autre échelle. Elles permettent d’exprimer autrement une même réalité
-> Ex: Transformer l’échelle Celsius en Fahrenheit
Quel est la formule de la transformation linéaire
Y = bX + a
Y: Variable transformée
X: Variable originale
a et b: Constantes
Une transformation linéaire de X, c’est toute transformation par l’addition ou la multiplication d’une constante
VRAI ou FAUX
Suite à une transformation linéaire, les variables changent de qualités métriques.
FAUX
Les qualités métriques de la variable restent les mêmes et n’influenceront pas les résultats statistiques
Qu’est-ce que le score Z?
Score de déviation divisé par l’écart-type
-> C’est le score standardisé/réduit
C’est une transformation du type Y = b(X+a)
-> b = 1/Sx
-> a = - X(moyenne)
Dans le cas d’un score Z, si j’ai deux variables (x et y) et qu’elles ont une relation linéaire, le […] (diagramme de dispersion qui va ressembler à un ballon soit la dispersion normale) restera pareil d’une relation à l’autre
Dans le cas d’un score Z, si j’ai deux variables (x et y) et qu’elles ont une relation linéaire, le corrélogramme (diagramme de dispersion qui va ressembler à un ballon soit la dispersion normale) restera pareil d’une relation à l’autre
VRAI ou FAUX
Les transformations linéaires changent les propriétés métriques des données
FAUX
Les transformations linéaires ne changent pas les propriétés métriques des données
VRAI ou FAUX
Les transformations linéaires n’influencent pas les conclusions des tests statistiques
VRAI
VRAI ou FAUX
Les transformations linéaires préservent les relations linéaires entre les variables
VRAI