Phase analytique : principe de base en stats Flashcards
Définir statistique descriptives
Décrire et résumer les données
Définir statistiques inférentielles
Estimer les paramètres d’une population et vérifier les hypothèses u moyen de test statistiques appropriés
Définir présentation des résultats
figures et tableaux
Définir interprétation des résultats
faire ressortir la signification des résultats et indiquer s’ils confirment ou non l’hypothèse
V/F une variable peut prendre un valeur différente selon les individus
vrai
Définir variable qualitative (catégorielle)
variable que l’on OBSERVE
qualités reparties en classes
Pas de valeurs numériques (mais peuvent être recordées)
Définir variable quantitative
Variable que l’on MESURE
valeurs numériques
Quelles sont les sous-types de variables qualitative
nominale et ordinale
Quelles sont les sous-types de variables quantitatives
discrète et continue
Définir variable qualitative nominale
classe nommées
pas de hiérarchie
Binaires : 2 classes
Définir variable qualitative ordinale
classe ordonnée selon une échelle de valeurs
Définir variable quantitative discrète
discontinue
résultat d’un dénombrement
Définir variable quantitative continue
peut prendre toute valeur numérique
Les statistique servent à décrire : comment décrire les résultats
- tableau brut des données
- tableau de fréquence
- histogramme (distribution de fréquence
- polygone de fréquence
À quoi servent les mesures en statistiques
Décrire et résumer les données afin de les exprimer et de les comparer
Quelles sont les 2 types de mesures pour résumer les données
mesures de tendance centrale (moyenne)
mesures de dispersion
Définir mesures de tendance centrale
résume la position dans un distribution en fonction des valeurs possibles de la variables étudiée
Définir mesures de dispersion
résume l’étalement de la dispersion, ex. la dispersion des valeurs autour de la valeur centrale
V/F l’utilisation des mesures de tendance centrale et de dispersion incluent toutes les valeurs
Faux, se fait toujours au détriment d’une perte d’information
Définir la moyenne
- mesure la plus couramment utilisée
- influencée pas la valeur de toutes les observations et est donc très sensibles à la présence des données extrêmes
- peut devenir non représentative de l’échantillon si la distribution est fortement asymétrique( valeurs tirent vers le haut ou le bas)
Définir médiane
valeur qui occupe la place du milieu
- environ 50% des observations se trouvent de chaque côté
- déterminé par le nombre d’observations et non par la valeur de celles-ci
- rôle purement descriptif
- pour données sur échelle ordinale
Dans une distribution parfaitement symétrique comment la moyenne et la médiane intéragissent
la médiane sera égale à la moyenne
Définir mode
valeur la plus fréquente d’une série d’observation (pic de la distribution)
peu utilisée purement descriptif (pour définir l'allure de la distribution , unimodale ou bimodale
pour données sur échelle nominale
Quelles mesures de tendance centrale seront égales lors d’une distribution parfaitement symétrique
médiane, moyenne et mode
Quel type de mesure résume en un seul nombre la distribution des données
mesure de tendance centrale
Qu’est-il nécessaire de savoir pour évaluer une mesure par rapport à la moyenne
savoir comment elle s’écarte de la moyenne
Que permettent les mesures de dispersion
d’évaluer le degré d’étalement des scores autour de la moyenne
Quelles sont les 4 mesures principales de dispersion
étendue
variance
écart-type
coefficient de variation
quelle est la mesure de dispersion la plus utilisée
écart-type
Définir étendue
différence entre la valeur al plus grande et la valeur la plus petite d’une série d’observations
Définir variance
- mesure de l’étendue des scores basée sur la déviation de chacun de ceux-ci par rapport à la moyenne
- somme des carrés des écarts à la moyenne divisé par le nombre d’observation -1 (moyenne des carrés des écart à la moyenne)
- représente la valeur globale de dispersion des scores par rapport à la moyenne
Plus la variance est grande, plus la distribution sera :
étallée
Quel inconvénient à la variance
s’exprime pas une valeur élevée au carré, donc par une unité différente de valeurs de la distribution
Définit écart-type
écart-type de l’échantillon est un bon estimé de l’écart-type de la population
- on peut l’interpréter comme une mesure linéaire de la variabilité au sein d’une distribution
- s’exprime dans les mêmes unités que la moyenne
- Dans distribution normale, mesure très importante en raison de la relation existante entre celui-ci et la moyenne
Définir erreur-type de la moyenne
donne une idée de la précision avec laquelle la moyenne de l’échantillon est représentative de la moyenne de la population
Toujours plus petite que l’écart-type
Quelle valeur est plus petite entre l’erreur type de la moyenne et l’écart type
toujours l’erreur-type de la moyenne
Quel autre nom donne-t-on à l’erreur-type de la moyenne
écart-type de la moyenne
Définir coefficient de variation
c’est le rapport entre l’écart-type sur la moyenne
indépendant des unités de mesure (écart-type exprimé en % de la moyenne)
exprime le degré de dispersion d’une distribution autour de la moyenne
utilise pour comparer la dispersion de deux variable différentes (unités différentes)
Comment définir la plus grande dispersion entre deux variables différentes ?
calculer le coefficient de variation
comment calculer le coefficient de variation
S/X x100
écart-type / moyenne x100
De quoi doit tenir compte l’évaluation d’une mesure
de la moyenne et de la dispersion des scores
Que permet les mesures de position
de situer une donnée par rapport aux autres dans un distribution
Définir score percentile
situer une donnée p/r aux autres dans une distribution
indique le rang d’un score en donnant le pourcentage d’observations se situant au dessous de ce score
Qu’indique un score percentile P90
90% des sujets de la population ont un score inférieur
Qu’indique un score percentile P50
milieu de la distribution (médiane)
Qu’est-ce qu’un quartile
classement en 4 groupes
0-25% (Faible)
25-50%(bon)
50-75%(très bon)
75-100%(excellent)
Définir score standardisé
exprime un score en fonction de son écart-type p/r à la moyenne
score dont l’écart par rapport à la moyenne s’exprime en unités d’écart-type (-3 à 3)
permet de comparer des scores qui n’ont pas le même point de référence (pas lié à des unités)
Qu’est-ce que l’inférence statistique
utilise les données de l’échantillon pour estimer les paramètres de la population et vérifier les hypothèses de recherche
Qu’est-ce que faire une estimation
tenter de définir les paramètres d’une population à partir des données d’un échantillon
Qu’est-ce qu’on suppose en faisant une estimation
- que la valeur observée a peu de chance d’être exactement celle de la population
- que cette valeur est néanmoins assez proche si l’échantillon est représentatif
- que répétant l’échantillon on trouverait d’autres valeurs relativement proches de la valeur inconnue
Qu’est-ce que l’estimation ponctuelle
estimation de la valeur d’un paramètre d’une population faite à partir de la statistique mesurée auprès de l’échantillon
Qu’est-ce que l’estimation par intervalle de confiance
estimer un intervalle dans lequel la moyenne inconnue a la plus grande probabilité
-s’effectue à partir de la distribution théorique de la courbe normale et du théorème de la limite centrale
Qu’est-ce que l’intervalle de confiance
gamme de valeurs dans laquelle devrait se trouver le paramètre de la population