Cours 9 : Phase analytique I Flashcards
Énumérer les étapes de la phase analytique.
- Analyse de données
- Présentation des résultats
Statistique x : décrire et résumer les données
descriptive
Statistique x : estimer les paramètres d’une population et vérifier les hypothèses au moyen de tests statistiques
inférentielle
caractéristique ou valeur mesurée d’un échantillon
statistique
caractéristique ou valeur non-mesurée d’une population
paramètre
Statistique –> paramètre inconnu
inférence
population –> échantillon
échantillonnage
Quelles sont les deux grands types de variables
quantitatives et qualitative
Variable que l’on observe (catégorielle)
qualitative
Variable que l’on mesure (numérique)
quantitative
Quelles sont les sous catégories des variables qualitatives?
nominale et ordinale
Classes nommées, pas de hiérarchie
Nominale (ex : statut matrimonial)
Classes ordonnées selon une échelle de valeurs
ordinale (ordre de grandeur, ex : niveau d’éducation)
Quelles sont les sous catégories des variables quantitatives?
discrète et continue
Discontinue, résultat d’un dénombrement, pas d’infinité de valeur
discrète (ex : nombre de grossesses)
Peut prendre une infinité de valeurs
Continue (ex : poids, hauteur, etc…)
Nommes les échelles de mesure
N : échelle nominale
O : échelle ordinale
I : échelle d’intervalle
R : échelle de proportion (ratio)
Échelle classée dans des catégories (sexe, groupe sanguin)
échelle nominale
Échelle classée par ordre de grandeur (degré de scolarité)
échelle ordinale
échelle ayant des intervalles égaux et pas de zéro absolu (ex : celsius et fahrenheit)
échelle d’intervalle
Quantités réelles et zéro absolu (poids, taille, distance, revenu)
échelle de proportion
Quels sont les types de mesures pour résumer les données
mesure de tendance centrale, de dispersion et de position
indice de regroupement des données autour d’une valeur centrale
mesures de tendance centrale
indice du degré d’étallement des données qui rendent compte de leur variabilité, le plus souvent par rapport à la moyenne
mesures de dispersion
permettent de situer une donnée par rapport aux autres dans une distribution
mesures de position
L’utilisation de mesures en statistiques se fait toujours…
au détriment d’une perte d’informaiton
sensible aux valeurs extrêmes (possible non représentative, si asymétrique), mesure la plus couramment utilisée
moyenne
valeur qui occupe la place du milieu (50% de chaque côté), déterminé par le nb d’observation et non pas la valeur –> échelle ordinale
médiane
valeur la plus fréquente d’une série d’observation (PIC de la distribution), peu utilisée, défini l’allure de la distribution (unimodale, bimodale, multimodale) –> échelle nominale
mode (pic)
la moyenne, médiane et mode sont égaux lorsque….
une distribution est parfaitement symétrique
Nommes-moi les mesures de tendance centrale
mode, médiane, moyenne
Quelles sont les 4 mesures principales de dispersion (évaluer la variabilité des données) ?
étendue (E), variance (s2), écart-type (s) et coefficient de variation (CV)
différence entre la valeur la plus grande et la valeur la plus petite d’une série d’observations
étendue
mesure de l’étendue des scores basée sur la déviation de chacun de ceux-ci par rapport à la moyennee :
La moyenne des carrées des écarts à la moyenne
Variance
mesure linéaire de la variabilité, s’exprime dans les mêmes unités que la moyenne
écart-type
degré de précision avec laquelle la moyenne de l’échantillon est une représentation de la moyenne de la population (toujours plus petite que l’écart-type)
erreur type de la moyenne (SEM : standard error of the mean)
écart-type exprimé en % de la moyenne, donc indépendant des unités de mesure. Comparer la dispersion de deux variables de nature différente (unités différentes)
Coefficient de variation (CV)
–> ex : BMI et CT
BMI: 27.8 ± 7.6 kg/m2
CT: 89.1 ± 18.3 cm
Laquelle des variables présente la plus grande dispersion?
CV de BMI = 27,4%
CV de CT : 20,5%
indique le rang d’un score en donnant le pourcentage d’observation se situant au dessousde ce score
Score percentile (centiles)
P90 correspond à…
90% des sujets de la population ont un score inférieur à vous
subdivisent une distribution en 4 parties égales contenant chacune 25% des données.
quartiles (Q)
Exprime un score en fonction de son écart par rapport à la moyenne (unité d’écart-type)
score standardisé (score z)
Que permet le score z?
de comparer des scores qui n’ont pas le même point de référence.
Vrai ou faux
Si l’échantillon est représentatif de la population la moyenne m1 observée est près de la moyenne inconnue.
La moyenne de l’échantillon sélectionné aléatoirement constitue une approximation de la valeur réelle moyenne de la population
Vrai : théorème de la limite centrale
estimation de la valeur d’un paramètre d’une population faite à partir de la statistique mesurée
auprès de l’échantillon.
estimation ponctuelle
Gamme de valeurs dans laquelle devrait se trouver le paramètre de la population. S’effectue à partir de la distribution théorique de la courbe normale.
intervalle de confiance (IC)