Introduction à l'analyse statistique Flashcards
Introduction, Variabilité, Inférence statistique, Population et échantillon, Méthode d'échantillonnage, types de variables et types de données
Pourquoi faire des analyses statistiques?
Pour donner (déterminer) du sens au valeur et pour faire confiance aux chiffres devant nous
- La fiabilité des chiffres
Qu’est-ce que la fiabilité?
Est-ce que je mesure ce que je veux mesurer? (est-ce que je peux me fier à ce que je mesure pour répondre à ma questions?)
Qu’est-ce que des chiffres valides (validité statistique)
La validité statistique désigne le degré de précision avec lequel les résultats d’une analyse statistique reflètent la réalité des données.
- Elle évalue la rigueur de l’analyse en s’assurant que les conclusions tirées ne sont pas dues à des erreurs ou à des biais.
Pour comparer objectivement il faut … ?
des chiffres
Qu’est-ce que la variabilité?
- La variabilité mesure le degré de dispersion ou d’écart des données autour de leur centre (comme la moyenne).
- Elle indique dans quelle mesure les valeurs d’un ensemble de données diffèrent les unes des autres.
Qu’est-ce la statistique?
Science mathématique se rapportant à la collecte, l’analyse, l’interprétation, l’explicaiton et la présentation des données
- Science de la variabilité
À l’aide de quel type de statistique peut-on décrire la variabilité?
Statistique descriptives
- Résumer ou décrire les caractéristiques importantes d’un ensemble de données démographiques
À l’aide de quel type de statistique peut-on inférer en présence de variabillité?
Statistique inférentielle
- Utiliser des échantillons de données pour faire des inférences (ou des généralisations) sur une pop
À l’aide de quel type de statistique peut-on prédire la variabilité?
Modélisation statistique
- Utiliser des exemples de données pour faire des prédictions
Quelle est la différence entre un paramètre et une statisitque
Paramètres:
- Une mesure qui décrit une caractéristiques de la population
- sont des entité réelles (la moyenne dans une populaiton est un paramètre)
- Elle est fixe, mais généralement inconnue
Statistique:
- Une mesure qui est calculer à partir d’un échantillon
- sont des estimations d’un paramètres
- varie d’un échantillon à l’autre
Qu’est-ce qu’une population?
ensemble des individus d’intérêt d’une étude, que ce soient des patients, des plantes, des insects.
Qu’est-ce qu’un individu?
membre de la population étudiée
Qu’est-ce qu’une variable?
Une caractéristique d’intérêt mesurable chez les individus de la population
- L’âge
- La taille
- pile ou face
> définir le quoi
Qu’est-ce que la taille (effectif total)?
nombre d’invidus (éléments) concernés par l’étude
Qu’est-ce que des données?
Ce sont des ensembles de mesures ou d’observations concernant l’état ou l’évolution d’un phénomène.
- Ce sont aussi les valeurs d’une ou de plusieurs variables chez un certains nombres d’invididus.
Qu’est-ce qu’un échantillon?
partie ou sous-ensemble formée à partir d’une population
Quel est le but de l’échantillonnage?
- recueillir de l’information en vue d’un jugement, d’une appréciation ou d’une décision
- Faire une inférence: on s’intéresse à une population, mais on ne dispose que d’un échantillon
- Il faut donc que les informations sur l’échantillon soient pertinents, fiables, représentatives et non biaisées.
Quels sont les types d’échantillons (non exhaustif)
- Échantillon représentatif
- Échantillon biaisé
- Échantillon aléatoire (ses éléments ont été choisis au hasard)
- Échantillon aléatoire simple (chaque unité a une chance égale d’être choisi)
Qu’est-ce qu’un échantillonage stratifié?
- la population est divisée en groupes homogènes d’individu (groupe = strate)
- … puis, on effectue une EAS dans chaque strate => forme l’échantillon
Quelles sont les 2 types de variables?
qualitative (catégorielle) & quantitative (numérique)
- Variable qualitiative:
> Les valeurs sont des catégories ou groupes
> Ex: sexe, couleur des yeux, échelle de satisfaction, allégeance politique - Variable quantitative:
> Elle peut prendre n’importe quelle valeur chiffrée
> Ex: masse, taille, concentration d’un médicament
Quelles sont les autres possibilité des variables quantitatives?
- Continues: peuvent prendre n’importe qu’elle valeur
- Discrètes (chiffres entiers): Nb de personnes, nb d’enfants dans une famille, nb de produits défectueux
Qu’est-ce qu’une variable dépendante?
- Ce sont les mesures à réaliser (une ou plusieurs)
- Ex: on mesure le temps au 100m, le nb max de push up
Qu’est-ce que les variables indépendantes?
- Ce sont des variables contrôlées par l’expérimentateur
Quelles sont les différentes échelles de mesure des type de données?
- Échelle nominale: catégorie mutuellement exclusives et non ordonnées: Sexe, ethnicité, allégeance politique
- Échelle ordinale: catégorie mutuellement exclusive et ordonnées, mais on ne quantifie pas l’écart entre les sujets => grade dans l’armée
- Échelle d’intervalle: Ordre de grandeur, classement où l’on peut quanitifier l’écart entre les sujets, mais il n’y a pas de point de départ (0 ne signifie par une absence de valeur) => température (10° n’est pas 5x plus chaud que 2°)
- Échelle de rapport ou ratio: ordre de grandeur, distance égale entre les unités et 0 signifie une absence de valeur => 50kg = 2x plus que 25kg
Comment obtenir un EAS?
- Générateur de nombre aléatoire
- pige mécanique
- table de nombre aléatoire
Comment faire un échantillonnage systématique?
déterminer de façon aléatoire le premier élément d’une liste puis choisir chaque nom suivant sur la liste en fonction d’un intervalle
Comment faire un échantillonnage stratifié?
La populaiton est divisée en groupes homogènes d’individu, puis un EAS dans chaque strate (groupe)