Statistiques Flashcards
Pourquoi faire des statistiques?
pour comparer objectivement et pouvoir faire confiance aux chiffres que l’on voit
Ex: -fiabilité d'un appareil -efficacité d'un traitement -Déterminer une valeur normal -Détermination des risques ...
Quel est la définition des statistiques ?
Branche des mathématiques appliquées qui a pour objet l’étude des phénomènes mettant en jeu un grand nombre d’éléments
Science de la variabilité
Lorsque la variabilité implique de la confusion, comment peut-on la décrire?
Statistiques descriptives
Lorsque la variabilité implique de l’incertitude, être certain en présence de variabilité?
Statistiques inférentielles
Lorsque la variabilité implique des questions scientifiques, comment peut-on la prédire?
Modélisation statistique
Qu’est ce que les statistiques descriptives?
Méthode permettant de résumer l’information recueillie sur une population au moyen de statistiques dans le but de faire la description de données étudiées.
Comment représente-t-on graphiquement les statistiques descriptives?
- Diagramme de dispersion
- Boite à moustache
- Distribution des données (baton)
Qu’est ce que l’inférence statistique?
Méthodes permettant de généraliser à une population les conclusions tirées des résultats obtenus à partir d’un échantillon. Utilise le calcul des probabilités et se fait sur la base de divers tests statistiques
Mesure qui décrit une caractéristique de la population
Paramètre
–> entités réelles
Mesure qui est calculée à partir d’un échantillon
Statistiques
–>Estimations d’un paramètre
Ensemble des individus d’intérêt d’une étude
Population
Membre de la population étudiée
Individu
Nombre d’individus (éléments) concernés par l’étude
Taille
Effectif total
Ensemble de mesures ou d’observations concernant l’état ou l’évolution d’un phénomène
Données
Qu’est ce qu’un échantillon?
Comment peut-il être?
Partie ou sous-ensemble prélevé d’une population
- Représentatif: contient toutes les caractéristiques de la population (population-mère)
- Biaisé : contient pas toutes les caractéristiques de la population
- Aléatoire: éléments choisis au hasard
- Aléatoire simple (EAS) : chaque unité à une chance égale d’être choisie
Quel est le but de l’échantillonnage?
Recueillir de l’information en vue d’un jugement, d’une appréciation ou d’une décision : inférence : on s’intéresse à une population, mais on ne dispose que d’un échantillon.
Il faut donc que les informations sur l’échantillon soient pertinentes, fiables, représentatives et non biaisées.
Quels sont les méthodes d’échantillonnage?
- Scientifique (probabiliste)
2. Non-scientifique (non-probabiliste)
Dans la méthode scientifique, quels sont les trois types d’échantillonnage?
Échantillonnage aléatoire simple (EAS) :
Donne à chaque membre de la population une chance (probabilité non nulle) connu d’être choisi.
Échantillonnage stratifié (ES):
La population est divisée en groupes homogènes d’individus (groupe = strate). Puis, on effectue un échantillonnage aléatoire simple (EAS) dans chaque strate.
Le tout forme l’échantillon.
Échantillonnage par grappes: Une grappe (ou amas) est une partie de la population dans laquelle on retrouve les caractéristiques de la population.
- On fait un EAS parmi les quartiers.
- On prend un EAS parmi les habitants des quartiers sélectionnés.
Qu’est ce qu’une variable?
Caractère, attribut de la population étudié
Quels sont les deux types de variables?
- Quantitative (numérique)
- Qualitative (catégorielle)
Qu’est ce que des variables quantitatives continues?
Peuvent prendre n’importe quelle valeur (théoriquement)
Qu’est ce que des variables quantitatives discrètes?
Chiffres entiers
Ex: nb de personne
Quels sont les types d’échelles de mesures?
- Échelle nominale
- Échelle ordinale :
- Échelle d’intervalle :
- Échelle de rapport ou ratio:
De quel façons peut être évaluer la distribution des données?
- Forme
- Moyenne
- Dispersion
Quels sont les étapes pour faire des stats descriptives ?
- Organiser les données en les triant en ordres de grandeur
- Regrouper les données dans un tableau de fréquence qui nous montreras les valeurs extrêmes ainsi qu’une idée de la dispersion
- Faire un graphique de diagramme en baton pour voir la fréquence d’apparition des données
- Utiliser une courbe pour voir la distribution
- Effectuer un test statistique pour voir si la distribution est normal ou non
Que mesure-t-on pour connaitre la tendance centrale?
Mode
Moyenne
Médiane
Dans quel cas on utilise des tests non paramétrique ?
Courbe asymétrique
Dans quel cas on utilise des tests paramétrique ?
Distribution normale
Qu’est ce que la distribution normale?
Lorsque la moyenne est = à la médiane
Qu’est ce que le mode?
score ou valeur la plus fréquente dans une distribution de fréquence
Lors d’une distribution bimodale = 2 mode
Qu’est ce que la médiane ?
La valeur du milieu
Seulement pour quantitatif, autant de données supérieur que inférieur à la Md
Qu’est ce que la moyenne?
somme de toutes les données divisées par la taille de leur effectif
Vrai ou faux? il est possible d’avoir deux moyennes ou deux médianes
Faux
Qu’est ce que l’étendue?
différence des deux valeurs extrèmes de la série : E = max – min
Environ = 6 écart-type si pas de données abérantes
Qu’est ce que l’écart-type (s)?
mesure la dispersion des données autour de la moyenne.
Qu’est ce que la variance?
le carré de l’écart type
Qu’est ce que le coefficient de variation (CV) et quel est sa formule pour une population et pour un échantillon?
obtenu en divisant l’écart type par la moyenne
Population : CV = o / mu * 100
Échantillon : CV = s / xmoy * 100
Qu’est ce qu’un CV< 15% signifie?
Dispersion faible des données
Qu’est ce que les quartiles?
Les nombres Q1, Q2, Q3 qui séparent les données rangées (ordre croissant) en 4 groupes contenant chacun 25% des observations.
Q2, est la médiane Md. L’étendue (intervalle) interquartile est la différence entre les valeurs du troisième et du premier quartiles : EI = Q3 – Q1
De quoi dépend la distribution normale (gausienne)?
De la moyenne u et de l’écart-type o
N (u, o)
Que signifie N(0,1)?
moyenne = 0 écart-type = 1
la loi est centrée réduite
Qu’est ce qui représente 95,5% de la population?
u +/- 2o
Qu’est ce qui représente 99,7% de la population?
u +/- 3o
Qu’est ce que la cote z?
Les observations X exprimées en nombres d’écarts type σ au-dessus ou au- dessous de la moyenne μ d’une distribution normale sont les valeurs (ou cotes) Z.
En quoi est utile la cote z?
elle est pratique pour classé les individu dans un groupe
Ex: trier des athlètes en fonction de différents tests lors de camps de sélection
Quel est la formule de la cote z?
Z= X * u / o