Notion de base statistique Flashcards
Étapes de l’étude statistique
- La cueillette des données
- les calculs mathématiques
- l’interprétation des résultats
Qu’est-ce qu’une unité statistique ?
Élément de base de l’étude statistique (Sujet ou objet)
Qu’est-ce qu’une variable ?
Caractère qui peut être de nature quantitative ou qualitative et varie selon l’unité statistique observées
Variable qualitative
on ne peut lui attribuer une valeur numérique, classée selon sa différence
Variable quantitative
Grandeur définie par une mesure et exprimées par une valeur numérique
Définition d’une donnée
Résultat obtenu - expression de la variable étudiée chez chaque unité statistique. Peut être continue ou discontinue
Qu’est-ce qu’une donnée discontinue?
Quand elles ne peuvent prendre que quelques valeurs déterminées.
Nombre entier, quantifiés d’entités indivisibles
Qu’est-ce qu’une donnée continue ?
Toutes les valeurs numériques possibles dans un certain intervalle
Définition de la statistique
Étude de séries de faits ou de valeurs pour trouver une signification objective
Cueillette des données: définir les paramètres de l’étude
1- Définir la variable : + elle est simple + l’étude sera précise
2 - Définir la méthode : + la méthode est définie + l’étude sera précise
3 - Sélectionner les unités statistiques
4 - Déterminer le nombre d’unités statistiques nécessaires à l’étude (population ou échantillon)
Population statistique
Ensemble des unités statistiques sur lesquelles on désire obtenir de l’information relative à une variable
- Taille varie beaucoup
- Possible d’étudier l’ensemble des sujets mais rare
- Difficile voir impossible d’observer chacune des unités statistiques
- 31 unités ou plus
Échantillon statistique
Groupe restreint d’unités statistiques de la population
- Jusqu’à 30 unités
- Doivent être représentatives de la population
- la pige au hasard est le meilleur moyen de constituer un échantillon
Que permet l’étude de fréquence
Permet de constater la répartition d’un ensemble de données
Les étapes d’une étude de fréquence
1 - Mise en ordre des données : Permet de constater s’il y a une tendance particulière
Qualitatives : regrouper en
fonction des différentes classes
qu’elles représentent
Quantitatives : Ordre croissant. Si
trop dispersées, regrouper en
intervalles de classe (entre 10-20)
2 - Mettre sous une forme :
- Table des fréquences
- représentation graphique
À quoi sert les représentations graphiques ?
Permet de constater s’il y a des tendances particulières à travers l’ensemble des données d’une façon visuelle
Quelle sont les types de représentations graphiques en statistique
- Diagramme à bâton
- Histogramme
- Polygone des fréquences
- Ogives
Quand utilise-t-on le diagramme à bâton ?
Variable qualitative ou données discontinues d’une variable quantitative
Quand utilise-t-on l’histogramme
Bâtons collés pour illustrer la continuité des données. C’est pour les variable quantitatives, données continues
Quand utilise-t-on le polygone des fréquences
Variables quantitatives, données continues et discontinues
Quand utilise-t-on l’ogives
Représente la fréquence cumulée (croissante ou décroissante) des données d’une variable quantitative
Qu’est-ce qu’une mesure de tendance centrale
Moyen mathématique pour déterminer vers quelle valeur les données tendent
Quelles sont les mesures de tendance centrale
Moyenne, médiane et mode
Qu’est-ce qu’une Moyenne
Représentative de la tendance centrale lorsque les données se répartissent également de part et d’autre de cette moyenne et sur un intervalle restreint. C’est la plus utilisée.
X ̅= (somme X)/n
Qu’est-ce qu’une Médiane
- S’approche de la moyenne lorsque les données se répartissent également de chaque côté et près de cette moyenne
- Tendance centrale plus juste lorsque quelques valeurs éloignées de l’ensemble
C’est la valeur du milieu d’une série de données mise en ordre
Qu’est-ce qu’un Mode
Représente la donnée qui revient le plus souvent dans une série
- Pas d’équation, une simple observation des données ou de la table des fréquences
Pas de mode si aucune donnée plus fréquente
Si 2 données consécutives ont la même fréquence et supérieure aux autres, le mode est le point milieu de ces deux données
Si 2 données non consécutives ont la même fréquence et sont supérieures aux autres, alors il y a deux modes (indice de l’hétérogénéité de l’échantillon, non homogène)
Qu’est-ce qu’une mesure de dispersion
servent à évaluer la variation des données par rapport à la moyenne.
Si elles varient peu, l’échantillon est plutôt homogène.
Si elles varient beaucoup, l’échantillon est plutôt hétérogène.
Quelles sont les mesures de dispersion
- Étendue
- Déviation moyenne
- Variance
- Écart type
- Coefficient de variation
Étendue
Intervalle dans lequel se situent les valeurs de toutes les données
Étendue = Xn - X1
Plus que la valeur de l’étendue est élevée, plus que les données sont dispersées
Déviation moyenne
Indique comment, en moyenne, les données sont éloignées ou rapprochées de la moyenne
Somme des écarts à la moyenne sur le nombre de données
Théoriquement, si les données sont suffisantes et distribution symétrique, les écarts positifs et négatifs s’annulent et la déviation est de zéro.
Variance
Basée sur les écarts à la moyenne
Constitue une étape au calcul pour l’écart-type
Somme des écarts au carré
sur le nombre de données
si c’est un échantillon c’est sur le nombre de données moins 1 (n-1)
Écart type
Donne le degré de variation des données d’une étude particulière, mais n’indique pas réellement l’importance de cette variation par rapport à la valeur des données lorsqu’un compare 2 études dont les données s’expriment par des valeurs complètement différentes.
Calcul: Racine carré de la variance
Quelle mesure de dispersion est la plus utile en biologie médicale
L’écart type :
- études statistiques
- calcul des valeurs normales (références) utile pour le médecin
- contrôle de la qualité (utile pour les TAB)
Coefficient de variation
Permet de comparer des données d’ordre de grandeur différente. Il est donc possible de déterminer quelle série de données présente la variation la plus significativement importante.
C.V. = S / X x 100
Quelle mesure de dispersion est à la base de l’interprétation des résultats d’analyse en laboratoire médical ?
Le coefficient de variation
Quelle mesure de dispersion est à la base de l’évaluation des limites d’erreur acceptables d’une méthode de mesure ?
Le coefficient de variation
Distribution normale
Modèle de distribution de fréquence dans lequel les données se dispersent équitablement de chaque côté de la moyenne, de façon symétrique et avec une variation définie.
Polygone de fréquence en forme d’une cloche ou courbe de Gauss = distribution gaussienne
Critères d’une distribution normale
Doit avoir des données suffisamment nombreuse
- 68,3% +/- 1 écart type
- 95,4% +/- 2 écart type
- 99,7% +/- 3 écart type
Intervalle de confiance
Sert à déterminer les limites d’erreur acceptable et les intervalles de références
Calcul : Intervalle = X +/- 2 écarts types
- Utilisée en biologie médical, la distribution normale est fixée à 95%
- Seuil de 5% représente le niveau de confiance appelé alpha
À quoi sert les limites d’erreur acceptable
Pour les contrôles de la qualité en laboratoire, c’est l’intervalle auquel le technologiste médical se réfère pour valider les résultats qu’il a obtenu.
À quoi sert l’Intervalles de référence
Intervalle auquel se réfère le médecin pour savoir si les résultats d’analyse sont normaux (valeurs normales)
Sur quoi on mesure les limites d’erreur acceptable ?
un sérum contrôle
Sur quoi on mesure les intervalles de référence
sur des échantillons de personnes normales
Procédure pour déterminer la limite d’erreur acceptable
1 - Analyser un sérum de contrôle 31 fois pour avoir une population et ce, avec nos méthodes en laboratoire
2 - Mettre en ordre les valeurs obtenues
3 - Calculer la moyenne, la médiane et le mode pour voir si les valeurs sont égaux = distribution symétrique
4 - Vérifier les données répondent à la distribution normale
5 - Si tous les critères sont respectés, on calcul la limite d’erreur acceptable
Procédure pour déterminer les intervalles de référence
Même démarche que pour la limite d’erreur acceptable sauf avec les échantillons de personnes normales
En bref,
1- Moyenne, médiane et mode égaux
2 - Vérifier si on répond à la distribution normale
3 - Calculer l’intervalle de confiance
Quel est le seuil qui représente le niveau de confiance et comment l’appelle-t-on ?
5%
alpha