Cours 10-11-12 : Phase analytique Flashcards
Que faut-il dans une étude dans la section méthodologie?
- Puissance statistique suffisante
- Présence d’un groupe contrôle
- Pas de biais dans la répartition des participants dans le groupe contrôle ou ce que fait le groupe contrôle (placébo)
- Analyse statistique robuste ou simple corrélation?
Quels sont les étapes de la phase analytique?
- ANALYSE DES DONNÉES
- Statistiques descriptives: décrire et résumé les données
- Statistiques interférentielles: Estimer les paramètre d’une population et vérifier les hypothèses au moyen de tests statistiques appropriés - PRÉSENTATION ET INTERPRÉTATION DES RÉSULTATS
- Présentation: Figures et tableaux
- Interprétation: Faire ressortir la signification des résultats et indiquer s’ils confirment ou non l’hypothèse
Qu’est-ce qu’une variable?
Caractéristique qui peut prendre une valeur différente selon les individus
Quelles sont les deux grand types de variables?
- Qualitative (catégorielle)
Observe, pas de valeur numérique
Mesurée d’après une échelle nominale ou ordinale - Quantitative (numérique)
Mesurer, quantité
Quelles sont les deux types de variables qualitative?
- Nominale
Classes nommées pas de hiérarchie
Binaire: 2 classes
Ex.: Groupes ethniques - Ordinale
Classes ordonnées selon une échelle de valeurs
Ordre dans les différentes classes
Ex.: Classement à une course de 10 km
Quelles sont les deux types de variables quantitative?
- Discrète
Discontinue
Résultat d’un dénombrement
Ex.: Nb de personnes dans une famille, nb de grossesses (peut pas avoir un enfant et demi) - Continue
Peut prendre toute valeur numérique
Mesurée d’après une échelle d’intervalle ou de proportion
Ex.: Tension artérielle systolique
À quoi servent les mesures en statistiques?
À décrire et à résumer les données afin de les exprimer et de les comparer
Quelles sont les deux types de mesures pour résumer les données?
- Mesures de tendance centrale
- Mesure de dispersion
Qu’est-ce qu’une mesure de tendance centrale?
Résume la position dans une distribution en fonction des valeurs possibles de la variable étudiée
Qu’est-ce qu’une mesure de dispersion?
Résume l’étalement de la distribution
La dispersion des valeurs autour de la valeur centrale (moyenne)
Permet d’évaluer le degré d’étalement des scores autour de la moyenne
Quelle est la conséquence d’utiliser une mesure de tendance ou de dispersion?
Il y a toujours une perte d’information
Quelles sont les mesures de tendance centrale?
- Moyenne
- Médiane
- Mode
Qu’est ce qu’une moyenne (µ ou x avec une barre au-dessus)?
- Mesure la plus couramment utilisée
- Influencée par la valeur de toutes les observations et est donc très sensible à la présence des données extrêmes
- Peut devenir non représentative de l’échantillon si la distribution est fortement asymétrique
Qu’est-ce que la médiane (Md)?
- Valeur qui occupe la place du milieu
Ex.: 1, 2, TROIS, 4, 5 - Environ 50% des observations se retrouvent de chaque côté
- Déterminée par le nombre d’observations et non pas la valeur de celle-ci
- Rôle purement descriptif
- Pour données sur échelle ORDINALE
- Décrit la valeur moyenne d’une distribution asymétrique
- Indice de tendance centrale basé sur la fréquence d’observations
Qu’est ce que le mode (Mo)?
- Valeur la plus fréquente d’une série d’observations (pic de la distribution)
- Mesure peu utilisée
- Purement descriptif, pour définir l’allure de la distribution (unimodale ou bimodale)
- Pour données sur échelle NOMINALE
- Pas influencer par les valeurs extrêmes
- Ne permet pas d’opérations mathématiques
- Décrit des variables catégorielles
Qu’est-ce qui se passe dans le cas d’une distribution parfaitement symétrique?
La moyenne, la médiane et le mode sont égaux
Qu’est-ce qu’une mesure décrivant la distribution d’une population?
Le coefficient de d’asymétrie (skewness) (CD)
Souvent valeurs de -1.0 à 1.0
La valeur indique le degré de dissymétrie et le signe la direction
Si la distribution est symétrique -> CD = 0
Courbe normale (symétrique): Mode=médiane=moyenne
Asymétrie positive (tire vers la droite):
Mode, Médiane, moyenne
Asymétrie négative (tire vers la gauche):
Moyenne, Médiane, Mode
Quelles sont les mesures de dispersion?
- Étendue (E)
- Variance (s 2)
- Écart-type (s)
- Coefficient de variation (CV)
Qu’est-ce que l’étendue?
Différence entre la valeur (V) la plus grande et la valeur la plus petite d’une série d’observations
Qu’est-ce que la variance?
- Mesure de l’étendue des scores basée sur la déviation de chacun de ceux-ci par rapport à la moyenne
- Séries d’écart, et on fait la moyenne de ces écarts là
- Représente la valeur globale de dispersion des scores par rapport à la moyenne
- Plus la variance est grande Plus la distribution sera étendue (plus il y aura de dispersion dans nos scores)
- Très difficile à concrétiser/comprendre en regardant sa valeur
Qu’est-ce que l’écart type?
- On peut l’interpréter comme une mesure linéaire de la variabilité au sein d’une distribution
- S’exprime dans les même unités que la moyenne
- Dans le cas d’une distribution normale, l’écart-type devient une mesure de dispersion très importante en raison de la relation existant entre celui-ci et la moyenne
- Dispersion des valeurs d’une distribution qui tient compte de l’écart de chaque valeur par rapport à la moyenne du groupe
Qu’est-ce que l’écart-type de la moyenne (erreur type)?
- L’erreur type, aussi appelée l’écart-type de la moyenne, donne une idée de la précision avec laquelle la moyenne de l’échantillon est représentative de la moyenne de la population
- L’erreur type de la moyenne est toujours plus petite que l’écart-type
- Plus on a un échantillon qui est représentatif de la moyenne de la population, plus erreur type de la moyenne va être petite
- C’est mieux de rapporter l’écart-type que l’erreur type de la moyenne dans une étude
Qu’est-ce que le coefficient de variation?
- C’est le rapport de l’écart-type sur la moyenne
- Écart-type exprimé en % de la moyenne, donc indépendant des unités de mesure
- Exprime le degré de dispersion d’une distribution autour de la moyenne
- Utile pour comparer la dispersion de deux variables de nature différente (unités différentes)
Exemple:
Laquelle des variables présente la plus grande dispersion?
BMI: 27.9 +- 7.7kg/m2
CT: 89.5 +- 18.1 cm
- 7 / 27.9 x 100 = 26.9%
- 1 / 89.5 x 100 = 20.2%
Donc, c’est le BMI
Qu’est-ce que les mesures de position?
Permettent de situer une donnée par rapport aux autres dans une distribution
Quels sont les deux types de mesure de position?
- Score percentile
- Score standardisé
Qu’est-ce que le score percentile?
Indique le rang d’un score en donnant le pourcentage d’observations se situant en dessous de ce score.
Ex.: P90 -> 90% du monde on un score inférieur à vous
Qu’est-ce que le score standardisé (score z)?
Exprime un score en fonction de son écart-type par rapport à la moyenne.
Score dont l’écart par rapport à la moyenne s’exprime en unités d’écart-type: -3.0 à 3.0.
Permet de comparer des scores qui n’ont pas le même point de référence.
Qu’est-ce que donne le tableau des aires sous la courbe normale?
Donne le % de scores entre la moyenne et le score z.
Qu’est-ce que l’inférence statistique?
L’inférence statistique utilise les données de l’échantillon pour estimer les paramètres de la population et vérifier les hypothèses de recherche.
Inférer à partir d’un échantillon, les paramètres de la population qui est inconnue.
Suppose une prise de décision de la part du chercheur. Cette prise de décision comporte un risque ou une probabilité d’erreur
(Inférence statistique)
Quand on fait une estimation, on suppose…
- Que la valeur observée a peu de chance d’être exactement celle de la population
- Que cette valeur est néanmoins assez proche si l’échantillon est représentatif
- Qu’en répétant l’échantillonnage on trouverait d’autres valeurs relativement proches de la vrai valeur inconnue
Pourquoi la relation entre l’écart-type et le score z est utile?
Car ça nous permet de calculer les scores percentiles correspondant à des scores z déterminés.
Les statistique inférencielles reposent sur le théorème de la limite centrale. C’est quoi?
Théorème de la limite centrale:
- La moyenne d’une variable calculée sur un échantillon est elle même une variable aléatoire. Elle varie selon l’échantillon.
- Cette variable aléatoire suit une loi normale.
- Cette loi normale est centrée sur la moyenne de la population.
Qu’est-ce que l’estimation ponctuelle?
Estimation de la valeur d’un paramètre d’une population faite à partir de la statistique mesurée auprès de l’échantillon.
Qu’est-ce que l’estimation par intervalle de confiance (IC)?
Estimer un intervalle dans lequel la moyenne inconnue µ a la plus grande probabilité de se retrouver.
- Se fait à partir de la distribution théorique de la courbe normale et du théorème de la limite centrale
- L’intervalle de confiance est donc une gamme de valeurs dans laquelle devrait se trouver le paramètre de la population
Quelles sont les types d’estimation des paramètres?
- Estimation ponctuelle
- Estimation par intervalle de confiance