statistiques Flashcards
qu’est-ce que la pratique basée sur les données probantes
utilisation consciencieuse, explicite et judicieuse des meilleures et récentes connaissances scientifiques lors de la prise de décision concernant les soins d’un client
quels sont les types de recherches où l’on retrouve des statistiques
- recherche qualitative
- recherche quantitative
- recherche de mesure
les études quantitatives permettent d’utiliser quoi
- modèles statistiques
- classifications des caractéristiques
- graphiques
- figures
quel est le but principal des études quantitatives
expliquer ce qui est observé et répondre à une problématique
quelles sont les “classes” d’étude quantitative
- descriptif
- exploratoire
- expérimentale
quel est l’objectif d’une recherche descriptive
décrire une population
quel est l’objectif d’une recherche exploratoire
démontrer une relation entre des variables
quel est l’objectif d’une recherche expérimentale
démontrer un lien de causalité
quels sont les types de recherche dans les recherches descriptives
- études qualitatives
- études de cas quantitatives
quels sont les types de recherche dans les recherches exploratoires
- études de cas-témoin
- études de cohorte
quels sont les types de recherche dans les recherches expérimentales
- quasi-expérimentale
- expérimentale
nommez les niveaux de preuve scientifique en quantitatif (du niveau le plus faible au plus élevé)
descriptif :
- avis d’experts
- rapport de cas individuel
- séries de cas
exploratoire :
- études de cas-témoins
- études de cohortes
expérimentale :
- essais non-randomisés contrôlés
- essais randomisés contrôlés
exploratoire et expérimentale :
- revues systématiques
- méta-analyse
quelle est la première étape avant d’utiliser des statistiques
savoir quel est notre problème :
- px avec un usager = consommateur de données scientifiques
vs
- px pour une population = créateur de données scientifiques
quelles sont les étapes après avoir soulevé une problématique (en temps que consommateur de données scientifiques)
- formuler la question (de la problématique) en la mettant dans son contexte
- recherche méthodologique auprès de différentes sources de données pour trouver des réponses à notre question
- comprendre et interpréter des résultats statistiques en provenance des différentes sources de données
- au besoin, modification de l’approche auprès des clients
quelles sont les étapes après avoir soulevé une problématique (en temps que créateur de données scientifiques)
- formuler la question (de la problématique) en la mettant dans son contexte
- recherche méthodologique auprès de différentes sources de données pour trouver des réponses à notre question
- localiser la présence ou non de fossé dans la littérature
- mettre sur pieds un projet de recherche
- connaitre les statistiques et les utiliser dans le cadre de recherche
quel est l’élément central à toute recherche
problématique
comment peut-on formuler une question
PICO
P : patient, population, problème
I : intervention, exposition
C : comparaison, contrôle
O : “outcome”, résultat
quelles sont les différents types de variables et niveaux de mesure
- qualitative (catégorielle)
- nominale
- ordinale
- quantitative (discrète ou continue)
- intervalle
- ratio
quelles sont les caractéristiques (générales) d’une variable qualitative
- correspond à un attribut ou une caractéristique
- ne peut pas être mesurée (car ce n’est pas un nbr)
- peut être classée
quelles sont les caractéristiques (générales) d’une variable quantitative
- correspond à un nbr, à une quantité
- peut être mesurée
quelles sont les caractéristiques d’une variable qualitative catégorielle, d’échelle nominale
- contient des catégories
- n’a pas d’ordre hiérarchique
quelles sont les caractéristiques d’une variable qualitative catégorielle, d’échelle ordinale
- contient des catégories
- ordre hiérarchique
quelles sont les caractéristiques d’une variable quantitative discrète, d’échelle intervalle
- contient des valeurs mesurables
- n’a pas de point “0” (zéro arbitraire)
- valeurs entières (pas de décimales)
quelles sont les caractéristiques d’une variable quantitative discrète, d’échelle de proportion/de ratio
- contient des valeurs mesurables
- a un point “0”
- valeurs entières (pas de décimales)
quelles sont les caractéristiques d’une variable quantitative continue, d’échelle intervalle
- contient des valeurs mesurables
- n’a pas de point “0” (zéro arbitraire)
- multitudes de valeurs (décimales)
quelles sont les caractéristiques d’une variable quantitative continue, d’échelle de proportion/de ratio
- contient des valeurs mesurables
- a un point “0”
- multitudes de valeurs (décimales)
quelles sont les caractéristiques (générales) d’une variable quantitative discrète
- contient des valeurs mesurables
- nombres entiers seulement
- nombre limité de valeurs possibles (moins de 10)
quelles sont les caractéristiques (générales) d’une variable quantitative continue
- contient des valeurs mesurables
- peut prendre toutes les valeurs possibles dans un intervalle
- tous les nombres (unité, décimales, fractions)
- grand nombre de valeurs possibles
quelles sont les caractéristiques (générales) des variables quantitatives à échelle intervalle
- nbr à valeur numérique
- intervalles fixes (unité de mesure)
- zéro arbitraire (0 ne veut pas dire absence)
- possibilité d’effectuer des opérations mathématiques d’addition et de soustraction
- impossibilité d’effectuer des opérations mathématiques de multiplication et de division
exemples de zéro arbitraire
0˚C, 0 de pH
quelles sont les caractéristiques (générales) des variables quantitatives à échelle de ratio
- nbr à valeur fixe
- intervalles fixes (unité de mesure)
- zéro absolu (0=absence)
- impossible d’avoir des scores négatifs
- toutes les opérations mathématiques et statistiques sont possibles
quels sont les types de statistiques
- statistique descriptive
- statistique inférentielle
quel est l’objectif des statistiques descriptives (et les sous-objectifs)
vise à présenter, décrire et résumer un échantillon ou un ensemble de données
- décrire les participants
- apprécier la distribution des données
vrai ou faux
les statistiques descriptives font partie de tous les projets de recherche
vrai
quel est l’objectif des statistiques inférentielles (et les sous-objectifs)
vise à généraliser un constat qui émerge d’un échantillon pour l’appliquer à l’ensemble d’une population
- explorer l’association entre des variables
- examiner la valeur prédictive de variables
- comparer des variables
quels sont les différents types de statistiques descriptives
- distributions de fréquences
- mesures de tendance centrale
- mesures de dispersion
- mesures de position
- courbe de distribution normale
quels sont les différents types de statistiques inférentielles
- mesures d’association entre les variables (corrélation)
- mesures de prédiction (régression)
- mesures de différences
quels sont les types de distributions de fréquences
- fréquence absolue
- fréquence relative
qu’est-ce qu’une fréquence absolue
nombre/occurence des observations de variables pour un groupe ou pour l’échantillon
qu’est-ce qu’une fréquence relative
nombre/occurence des observations de variables pour un groupe ou pour l’échantillon, exprimé en %
quel est ce type de distribution de fréquence :
échantillon de 25 personnes, dont 10 femmes et 15 hommes
fréquence absolue
quel est ce type de distribution de fréquence :
échantillon dont 40% sont des femmes et 60% des hommes
fréquence relative
quel est l’objectif des distributions de fréquences
permet d’organiser et de classer des données de masse pour en faire ressortir un sens quelconque
vrai ou faux
les distributions de fréquences peuvent être faits avec des données nominales et ordinales seulement
faux
peuvent être faits avec tous les types de données
quelles sont les deux catégories des distributions de fréquences (ce n’est pas fréquence absolue et relative)
- groupées
- non-groupées
quelle est cette catégorie de distribution de fréquence :
8 réponses - 1 personne
9 réponses - 1 personne
10 réponses - 2 personnes
11 réponses - 1 personne
12 réponses - 3 personnes
etc.
non-groupée
quelle est cette catégorie de distribution de fréquence :
[8 à 10[ réponses - 2 personnes
[10 à 12[ réponses - 3 personnes
[12 à 14[ réponses - 3 personnes
etc.
groupée
quel est l’objectif des mesures de tendance centrale
résumer les observations ou les données en une seule valeur
quels sont les types de mesures de tendance centrale
- moyenne
- médiane
- mode
qu’est-ce que la moyenne
somme de toute les valeurs de l’échantillon divisée par le nombre d’effectifs de cet échantillon
quelle est la formule de la moyenne
que représente ce symbole
moyenne
que représente “n”
nombre d’observations
qu’est-ce que la médiane
valeur du milieu d’une série d’observations triées dans un ordre ascendant
quel est l’objectif de la médiane
permet de diviser une série d’observations en deux partie égale
quelles sont les particularités de la médiane
- ne tient pas en compte de toutes les observations
- peu influencée par les valeurs extrêmes
quelle est la formule de la médiane lorsque le nombre d’observations est impair
x((n+1)/2)
calculez la médiane de ces observations :
sujet 1 = 5
sujet 4 = 7
sujet 3 = 9
sujet 2 = 11
sujet 5 = 12
x((n+1)/2)
n = 5 (5 observations)
x((5+1)/2)
x(3) donc valeur de la 3e observation
médiane = 9
quelle est la formule de la médiane lorsque le nombre d’observations est pair
(x(n/2)+x(((n/2)+1)))/2
calculez la médiane de ces observations :
sujet 1 = 5
sujet 4 = 7
sujet 3 = 9
sujet 2 = 11
sujet 6 = 15
sujet 5 = 16
(x(n/2)+x(((n/2)+1)))/2
n = 6 (6 observations)
(x(6/2)+x(((6/2)+1)))2
(x(3)+x(4))/2
(9+11)/2
médiane = 10
qu’est-ce que le mode
valeur ou réponse la plus fréquente
vrai ou faux
le mode est très fréquemment utilisé
faux
très peu utilisé
vrai ou faux
à travers plusieurs observations, il peut y avoir plusieurs modes
vrai
vrai ou faux
à travers plusieurs observations, il peut y avoir aucun mode
vrai
si toutes les valeurs sont différentes
calculez le mode de ces observations :
sujet 1 = 10
sujet 2 = 11
sujet 3 = 10
sujet 4 = 12
sujet 5 = 11
sujet 6 = 13
10 et 11
(deux modes présents)
quels sont les types de mesures de dispersion
- étendue
- variance et écart-type
- coefficient de variation
qu’est-ce que l’étendue
différence entre la plus grande valeur et la plus petite valeur des observations
que sont la variance et l’écart-type
distance ou écart des valeurs de l’échantillon p/r à la moyenne
quel est l’objectif de l’étendue
permet d’offrir une vue rapide de la dispersion des données, sans tenir compte de la distribution de la fréquence, ni de la concentration des valeurs
quelle est la formule de l’étendue
étendue = x max - x min
(x : valeur)
que signifie une variance élevée
une grande dispersion
que signifie une variance faible
une petite dispersion
qu’est-ce que la variance
mesure de dispersion globale des données autour de la moyenne
qu’est-ce que l’écart-type
mesure de dispersion des données autour de la moyenne la plus commune
quel est l’objectif de l’écart-type
quantifie la distance des observations d’une distribution par rapport à la moyenne d’une série
que signifie un grand écart-type
une grande dispersion
que signifie un petit écart-type
une petite dispersion
comment est souvent décrit un échantillon dans la littérature
avec une mesure de tendance centrale accompagnée d’une mesure de dispersion
ex :
moyenne = 32 +/- 12.4
que permet de décrire un échantillon à l’aide d’une mesure de tendance centrale accompagnée d’une mesure de dispersion
comparer plusieurs distributions qui ont la même moyenne
quel est l’objectif d’un coefficient de variation
comparer deux distributions différentes (comparer des échantillons)
quelle est la formule du coefficient de variation
que signifie “S”
mesure de l’écart-type
quels sont les types de mesures de position
- centiles et quartiles
- score standardisé (cote Z)
quel est l’objectif des mesures de position
situer une donnée par rapport aux autres dans un ensemble
que sont les centiles
les valeurs de la distribution, placées en ordre croissant, sont séparées en 100 sous-ensembles, contenant chacun 1% des données (C1, C2, C3, …)
que sont les quartiles
les valeurs de la distribution, placées en ordre croissant, sont séparées en 4 sous-ensembles, contenant chacun 25% des données (Q1,Q2, Q3, Q4)
vrai ou faux
C50 = Q2
vrai
vrai ou faux
C50 = médiane
vrai
qu’est-ce que le score standardisé
score brut transformé en score standardisé
quel est l’objectif du score standardisé
indiquer à combien d’écarts-types au-dessus ou au-dessous de la moyenne se situe un score
quelle est la formule du score standardisé
que signifie “Z”
score standardisé (cote Z)
vrai ou faux
si un score équivaut à la moyenne, sa cote Z = 0
vrai
quels sont les critères pour qu’une courbe de distribution soit “Normale”
lorsque :
1. les données, organisées dans l’ordre croissant, sont similaire de part et d’autre de la valeur du centre créant une courbe de la forme d’une cloche
2. la moyenne, la médiane et le mode ont la même valeur
3. la proportion des données décroit en s’éloignant de la moyenne
4. la courbe se situe au-dessus de l’axe horizontal, sans lui toucher
5. l’aire sous la courbe = 100%
dans une courbe de distribution Normale, quels sont les différents pourcentages d’observations
0.13% = -4 à -3 cote Z
2.14% = -3 à -2 cote Z
13.59% = -2 à -1 cote Z
34.13% = -1 à 0 cote Z
34.13% = 0 à 1 cote Z
13.59% = 1 à 2 cote Z
2.14% = 2 à 3 cote Z
0.13% = 3 à 4 cote Z
quelles sont les formes de présentation des données
- tableau
- graphique
quels sont les objectifs du tableau
- présentation des différents types de données
- présentation des items et des réponses à un questionnaire
- présentation des résultats des tests statistiques
quels sont les objectifs du graphique
- présentation visuelle des données et/ou des résultats
- description de l’échantillon
- soutenir une explication des résultats trouvés
quels sont les types de graphiques
- diagramme circulaire/à secteurs
- diagramme à barre
- histogramme
- boite de moustache
- diagramme de dispersion (nuage de points)
- courbes de suivi
quel est l’objectif d’une diagramme circulaire
décrire un échantillon, ou dans les enquêtes, les statistiques sur une large population
quelles variables sont présentées dans un diagramme circulaire
- catégorielles
- fréquences
vrai ou faux
il y a beaucoup de catégories dans un diagramme circulaire
faux
peu de catégories, sinon on se perd dans l’information
quelles variables sont présentées dans un diagramme à barre
tous types de variables
quelles sont les variables les plus fréquemment présentées dans un diagramme à barre
fréquences
quel est l’objectif d’un diagramme à barre
comparer entre les groupes, entre les séances
vrai ou faux
les diagrammes à barre sont rarement utilisés dans les études cliniques
faux
fréquemment
quels sont les objectifs d’un histogramme
- observer la distribution des données
- vérifier la normalité de la distribution des données
l’histogramme est utilisé pour quel type de variable
variables quantitatives continues
quelle est la différence entre un diagramme à barre et un histogramme (visuellement)
dans un diagramme à barre les bandes sont décollées, alors que dans un histogramme, il y a une continuité entre les bandes
quelles données peut-on voir dans des boites à moustaches
- valeur minimale
- valeur maximale
- quartiles
- moyenne
- médiane
quel est l’objectif des boites à moustaches
présenter la dispersion des données autour de la moyenne et des médianes de chaque niveau d’observation
quelles variables sont présentées dans des boites à moustaches
- une variable catégorielle (groupe)
- une variable quantitative continue
quel est l’objectif d’un diagramme de dispersion
présente la dispersion des données d’une variable par rapport à une autre variable
quelles variables sont présentées dans un diagramme de dispersion
deux variables quantitatives
dans quel type d’étude retrouvons-nous les diagramme de dispersion
études de corrélation
que présente la courbe de suivi
données des différentes observations au cours du temps
quel est le type de variable présenté dans une courbe de suivi
variable quantitative continue
que présente la courbe de survie
nombre de décès dans le temps
quel est le type de variable présenté dans une courbe de survie
variable quantitative discrète
à quoi servent les statistiques inférentielles
permettent de tester des hypothèses sur la relation entre les variables et de porter un jugement en s’appuyant sur des techniques statistiques
qu’est-ce qu’un test d’hypothèse statistique
démarche permettant d’effectuer un choix entre :
- accepter l’hypothèse nulle
- rejeter l’hypothèse nulle
quelles sont les propositions que l’on souhaite vérifier avec un test d’hypothèse statistique
hypothèse nulle :
- égalité des effets
- absence d’effet
hypothèse de recherche :
- inégalité des effets
- présence d’effet
quelles sont les étapes d’un test d’hypothèse statistique
- formuler des hypothèses statistiques (H0 et H1)
- déterminer les risques d’erreur de type 1 alpha et de type 2 beta
- choisir un test statistique inférentiel selon les variables et le type de question de recherche
- interpréter le résultat du test statistique d’hypothèse et la signification
qu’est-ce qu’une erreur de type 1 (alpha)
lorsqu’on rejette l’hypothèse nulle, alors qu’elle est vraie
qu’est-ce qu’une erreur de type 2 (beta)
lorsqu’on accepte l’hypothèse nulle, alors qu’elle est fausse
comment peut-on réduire les chances d’effectuer des erreurs de type 1 ou de type 2
en choisissant un niveau de risque pour lequel on se sent à l’aise de faire une erreur (de n’importe quel type)
on choisit le seuil de signification (alpha) et la puissance du test statistique (beta)
qu’est-ce que le seuil de signification (alpha)
le seuil de probabilité de faire une erreur de type 1 (rejeter H0 lorsqu’elle est vraie)
qu’est-ce que la puissance d’un test statistique
la probabilité de rejeter correctement l’hypothèse nulle, donc, la capacité du test à détecter une différence significative qui existe réellement (pr erreur de type 2)
quels sont les choix de seuil de signification les plus courants
0.05 (5%), 0.01 (1%), 0.001 (0.1%)
quel est le choix de puissance d’un test statistique le plus courant
0.20 (80%)
(calcul = 1-beta)
quels facteurs influencent la puissance d’un test statistique
- seuil de signification statistique (alpha)
- dispersion des données (variance)
- taille de l’échantillon
+ taille de l’effet (si on connait les trois premiers on peut le calculer)
comment peut-on vérifier/évaluer le résultat des hypothèses
- valeur P
- intervalle de confiance (IC)
+ effet de taille (info supplémentaire)
vrai ou faux :
la valeur P est calculée avec des logiciels
vrai
car très complexe à calculer
avec la valeur P, comment peut-on dire qu’un test est significatif
si la valeur P est inférieure à la valeur d’alpha (seuil de signification qui est souvent à 0.05 (5%))
qu’est-ce que la MCID
la différence minimale cliniquement pertinente
que représente l’intervalle de confiance
la marge d’erreur ou la précision des résultats de l’étude
l’intervalle qui devrait contenir, avec un certain degré d’incertitude (seuil de signification), la vraie valeur
comment peut-on dire qu’une mesure est statistiquement significative avec l’IC
si la valeur nulle n’est pas dans l’intervalle de confiance
si l’IC = 90% quel est le seuil de signification
10%
quelle est la fonction de la taille de l’effet
quantifie l’ordre de grandeur de la différence entre la moyenne de nos groupes
détermine si la différence observée est de petite ou grande taille
quelle est la convention pour un effet de taille nul
[0-0.20[
quelle est la convention pour un effet de taille faible
[0.20-0.50[
quelle est la convention pour un effet de taille modéré
[0.50-0.80[
quelle est la convention pour un effet de taille élevé
[0.80 et infini
quel est l’effet d’une grande taille d’échantillon sur la puissance, la précision et l’IC
- augm puissance
- augm précision
- dim IC
quel est l’effet d’une petite taille d’échantillon sur la puissance, la précision et l’IC
- dim puissance
- dim précision
- augm IC
quelles sont les caractéristiques d’une statistique paramétrique
- variables sont normalement distribuées dans la population
- échantillon provient d’une population dont il est possible de calculer la variance
- variables sont à échelle ratio/proportion ou d’intervalle (quantitatives)
quelles sont les caractéristiques d’une statistique non-paramétrique
- variables ne sont pas normalement distribuées (distribution asymétrique)
- convient aux échantillons de petite taille
- conviennent aux données nominales et ordinales (qualitatives)
qu’est-ce qu’une mesure d’association
mesure statistique exprimée par un coefficient de corrélation : positif, négatif ou nul (entre 0 et +/- 1)
quel est le rôle d’une mesure d’association
indique la présence de relation entre deux variables, la force et la direction de ce lien
comment sont représentées les mesures d’association
diagramme de dispersion (nuage de points)
quelles sont les mesures d’association les plus fréquentes
- Pearson : pour variables normalement distribuées
- Spearman : pour variables qui suivent une distribution normale ou pas
quelle mesure d’association est utilisée pour les variables paramétriques
Pearson
quelle mesure d’association est utilisée pour les variables non-paramétriques
Spearman
que signifie : r
coefficient de corrélation Pearson
que signifie : rs ou rho
coefficient de corrélation Spearman
que signifie : r = entre 0 et 1
corrélation positive
lorsque les valeurs de x augmentent, les valeurs de y augmentent
que signifie : r = entre 0 et -1
corrélation négative
lorsque les valeurs de x augmentent, les valeurs de y diminuent
que signifie : r = 0
corrélation nulle
aucune association entre les valeurs de x et celles de y
comment peut-on interpréter qu’une corrélation est faible
|0.3| ≤ r < |0.5|
comment peut-on interpréter qu’une corrélation est modérée
|0.5| ≤ r < |0.7|
comment peut-on interpréter qu’une corrélation est forte
|0.7| ≤ r < |1|
vrai ou faux :
le coefficient de corrélation suffit pour déterminer si on accepte ou rejette notre H0
faux
il est nécessaire d’effectuer un ou plusieurs autres tests statistiques pour tester notre hypothèse, pour générer une valeur P ou IC
vrai ou faux :
le coefficient de corrélation indique une relation de cause à effet dans ses variables
faux
quel est l’objectif des mesures de prédiction
établir une prédiction basée sur une corrélation (cause à effet entre les varibales)
quelle est la méthode d’analyse de régression
examine la relation prédictive entre une variable dépendante et une ou plusieurs variables indépendantes
Y est une variable …
dépendante
X est une variable …
indépendante
quelle variable est celle qui est prédite ou à expliquer
dépendante (Y)
quelle variable est celle explicative
indépendante (X)
quels sont les types de régression
- régression linéaire simple
- régression multiple
- régression logistique
quel est l’objectif d’une régression simple linéaire
prédire la valeur d’une variable dépendante en se basant sur la valeur d’une variable indépendante
quel est l’objectif d’une régression multiple
prédire la valeur d’une variable dépendante en se basant sur plusieurs variables indépendantes
quel est l’objectif d’une régression logistique
vérifier l’effet d’une ou de plusieurs variables indépendantes sur une variable dépendante dichotomique (deux possibilités)
quels sont les types de variables dans une régression linéaire simple
X : continues ou autre niveaux de mesures
Y : continues
quels sont les types de variables dans une régression multiple
X : nominales ou continues
Y : continues
quels sont les types de variables dans une régression logistique
X : nominales ou continues
Y : nominales (dichotomiques)
sur quoi se base la régression
la corrélation entre des variables
quelle est la formule de la régression linéaire simple
y = b0 + (b1 x X)
(b0 = origine et b1 = pente)
quelle interprétation pouvons-nous faire avec la pente d’une régression linéaire simple
si b1 = 0 = aucun lien entre X et Y
si b1 est positif = quand X augmente, Y augmente
si b1 est négatif = si X augmente, Y diminue
que signifie la valeur P dans une régression linéaire simple
vérifie si le coefficient de régression est significativement différent de 0
que signifie l’IC dans une régression linéaire simple
calcule un intervalle de prédiction de notre variable
comment est souvent interprété une régression logistique
avec un rapport de cote (RC ou odds ratio OR), où la valeur nulle = 1
(car ça indique la probabilité qu’un évènement survienne entre 0 et 1)
quel est l’objectif d’une mesure de différence
établir la présence ou l’absence de différence entre deux ou plusieurs groupes p/r à une variable
quelle est la méthode d’analyse des différences
compare les moyennes, la variance ou la proportion des groupes pour vérifier la présence ou non de différence
quelles sont les grandes catégories de mesures de différence
- comparaison entre deux moyennes
- comparaison entre les moyennes de plus de deux groupes
- comparaison entre deux proportions/fréquences
la catégorie “comparaison entre deux moyennes” s’applique à quel type de variable
continue
la catégorie “comparaison entre les moyennes de plus de deux groupes” s’applique à quel type de variable
continue
la catégorie “comparaison entre deux proportions/fréquences” s’applique à quel type de variable
catégorielle
quels sont les tests possibles dans la catégorie “comparaison entre deux moyennes”
- test t (de Student)
- test U (de Mann-Whitney)
- test de Wilcoxon
quels sont les tests possibles dans la catégorie “comparaison entre les moyennes de plus de deux groupes”
- analyse de variance ANOVA
- test de Kruskal-Wallis
quels sont les tests possibles dans la catégorie “comparaison entre deux proportions/fréquences”
- test de Khi-carré (Khi-2)
selon quoi peut-on choisir le bon test sur deux moyennes
- type de groupe (indépendant vs apparié)
- type de variable statistique (paramétrique vs non-paramétrique)
qu’est-ce qu’un groupe indépendant
comparaison de deux groupes différents
ex : gr 1 vs gr 2
qu’est-ce qu’un groupe apparié
comparaison du même groupe à des moments différents
ex : gr 1 jour 1 vs gr 1 jour 99
le test t compare quoi
les moyenne de chaque groupe
le test U compare quoi
la distribution des valeurs de chaque groupe
quel est le test à utiliser pour un groupe indépendant avec des valeurs paramétriques
test t
quel est le test à utiliser pour un groupe indépendant avec des valeurs non-paramétriques
test U
quel est le test à utiliser pour un groupe apparié avec des valeurs paramétriques
test t pour groupe apparié
quel est le test à utiliser pour un groupe apparié avec des valeurs non-paramétriques
test de Wilcoxon
quelles sont les caractéristiques du test t
- ressemble à la loi normale mais plus évasée
- utile pour des échantillon de toutes tailles (même <30 sujets)
- degrés de liberté doivent être calculés
quels sont les postulats pour utiliser le test t
- les données de la variable dépendante des deux groupes doivent être distribuées selon les paramètres de la loi normale
- les deux groupes doivent avoir la même variance
- la variable dépendante doit être continue
quel est le test sur plus de deux moyennes/variances avec des variables paramétriques
ANOVA
quel est le test sur plus de deux moyennes/variances avec des variables non-paramétriques
test de Kuskal-Wallis
qu’est-ce qui est analysé dans un test ANOVA
variance des groupes (et non les moyennes)
quels sont les deux types de variance
- intragroupe
- intergroupe
quel est l’objectif d’un test de comparaison sur deux proportions
déterminer si les proportions observées dans deux groupes sont différentes (si p1 est différent de p2)
quelles sont les caractéristiques du test Khi-carré
- test non-paramétrique
- variables catégorielles
- compare fréquence réelle avec celle attendue
- compare deux groupes indépendants
- valide pour un nombre d’observations > 5
que signifie ce symbole
Khi-carré
comment peut on vérifier si les données sont significatives avec un test de Khi-carré
valeur Khi-carré > valeur critique (trouvée avec un calcul assez complexe)
quel test doit avoir une variable dichotomique à deux niveaux et une à échelle ordinale
test U de Mann-Whitney
quel test compare la médiane de deux groupes
test de Wilcoxon
comment est construit un article scientifique
- introduction (objectif, question, hypothèse)
- méthodologie (variables, collecte de données, méthode d’analyse des données)
- résultat (stats descriptives et inférentielles)
- discussion (interprétation des résultats)
- conclusion