Cours 3 Flashcards
Statistiques inférentielles -> à quoi elles servent?
Prendre des décisions concernant l’application ou la généralisation d’un constat à l’ensemble de la population
Ex: « Est-ce que l’utilisation des orthèses Bobath prévient vraiment une subluxation de l’épaule? »
“C’est un outil d’aide à la décision
Permet de répondre aux hypothèses de recherche
Permet d’induire les résultats d’un échantillon à une population”
Parle-t-on de statistiques inférentielles ou descriptives?
Inférentielles
Qu’est-ce qu’une statistique inférentielle?
C’est un outil d’aide à la décision
Permet de répondre aux hypothèses de recherche
Permet d’induire les résultats d’un échantillon à une population
Les statistiques inférentielles permettent de tester des _________________________________ et de porter un jugement en s’appuyant sur des techniques statistiques.
hypothèses sur la relation entre les variables
Les statistiques inférentielles déterminent si une différence est présente au niveau statistique = …
statistiquement significative
Les statistiques inférentielles déterminent si une différence est Absente au niveau statistique = …
non statistiquement significative = résultat de fluctuations aléatoires = due à la chance
Étapes pour statistiques inférentielles (4)
1) Formulation des hypothèses statistiques
2) Choix d’un test statistique inférentiel selon les variables et le type de question
3) Choix d’un test statistique d’hypothèse et de signification
4) Interprétation du résultat du test statistique d’hypothèse et de signification
Qu’est-ce qu’un test d’hypothèse statistique?
Démarche permettant d’effectuer un choix entre:
* accepter l’hypothèse nulle (H0)
* rejeter l’hypothèse nulle (H0)
Quand accepte-t-on H0? Quand la rejetons-nous?
Quelles sont les propositions que l’on souhaite vérifier:
1) Avec l’hypothèse nulle?
2) Avec l’hypothèse de recherche?
Pour la proposition suivante, lors d’un 1) test d’hypothèse statistique, donner:
1) L’hypothèse nulle (H0)
2) L’hypothèse de recherche (H1)
“Une étude vise à comparer la spasticité musculaire chez les personnes atteintes de sclérose en plaque qui ont porté (Groupe A) ou non (Groupe B) une orthèse antispastique de la main.”
“Une étude vise à comparer la spasticité musculaire chez les personnes atteintes de sclérose en plaque qui ont porté (Groupe A) ou non (Groupe B) une orthèse antispastique de la main.”
Exemples d’hypothèses.
2) Choix d’un test statistique inférentiel selon les variables et le type de question
Pour tester les hypothèses, qu’est-ce qu’on utilise?
Des tests d’hypothèse statistiques qui s’appuient sur des
lois de distribution de probabilités
Pourquoi les tests statistiques inférentiels sont-ils utiles? (3)
1) Examiner des mesures d’association entre variables (corrélation)
2) Examiner des mesures de prédiction entre variables (régression)
3) Examiner des differences entre des groupes (mesures de differences de moyennes, proportion)
3) Choix d’un test statistique d’hypothèse et de signification
Pour vérifier empiriquement les hypothèses et pouvoir dire si oui ou non notre résultat est statistiquement significatif, nous devons faire appel à quoi?
- La valeur-p
- L’intervalle de confiance
4) Interprétation du résultat du test statistique d’hypothèse et de signification
La valeur-p est souvent directement issue des ______________________________________
résultats des statistiques inférentielles.
Par quoi est générée la valeur-p?
Par le logiciel des analyses statistiques
L’interprétation de la valeur de p est très importante.
Pourquoi? (2)
1) Détecter la présence ou non d’une différence significative entre les groupes
2) Accepter ou rejeter une hypothèse nulle
Le calcul de la valeur de p est très __________
complexe.
Dans l’interprétation du résultat valeur-p, quels sont les types d’erreurs dans la vérification des hypothèses? (2)
Erreur de type I : Rejet de l’hypothèse nulle alors qu’elle est vraie
Erreur de type II : Accepte l’hypothèse nulle lorsqu’elle est fausse
Choix d’un seuil de signification alpha pour la valeur-p
Les valeurs-p utilise des seuils de signification alpha: α=10%
α=5%
α=1%
Est-ce que les évidences sont plus fortes lorsque la valeur de α est petite ou grande?
Plus la valeur de α est petite, plus les évidences sont fortes pour montrer que les résultats ne sont pas attribués à la chance
Plus alpha est petit, plus l’erreur de type I est _______
réduite!
Valeur-p et alpha.
Quelle est l’utilité de la vérification de la normalité de la distribution des données? (2)
1) Vérifier la normalité des données -> choisir le test statistique approprié
2) Choisir les mesures de tendance centrale
Compléter le tableau selon la façon de décrire l’échantillon.
-
Les statistiques inférentielles, à quoi servent-elles?
Prendre des décisions concernant l’application ou la généralisation d’un constat à l’ensemble de la population
Ex: « Est-ce que l’utilisation des orthèses Bobath prévient vraiment une subluxation de l’épaule? »
Les statistiques inférentielles permettent de tester des hypothèses sur la _____________________(1) et de ____________________(2) en s’appuyant sur des techniques statistiques.
1) relation entre les variables
2) porter un jugement
Les statistiques inférentielles
4 étapes
1) Formulation des hypothèses statistiques
2) Choix d’un test statistique inférentiel selon les variables et le type de question
3) Choix d’un test statistique d’hypothèse et de signification
4) Interprétation du résultat du test statistique d’hypothèse et de signification
Pour vérifier empiriquement les hypothèses et pouvoir dire si oui ou non, notre résultat est statistiquement significatif, nous devons faire appel à: (2)
1) La valeur-p
2) L’intervalle de confiance
La valeur-p est souvent directement issue des ____________________________________
résultats des statistiques inférentielles.
L’interprétation de la valeur de p est très importante.
Pourquoi? (2)
1) Détecter la présence ou non d’une différence significative entre les groupes
2) Accepter ou rejeter une hypothèse nulle
Plus la valeur de α est petite, plus les évidences sont fortes pour montrer que les résultats ________________________________
ne sont pas attribués à la chance.
Interprétation du résultat
Valeur-p
“Valeur de p<0,05 ; alpha=5%”
Qu’est-ce que ça signifie?
Nous avons moins de 5% de probabilité de rejeter l’hypothèse nulle alors qu’elle est vraie.
Interprétation de la Valeur-p et jugement clinique
Un résultat _____________________ indique que la différence observée n’est pas le résultat de fluctuations
aléatoires (n’est pas un résultat obtenu « par chance »).
statistiquement significatif
Un résultat statistiquement significatif indique que la différence observée n’est pas le résultat de fluctuations
aléatoires (n’est pas un résultat obtenu « par chance »).
Cependant, cette valeur n’implique pas nécessairement… (4)
- Un résultat cliniquement significatif
- La présence d’un lien de causalité
- Le taux de différence entre les deux groupes
- Une absence de biais dans l’étude
GLOSSAIRE PAGE 1
La _________________________________ est conclue à partir des résultats des tests statistiques -> de la valeur de p.
différence statistiquement significative
La différence cliniquement significative dépend de ____________________
l’outil clinique utilisé.
La différence cliniquement significative dépend de l’outil clinique utilisé.
Chaque outil clinique destiné pour l’évaluation a un score de ___________________________________________
différence minimale cliniquement pertinente (MCID).
Qu’est-ce qu’un score de différence minimale cliniquement pertinente (MCID)?
Une valeur qui permet au clinicien de conclure une différence clinique importante
Une différence statistiquement significative implique-t-elle nécessairement une différence cliniquement significative?
Non
Différence minimale cliniquement pertinente (MCID)
4) Interprétation du résultat: Intervalle de confiance
L’utilisation des intervalles de confiance est une…
…autre façon d’aborder les statistiques inférentielles.
Qu’est-ce que l’intervalle de confiance?
Représente la marge d’erreur ou la précision des résultats de l’étude
GLOSSAIRE PAGE 1
L’intervalle de confiance est l’intervalle qui devrait contenir, avec un certain degré d’incertitude, ________________
la vraie valeur.
Dans l’intervalle de confiance, les bornes sont parfois désignées par le terme « ________________ ».
limites de confiance
Intervalle de confiance
Peu importe la statistique inférentielle choisie (une moyenne, proportion, corrélation, différence de moyennes, différence de proportion, effet de taille)
la valeur nulle = __
0.
Si la valeur nulle n’est PAS dans l’intervalle de confiance à 95% d’une mesure, cette mesure est _________________________
statistiquement significative.
GLOSSAIRE PAGE 2
Intervalle de confiance représentation.
Intervalle de confiance exemple.
Intervalle de confiance tableau.
Donner une autre façon de représenter un intervalle de confiance.
Une proportion d’un ensemble d’observations
Intervalle de confiance autre graphique.
Les statistiques inférentielles sont utiles pour… (3)
1) Examiner des mesures d’association entre variables (corrélation)
2) Examiner des mesures de prediction entre variables (régression)
3) Examiner des differences entre des groupes (mesures de differences de moyennes, proportion)
Les statistiques paramétriques
Les variables sont _____________________ dans la population.
normalement distribuées
Les statistiques paramétriques
L’échantillon provient d’une population dont il est ______________________________
possible de calculer la variance.
Les statistiques paramétriques
Les variables sont à échelle ____________________________
d’intervalle ou de proportion/ratio.
Les statistiques non-paramétriques
Les variables ne sont pas _______________________________________________________
normalement distribuées (distribution asymétrique).
Les statistiques non-paramétriques conviennent aux échantillons de _____________
petites tailles.
Les statistiques non-paramétriques conviennent aux données _________________________________
nominales et ordinales (qualitatives).
Étude de corrélation = Mesure statistique exprimée par un _______________________ : positif, négatif ou nul (entre 0.00 et ±1.00).
coefficient de corrélation
Qu’est-ce qu’indique une étude de corrélation?
Indique la présence de relation entre deux variables. La force et la direction du lien entre ces deux variables.
Une étude de corrélation est représentée par un ________________________
diagramme de dispersion.
Étude de corrélation
Il en existe plusieurs, les plus fréquentes : (2)
- Pearson: pour variables normalement distribuées
- Spearman: pour variables qui suivent une distribution normale ou pas
Étude de corrélation
4 étapes
1) Choix du bon coefficient de corrélation
2) Calcul du coefficient de corrélation
3) Interprétation du coefficient de corrélation
4) Inférence en corrélation (valeur-p ou intervalle de confiance)
GLOSSAIRE PAGE 6
1) Choix du coefficient de corrélation
Donner 2 options.
2) Calcul du coefficient de corrélation
Que signifie “corrélation positive”?
Le coefficient r varie entre 0 et 1
- Lorsque les valeurs de x augmentent, les valeurs de y augmentent
2) Calcul du coefficient de corrélation
Que signifie “corrélation négative”?
Le coefficient r varie entre -1 et 0
- Lorsque les valeurs de x augmentent, les valeurs de y diminuent
2) Calcul du coefficient de corrélation
Que signifie “corrélation nulle”?
Coefficient de corrélation r = 0
- Aucune association entre la valeur des x et celle des y, les points du diagramme de dispersion vont dans tous les sens
3) Interprétation du coefficient de corrélation
Comment la valeur du coefficient de corrélation est-elle interprétée? (Qu’est-ce qui constitue une corrélation faible, modérée, forte?) (3)
- │0,3│ ≤ r < │0,5│ : : Une corrélation faible
- │0,5│ ≤ r < │0,7│ : Une corrélation modérée
- │0,7│ ≤ r < │1│ : Une corrélation forte
La valeur du coefficient de corrélation est interprété comme suit :
* │0,3│ ≤ r < │0,5│ : : Une corrélation faible
* │0,5│ ≤ r < │0,7│ : Une corrélation modérée
* │0,7│ ≤ r < │1│ : Une corrélation forte
Selon les auteurs, ces étendues peuvent _______ allant même jusqu’à en faire des interprétations dépendamment des variables à l’étude.
varier
4) Inférence en corrélation (valeur-p ou intervalle de confiance)
Une fois la corrélation effectuée, r est une donnée _____________________
statistique descriptive.
4) Inférence en corrélation (valeur-p ou intervalle de confiance)
Il est nécessaire d’effectuer un ou plusieurs autres tests statistiques pour tester notre hypothèse, ce qui nous permettra de générer _________________________________________
une valeur de p ou un intervalle de confiance.
4) Inférence en corrélation (valeur-p ou intervalle de confiance)
Il est nécessaire d’effectuer un ou plusieurs autres tests statistiques pour tester notre hypothèse, ce qui nous permettra de générer une valeur de p ou un intervalle de confiance.
Comme nous l’avons appris, il sera ensuite possible d’interpréter la valeur-p ou l’intervalle de confiance pour en conclure que ______________________________________________________________
la corrélation est jugée statistiquement significative ou non.
4) Inférence en corrélation (valeur de p ou intervalle de confiance)
La valeur-p et l’intervalle de confiance associée à une corrélation est souvent
calculée et rapportée selon les façons suivantes:
Des experts des troubles de l’humeur veulent évaluer si une augmentation des symptômes dépressifs est accompagnée d’une augmentation des symptômes anxieux des sujets de leur étude. Ils évaluent 300 sujets et obtiennent un r = 0,62 (p < 0,001).
- Quel est la force du lien? (Est-ce que cette corrélation est nulle, faible, modérée ou forte?)
- Est-ce une corrélation positive ou négative?
- Est-ce qu’elle est statistiquement significative à 5%?
Trouver la réponse.
Une étude de corrélation indique le lien entre deux variables ou leur influence mutuelle.
Est-ce que cela indique nécessairement une relation de cause à effet?
Non
Étude de corrélation indique le lien entre deux variables ou leur influence mutuelle, mais n’indique pas nécessairement une relation de cause à effet.
Donner un exemple.
Exemple:
Les symptômes anxieux et dépressifs peuvent s’influencer mutuellement, mais l’un n’est pas nécessairement la cause de l’autre
Mesures de prédiction entre variables: Analyse de régression
Quel est l’objectif de la régression?
Établir une prédiction basée sur une corrélation
(cause à effet entre les variables).
Mesures de prédiction entre variables: Analyse de régression
À quoi sert la méthode d’analyse de régression?
Examine la relation prédictive entre une variable dépendante et une ou plusieurs variables indépendantes.
Étude de régression
4 étapes
1) Choix de régression
2) Calcul de la régression
3) Interprétation de la régression
4) Inférence en régression (valeur-p ou intervalle de confiance)
GLOSSAIRE P.6
Expliquer l’étape 1) Choix de régression.
1) Choix de régression: Variable dépendante & indépendante
Tableau
Quel est l’objectif d’une régression linéaire simple?
Prédire la valeur d’une variable dépendante en se basant sur la valeur d’une variable indépendante.
Quels sont les types de variables possibles dans une régression linéaire simple? (2)
Variable Indépendante (X): continue ou autre niveaux de mesures
Variable Dépendante (Y): continue
Quel est l’objectif d’une régression multiple?
Prédire la valeur d’une variable dépendante en se basant sur plusieurs variables indépendantes.
Quels sont les types de variables possibles dans une régression multiple? (2)
Variables Indépendantes (X): nominales ou continues
Variable Dépendante (Y): continue
Quel est l’objectif d’une régression logistique?
Vérifier l’effet d’une ou de plusieurs variables indépendantes sur une variable dépendante dichotomique.
Quels sont les types de variables possibles dans une régression logistique? (2)
Variables Indépendantes (X): nominales ou continues
Variable Dépendante (Y): nominale (dichotomique)
2) Calcul de la régression
La régression se base sur la ____________ entre les variables tel que vu précédemment.
corrélation
2) Calcul de la régression
Ainsi la régression linéaire sera représentée par un _________________________(1) Toutefois, à la différence de la corrélation, une _________________(2)
1) diagramme de dispersion.
2) droite y sera tracée.
2) Calcul de la régression
Ainsi la régression linéaire sera représentée par un diagramme de dispersion. Toutefois, à la différence de la corrélation, une droite y sera tracée.
Qu’est-ce que cela permet?
Permet d’obtenir une formule ou un modèle
2) Calcul de la régression
La formule de la droite/modèle permet de ________________________________________________________________
répondre à des questions et de prédire des phénomènes
2) Calcul de la régression: La régression linéaire simple
La droite représente _______________________________________________________
l’effet de la variable indépendante (x) sur la variable dépendante (y).
2) Calcul de la régression: La régression linéaire simple
La formule de la droite est:
y= b0 + b1x
où
b0 est le point d’origine b1 est la pente
3) Interprétation de la régression: La régression linéaire simple
Interprétation de la direction de la pente (b1), si b1 = 0, qu’est-ce que ça signifie?
Aucun lien entre x et y
b1 = 0
3) Interprétation de la régression: La régression linéaire simple
Interprétation de la direction de la pente (b1)
* Si b1 est positif, qu’est-ce que ça signifie?
Quand x augmente, y augmente
3) Interprétation de la régression: La régression linéaire simple
Interprétation de la direction de la pente (b1) * Si b1 est négatif → _____________________
quand x augmente, y diminue.
3) Interprétation de la régression: Exemple de prédiction régression linéaire simple
Une étude a évaluée le salaire horaire des professionnels de la santé et obtient la formule de régression linéaire simple suivante:
y = 25,09 + 1,83(x)
où x est le nombre d’années d’expérience
Quel est le salaire d’un professionnel ayant 10 années d’expérience?
Le salaire horaire d’un professionnel ayant 10 années d’expérience (x = 10)
y = 25,09 + 1,83(x) y = 25,09 + 1,83(10) y = 25,09 + 18,3
y = 43,39
- Alors le salaire horaire est de 43,39$
4) Inférence en corrélation (valeur de p ou intervalle de confiance)
L’inférence peut porter sur…
… l’origine ou la pente de la droite de régression (souvent plus sur la pente que sur l’origine).
4) Inférence en corrélation (valeur de p ou intervalle de confiance)
La valeur-p issue d’un test statistique sur la pente permettra de vérifier si…
… le coefficient de régression est significativement différent de 0.
4) Inférence en corrélation (valeur de p ou intervalle de confiance)
L’intervalle de confiance issue d’un test statistique sur la pente permettra de calculer un ___________________________________________
intervalle de prédiction de notre variable.
4) Inférence en corrélation (valeur de p ou intervalle de confiance)
Interpréter le tableau suivant.
Interprétation: La valeur-p indique que les corrélations suivantes sont statistiquement significatives et différentes de zéro.
4) Inférence en corrélation (valeur de p ou intervalle de confiance)
Dans un article, cela peut ressembler à:
Calcule l’intervalle de confiance à 99 % de la pente1 :
99% IC pente = 0,61 ± 2,756 (0,15) OU
99% IC pente = (0,20 ; 1,02)
Interpréter ces résultats.
Interprétation: L’intervalle de confiance nous indique que nous sommes confiants à 99% que le coefficient de corrélation se situe entre 0.20 et 1.02 dans la population sous-jacente à l’étude. Comme le zéro ne se retrouve pas dans l’intervalle, nous sommes confiants à 99% que le coefficient de corrélation est différent de zéro.
Survol rapide des autres types de régression: La régression linéaire multiple.
Vérification simultanée des relations entre les variables indépendantes (X) (prédictives) et la variable dépendante (Y).
Quelle est la formule?
Survol rapide des autres types de régression: La régression linéaire multiple
L’interprétation des résultats est sensiblement la même que pour _____________________
la régression linéaire simple.
Survol rapide des autres types de régression: La régression linéaire multiple
Souvent utilisé dans le but d’examiner l’effet de _________________________________________
plus d’un facteur sur un résultat anticipé.
Survol rapide des autres types de régression: La régression linéaire multiple
Souvent utilisé dans le but d’examiner l’effet de plus d’un facteur sur un résultat anticipé. Donner un exemple.
Exemple: Une étude qui vise à développer un modèle prédictif du quotient intellectuel des enfants d’une ville selon le niveau d’éducation des parents, le quartier, le statut économique familial, la consommation de fruits et légumes.
Survol rapide des autres types de régression: La régression logistique
Caractériser un groupe de personne présentant une condition, par rapport à ____________________(1) Prédiction de cote ___________________(2) de la variable Y en se basant sur les variables X.
1) des personnes saines.
2) de présence ou d’absence
Survol rapide des autres types de régression La régression logistique
Caractériser un groupe de personne présentant une condition, par rapport à des personnes saines. Prédiction de cote de présence ou d’absence de la variable Y en se basant sur les variables X.
Ainsi la variable dépendante (Y) est _____________________________________________________________________
dichotomique (ex: absence ou présence d’une maladie, d’une condition)
Survol rapide des autres types de régression: La régression logistique
Les variables indépendantes (X) peuvent être ______________________(1) et sont des variables susceptibles d’influer sur la _________________________________(2)
1) catégorielles ou continues
2) survenue ou non de l’évènement.
Survol rapide des autres types de régression: La régression logistique
Un modèle de régression logistique permet de prédire la _____________________________________________________________________
probabilité qu’un évènement ou un résultat survienne.
Un modèle de régression logistique permet de prédire la probabilité qu’un évènement ou un résultat survienne.
La probabilité est un nombre entre ______
0 et 1
Un modèle de régression logistique permet de prédire la probabilité qu’un évènement ou un résultat survienne.
La probabilité est un nombre entre 0 et 1. Souvent exprimé par un ___________________________________
rapport de cote (RC ou odds ratio OR).
Un modèle de régression logistique permet de prédire la probabilité qu’un évènement ou un résultat survienne.
La probabilité est un nombre entre 0 et 1. Souvent exprimé par un rapport de cote (RC ou odds ratio OR).
Il existe plusieurs calculs et modèles de régression logistique, mais ceux-ci sont souvent ___________________________________________________________________
très complexes et nécessitent l’utilisation de logiciel statistique.
Expliquer la différence entre corrélation et régression.
Les statistiques inférentielles sont utiles pour examiner des _____________________ (mesures de différences de moyennes, proportion).
différences entre des groupes
Pour les variables continues, quels tests utilise-t-on pour comparer entre deux moyennes? (3)
1) Test t (t de Student)
2) Test U de Mann- Whitney
3) Test de Wilcoxon
Alphabet: TU(pas de V)W
Pour les variables continues, quels tests utilise-t-on pour comparer entre les moyennes de plus de deux groupes? (2)
1) ANOVA (analyse de variance)
2) Kruskal- Wallis
Pour les variables catégorielles, quels tests utilise-t-on pour comparer entre deux proportions/fréquences?
Test de Khi-carré
GLOSSAIRE PAGE 8
Pour groupe indépendant (comparaison de deux groupes), quel choix fait-on pour le test t (paramétrique)?
Test t pour groupe indépendant :
Comparaison de moyenne de chacun des groupes
Pour groupe indépendant (comparaison de deux groupes), quelle équivalence non-paramétrique utilise-t-on?
Test U de Mann-Whitney: Comparaison de distribution des valeurs pour chaque groupe
Pour groupe appariés (pré-post), quel choix fait-on pour le test t (paramétrique)?
Test t pour groupe appariés
Pour groupe appariés (pré-post), quelle équivalence non-paramétrique utilise-t-on?
Test de Wilcoxon par rangs signés
Test sur deux moyennes: Test t de student
Ce test vise à déterminer si les moyennes (variable continue) observées dans les deux groupes à l’étude sont __________
différentes.
Quelle est la loi de distribution pour un Test T de student?
La loi t de Student
La loi de distribution appropriée pour ce test est la loi t de Student et la formule est la suivante:
Le Test t de Student ressemble à la loi Normale, mais _______________
plus évasé.
Le Test t de Student est utile pour des échantillons de quelle taille?
De toutes tailles même petits (n < 30 sujets)
Dans le test T de Student, les degrés de liberté (Ƭddl) doivent être __________
calculés.
Quels sont les postulats pour utiliser le test T de Student? (3)
1) Les données de la variable dépendante des deux groupes doivent être distribuées selon les paramètres de la loi Normale (normalement distribuées)
2) Les deux groupes doivent avoir la même variance
3) La variable dépendante est continue
GLOSSAIRE PAGE 8
P.76 à 78
Exemples de Test T de Student
Si on a plus que deux groupes?
Analyse des variances
Test sur plus de deux moyennes
Donner 2 tests possibles.
Le test d’analyse de variance ANOVA et Kruskal-Wallis
Le test d’analyse de variance ANOVA et Kruskal-Wallis.
1) Lequel est paramétrique?
2) Lequel présente une équivalence non-paramétrique?
1) Test d’analyse de variance ANOVA
2) Test de Kruskal-Wallis
Lorsque l’on veut comparer la distribution d’une variable quantitative continue de 3 groupes et plus pour déterminer l’effet d’une intervention, est-ce que c’est la moyenne des groupes qui est comparée?
Ce n’est pas la moyenne des groupes qui est comparée
C’est la variance des groupes qui est comparée et analysée (ou décomposée)
Aussi nommé ANOVA
Test sur plusieurs variances
Pour comparer la variance des groupes, il faut la décomposer en ses différentes sources.
Quelles sont-elles? (2)
Variance intra-groupe :
Différence entre les individus à l’intérieur d’un groupe
Variance inter-groupe : Différence entre les groupes
Différencier la variation intragroupe de la variation intergroupe.
Différencier la variation intragroupe de la variation intergroupe.
Test ANOVA permet de mesurer les ___________________________
variances inter et intra groupes.
Test ANOVA permet de comparer des ___________________________________________________
mesures répétées et entre plus que deux groupes.
Test ANOVA est généré par un logiciel d’analyse statistique: ___________________
formule et calcul complexe.
Test ANOVA utilise la ____________(1) dont l’interprétation de la valeur de p se fait comme à l’habitude : _______________________________(2)
1) statistique F
2) validation de l’hypothèse statistique.
Interprétation -Test ANOVA
Donner un exemple.
Une étude veut tester s’il existe une différence statistiquement significative à travers trois temps de mesure de l’effet de la stimulation électrique transcrânienne en courant continu sur différentes variables de la fonction motrice chez des patients hémiparétique post AVC.
Interprétation -Test ANOVA Exemple
Qu’est-ce qu’indique le tableau suivant?
L’ANOVA suivant indique seulement si on observe une différence significative entre les moyennes d’au moins deux des trois temps de mesure, mais n’indique pas spécifiquement entre quels temps de mesure on observe une différence.
Interprétation -Test ANOVA Exemple
Pour connaitre entre quels temps de mesure, il y a une différence, il faudra faire appel à d’autres tests appelé « _____________(1) » permettant de faire des _____________________(2) entre tous les groupes.
1) tests post hoc
2) comparaison multiples
Test ANOVA
Pour connaitre entre quels temps de mesure, il y a une différence, il faudra faire appel à d’autres tests appelé « tests post hoc » permettant de faire des comparaison multiples entre tous les groupes.
Pour ces tests post hoc, on se retrouve à utiliser ___________ entre chaque paires de groupes.
les test-t
Exemple de test ANOVA.
Test sur deux proportions
Afin de déterminer si les proportions observées dans deux groupes (Groupe 1 et Groupe 2) sont différentes et si p1 est différent de p2, qu’est-ce qu’on utilise?
Test de Khi-carré, nommé aussi test de Khi-2
Test du Khi-carré
Test __________________(1) sur des variables ________________________________(2)
1) non paramétrique
2) catégorielles (comparer ≥ 2 proportions)
GLOSSAIRE PAGE 9
Test du Khi-carré compare la fréquence ________________________
réelle à celle attendue.
Test du Khi-carré
Sert pour comparer _____________________
deux groupes indépendants.
GLOSSAIRE PAGE 9
Test du Khi-carré est valide pour un nombre d’observation _____
< 5.
Test du Khi-carré
5 étapes
Étape 1 : Construire un tableau croisé/tableau de contingence et formuler hypothèse
Étape 2 : Calculer le Khi-carré à l’aide de la formule du Khi-carré et du tableau
Étape 3: Calculer le nombre de degré de liberté et choisir le seuil de signification
Étape 4: Trouver la valeur critique d’acceptation ou de refus de l’hypothèse nulle
Étape 5: Comparer la valeur critique à la valeur résultante du Khi-carré
GLOSSAIRE PAGE 10
Expliquer l’étape 1 du Test du Khi-carré.
Expliquer l’étape 2 du Test du Khi-carré.
Étape 2 du Khi-Carré, exemple de valeurs observées.
Étape 2 du Khi-Carré, exemple de valeurs attendues.
Lorsqu’on a le tableau des valeurs observées et des valeurs attendues à l’étape 2 du Khi-Carré, que fait-on?
Quelle est l’étape 3 du Khi-Carré?
Quelle est l’étape 4 du Khi-Carré?
Quelle est l’étape 5 du Khi-Carré?
Diapos 100 à 109: pour voir un exemple du test Khi-Carré.
-
Quelles sont les conditions d’application du Test de la loi Normale? (2)
1) Test sur une moyenne : Variable quantitative
2) Test sur une proportion: Variable catégorielle
Quelles sont les conditions d’application du Test T de Student?
1) Test sur deux moyennes
2) Variable quantitative
Quelles sont les conditions d’application du Test ANOVA? (2)
1) Test la variance de deux groupes ou plus
2) Variable quantitative
Quels sont les tests principaux utilisés pour les lois de distribution paramétriques? (3)
1) Test de la Loi Normale
2) Test t de Student
3) Test ANOVA
GLOSSAIRE PAGE 11
Quels sont les tests principaux utilisés pour les lois de distribution non-paramétriques? (4)
1) U de Mann-Whitney
2) Wilcoxon
3) Kruskall-Wallis
4) Khi-Carré
Quelles sont les conditions d’application du test U de Mann-Whitney? (2)
1) Test de différence entre la distribution de deux groupes
2) Une variable dichotomique (à deux niveaux) et l’autre à l’échelle ordinale
Quelles sont les conditions d’application du test de Wilcoxon? (2)
1) Test de différence entre la médiane des deux groupes
2) Variable quantitative ou catégorielle ordinale
Quelles sont les conditions d’application du test de Kruskall-Wallis? (2)
1) Test de différence entre la distribution de trois groupes et plus
2) Variable catégorielle ordinale
Quelles sont les conditions d’application du test Khi-Carré? (2)
1) Test sur deux proportions ou plus
2) Variable catégorielle
GLOSSAIRE PAGE 12
À quoi se réfère la puissance d’un test statistique?
Capacité d’un test de déceler un effet ou une différence statistiquement significative
Quels facteurs influencent la puissance d’un test statistique? Dire le facteur le plus contrôlable en premier. (4)
1) Taille de l’échantillon
2) Seuil de signification statistique (alpha)
3) Dispersion des données (variance)
4) Taille de l’effet
Pourquoi est-il important de considérer la taille de l’échantillon?
Parce qu’elle influence:
1) La puissance de l’étude
2) La variance des données
3) La précision des indicateurs statistiques
4) La validité des résultats
5) La généralisabilité des conclusions (les implications cliniques)
GLOSSAIRE PAGE 15
Qu’est-ce que l’effet de taille?
L’effet de taille (Effect Size) quantifie l’ordre de grandeur de la différence de moyenne
En d’autre mot, permet de déterminer si la différence observée est de la taille d’une souris ou d’un éléphant
Dans l’effet de taille, que représente la variable S?
-
Comment interprète-t-on l’effet de taille?
Regarder page 117 et 118.
-
Une grande taille d’échantillon signifie une puissance _______________(1), une précision _____________(2) et un intervalle de confiance ______________(3)
1) plus élevée
2) plus élevée
3) plus petit.
Une petite taille d’échantillon signifie une puissance _______________(1), une précision _____________(2) et un intervalle de confiance ______________(3)
1) plus basse
2) plus basse
3) plus grand.
Les analyses statistiques permettent de valider des hypothèses de recherche.
-> Évaluer un ______(1) de traitement/__________(2) des observations
1) effet
2) constater
Le choix du test statistique dépend de quoi? (3)
1) L’objectif de l’étude
2) Le type de données
3) La normalité de la distribution des données
Acronyme: NOT
L’interprétation des analyses statistiques est guidée par quoi? (2)
1) La valeur de p
2) L’intervalle de confiance
Donner le test qu’on doit utiliser pour comparer entre les groupes.
Quelles corrélations doit-on utiliser dans les deux exemples ici-présents?
Donner la structure d’un article scientifique. (5)
1) Introduction (objectif, question, hypothèse)
2) Méthodologie (variables, collecte de données, méthode d’analyse des données)
3) Résultat (statistiques descriptives, statistiques inférentielles)
4) Discussion (interprétation des résultats)
5) Conclusion
L’étape 2 d’un article scientifique est le suivant:
“Méthodologie (variables, collecte et méthodes)”
Quelles questions doit-on se poser à cette étape? (4)
1) Quelles sont les variables qui découlent de la question/problématique?
2) Comment ces variables seront-elles seront colligées?
3) Quels types de variables seront utilisés?
4) Quelles méthodes d’analyse statistique seront utilisées?
GLOSSAIRE PAGE 17
Quelles sont les variables à l’étude dans cet exemple?
“Une étude vise à comparer l’efficacité d’un traitement de stimulation magnétique transcrânienne et d’un traitement de thérapie miroir sur la fonction motrice de la main, 6 mois suivant un AVC.”
Traitement et fonction motrice
De quel type de variables s’agit-il?
Catégorielle ordinale
À l’étape 2 de la rédaction d’un article scientifique, “Méthodologie (variables, collecte et méthodes)”, il faut identifier des _____________________________
variables dépendante et indépendante.
Étape 3 de la rédaction d’un article scientifique: “Résultats (Statistiques descriptives)”
À quoi servent les statistiques descriptives à ce point-ci?
Les statistiques descriptives servent à décrire les participants, résumer un échantillon, apprécier la distribution des données.
Étape 3 de la rédaction d’un article scientifique: “Résultats (Statistiques descriptives)”.
Quelles statistiques descriptives peut-on utiliser? (3)
1) Statistiques de fréquence (fréquence absolue, fréquence relative)
2) Statistiques de tendance centrale (moyenne, médiane, mode)
3) Statistiques de dispersion (étendue, variance, écart-type)
Étape 3 de la rédaction d’un article scientifique: “Résultats (Statistiques descriptives)”.
Qu’est-ce qu’on utilise pour présenter les données? (2)
Des graphiques ou des tableaux.
De quel type de graphique s’agit-il?
Courbe de suivi
Quels sont les deux mots permettant de compléter le titre de ce graphique?
circulaire, fréquence relative
De quel type de graphique s’agit-il?
Courbe de dispersion
De quel type de graphique s’agit-il?
Diagramme à barre
Regarder p.17, powerpoint 3.
-
Étape 3 de la rédaction d’un article scientifique: “Résultats (Statistiques inférentielles)”.
Pour vérifier les hypothèses, on utilise des tests statistiques : les statistiques _____________
inférentielles.
Les tests de statistiques inférentielles nous informent s’il y a une différence entre les _______________________
groupes ou les observations.
Le choix du test statistique dépend du ________________(1) et de la __________________________________________(2)
1) type de la variable
2) normalité de la distribution des données.
Une différence statistiquement significative ne traduit pas nécessairement une différence _____________ significative.
cliniquement
Étape 3 de la rédaction d’un article scientifique: “Résultats (Statistiques inférentielles)”.
Quelles sont les 3 sous-étapes de cette étape?
GLOSSAIRE PAGE 18
On doit analyser le type de variables à l’étude et la distribution de nos données (vérification de la normalité par le test _______________).
de Shapiro Wilk
Exemple pour l’étape 1 des statistiques inférentielles.
Dans le test de Shapiro Wilk, qu’est-ce que ça signifie si la valeur de p est <0,05?
Les données ne suivent pas une distribution normale
Le test de Shapiro Wilk est adéquat pour un ____________________
petit échantillon (N<50).
Étape 2 des statistiques inférentielles: “Choisir l’objectif statistique approprié pour répondre à notre hypothèse (corrélation, régression, mesures de différences) et à notre échantillon (paramétrique ou non-paramétrique)”
Expliquer pourquoi on prendrait paramétrique et pourquoi on prendrait non-paramétrique. (3 chaque)
-
Étape 2 des statistiques inférentielles: “Choisir l’objectif statistique approprié pour répondre à notre hypothèse (corrélation, régression, mesures de différences) et à notre échantillon (paramétrique ou non-paramétrique)”
Quand la statistique est paramétrique et qu’on veut une association entre deux variables continues, quel coefficient de corrélation prend-t-on?
Coefficient de corrélation de Pearson (r)
Étape 2 des statistiques inférentielles: “Choisir l’objectif statistique approprié pour répondre à notre hypothèse (corrélation, régression, mesures de différences) et à notre échantillon (paramétrique ou non-paramétrique)”
Quand la statistique est non-paramétrique et qu’on veut une association entre deux variables ordinales ou continues, quel coefficient prend-t-on?
Coefficient de corrélation Spearman (rs ou rho)
Dire quels tests on utiliserait dans chacun des cas.
Dire quel test on utiliserait.
Étape 4 de la rédaction d’un article scientifique: “Discussion (interprétation des résultats)”
Interprétation de la valeur de p: Une différence est dite statistiquement significative si la valeur de p est ___________________________
inférieure au taux de signification.
Étape 4 de la rédaction d’un article scientifique: “Discussion (interprétation des résultats)”
Interprétation de la valeur de p: Si la valeur nulle n’est PAS dans l’IC d’une mesure, cette mesure est ___________________________
statistiquement significative.
Dans le test du Khi-Carré, à quoi est égal le nombre de degrés de liberté?
(nombre de rangées - 1) x (nombre de colonnes -1)
L’étape 5 du test du Khi-Carré consiste à comparer la valeur critique à la valeur résultante du Khi-Carré.
Comment atteint-on la signification?
La valeur doit être supérieure à la valeur critique
Donner les 4 caractéristiques du Khi-Carré.
- Test non paramétrique sur des variables catégorielles (comparer ≥ 2 proportions)
- Compare la fréquence réelle à celle attendue
- Comparer deux groupes indépendants
- Valide pour un nombre d’observation < 5