Module 5 - Intro aux stats Flashcards
Pourquoi utiliser des tests stat dans une étude?
Est-ce que les résultats sont significatifs + Généralisables et applicables à d’autres patients similaires (population cible
déf : Erreur d’échantillonnage
Chercheur “tire” un échantillon non-représentatif (différent) de la population
De quoi faut-il tenir compte dans l’interprétation des tests statistiques (4)?
- Types de tests (qui dépend de bien d’autres choses)
- Importance des résultats
- Précision des résultats estimés
- Puissance des tests stat
déf : Statistiques descriptives + 2 types
Présentent les caractéristiques et synthétisent les données. Permettent de visualiser le comportement des variables et choisir les tests stat appropriés.
- Mesures de tendance centrale, Mesures de dispersion
Quelles sont les 3 mesures de tendance centrale + expliquez chacune
Moyenne : Somme des résultats/Nb de sujets
Médiane : Ordonner toutes les variables, c’est celle qui est au centre
Mode : Valeur la + fréquente
Quelles sont les mesures de dispersion?
Variance/Écart-type : Dispersion des valeurs autour de la moyenne Étendue : Valeur max - min Intervalle interquartile (Q) : Différence entre le 75c et le 25c (séparation à chq quart, donc à 25%, 50% et 75% : même concept que la médiane, 50c)
Dans cette série de chiffre, quel est
10, 12, 14, 16, 17, 20, 22
a) Moyenne
b) Médiane
c) Mode
d) Étendue
e) Intervalle interquartile (Q)?
a) (10+12+14+16+17+20+22)/7 = (111)/7 = 15.86
b) Méd = 16
c) Il n’y en a pas
d) Étendue = (22-10) = 12
e) Q = (20-12) = 8
(oui, j’ai laissé faire variance et écart-type, elle demandera pas à l’exam, c’est trop des gros calculs)
V/F : L’étude graphique est intéressante pour représenter la distribution d’un échantillon, mais n’est généralement pas présente dans une étude
Vrai, les auteurs manquent souvent d’espace
déf : distribution normale
Moyenne, Mode, Médiane sont équivalentes, donc données symétriquement disposées autour de la moyenne, en forme de cloche inversée
Quels sont les 2 principaux coefficients qui modifient la courbe normale?
Aplatissement, Asymétrie
V/F : La distribution d’un échantillon détermine le type d’analyses stat qui pourront être faites
Vrai
Si la distribution ressemble à un distribution normale, quel type de test sera utilisé? Que fera-t-il si elle ne ressemble pas?
Paramétrique
Tenter de la normaliser avec des équations, pour pouvoir utiliser les tests paramétriques
À quoi sert la loi normale?
Déterminer la probabilité d’obtenir un score dans un échantillon, si la moyenne et l’écart-type sont connus
Si les données se conforment à la distribution (loi) normale, on peut prédire le pourcentage de scores dans un écart défini :
a) + ou - 1 écart-type autour de la moyenne
b) + ou - 2 écart-type autour de la moyenne
c) + ou - 3 écart-type autour de la moyenne
a) 68% des scores
b) 95% des scores
c) 99% des scores
(je ne crois pas qu’elle demanderait ça, mais bon…)
Pourquoi ne peut-on pas, la plupart du temps, se fier aux % de la loi normale dans une étude de type ECR?
On n’a pas la moyenne et l’écart-type des scores de la population entière
De quoi peut-on se servir dans ce cas (ECR) si on souhaite utiliser la loi normale? La distribution d’___ de ___
Distribution d’échantillonnage de moyenne, un concept stat dérivé de la loi normale (permet d’appliquer certains tests statistiques pour comparer l’échantillon)
déf : Distribution d’échantillonnage de moyenne
Distribution des moyennes de tous les échantillons possibles de même taille pouvant être formés à partir de la pop complète (valeur vers laquelle tendent les moyennes des échantillons = moyenne de la pop, théoriquement). C’est ce qui fait qu’on peut considérer la moyenne de l’échantillon comme représentative/bon estimateur de celle de la population
Que nous permet donc de faire le concept de distribution d’échantillonnage de moyenne?
Comparer les moyennes de 2 échantillons, et vérifier avec un test statistique si les groupes sont significativement différents
(je crois que c’est pcq ils sont supposés être assez proche de la moyenne de la pop, puisqu’ils proviennent de celle-ci, s’ils ne le sont pas, c’est que le tx a eu un effet)
déf : erreur-type
Estimation de l’écart-type de la population, à partir de l’échantillon (écart-type et taille échantillon)
De quoi dépend l’erreur-type?
Taille de l’échantillon (inversement proportionnelle)
déf : Inférence statistique
Induire les caractéristiques inconnues d’une population à partir d’un échantillon tiré de celle-ci
Quelles sont les 2 hypothèses possibles en statistique?
H0 : hypothèse nulle (moyennes des 2 groupes sont égales)
H1 : Hypothèse alternative (moyennes des 2 groupes sont différentes)
déf : Valeur p
Probabilité d’obtenir un résultat aussi ou + petit/grand/extrême si H0 est vrai (moyennes des groupes pareilles)
a) déf : Seuil de signification (significance level)
b) Généralement, quel est le seuil utilisé par les chercheurs?
c) Que signifie p < 0,03 ?
a) Seuil (choisi par les auteurs, donc arbitraire) à partir duquel on considère que les groupes sont statistiquement différents. Si p est + petit que lui, les groupes sont différents.
b) 5%, mais parfois on utilise 1%
c) Cela signifie qu’il y a moins de 3% de chance que le résultats soit bel et bien non-significatif
Dans un graphique, qu’est-ce que la zone alpha α=5%?
Zone à l’extrémité du graphique. Les valeurs dans cette zone ont moins de 5% de chance d’arriver.
Un changement statistiquement significatif est-il nécessairement cliniquement important?
Non, c’est 2 concepts différents
déf : Puissance stat
Probabilité qu’un test stat détecte la différence entre 2 groupes s’il y en a véritablement une
Nommez les 3 items qui influencent la puissance statistique
- Écart entre les moyennes
- Chevauchement entre les distributions (donc variabilité de chacune)
- Taille de l’échantillon
Qu’est-ce qu’un faux négatif, dans le cadre d’un test stat?
Une différence significative n’a pas été détectée
a) Quel est le “seuil” minimal qui constitue une puissance stat acceptable?
b) Que signifie ce chiffre?
a) 80%
b) Il y a 20% d’avoir une erreur de type 2 (faux négatif)
Lequel des 3 items qui influencent la puissance statistique est le + facile à modifier pour un chercheur? Que devrait-il faire pour s’assurer que ce facteur ne soit pas un problème?
- La taille de l’échantillon
- Calcul de la taille d’échantillon nécessaire pour avoir une puissance supérieure à 80%
(Nb de sujets = Taille d’échantillon calculée + prendre en compte la mortalité expérimentale)
a) Qu’est-ce que l’intervalle de confiance (p.ex. IC 95%)?
b) De quoi dépend-il?
- Il y a 95% (pourrait être un autre pourcentage, p.ex. IC 99%) de chance que la vraie moyenne de la population se retrouve entre la valeur x et la valeur y. Donc, si je tire un nouvel échantillon, il devrait être dans cet intervalle
- Moyenne, Écart-type, Taille de l’échantillon
Comment détermine-t-on si 2 échantillons sont statistiquement différents avec l’IC?
Si les IC ne se chevauchent pas, on considère qu’ils sont statistiquement différents, puisqu’ils ne proviennent pas de la même population
En quoi est-ce que l’IC permet d’apprécier la précision des estimations tirées de l’échantillon?
Plus l’IC est petit, plus on est certain que la vraie valeur de la population est proche de l’estimation
V/F : Il n’est pas obligatoire que les valeurs aient une distribution normale pour utiliser des tests stat param
Faux