Cours 3 Flashcards
Dans un type de variable quatitative si les données sont normalement distribués comment est la description de l’échantillon?
Distribué selon la loi de la normale
- Moyenne
- Écart-type
Dans un type de variable quantitative si les données NE sont PAS normalement distribués comment est la description de l’échantillon?
Distribué selon la loi de la normale
- Médiane
- Quartile
Dans un type de variable qualitative si les données sont normalement distribués comment est la description de l’échantillon?
ou le nb des observations est plus grand ou égal à 5
Pourcentage
Dans un type de variable qualitative si les données NE sont PAS normalement distribués comment est la description de l’échantillon?
Ou le nb des observations est plus petit que 5
Pourcentage
À quoi servent les stats interférentielles
Prendre des décisions concernant l’application ou la généralisation d’un
constat à l’ensemble de la population.
* C’est un outil d’aide à la décision
* Permet de répondre aux hypothèses de recherche
* Permet d’induire les résultats d’un échantillon à une population
Autres rôles des stats interférentielle
- Permettent de tester des hypothèses sur la relation entre les variables et de porter un jugement en s’appuyant sur des techniques statistiques
- Déterminent si une différence est présente ou absente a/n stats
Qu’est-ce que ça veut dire une différence présente a/n stats
Statistiquement significative
Qu’est-ce que ça veut dire une différence abscente a/n stats
Non statistiquement significative = résultat de fluctuations aléatoires = due à la chance
Qu’est-ce qu’une hypothèse nulle
Pas de changement suite à l’intervention, souvent il va avoir une petite différence, mais ce n’est pas assez marquant pour qu’on puisse dire a/n statistique que c’est le tx qui a fait le changement.
Qu’est-ce que le test d’hypothèse stats
Démarche permettant d’accepter ou rejeter l’hypothèse nulle
Qu’est-ce que ça veut dire accepter l’hyposthèse nulle
Petite différence entre les résultats observés et les résultats attendus
Qu’est-ce que ça veut dire rejeter l’hyposthèse nulle
Grande différence entre les résultats observés et les résultats attendus
V ou F: Les statistiques sont basées sur l’hypothèse nulle, ça nous permet d’apprécier si la différence entre 2 groupes est cliniquement significative
Vrai
Qu’est-ce qu’on utilise pour tester des hypothèses
- Des tests d’hypothèse statistiques qui s’appuient sur des
lois de distribution de probabilités - Des calculs d’intervalles de confiance
Qu’est-ce que la valeur P
- Issue des résultats des statistiques inférentielles
- Nous permet d’interpréter si c’est statiquement significatif ou non
Pourquoi l’interprétation de la valeur P est-elle importante
- Détecter la présence ou non d’une différence significative entre les groupes
- Accepter ou rejeter une hypothèse nulle
V ou F: Plus la valeur de α (pourcentage de la valeur P) est petite, plus les évidences sont fortes pour montrer que les résultats ne sont pas attribués à la chance
Vrai
V ou F: Un résultat statistiquement significatif indique que la différence observée est le résultat de fluctuations
aléatoires
Faux, la différence observée N’est PAS le résultat de fluctuations aléatoires
La différence statistiquement significative est conclue à partir de quoi
Des résultats des tests statistiques à de la valeur de p
La différence cliniquement significative dépend de quoi?
De l’outil clinique utilisé score de différence minimale cliniquement pertinente (MCID)
V ou F: Une différence statistiquement significative n’implique pas nécessairement une différence cliniquement significative
Vrai
Qu’est-ce que le score de différence minimale cliniquement pertinente (MCID)
Une valeur qui permet au clinicien de conclure une différence clinique importante
Le choix d’un test statistique inférentiel est utile pour..?
• Examiner des mesures d’association entre variables (corrélation)
• Examiner des mesures de prediction entre variables (régression)
• Examiner des differences entre des groupes (mesures de differences de moyennes, proportion)
Pour verifier empiriquement les hypothèses et pouvoir dire si oui ou non, notre résultat est statistiquement significatif, nous devons faire appel à quoi?
• La valeur-p
• L’intervalle de confiance
V ou F: La valeur-p N’est PAS souvent directement issue des résultats des statistiques inférentielles
Faux
L’interprétation de la valeur P est importante pour quoi?
- Détecter la présence ou non d’une différence significative entre les groupes
- Accepter ou rejeter une hypothèse nulle
Qu’est-ce qu’une erreur de type I
Rejet de l’hypothèse nulle alors qu’elle est vraie
Qu’est-ce qu’une erreur de type II
Accepte l’hypothèse nulle lorsqu’elle est fausse
V ou F: Plus alpha est petit, plus l’erreur de type I est réduite
Vrai
Un résultat statistiquement significatif indique quoi?
Cela indique que la différence observée n’est pas le résultat de fluctuations
aléatoires
Qu’est-ce que l’intervalle de confiance?
- Représente la marge d’erreur ou la précision des résultats de l’étude
- Est l’intervalle qui devrait contenir, avec un certain degré d’incertitude, la vraie valeur
Qu’est-ce que la valeur nulle
0
V ou F: Si la valeur nulle est dans l’IC à 95% d’une mesure, cette mesure est statistiquement significative
Faux, si la valeur nulle N’est PAS dans l’IC à 95% d’une mesure, cette mesure est statistiquement significative
D’une manière générale, le taux de signification est de..?
5%
V ou F: Si l’écart-type est plus étroit et/ou plus il y a de participant dans une étude –> plus l’intervalle de confiance est étroit
Vrai
Quelles sont les caractéristiques de stats paramétriques
- Les variables sont normalement distribuées dans la population
- L’échantillon provient d’une population dont il est possible de calculer la variance
- Les variables sont à échelle d’intervalle ou de proportion/ratio
Quelles sont les caractéristiques de stats non- paramétriques
- Les variables ne sont pas normalement distribuées (distribution asymétrique)
- Convient aux échantillons de petites tailles
- Conviennent aux données nominales et ordinales (qualitatives)
Qu’est-ce que la mesure d’association?
Mesure statistique exprimée par un coefficient de corrélation : positif, négatif ou nul (entre 0.00 et ±1.00)
Qu’est-ce que la mesure d’association indique?
La présence de relation entre deux variables. La force et la direction du lien entre ces deux variables.
Comment est-ce que la mesure d’association est-elle représentée?
Représentée par un diagramme de dispersion:
* Pearson: pour variables normalement distribuées
* Spearman: pour variables qui suivent une distribution normale ou pas
Comment choisir le coefficient de corrélation?
Lorsque la corrélation est positive, que se passe-t-il?
Le coefficient r varie entre 0 et 1
* Lorsque les valeurs de x augmentent, les valeurs de y augmentent
Lorsque la corrélation est négative, que se passe-t-il?
Le coefficient r varie entre -1 et 0
* Lorsque les valeurs de x augmentent, les valeurs de y diminuent
Lorsque la corrélation est nulle, que se passe-t-il?
Coefficient de corrélation r = 0
* Aucune association entre la valeur des x et celle des y, les points du diagramme de dispersion vont dans tous les sens
Une corrélation est faible lorsque le coefficient varie entre?
│0,3│ ≤ r < │0,5│
Une corrélation est modérée lorsque le coefficient varie entre?
│0,5│ ≤ r < │0,7│
Une corrélation est forte lorsque le coefficient varie entre?
│0,7│ ≤ r < │1│
V ou F: Il N’est PAS nécessaire d’effectuer un ou plusieurs autres tests statistiques pour tester notre hypothèse, ce qui nous permettra de générer une valeur de p ou un intervalle de confiance.
Faux, il EST nécessaire […]
Regarde comment ça peut être écris
L’étude de corrélation indique quoi?
- Indique le lien entre deux variables ou leur influence mutuelle
N’indique pas nécessairement une relation de cause à effet
Quel est l’objectif de la régression?
Établir une prédiction basée sur une corrélation
(cause à effet entre les variables).
Que fait la méthode d’analyse de régression?
Examine la relation prédictive entre une variable dépendante et une ou plusieurs variables indépendantes.
Qu’est-ce que la variable dépendante dans l’étude de régression?
Variable prédite ou à expliquer (Y)
Qu’est-ce que la variable indépendante dans l’étude de régression?
Variable explicative (X)
Quel est l’objectif de la régression linéaire simple
Prédire la valeur d’une variable dépendante en se basant sur la valeur d’une variable indépendante
Type de variable:
Variable Indépendante (X): continue ou autre niveaux de mesures
Variable Dépendante (Y): continue
Quel est l’objectif de la régression multiple
Prédire la valeur d’une variable dépendante en se basant sur plusieurs variables indépendantes.
Type de variable:
Variables Indépendantes (X): nominales ou continues
Variable Dépendante (Y): continue
Quel est l’objectif de la régression logistique
Vérifier l’effet d’une ou de plusieurs variables indépendantes sur une variable dépendante dichotomique.
Type de variable:
Variables Indépendantes (X): nominales ou continues
Variable Dépendante (Y): nominale (dichotomique)
La régression linéaire est représentée par quoi?
Elle est représentée par un diagramme de dispersion. Toutefois, à la différence de la corrélation, une droite y sera tracée
(Permet d’obtenir une formule ou un modèle)
La formule de droite permet de répondre à quoi?
Des questions et de prédire des phénomènes
La droite représente quoi?
L’effet de la variable indépendante (x) sur la variable dépendante (y).
La formule de la droite est:
y= b0 + b1x
Si b1 = 0
Aucun lien entre x et y
Si b1 est positif
quand x augmente, y augmente
Si b1 est négatif
Quand x augmente, y diminue
V ou F: L’inférence peut porter sur l’origine ou la pente de la droite de régression (souvent plus sur la pente que sur l’origine)
Vrai
La valeur-p issue d’un test statistique sur la pente permettra de vérifier quoi?
Si le coefficient de régression est significativement différent de 0.
L’intervalle de confiance issue d’un test statistique sur la pente permettra de calculer quoi?
Un intervalle de prédiction de notre variable.
La régression linéaire multiple permet quoi?
La vérification simultanée des relations entre les variables indépendantes (X) (prédictives) et la variable dépendante (Y).
Quelle est la formule de la régression linéaire multiple
La formule est: y= b0 + b1x1 + b2x2 + …
Quelle est le but de la régression linéaire multiple
Examiner l’effet de plus d’un facteur sur un résultat anticipé
La régression logistique permet quoi?
Permet de prédire la probabilité qu’un évènement ou un résultat survienne.
Regarde (IMPORTANT)