Statistiques Inférentielles Flashcards
Correlation & régression, T-test & ANOVA
À quoi sert la statistique inférentielle?
pour faire des déductions ou tirer des conclusions sur une population en se basant sur un échantillon de données
Quelles sont les deux branches de la statistique inférentielle?
- Paramétrique
- Non-paramétrique
À quoi sert une statistique paramétrique?
Elles sont utilisées pour estimer les paramètres de la populaiton et tester des hypothèses en tenant compte des postulats sur la distribution des variables
Quels sont les 4 postulats des tests paramétriques?
- les variables sont normalement distribuées dans la pop (distribution normale)
- Possibilité de calculer la variance
- données continues
- Les variables sont à échelle d’intervalle ou de ratio
À quoi sert une statistique non-paramétrique?
Est utilisée quand la distribution des données ne repose pas sur des postulats de normalité:
- variables continues, mais n< 30
- Variables ordinales
- variables nominales
Qu’est-ce que la distribution normale (gaussienne) ?
- C’est la plus importante distribution en biostatistique
- Elle dépend de 2 paramètres: la moynne (µ) et l’écart type (σ) : N(µ,σ)
> le graph a une forme de cloche, symétrique
moyenne = Médiane
µ +- 2σ = 95,5%de la pop
Pour quelle genre de mesure on utilise des stats inférentielles?
Mesure d’association:
- Examiner la relation proposée entre 2 variables
Mesure de prédiction:
- Utiliser une variable indépendante pour prédire une variable dépendante
Mesure de différences des moyennes
- déterminer des différences entre les groupes expérimentals et contrôle
Probabilité et signification :
Qu’est-ce qu’un test d’hypothèse?
Procédure d’inférence statistique qui vise, par la réfutation de l’H0, à rendre l’H1 probable
Quelle hypothèse fait l’objet d’une vérification statistique?
l’hypothèse nulle (L’H0)
Qu’est-ce que l’Erreur de type 1?
Rejette l’hypothèse nulle alors qu’il est plus probable qu’elle soit vraie, que le seuil requis
Qu’est-ce que l’Erreur de type 2?
Que l’on accepte l’hypothèse nulle alors qu’elle est fausse
- ex: un test de grossesse vous indique ne pas être enceinte alors que vous l’êtes
Quel est le seuil de certitude conventionnel?
95% de Interval de confiance
À quoi correspond alpha (α) ?
α = niveau de signification déterminé avant de procéder à un test d’hypothèse
Qu’est-ce que un test statisitque unilatéral (one tailed) vs bilatéral (two-tailed) ?
Test Unilatéral (One-tailed):
- Teste une hypothèse dans une seule direction (ex. : si une moyenne est supérieure OU inférieure à une valeur spécifique).
- Utilisé lorsqu’on a une hypothèse précise sur la direction de l’effet.
- Exemple : Tester si un médicament augmente la performance par rapport à un placebo (sans considérer une baisse potentielle).
Test Bilatéral (Two-tailed):
- Teste une hypothèse dans les deux directions (ex. : si une moyenne est différente, supérieure ou inférieure à une valeur spécifique).
- Utilisé lorsque l’on s’intéresse à tout écart significatif (dans un sens ou l’autre).
- Exemple : Tester si un médicament a un effet différent (positif ou négatif) par rapport à un placebo.
Qu’est-ce qu’une statistique bivariée vs univariée
Univariée:
- les mesures de tendance centrale et de variabilité décrivent les caractéristique des variables, une variable à la fois
Bivariée:
- Décrire une caractéristique d’une variable par rapprot à une autre variable.
Quelles sont les 2 types de corrélations?
Pearson (paramétrique)
Spearman (non-paramétrique)
Qu’est-ce que des coefficients de corrélation?
C’est la valeur numérique, de la mesure statistique d’une relation de correlation
- s’exprime ainsi: (r)
Qu’elle est la distinction importante entre la causalité et la corrélation?
La corrélation ne signifie pas l’existence d’une relation causale (causalité) entre 2 variables
- la corrélation quanitifie le degré auquel les changements dans une variable semblent liés aux changement dans une autre variable
Quelles conditions devons-nous remplir pour établir une inférence causale?
- l’ordre chronologique approprié doit être établi (Si A cause B, A doit se produire avant B)
- Il ne doit pas y avoir de variables de confusion ou extrinsèques. Il ne doit pas y avoir d’autres explications alternatives. (Portes arrières)
Qu’est-ce que le coefficient de corrélation de Pearson?
Désiginé par ρ (rho) pour la pop et r dans l’échantillon
- Indicateur numérique de la relation linéaire entre deux variables
- À mesure qu’une variable augmente ou diminue l’autre augmente ou diminue de manière directement proportionnelle.
Quelles sont les particularités du coefficient de corrélation de Pearson?
Direction:
- “+” indique une relation “positive”
- “-“ indique une relation négative
Range:
- -1.0 < r < 1.0
Intensité (force) :
- 0.0 < |r| < 0.2 Relation faible
- 0.2 < |r| < 0.4 Relation modérée
- 0.4 < |r| < 0.6 Relation forte
- 0.6 < |r| < 1.0 Relation très forte
Distinction entre corrélation et régression?
-
Corrélation : Utilisée pour examiner des associations ou relations générales entre deux variables.
- Exemples : Relation entre taille et poids, confiance et performance, estime de soi et dépression.
-
Régression : Utilisée pour déterminer si une ou plusieurs variables prédisent un résultat spécifique et quel prédicteur est le plus fort.
- Exemple : La fréquence des exercices, l’estime de soi et la dépression prédisent-elles la tension artérielle ?
Qu’est-ce que l’analyse de régression?
Sert à caractériser le modèle de relation entre la ou les variables indépendantes et la variable dépendante
- Fait usage de la corrélation entre les variables et la notion d’une ligne droite pour formuler une équation de prédiction
- L’équation permettra de prédire la valeur d’une des variables en fonction de la valeur de l’autre (ou des autres) variable(s).
Explique moi la régression linéaire simple.
Elle cherche une relation linéaire entre les variables (2)
Y = aX + b
- Y: la variable dépendante
(valeur prédite) - X: la variable indépendante
- a: le point d’intersection de la
ligne droite avec l’axe des Y - b: le pente de la ligne droite,
appelée (coefficient de
régression)