Analyses Statistques Flashcards
Statistiques Inférentielle
Est utilisée pour faire des déductions ou tirer des conclusions sur une population en se basant sur un échantillon de données.
Quelles sont les deux branches de la statistique Inférentielle?
- Paramétrique
- Non-paramétrique
Statistique Paramètre
Elles sont utilisés pour estimer les paramètres de la population et tester des hypothèses en tenant compte des postulates sur la distribution des variables
Des test paramétriques reposent sur 4 postulats
- Les variables sont normalement distribuées dans la population
- Possibilité de calculer la variance
- Données continues
- Les variables sont à échelle d’intervalle ou de ratio
Statistique Non Paramétrique
Elle est utilisée quand la distribution des données ne repose pas sur des postulats de normalité:
- Variables continues, mais petit échantillon
- Variables ordinales
- Variables nominales
Distribution Normale (Ou Gaussienne)
C’est la plus importante distribution en biostatistiques
Elle dépend de deux paramètres: la moyenne ų et l’écart type õ: N(ų,õ)
Le graphe a la forme d’une cloche
Celle-ci est symétrique
La médiane = la moyenne
Utilisations Des Stats Inférentielles - Mesure d’association
Mesuré d’association: examiner la relation proposée entre 2 variables
Utilisations Des Stats Inférentielles - Mesure de prédiction
Mesure de prédiction: Utiliser une variable indépendante pour prédire une variable dépendante
Utilisations Des Stats Inférentielles - Mesure de différences de moyennes
Mesure de différences de moyennes: déterminer des différences entre les groupes expérimental et de contrôle
Hypothèse Nulle (Ho)
La relation ou la différence n’existe pas
- Conclusion: pas de relation/pas de différence (Décision Correcte)
- Conclusion: il y a une relation/difference (Erreur de Type 1) *Faux Positif
Hypothèse Alternative (H1)
Une relation ou une différence
- Conclusion: pas de relation/pas de différence (Erreur de Type 2) *Faux négatif
- Conclusion: il y a une relation/difference (Décision Correcte)
Test bilatéral
(À deux queues)
Exist-t-il une relation significative?
- En forme de question
Test unilatéral
(À une queue)
Existe-t-il un type spécifique de relation?
One has a correlation with another
Mesure D’association ou Corrélation
Statistiques bivariées
Deux types de corrélations: Pearson (paramètre) et Spearman (non-paramétrique)
Les Coefficients De Corrélation
La corrélation est un type de relation qui, mesurée statistiquement, produit une valeur numérique: le coefficient de corrélation (r)
Causalité et Corrélation
La corrélation ne signifie pas l’existence d’une relation causale entre deux variables
- La corrélation quantifié le dégrées auquel les changements dans une variable sont liés aux changement dans une autre variable
- Dans de nombreux cas, deux variables sont corrélés car elles sont toute deux corrélés avec une troisième variable
Quelles conditions devons-nous remplir pour établir une inférence causale?
- L’ordre chronologique approprié doit être établi. Si À cause B, À doit se produire avant B
- Il ne doit pas y avoir de variables de confusion ou extrinsèques. Il ne doit pas y avoir d’autres explications alternatives.
Coefficient de corrélation de Pearson
Désigné par p ( rho) dans la population, et r dans l’échantillon
Indicateur numérique de la relation linéaire entre deux variables
Les Mesures de Prédiction
L’analyse de régression: sert à caractériser le modèle de relation entre la ou les variables indépendantes et la variable dépendante
- Variable indépendante
- Variable dépendante
Variable Indépendante
Variable que le chercheur manipule ou modifie intentionnellement dans l’expérimentation
OU celle qui est explicative dans une étude d’observation
Variable Dépendante
Variable qui tend à changer en fonction de la variable indépendante
OU la variable qu’on souhaite prédire dans une association
L’analyse De Régression
Fait usage de la corrélation entre les variables et de la notion d’une ligne droite pour formuler une équation de prédiction.
L’équation permettra de prédire la valeur d’une des variables en fonction de la valeur de l’autre variables.
La Régression Multiple
Analyse statistique multivariée servant à établir la relation prédictive (Y) et un ensemble de variables indépendantes.
Donne une équation de régression qui permet de prédire la valeur de la variable dépendante quand les variables indépendantes sont connues (modèle prédictif).
Le coefficient de régression multiple au carré (R^2) indique la proportion de la variance de la variable dépendante (Y) qui est expliqué par un groupe de variables indépendantes.
La Régression Linéaire Simple
Elle recherche une relation linéaire entre les variables
Y= a+bx
Y: la variable dépendante (valeur prédite)
X: la variable indépendante
a: le point d’intersection de la ligne droite avec l’axe des Y
b: le pente de la ligne droite, appelée (coefficient de régression)