7_8_Analyse statistiques (inférentielles) Flashcards
Statistiques paramétriques
Pour estimation des paramètres de la pop
Pour vérifier hypothèses
Tient compte des postulats sur la distribution normale des variances
Postulats:
• Possibilité de calculer la variance
• Données continues
• Grands échantillons
Statistiques non paramétriques
Pour données nominales et ordinales
Distribution normale ne repose pas sur des postulats rigoureux
• Variables continues, mais petit échantillon (n<30)
• Variables ordinales
• Variables nominales
Arbre décisionnel
Voir arbre…
Utilisation des statistiques inférentielles
Mesures d’association, de prédiction, des moyennes
Mesures d’association
Examiner la relation proposée entre 2 variables
Les coefficients de corrélation : Pearson et Spearman
Test de coefficient de corrélations
Les coefficients de corrélation
La corrélation est un type de relation qui, mesurée statistiquement, produit une valeur numérique, le coefficient de corrélation (r)
* r compris entre -1 et 1
Pearson :
Test paramétriques pour vérifier s’il existe une association entre 2 variables continues (si les variables sont corrélées)
Relation linéaire
Spearman :
Variables non continues
Relation non linéaire
Test de coefficient de corrélations
• Donnent un p, montrant si la relation est significative
• Donnent un indice numérique du sens et de la force de la relation entre 2 variables
• Sens (relation positive ou négative)
• Force:
Plus r se rapproche de 1 (-1), plus la relation est forte
Règle générale
Corrélation forte, faible, modérée
Mesure de prédiction
Prédire l’issue d’une variable dépendante
L’analyse de régression:
Sert à caractériser le modèle de relation entre la ou les variables indépendantes et la variable dépendante
Variable indépendante:
• variable qui est fixe dans l’expérimentation
• OU celle qui est explicative dans une étude d’observation
Variable dépendante:
• variable qui tend à changer en fonction de la variable indépendante
• OU la variable qu’on souhaite prédire dans une association
Types de test de régression (mesure de prédiction)
Régression linéaire simple
Régression multiple
Régression linéaire simple
Prédit valeur VD en se fondant sur valeur d’une VI
Y = aX + b
Y: VD (valeur prédite)
X: VI
b: le point d’intersection de la droite avec l’axe des Y
a: le pente de la droite, appelée (coefficient de régression)
VI : continues
VD : continue
Régression multiple (mesure de prédiction)
Prédit valeur VD d’après valeurs de plusieurs VI
Extension de l’analyse de régression linéaire
Le coefficient de régression multiple au carré (R2) = proportion variance de VD (Y) qui est expliquée par un groupe de VI
VI : nominales ou continues
VD : continue
Analyse de régression
Corrélation entre les variables = ligne droite = équation de prédiction = valeur d’une des variables en fonction de la valeur de l’autre (ou des autres) variable(s)
Mesure de différences des moyennes
Déterminer des différences entre les groupes expérimentaux et contrôle
Paramétriques:
t-test (pairé et indépendant) : différence entre 2 groupes
Analyse de variance ANOVA : différence entre 3+ groupes
Non paramétriques:
Khi-carré (x2)
Khi-carré indépendant (x2)
voir notes…
Khi-carré apparié de Mc Nemar (x2)
voir notes…