COURS 6- Comparaison de moyenne et de pourcentage Flashcards
Qu’est-ce que la signification statistique?
Signification statistique: probabilité de trouver une relation dans un échantillon alors qu’il n’y a pas de relation dans la population.
Quelle est l’hypothèse nulle?
Hypothèse nulle: affirmation qu’il n’y a pas d’association statistique dans la population.
Si les deux variables ne sont pas liées dans la population, quelles sont les chances que les deux variables soient significativement reliées
Quel est le seuil, la marge d’erreur en statistique?
Seuil: généralement c’est 0,05 (5% des chances, 1 chance sur 20,)
Si la probabilité de trouver une relation auprès d’un échantillon alors qu’il n’y a pas de relation dans la population est supérieure à 0,05: on ne rejette pas l’hypothèse nulle, on considère que la relation dans l’échantillon n’est pas statistiquement significative et on ne peut pas conclure qu’une relation existe probablement dans la population.
Si la probabilité de trouver une relation auprès d’un échantillon alors qu’il n’y a pas de relation dans la population est inférieure à 0,05: on rejette l’hypothèse nulle, on considère que la relation dans l’échantillon est statistiquement significative et on conclut qu’une relation existe probablement dans la population.
Comment appliquer le chi-carré?
Plus la valeur du chi-carré est élevée, plus il y a de chance qu’il y ai une relation significative
Si le chi-carré est au-delà de 3,84
-La probabilité de trouver une relation auprès d’un échantillon alors qu’il n’y a pas de relation dans la population est inférieure à 0,05
- On rejette l’hypothèse nulle et on considère que la relation dans l’échantillon est statistiquement significative
- On conclut qu’une relation existe probablement dans la population (99%)
Si le chi-carré est en deçà de 3,84
-La probabilité de trouver une relation auprès d’un échantillon alors qu’il n’y a pas de relation dans la population est supérieure à 0,05
- On ne rejette pas l’hypothèse nulle
- On considère que la relation dans l’échantillon n’est pas statistiquement significative
- On ne peut pas conclure qu’une relation existe probablement dans la population
Comment analyser l’association statistique entre des variables nominales?
Avec une variable nominale (ex : Genre), on ne peut pas nécessairement la comparer à une autre. On utilise donc des catégories de références (ex : Femmes ou Hommes)
- La différence des deux moyennes démontre une relation statistique entre deux variables
- Une différence de 0 voudrait dire que la différence est nulle et qu’il n’y a pas de relation statistique
- La différence peut être négative ou positive et montre la direction de la relation
Quels sont les fondements du test de différence de moyennes?
Tous les échantillons possibles
Distribution d’échantillonnage des différences de moyennes
Approximativement normale si n > 50
Presque normale si n > 120
La moyenne de la distribution d’échantillonnage sera identique à la différence de la population
S’il est relativement probable (plus de 1 sur 20) de tomber sur une telle différence dans un échantillon alors qu’elle n’existe pas dans la population, on ne rejette pas l’hypothèse nulle, donc on ne peut conclure qu’il y a une différence dans la population.
S’il est relativement improbable (moins de 1 sur 20) de tomber sur une telle différence dans un échantillon alors qu’elle n’existe pas dans la population, on rejette l’hypothèse nulle, donc on conclut qu’il y a probablement une différence dans la population
Qu’est-ce que le test de différence de moyenne?
Technique pour évaluer la signification statistique d’une différence entre les moyennes de deux sous-groupes.
S’applique aux situations où il y a une variable indépendante dichotomique et une variable dépendante d’intervalles/ratio
Comment interpréter le test de différence de moyenne (t)?
Normalement (voir Fox et Imbeau), il faut ensuite prendre le t, calculer le nombre de degrés de liberté et aller consulter une table pour savoir si le t est plus grand qu’une valeur donnée qui varie selon le degré de liberté et le seuil souhaité.
On peut se simplifier la vie, puisque notre seuil sera toujours 0,05 (1 sur 20, 5%) et que nos échantillons seront toujours près du degré de liberté infini (n > 120).
On n’a qu’à se poser la question:
Est-ce que la valeur absolue du t est supérieure à 1,96?
Si oui, la différence de l’échantillon est statistiquement significative, on rejette l’hypothèse nulle, et on conclut qu’une différence existe probablement dans la population.
Si non, la différence de l’échantillon n’est pas statistiquement significative, on ne rejette pas l’hypothèse nulle, et on ne pas peut conclure qu’une différence existe probablement dans la population.
Qu’est-ce qui fait varier les moyennes?
La différence entre les moyennes
La taille de l’échantillon
Les écart-types des échantillons
À quoi faut-il faire attention avec le résultat du test t?
Si la différence dans un échantillon est statistiquement significative, cela ne veut pas dire qu’exactement la même différence existe probablement dans la population.
On peut seulement conclure que la différence dans la population n’est probablement pas nulle, qu’elle est probablement dans la même direction que celle de l’échantillon.
Lorsque l’on parle de différence de moyennes, on parle tout de même de relation ou d’association entre variables.
Mais on ne peut pas quantifier la force de cette association. On ne peut qu’identifier sa direction (en référence à une des catégorie de la variable indépendante lorsque celle-ci est nominale).
Par ailleurs, il ne faut jamais confondre association statistique et relation causale.