Cours 7 : l'inférence statistique Flashcards
Quelles sont les conditions nécessaires ?
- Séquence temporelle - la cause doit précéder l’effet
(X cause Y) - Association entre X et Y; X et Y sont présents
- La relation persiste même si on inclut d’autres variables (influence de variables tierces?)
- Les deux concepts (cause et effet) doivent être
conceptuellement distincts - Il existe une interprétation possible de la relation
Quels sont les 2 buts des types d’analyse statistiques ?
- Connaître l’association entre deux variables
* Le contrôle social informel est-il associé au nombre de crimes commis dans un quartier? - Connaître les différences de groupes pour une même
variable
* Existe-t-il une différence au niveau du nombre de crimes commis selon le statut d’emploi (emploi/sans emploi) ?
Quels sont les deux types d’hypothèses et leur caractéristiques ?
- Non directionnelle (aucune mention du sens de la relation entre les deux variables/des différences existantes )
- Afin d’accepter l’hypothèse de recherche, il doit exister une relation significative, peu importe le sens de cette relation
- Ex. Le contrôle social informel est associé au nombre de crimes commis dans un quartier - Directionnelle ( Le sens de la relation/les différences
existantes sont mentionnées)
- Afin d’accepter l’hypothèse de recherche, le sens de la
relation doit aussi s’avérer juste
- Ex. Un niveau de contrôle social informel faible est associé à un plus grand nombre de crimes commis
Quelles sont les différences entre une hypothèse de recherche et une hypothèse nulle ?
- Hypothèse de recherche (H1): présence d’une association/relation entre VI et VD
* Il existe une différence au niveau du nombre de crimes commis selon le statut d’emploi (emploi vs sans emploi) - Hypothèse nulle (H0): l’inverse de H1; aucune
association/relation entre VI et VD
* Il n’existe pas de différence au niveau du nombre de crimes commis selon le statut d’emploi (emploi vs sans emploi)
Le retour au hypothèse
- Important de toujours revenir à l’hypothèse nulle
- Procédures statistiques ne permettent pas d’accepter H1…
- Rejet de H0 (relation statistiquement significative) H1 est nécessairement vraie
- Non-rejet de H0 (≠ de relation significative)
- Ne veut pas forcément dire que H1 est fausse…
Limites (fluctuation des échantillons)
- Problème fondamental
- La plupart des études sont basées sur des échantillons
- Les statistiques obtenues à partir des échantillons peuvent varier d’une étude à l’autre
- = estimation de la population/probabilités
- Importance de reproduire les études
- Divergences entre les statistiques émanant de la population et des échantillons
Qu’est-ce que l’inférence statistique ?
- Consiste à induire les caractéristiques inconnues d’une
population à partir d’un échantillon issu de cette population - Généralisation
- Basée sur des analyses statistiques; méthode permettant de tirer des conclusions fiables sur la population, à partir de données obtenues pour l’échantillon (généralisation des résultats)
- Permet de minimiser les probabilités de tirer de fausses conclusions quant aux paramètres de la population
- Puisque nous inférons les données de notre population à partir d’un échantillon (aléatoire)
→ possibilité que les résultats trouvés soient attribuables au hasard/erreur d’échantillonnage
Quelles sont les caractéristiques de l’erreur de l’échantillonnage dans l’inférence statistique ?
- Loi des grands nombres: plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est petite.
- Plus grande est la variance de la population, plus grande est l’erreur d’échantillonnage
- Calculée grâce à l’erreur type de la moyenne
- = l’écart-type de la moyenne des échantillons
aléatoirement extraits de la population
Quel est le but de l’inférence statistique ?
Déterminer si les différences observées sont le reflet de
réelles différences au sein de notre population ou le résultat possible d’une erreur d’échantillonnage/hasard
Quels sont les deux types d’erreur d’inférence ?
- Erreur de type 1 (alpha)
- Affirmation du chercheur : il existe un lien (rejet de H0)
- Réalité : il n’existe pas de lien - Erreur de type 2 (bêta)
- Affirmation du chercheur : il n’existe pas de lien (non rejet de H0)
- Réalité : il n’existe pas de lien
Qu’est-ce que le seuil de signification ?
- Malgré la possibilité de faire des erreurs d’inférence
(type 1 et 2), on se fixe un seuil d’erreur minimal à atteindre - On contrôle le plus possible l’erreur de type 1
- La probabilité de faire une erreur de type 1= alpha (α);
« p » = seuil de signification - Seuil de signification généralement accepté:
- Nous voulons être certain à au moins 95% que la relation observée est attribuable à la présence d’une relation réelle entre les variables à l’étude
- 5% (.05) de chance de me tromper en affirmant qu’il existe une relation (erreur de type 1)
- ** p ≤ 0.01, *** p ≤ 0.001