Cours 5 Flashcards
Types d’analyse
Univarié : 1 variable, décrire et présenter les données pour chaque variable.
Bivariée : 2 variables, analyse l’effet d’une variable sur une autre.
Multivariée : 3 ou +, analyser l’effet de plusieurs variables sur une autre.
Types de variables
Dépendante : ce qu’on cherche à expliquer (effet) (Y)
Indépendante : celle qui vise à expliquer Y (explication)
Contrôle (tierce) : intervient dans la relation entre X et Y.
Conditions nécessaire causalité (5)
- Séquence temporelle (cause doit précéder l’effet)
- Association entre x et y
- Relation persiste même si on inclut d’autres variables (tierce)
- Les 2 concepts doivent être conceptuellement distincts
- Il existe une interprétation possible de la relation
Types d’analyses stat
Buts :
1. Connaître l’association entre 2 variables
2. Connaître les différences de groupes pour une même variable
Hypothèses :
Hypothèse non-directionnelle : aucune mention du sens de la relation entre les 2 variables / des différences existantes.
Directionnelle : sens de la relation sont mentionnées.
Hypothèse de recherche : présence d’une association / relation en VI et VD.
Hypothèse nulle : aucune association / relation entre VI et VD.
Population / échantillon et def inférence statistique
Population : ensemble de toutes les personnes, objets ou faits que lesquels porte une étude. Définir la population en spécifiant l’unité statistique, caractéristiques géographiques et temporelles.
Échantillon : sous-ensemble, importance de la représentativité de l’échantillon, échantillon aléatoire, généralisation des résultats.
Tirer des conclusions sur une population via une analyse statistique sur une échantillon de cette population.
Fluctuation des échantillon
Problème fondamental : stat obtenues à partir des échantillons peuvent varier d’une étude à l’autre = estimation de la population / probabilités, importance de reproduire les études. Divergences entres les statistiques émanant de la population et des échantillons.
Théorie probabiliste
Nombre de fois qu’un événement ou une situation survient divisé par le nombre d’occasions que l’événement ou la situation puisse survenir.
Inférence stat en profondeur (buts, types d’erreur)
induire les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population. Basée sur des analyses statistiques, permet de minimiser les probabilités de tirer de fausses conclusions quant aux paramètres de la population.
But : déterminer si les différences observées sont le reflet de réelles différences au sein de notre population ou le résultat possible d’une erreur d’échantillonnage / hasard.
Erreur d’échantillonnage : loi des grands nombre (+ taille de l’échantillon est grande, + l’erreur est petite, + grande variance de la population = + grande erreur d’échantillonnage,
Erreur d’inférence : type 1 (alpha) = il affirme qu’il existe un lien mais il n’existe pas.
Type 2 (bêta) = il affirme qu’il n’existe pas de lien mais il en existe un.
Seuil de signification
Seuil d’erreur minimal à atteindre. Contrôle le plus possible l’erreur de type 1. Généralement accepté = nous voulons être certain à au moins 95% que la relation observée est attribuable à la présence d’une relation réelle entre les variables à l’étude.