Cour 3 : l'analyse bivariée Flashcards
Qu’est-ce que l’analyse bivariée?
- Étudier la relation (association) entre deux variables de type qualitative ou quantitative.
- Trois cas :
a) Variable qualitative avec une variable qualitative
b) Variable qualitative avec une variable quantitative
c) Variable quantitative avec une variable quantitative
Quels sont les 5 facteurs de l’analyse bivariée?
- X doit précéder y
- On doit pouvoir retracer le lien entre x et y
- Concomitance empirique entre x et y fréquente et répétée
- Nécessité de considérer d’autres causes possibles
- Causalité reconnue lorsque plusieurs enquêtes l’ont repérée
***possibilité d’un indicateur fallacieux
Qu’est ce qu’une corrélation
- Un lien statistique entre deux variables, généralement quantitatives
- Type de corrélation : positive (les phénomènes vont dans le même sens, x et y augmentent) ou négative (les phénomènes vont dans des sens contraires, x augmentent mais y diminue)
Qu’est-ce que le coefficient de corrélation
Indicateur servant à mesurer le degré de lien linéaire entre deux variables quantitatives
- « r »
- Situé entre 1 et -1
- Lorsqu’il est porté au carré, il devient le coefficient de détermination R^2. Il sert alors à exprimer la capacité de la variable indépendante à expliquer le comportement de la variable dépendante. Souvent exprimé par forme de pourcentage.
- R^2=variable expliquée÷variation totale
Qu’est ce que la régression ?
Équation qui permet de prévoir la variable inconnue en utilisant la valeur donnée d’une ou plusieurs autres variables. L’équation Y=a+b_x+erreur donne la valeur estimative de Y, si la valeur de x est connue
- a = ordonnée à l’origine
- b = coefficient de régression
- x = Vi
Qu’est-ce que le test de khi carré?
- Test d’inférence statistique qui démontre si une série d’effectifs observés diffère de façon significative d’une série d’effectifs théoriques
- p < 0,05 = relation significative entre la Vindépendante et la Vdépendante
Qu’est ce que le V de Kramer
- Mesure de liaison lorsque les variables sont qualitatives
- Légende : 0,1 = petite association / 0,3 = moyenne association / 0,5 = grande association
Qu’est ce que l’inférence statistique et quels sont ses éléments de base ?
- Karl Pearson
- La notion de hasard : dire qu’une situation dépend du hasard ou est aléatoire ne signifie pas qu’il peut se produire n’importe quoi, n’importe comment. Le hasard obéit à des lois.
- L’Inférence statistique (elle-même) : démarche qui vise à tirer des conclusions sur une population (grand nombre d’individus) sur la base des observations réalisées sur un échantillon, représentant une portion restreinte de la population.
Décrivez les 5 types d’échantillons Non-probabilistes.
Non-Probabiliste : les éléments sont choisis de manière arbitraire
a) Formé sur la base du JUGEMENT : formé à partir de l’opinion d’une ou de plusieurs personnes suffisamment éclairées
b) Formé de manière ACCIDENTELLE : typique de la vie quotidienne. Lorsque les médias font un vox-pop.
c) De CONVENANCE : lorsque les répondants sont choisis par commodité. On s’en sert souvent pour tester un questionnaire.
d) Par QUOTAS : lorsque les répondants sont choisis par groupe homogène, mais selon les prérogatives de l’enquêteur.
e) VOLONTAIRE : très fréquent, ce sont les gens qui veulent répondre à la question
Décrivez les 5 sortes d’échantillons probababilistes
Probabiliste : le choix des éléments obéit aux lois des probabilités
a) Aléatoire SIMPLE : chaque membre d’une population à une chance égale d’être inclus dans l’échantillon
b) SYSTÉMATIQUE : c’est un échantillonnage où il existe un écart, ou un intervalle, entre chaque unité sélectionnée qui est incluse dans l’échantillon
c) STRATIFIÉ: dans cet échantillonnage, on divise la population en groupes homogènes (appelés strates), puis on sélectionne à partir de chaque strate des échantillons indépendants.
d) En GRAPPES : la technique de cet échantillonnage consiste à diviser la population en groupes ou en grappes (possibilité d’un biais, problème de représentativité)
e) COMBINÉ : deux types d’échantillonnage combinés
Qu’est ce qu’une erreur type?
erreur qui se produit lorsque les données sont recueillies après d’une partie seulement de la population. Elle est habituellement mesurable par les données de l’échantillon en cas d’échantillonnage probabiliste.
Présentez le niveau de confiance
- Lié à la cote z Seuil de confiance Cote Z 0,90 1,64 0,95 1,96 0,99 2,58 Pas mal toujours 0,95, donc 0,05
Présentez la marge d’erreur
- Se calcule en multipliant l’erreur type par la cote z
- ME=Erreur type (Z) ×cote z (seuil de confiance)
- Pour une moyenne : Z (Erreur type) = (écart type échantillon)/(√taille de l’échantillon)
Pour une proportion : Z= √(P(1-P))/n *** P = pas mal toujours P = 0,5