Grundbegriffe Flashcards
Untersuchungseinheit
(ou Merkmalträger, Falle, Element): L’object de la recherche statistique. Ça peut être une population, une famille, un pays, une entreprise…
Symboles: 1,…i,…n
Merkmal
(ou Variable) Ce sont les propriétés de l’objet de recherche.
Symboles: x, y, z
Merkmalausprägungen
Les possibles valeurs d’une propriété (par exemple si la Merkmal est le parti, alors la Merkmalausprägungen peut être le SPD/ Si c’est l’âge, alors ça peut être le l’âge en chiffre…)
Symboles: x1,…x2,…xn
Nominalskala
Ce sont les Merkmalen qui ont des propriétés “en classes”, on ne peut pas être entre les deux. Et on ne peut pas les ordonner. Ex.: Si l’unité de recherche est les noms de Famille (Müller, Hoffman, Leinmann) / Le groupe sanguin: O+, AB, AB-…
-> collecte de données combien de personnes sont O+ dans une classe.
Ordinalskala
Ce sont les Merkmalen qui ont des propriétés que l’on peut classifier par exemple les notes en primaire (A, B, C…)
->
Intervallskala
Ce sont des Merkmalen métriques qui ont une échelle (croissante/décroissante) et n’ont pas de réellement de zéro absolu. (Par exemple la température, ou sur une échelle de 0 à 10 de sentiment d’appartenance à l’EU)
-> Calculer tout (moyenne, médiane, quartiles, variance…)
Ratioskala
Ce sont des Merkmalen métriques avec une échelle mais un zéro absolu. Elle nous donne beaucoup de données: l’ordre, la valeur exacte entre les données et un zéro absolu Par exemple le prix, les m2, les pourcentages.
Dichotome Merkmale
Ce sont les variables qui sont binaires (0 ou 1, oui ou non).
Diskrete Merkmale
Ce sont des variables qui ont un nombre défini de valeurs (par exemple nombre de personnes dans une classe, les mois de l’année…)
Stetige Merkmale
Une variable est “stetige”/continue quand son nombre peut être infini entre une intervalle donnée (par exemple: On suppose qu’un humain ne peut pas mesurer plus de 3m, mais je peux mesure 1, 6187642653289…m )
Absolute Häufigkeit
hj ou h(xj)
le nombre de Untersuchungseinheit qui a une certaine propriété
h(xj) ou hj
0 < h(xj) < n
ex: Il y a 100 boules, 40 sont rouges (Absolute Häufigkeit)
Relative Häufigkeit
La proportion de Untersuchungseinheit avec une certaine propriété.
f(xj) ou fj
0 < fj < 1 (car 1=100%)
ex.: Il y a 100 boules, 40% sont rouges (Relative Häufigkeit)
Kumulierte Häufigkeiten
Savoir à partir d’un point données combien de valeurs sont au dessous ou au dessus.
Die Spannweite (range)
c’est la différence entre la plus grande valeur et la plus petite
Chi2 (Chi-Quadrat)
Le test de Chi-deux est utilisé pour tester l’hypothèse nulle d’absence de relation entre deux variables catégorielles. On peut également dire que ce test vérifie l’hypothèse d’indépendance de ces variables.
H0= Hypothèse nulle, les variables sont indépendantes.
H1= Hypothèse alternative, il y a une association entre les variables.
Phi (Chi2)
Le Phi découle de Khi deux,
- C’est une mesure symétrique
- il mesure l’association entre 2 variables nominales (non ordonnées).
- Il varie entre 0 et 1
- Le 1 et -1 indique une association plus forte entre les deux variables
- Le 0 indique que c’est faible, voire nul à 0.
V de Cramèr
- mesure symétrique.
- lorsque les variables catégorielles ont plus de deux catégories
- Varie de 0 à 1
- Proche de 1, l’association entre les variables est plus proches
Lambda (PRE-MAß)
- Mesure l’association entre deux variables ordinales (catégories ordonnées)
- Varie de 0 à 1
- Évalue la force et la direction de la relation ordonnée entre les variables
- est asymétrique: Si on échange les variables dépendantes et indépendantes, alors la valeur de L change.
pour mesurer indépendance variables catégorielles
- Chi deux
mesurer association entre variables nominales:
- Phi & V de Cramèr
mesurer association entre variables ordinales:
- Lambda
Yules Q (Coefficient de Yule):
- C’est une mesure symétrique
- Il permet de mesurer l’association entre deux variables binaires,
- Il varie entre -1 et 1, proche de 0 signifiant qu’il n’y a aucune association entre les variables et -1 et 1, qu’il y a une association parfaite entre les variables.
- Néanmoins: Il est sensible à l’inversion des catégories