Statistique UNI/BIV Flashcards

1
Q

Univariée/multivariée

A

Une seule variable/plusieurs variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Individu statistique

A

Objet qu’on observe à condition qu’il y en ai plusieurs, élément d’une population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Population statistique

A

Ensemble des individus statistiques, la population doit être homogène.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Distribution

A

Ensemble des populations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Caractère ou variable

A

Ce qui caractérise les individus. Exemple : population, superficie, PIB etc..
La variable peut être qualitative ou être quantitative.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Modalité

A

Valeur d’une variable pour 1 individu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les types de données qualitatives

A
  • Nominales = contiennent une notion de différence, aucun ordre
  • Ordinales : contiennent une notion d’ordre non mesurable
  • Discrètes : il y a moins de modalités que d’individus : hopital/région…
  • Exhaustives : il y a autant de modalités que d’individus : Nom des pays/ Identifiant.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Les types de données quantitatives

A
  • de stock : données brut : suprficie
  • de taux : rapport/indice (chomâge, pop. active)
  • discrètes : il y a moin de valeurs que d’individus : taille
    de chaussures, taux de chômage discrédité
  • continues : nombre illimité de valeurs dans un intervalle : altitude, surface, superficie
  • repérables : le zéro est conventionnel : température
  • mesurables : le zéro signifie l’absence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Les types de tableaux

A
  • élémentaire : il décrit un nombre d’individu par un nombre de variable. On note i la modalité que prend l’individu pour la variable x ce tableau est aussi appelé tableau de donnée géographique.
  • de contingence : tableau élémentaire que l’on transforme.
  • Tableaux à double entrée
  • Tableaux disjonctif complet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Valeur centrale

A

résumer par une seule valeur l’ensemble d’une distribution : moyenne, médiane, mode

Limite : le résumé d’une distribution par 1 valeur ne renseigne pas sur la disposition des valeurs autour de cette valeur centrale. La dispersion statistique correspond à la tendance qu’ont les valeurs à ce répartir autour de valeurs centrales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Médiane

A

valeur qui partage l’ensemble des valeurs en 2 effectifs égaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Mode/classe modale

A

valeur la plus fréquente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

paramètres de dispersion absolue

A
  • étendue : valeur max - min L’étendue est un indicateur de la dispersion des valeurs de cette série statistique
  • quartile : borne des classes en effectifs égaux
  • écart absolue moyen : correspond à la distance moyenne à la moyenne
  • écart-type : le plus utilisé, on le calcule en faisant la racine carré de la variance. Il permet une infos sur la répartition de la valeur des individus par rapport à l’écart type et le paramètre de disposition qui complète la moyenne à la médiane.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Variance

A

Correspond aux carrés des écarts à la moyenne. Mesure globale de la dispersion autour de la moyenne. Ce n’est pas un paramètre de dispersion absolue.
v(x)= 1/nSOMME

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Paramètres de dispersion relative

A
  • Le coefficient interquartile (CI)
    CI= (Q3-Q1)/2

Coefficient de variation CV= Ecart-type/moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Loi de Gauss

A

Probabilités de trouver des valeurs à la distance de la moyenne :

  • 68% entre -1 et +1 de l’écartype
  • 95% entre -2 et +2 écartype
  • 5% entre -3 et +3
17
Q

La contrainte des valeur absolue

A

c’est un mode de mesure par unité.

18
Q

5 distribution

A
  • unimodale (comme la courbe de Gauss)
  • multimodale : travailler en sous groupe pour une bonne analyse
  • symètre : répartition homogène
  • dissymétrique à gauche : + dans les valeurs faible
  • dissymétrique à droite : + dans les valeurs fortes
19
Q

Vocab important

A
  • variables qualitatives, variables quantitatives, partition en classe (méthode de discrétisation/dispersion), valeurs centrales, forme de la distribution, les dispersions.
20
Q

Calcul paramètre de dispersion relatif

A

PDA
__________________________
VC

21
Q

Relation statistique bivariée

A

La modification d’une variable va en modifié une autre
exemple : croissance altitude = baisse des températures

Limite : relation statistique ne suppose pas simplement une situation de causes à effets.

22
Q

Résidu statistique

A

Quelque chose qui sépare un élément de la tendance générale.

Et dont les facteurs restent à déterminer.

23
Q

Covariance

A

mesure qui permet d’évaluer si deux variables sont indépendantes ou pas et donner leurs relations
L’indépendance statistique signifie que la covariance est nul.

Formule = (xi - moy de x) * (yi - moy de y)
________________________
N (somme des individus)

  • covariance positive/négative
  • corrélation = intensité de la relation
24
Q

Limite Covariance

A

nous dis rien sur. de l’intensité statistique. Impossible à interpréter car il n’est pas borné par une valeur. D’où passage à la corrélation qui permet de connaître/estimé l’intensité de la relation.
r = cov(x,y)
______
o * oy

coefficient de relation r = indice entre 0 et 1 plus on s’éloigne du 0 plus la relation est forte, plus on s’éloigne du 1 moins la relation est forte.

25
Q

Significativité de la relation

A

On peut se demander si il y a des données suspect donc il faut prouver que les résultats ne viennent pas pas du hasard donc pour vérifier on procède à un test statistique -> le test de Bravais-Peason on part de l’hypothèse nulle H(0) ; choisir la marge d’incertitude ( environ égale 0,05) et je confronte le résultat.

26
Q

Le test du Chi2

A

Consiste à mesurer l’écart entre une situation observée et une situation théorique et d’en déduire l’existence et l’intensité d’une liaison mathématique. En sciences sociales on utilise le test du Chi2 dans la même logique que celle appliquée au calcul du coefficient de corrélation linéaire pour des variables quantitatives : existe-t-il une liaison entre deux variables, si oui quelle est son intensité ? On confronte une situation observée et une situation théorique d’indépendance mathématique.

27
Q

Standardisation des données

A

Centrage des données et réduction lorsqu’une distribution est très hétérogène. Elle permet de rassembler et comparer des choses aux caractéristiques différentes (on les mets sur un pied d’égalité) voir exemple des piesomètre.
Ecart à la moyenne/Ecart-type

28
Q

Coefficient de Bravais Pearson

A

Permet de détecter la présence ou l’absence d’une relation linéaire entre 2 variables quantitatives continues
r (x,y) = COV(x,y) / q x qy) il varie de 1 à -1
3 cas de figure :
- si r = 0 pas de corrélation entre x et y
- si r = 1 corrélation forte entre les deux variable
- si r = -1 il y a une forte relation négative

29
Q

Droite de régression

A

y = ax+b

a = cov(x;y) / (écartype x)²

b= moy Y - a moy X

30
Q

Coefficient de détermination

A

R = r² Permet de donner une estimation théorique et d’en dégager les éventuelle résidus.