principe de base en statistique Flashcards

1
Q

La phase analytique comporte 2 étapes, lesquelles?

A
  1. Analyse des données
    présentation
  2. présentation et interprétation des résultats.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est le différence entre une statistique descripitive et inférentielles?

A

Statistique descriptive : permet de décrire et résumé les données
Statistique inférentielles : estimer les paramètres d’une population et vérifier les hypothèses au moyen de tests statistiques appropriés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est la différence entre une variable qualitative et quantitative?

A

Qualitative :

  • Variable que l’on observe
  • qualités réparties en classes
  • pas de valeurs numérique (mais peuvent être recodées

Quantitative :

  • Variable que l’on mesure
  • Quantités : valeurs numériques
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dans les variables qualitatives, il y a les variables nominale et ordinale, quel est la différence?

A

Nominale : classes nommées, pas de hiérarchie, binaire (2 classes)
Ordinale : classes ordonnées, selon une échelle de valeurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dans les variables quantitative, il y a les variables discrète ou continue? Quel est la différence?

A

Discrète : discontinue, résultat d’un dénombrement

Continue : peut prendre toute valeur numérique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Voici des exemples et dites leur types de variable?

  • grossesse
  • état civil
  • échelle de perception de l’effort
  • date de naissance
  • l’âge
A

Ex : grossesse (quantitative discrète), état civil (qualitative ordinale), Échelle de perception de l’effort (qualitative ordinale, car au départ est basé sur des catégories), la date de naissance (aucune de ces réponses, car c’est une variable quantitative temporel), l’âge (quantitative continue)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les statistiques servent à décrire quoi? (4)

A
  1. Tableau brut des données (un tableau avec les résultats directement)
  2. Tableau de fréquence (un nombre d’individu dans chaque intervalle)
  3. Histogramme (distribution de fréquence)
  4. Polygone de fréquence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

À quoi sert des mesure en statistiques?

A

Elles servent à décrire et à résumer les données afin de les exprimer et de les comparer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel est la différence entre des mesure de tendance centrale et les mesures de dispersion pour résumer les données?

A
  • Mesures de tendance centrale : résume la position dans une distribution en fonction des valeurs possibles de la variable étudiée. Ex : la moyenne
  • Mesure de dispersion : résume l’étalement de la distribution, i.e la dispersion des valeurs autour de la valeur centrale.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

L’utilisation de ces mesures se fait toujours au _______ d’une ____ d’information

A

L’utilisation de ces mesures se fait toujours au détriment d’une perte d’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quels sont les 3 mesurent de tendance centrale?

A

moyenne, médiane, mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Il y a 2 choses à savoir sur la moyenne. Elle est influencé par quoi? Puis, est-ce que c’est une donné représentative ou pas?

A
  • Influencée par la valeur de toutes les observations et est donc très sensible à la présence des données extrêmes (tient compte de toutes les observations)
  • Peut devenir non représentative de l’échantillon su la distribution est fortement asymétrique. (des valeurs très faible ou très haute, qui la tire à des extrêmes non représentatif, influencée par les valeurs extrêmes)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la médiane?

A

valeur qui occupe la place du milieu
Environ 50% des observations se retrouvent de chaque côté (ce qui coupe les données en 2, décrit le point milieu d’une distribution)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

La médiane est déterminé par quoi?

Elle a un rôle purement….?

A
  • Déterminée par le nombre d’observations et non pas la valeur de celles-ci
  • Rôle purement descriptif (ne tient pas compte de la valeur numérique)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pour données sur échelle ordinale , (dans un monde parfaitement symétrique, la médiane est égale à la _______.

A

la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que le mode?

A

valeur la plus fréquente d’une série d’observations (pic de la distribution) (peut utilisé)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Le mode :
Purement ________.
Pour des données sur échelle ________.

A
  • Purement descriptif : pour définir l’allure de la distribution (unimodale ou bimodale (2 pics de distribution))
  • Pour données sur échelle nominale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Dans le cas d’une distribution parfaitement symétrique, qu’est-ce qui se passe?

A

La moyenne, la médiane et le mode sont égaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce qu’un coefficient d’asymétrie?

Asymétrie positive / négative

A
  • Souvent valeurs de -1.0 à 1.0 ; la valeur indique le degré de dissymétrie et le signe de la direction (Distribution symétrique → CD = 0 )
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Les mesures de tendance centrale résument quoi?

A

Les mesures de tendance centrale résument en un seul nombre la distribution des données : ce nombre n’est pas suffisant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Pour évaluer uen mesure par rapport à la moyenne, on doit savoir quoi?

A

comment elle s’écarte de la moyenne

22
Q

Les mesures de dispersion permettent d’évaluer quoi?

A

Le degré d’étalement des scores autour de la moyenne.

23
Q

Quels sont les 4 mesures principales de dispersion?

A
  • étendue
  • variance
  • écart-type
  • coefficient de variation
24
Q

Comment calcule-t-on l’étendue?

A

Différence entre la valeur (V) la plus grande et la valeur la plus petite d’une série d’observations.

25
Q

QU’est-ce que la variance?

A

Mesure de l’étendue des scores basée sur la déviation de chacun de ceux-ci par rapport à la moyenne.
Représente la valeur globale de dispersion des scores par rapport à la moyenne.

26
Q

Comment calcul-t-on la variance?

A

La somme des carrés des écarts à la moyenne divisé par le nombre d’observation -1, c’est donc la moyenne des carrés des écarts à la moyenne.

27
Q

Plus la variance est _____ (….), plus la distribution sera étalée

A

grande (plus il y a d’étalement)

28
Q

Quel est l’inconvénient du calcul de variance?

A

s’exprime par une valeur élevée au carré (pour avoir une valeur positive), donc par une unité différente de valeurs de la distribution

29
Q

Comment calcul-t-on l’écart-type?

A

C’est la racine carrée de la variance.

30
Q

L’écart-type de l’échantillon (s) est un bon estimé de l’écart-type de ?

A

de la population

31
Q

L’écart-type peut l’interpréter comme une ________ de la variabilité au sein d’une distribution. S’exprime dans les mêmes unités que la moyenne.

A

mesure linéaire

32
Q

Dans le cas d’une distribution normale, l’écart-type devient une mesure de dispersion __________ en raison de la relation existant entre celui-ci et la moyenne.

A

très importante

33
Q

À quoi sert l’erreur type de la moyenne?

A

L’erreur type, aussi appelée l’écart-type de la moyenne, donne une idée de la précision avec laquelle la moyenne de l’échantillon (x) est représentative de la moyenne de la population

34
Q

L’erreur type de la moyenne est toujours plus _____ que l’écart-type.

A

petite

35
Q

Comment calcul-t-on le coefficient de variation? et quel est son unité de mesure?

A

C’est le rapport de l’écart-type sur la moyenne

L’écart-type exprimé en % de la moyenne, donc indépendant des unités de mesure

36
Q

Que signifie le coefficient de variation?

A

Exprime le degré de dispersion d’une distribution autour de la moyenne
Utile pour comparer la dispersion de deux variables de nature différente (unités différentes)

37
Q

Que permet les mesures de position?

A

permettent de situer une donnée par rapport aux autres dans une distribution.

38
Q

Que signifie un score percentile?

A
  • Indique le rang d’un score en donnant le pourcentage d’observations se situant au-dessous de ce score
  • P90 → 90% des sujets de la population ont un score inférieur à vous
  • P50 → milieu de la distribution (médiane)
39
Q

Que permet de comparé le score standardisé et quel est sa distribution?

A
  • Exprime un score en fonction de son écart par rapport à la moyenne.
  • Score dont l’écart par rapport à la moyenne s’exprime en unités d’écart-type :-3.0 à 3.0
  • Permet de comparer des scores qui n’ont pas le même point de référence. (un score non liés à des unités)
40
Q

Qu’est-ce qu’on regarde dans un tableau des aires sous la courbe normale?

A

on regarde la colonne de score z et on l’associe à sa décimale (nous donnes le pourcentage des scores entre la moyenne et le scores obtenue) = on additionnel 50% à notre pourcentage trouver.

41
Q

L’interférence statistique utilise les données de l’échantillon pour estimer quoi? et vérifier quoi?

A

pour estimer les paramètres de la population et vérifier les hypothèses de recherche.

42
Q

Faire une estimation c’est tenter de définir les paramètres d’une population à partir des données d’un échantillon.
On suppose que (3)?

A
  • La valeur observée a peu de chance d’être exactement celle de la population
  • Cette valeur est néanmoins assez proche si l’échantillon est représentatif
  • Qu’en répétant l’échantillonnage on trouverait d’autres valeurs relativement proches de la vari. Valeur inconnue. (estimation de la moyenne de la population, quand on prend plusieurs moyennes d’échantillon de la population)
43
Q

Si l’échantillon est représentatif de la population, qu’est-ce qu’on peut estimer sur la moyenne de la population?

A

Si l’échantillon est représentatif de la population, la moyenne m1 observée va être le meilleur estimer de la moyenne (u) inconnue
Si on connaissait la vraie moyenne de la population, on constaterait que la courbe normale de distribution des moyennes serait centrée sur cette moyenne (u)

44
Q

Les statistiques inférentielles reposent sur le théorème de la limite centrale, qu’est-ce que ça consiste (3)?

A
  • La moyenne d’une variable calculé sur un échantillon est elle-même une variable aléatoire. Elle varie selon l’échantillon.
  • Cette variable aléatoire suit une loi normale.
  • Cette loi normale est centrée sur la moyenne de la population
45
Q

Dans le théorème de la limite centrale, l’écart-type de cette distribution est égal à?

A

écart-type à la moyenne (ETM).

46
Q

Qu’est-ce qu’une estimation ponctuelle?

A

estimation de la valeur d’un paramètre d’une population faite à partir de la statistique mesurée auprès de l’échantillon.

47
Q

Est-ce que je peux me fier à une estimation ponctuelle?

A

Non, car on a pas mesurer tous les individus

48
Q

Qu’est-ce que estimation par intervalle de confiance?

A

estimer un intervalle dans lequel la moyenne inconnue (u) a la plus grande probabilité de se retrouver

49
Q

Comment on détermine l’estimation par intervalle de confiance?

A
  • S’effectue à partir de la distribution théorique de la courbe normale et du théorème de la limite centrale.
  • L’intervalle de confiance est donc une gamme de valeurs dans laquelle devrait se trouver le paramètre de la population.
50
Q

Si je prends 100 personnes et la moyenne est de 153,7. Que veut dire l’intervalle de confiance à 95%?

A

Intervalle de confiance à 95 % (statistiquememt je me donne un intervalle de 95% de chance que la moyenne est entre cette intervalle) = score Z corresponds à 47,5 % des scores au dessus de la moyenne (quand on regarde dans le tableau)
Finalement, 95 fois sur 100, la moyenne des échantillons serait comprise entre 149.8 et 157.6. Il y a 95% de chances que ! se situe entre ces deux valeurs