Les statistiques descriptives Flashcards

1
Q

Qu’est ce qu’une inférence ?

A

Généralisation des caractéristiques d’un échantillon à l’ensemble d’une population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est ce que le principe de réfutabilité ?

A
  1. Une théorie scientifique doit être formulée de manière à pouvoir être réfutée.
  2. Il doit exister des expériences ou des observations possibles qui pourraient montrer que la théorie est fausse.
  3. La réfutabilité distingue les théories scientifiques des simples spéculations ou croyances non testables.
  4. Ce principe renforce la nature empirique et falsifiable de la science, contribuant ainsi au progrès des connaissances scientifiques.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est ce qu’une hypothèse nulle (H0) ?

A
  1. Une proposition statistique initiale formulée comme l’absence d’effet ou de relation, servant de point de départ dans un test d’hypothèse

Exemple : Dans le contexte d’un test de médicament, l’hypothèse nulle pourrait être formulée comme “le nouveau médicament n’a pas d’effet significatif sur la maladie”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est ce qu’une hypothèse alternative (H1) ?

A
  1. Une proposition qui exprime la présence d’un effet, d’une relation, ou d’une différence spécifique que le chercheur cherche à démontrer.

Exemple: L’hypothèse alternative pourrait être formulée comme “le nouveau médicament a un effet significatif sur la maladie”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est ce qu’une variable indépendante (VI) ?

A
  1. La variable indépendante est la cause ou le facteur que le chercheur manipule.
  2. Elle est souvent placée sur l’axe des x dans un graphique.
  3. Elle représente la condition expérimentale que le chercheur examine pour voir si elle a un effet sur la variable dépendante.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est ce qu’une variable dépendante (VD)

A
  1. Elle est la réponse ou le résultat que le chercheur mesure.
  2. Elle est généralement représentée sur l’axe des y dans un graphique.
  3. Elle est influencée par la manipulation ou la variation de la variable indépendante.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est ce qu’une population ?

A

L’ensemble des individus/objets qui nous intéressent et
qui pourraient potentiellement être observés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce qu’un échantillon ?

A

Un sous-groupe des individus qui composent la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce qu’une variable nominale ?

A
  1. **Catégories distinctes **: Les valeurs de la variable sont des catégories distinctes et non mesurables numériquement.
  2. Aucun ordre : Les catégories n’ont pas d’ordre spécifique ou de hiérarchie intrinsèque. Elles sont simplement des étiquettes sans relation numérique.
  3. Mode de mesure : On attribue des étiquettes (vecteur) ou des noms pour représenter différentes catégories. Par exemple, la couleur des yeux, le genre, la région géographique, ou le type de véhicule.
  4. Opérations limitées : Les opérations statistiques limitées peuvent être appliquées à ces variables. On peut calculer des fréquences, des modes, et d’autres mesures de tendance centrale, mais les opérations comme la moyenne ou l’écart-type n’ont pas de sens dans le contexte de variables nominales.

Exemple : Couleur des yeux (bleu, marron, vert, etc.), genre (homme, femme), type de véhicule (voiture, moto, camion).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est ce qu’une variable nominale dichotomique (binaire) ?

A
  1. Une variable nominale dichotomique, également appelée variable binaire, est un type de variable nominale qui comporte seulement deux catégories distinctes et mutuellement exclusives.

Exemple: Des exemples courants incluent le genre (masculin/féminin), la réussite à un examen (réussi/échoué), le statut de l’emploi (employé/chômeur), la présence d’une maladie (présent/absent), ou la réponse à une question (oui/non).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est ce qu’une variable ordinale ?

A

Une variable ordinale est un type de variable statistique qui représente des catégories ordonnées ou classées selon une échelle, sans spécifier des distances constantes entre les catégories.

Exemple :

  • Échelles d’opinion : “fortement en désaccord”, “en désaccord”, “neutre”, “d’accord”, “fortement d’accord”.
  • Classe sociale : “classe inférieure”, “classe moyenne”, “classe supérieure”.
  • Notation de la douleur : “légère”, “modérée”, “sévère”.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est ce qu’une variable intervalle ?

A

Une variable intervalle est un type de variable statistique qui possède des propriétés d’ordre et une échelle de mesure égale entre les valeurs consécutives, mais qui n’a pas de point zéro absolu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est ce qu’une variable ratio ?

A

Une variable ratio est un type de variable statistique qui possède des propriétés d’ordre, une échelle de mesure égale entre les valeurs consécutives, et un point zéro absolu.

Exemple : Revenu annuel en dollars : Les différences de revenu entre 50 000 $ et 60 000 $ ont une signification constante, et un revenu de 0 $ représente l’absence de revenu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est la différence entre une variable ratio et une variable intervalle ?

A

La différence clé réside dans la présence ou l’absence d’un point zéro absolu.

Exemple :
- Variable intervalle : La température en degrés Celsius, les scores de tests standardisés
- Variable ratio : La taille en centimètres, le revenu annuel en dollars, le poids en kilogrammes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce qu’une variable discrète ?

A

Une variable discrète est un type de variable statistique qui prend des valeurs distinctes et isolées.

Un nombre fini de valeurs

Exemple :
- Nombre d’étudiants dans une classe.
- Nombre de voitures dans un parking.
- Nombre de lancers de dés pour obtenir un certain résultat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est ce qu’une varibale continue ?

A

Une variable continue est un type de variable statistique qui peut prendre une infinité de valeurs dans une plage donnée. Contrairement aux variables discrètes, les valeurs d’une variable continue peuvent être mesurées avec une précision arbitraire.

Exemple :

  • Taille : La taille d’une personne peut prendre une infinité de valeurs dans une plage donnée.
  • Poids : Le poids d’un objet peut varier de manière continue avec une infinité de valeurs possibles.
  • Température : La température peut être mesurée avec une précision arbitraire.
17
Q

Qu’est ce qu’une association ?

A

L’association fait référence à la relation ou au lien entre deux variables. Cela implique d’examiner comment les valeurs d’une variable sont liées ou influencées par les valeurs d’une autre variable.

Il existe différentes types d’associations

18
Q

Qu’est ce qu’une association positive ?

A

Les valeurs d’une variable augmentent avec l’augmentation des valeurs de l’autre variable, et vice versa (corrélation positive).

19
Q

Qu’est ce qu’une association négative ?

A

Les valeurs d’une variable augmentent lorsque les valeurs de l’autre variable diminuent, et vice versa (corrélation négative).

20
Q

Qu’est ce qu’une association non linéaire ?

A

L’association entre les variables ne suit pas une tendance linéaire, mais peut être de nature plus complexe.

21
Q

Qu’est ce qu’aucune association ?

A

Il n’y a pas de relation évidente entre les variables.

22
Q

Qu’est ce qu’une corrélation ?

A

La corrélation mesure la relation statistique entre deux variables, indiquant dans quelle mesure les variations dans une variable sont associées aux variations dans une autre variable.

23
Q

Qu’est ce que le coefficient de corrélation ?

A

Le coefficient de corrélation, noté “r”, est une mesure numérique de la force et de la direction de la relation entre les variables. Il varie de -1 à 1.

Un “r” proche de 1 indique une corrélation positive forte.
Un “r” proche de -1 indique une corrélation négative forte.
Un “r” proche de 0 indique une faible corrélation.

24
Q

Qu’elle est l’objectif d’une corrélation ?

A

Comprendre la force et la direction de la relation entre deux variables, sans inférer une relation de cause à effet.

25
Q

Qu’est ce que la distribution ?

A

La distribution fait référence à la manière dont les valeurs d’une variable sont réparties ou distribuées.

26
Q

Qu’est ce que la loi des grands nombres ?

A

Lorsque la taille des échantillons augmente, les moyennes de ces
échantillons convergent vers la vraie moyenne .

27
Q

Qu’est ce que sont les mesures de centralité ?

A
  1. La moyenne
  2. La médiane
  3. Mode
28
Q

Qu’est ce que la moyenne ?

A

Moyenne : La moyenne, également appelée la moyenne arithmétique, est calculée en additionnant toutes les valeurs de données et en divisant le total par le nombre de valeurs. Elle est sensible aux valeurs extrêmes (outliers) et peut être influencée par des valeurs aberrantes.

29
Q

Qu’est ce que la médiane ?

A

La médiane est la valeur centrale d’un ensemble de données triées par ordre croissant. Si le nombre d’observations est impair, la médiane est la valeur au milieu. Si le nombre d’observations est pair, la médiane est la moyenne des deux valeurs centrales. La médiane est moins sensible aux valeurs extrêmes que la moyenne.

30
Q

Qu’est ce que le mode ?

A

Le mode est la valeur qui apparaît le plus fréquemment dans un ensemble de données. Un ensemble de données peut avoir aucun mode, un mode (unimodal), ou plusieurs modes (multimodal). Le mode est souvent utilisé pour les variables catégorielles.

31
Q

Qu’est ce que sont les msures de dispersion ?

A
  • La varience
  • L’écart type
32
Q

Qu’est ce que la varience ?

A

Distance moyenne entre chaque donnée et la moyenne des données.

Plus la variance est grande, plus les données sont dispersées autour de
la moyenne.

Plus la variance est petite, plus les données sont rapprochées autour de
la moyenne.

Difficile à interpréter, car au carré. . .

33
Q

Qu’est ce que l’écart type ?

A
  1. L’écart-type est une mesure de dispersion statistique qui indique dans quelle mesure les valeurs d’un ensemble de données s’écartent de la moyenne.
  2. Il quantifie la variabilité ou la dispersion des données.
  3. Un écart-type plus élevé indique une dispersion plus grande des valeurs par rapport à la moyenne, tandis qu’un écart-type plus faible indique une dispersion plus petite.
34
Q

Qu’est ce qu’une analyse bivariée

A
  1. L’analyse bivariée est une méthode d’analyse statistique qui examine la relation entre deux variables
  2. Contrairement à l’analyse univariée qui se concentre sur une seule variable à la fois, l’analyse bivariée explore les relations entre deux variables simultanément.
  3. L’objectif principal est de comprendre comment les variations dans une variable sont associées aux variations dans une autre variable.
35
Q

Qu’est ce que la covariance

A
  1. La covariance est une mesure statistique qui quantifie la façon dont deux variables varient ensemble.
  2. Elle évalue la tendance commune des variations de deux variables par rapport à leurs moyennes respectives.
  3. La covariance indique si les deux variables augmentent ou diminuent simultanément.