Statistiques descriptives et inférentielles Flashcards

1
Q

Le but de toutes les statistiques descriptives est de

A

décrire, de façon condensée (parfois un seul nombre), un ensemble de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

… la valeur des scores individuels d’un échantillon

A

on veut rarement savoir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

les stats descriptives impliquent l’idée de

A

communication : On s’intéresse à des moyens standardisés de transmettre l’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Rôle du tableau

A

condense l’info en colonnes et rangées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Première rangée identifie

A

le contenu des colonnes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

première colonne identifie

A

le contenu des rangées (optionnel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Important pour les tableaux (5)

A

Numéros séquentiels (Tableau 1, 2, 3…)
Titre bref et clair
Numéro et titre au dessus, centré, lignes séparées
Seulement trois lignes horizontales(*)
Aucune ligne verticale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

tableau de distribution d’effectifs simple est idéal pour

A

variables nominales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

ordre des rangées dans un tableau de distribution d’effectifs simple

A

choix perso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

consignes distribution d’effectifs regroupés
- chaque score est associé à
- le nombre d’intervalles doit
- à utiliser avec des variables ___ ou ___
- intervalles de taille ______
- intervalles __________ aux ________ si besoin

A
  • un (et un seul) intervalle de classe
  • condenser l’info sans masquer des détails importants (tension économie-détail)
  • intervallerapports
  • constante
  • ouverts aux extrémités si besoin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

distribution cumulative d’effectifs regroupés

A

La fréquence rapportée est celle de l’intervalle de classe courant PLUS celle(s) de l’(des) intervalle(s) précédent(s)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

distribution relative d’effectifs regroupés

A

La fréquence rapportée est non pas absolue (i.e., le nombre de scores de la classe) mais relative (i.e., la proportion de scores dans la classe rapportée)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Maximum et minimum dans une proportion

A

1 et 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

une proportion est

A

un nombre de choses particulières divisé par le nombre total de choses incluant les choses particulières (e.g., nombre d’hommes divisé par nombre de personnes = proportion d’hommes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vous décidez comment organiser vos données

Mais toujours avec le but de

A

résumer / simplifier l’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

données qualitatives : Puisque les scores se distinguent en fonction de leur essence, ils ne peuvent pas (2)

A

Ils ne peuvent se toucher lorsque représentés le long d’une dimension Ne peuvent pas être liés par des lignes ou autres connecteurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

données qualitatives : les scores se distinguent en fonction de leur …

A

essence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

vrai ou faux
il y a une manière logique d’ordonner des variables quantitatives sur un continuum

A

faux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

vrai ou faux
Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum (tel l’abscisse d’une figure)

On les met,

A

au choix, en ordre alphabétique, en ordre d’effectifs, en ordre selon les choix de réponse…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

À noter sur le graphique à bâtons : (3)

A

*Pas de cadre autour du graphique (les seules lignes sont celles identifiant les axes)

*Pas de contact entre les bâtons

*Légende à texte aligné à gauche sous le graphique, débutant par Figure #. où # est séquentiel

22
Q

Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques

A

à bâtons ou secteurs, à moins de transformer les scores en mesures nominales ou ordinales

23
Q

Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques à bâtons ou secteurs, mais plutôt

A

des polygones de fréquences ou des histogrammes

24
Q

Caractéristiques des polygones de fréquences

A

Il y a un point dans l’espace 2D pour chaque intervalle de classe

  • Le point est positionné au dessus du centre de l’intervalle le long de l’abscisse : Les étiquettes doivent référer à cette valeur centrale
  • La fréquence de l’intervalle de classe est représenté par la position du point selon l’ordonnée - Généralement un intervalle vide à chaque bout (pas d’intervalle ouvert)

Des lignes joignent les points voisins

25
Q

Histogramme

A

Très semblable aux polygones

Plutôt qu’un point, une barre horizontale est placée à la hauteur adéquate au-dessus de chaque intervalle de classe

La largeur de la barre correspond à la largeur de l’intervalle

Des lignes verticales (une de chaque côté) joignent la barre à l’abscisse

26
Q

Graphiques à bâtons pour groupes

A

Utiles pour illustrer la relation entre variables indépendantes et dépendantes
E.g., score d’anxiété moyen (VD) par sexe et technique de relaxation (VIs) Par convention, VDs représentées par axe y, VIs le long de l’axe des x

27
Q

Graphiques à dispersion

A

Représentent le score sur deux variables pour chaque membre de l’échantillon

Une variable est assignée à x, l’autre à y Pour chaque participant, un point représente son score sur les deux variables

28
Q

Par mesure ou tendance centrale, on réfère à

A

un nombre qu’on prétend typique ou représentatif d’un ensemble de scores

29
Q

Mode

A

Le mode est le score qu’on observe le plus souvent
Votre meilleure prédiction pour une personne inconnue si vous ne savez rien d’autre
- Une distribution peut avoir deux modes ou plus, en quel cas, on dit qu’elle est bimodale ou multimodale, respectivement
- Pas approprié pour des intervalles de classe : le score modal n’est pas nécessairement dans l’intervalle modal

30
Q

Mode et intervalles de classe

A

Pas approprié pour des intervalles de classe : le score modal n’est pas nécessairement dans l’intervalle modal

31
Q

Une distribution peut avoir deux modes ou plus En quel cas, on dit qu’elle est

A

bimodale ou multimodale, respectivement

32
Q

Médiane

A

La médiane est le score au milieu d’une distribution ordonnée

La moitié des scores en dessous, la moitié au dessus

Quoiqu’une proportion de scores peuvent être égaux à la médiane

Pour calculer:

Mettre les scores en ordre de grandeur Calculer (n + 1) / 2

Si le résultat est un nombre entier, il vous donne la position de la médiane Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19 e et 20 e scores)

Si ces deux scores diffèrent, on prend leur moyenne

Pas approprié pour des intervalles de classe

L’intervalle médian ne crée pas nécessairement deux moitiés égales

33
Q

Pour calculer la médiane

A

Mettre les scores en ordre de grandeur Calculer (n + 1) / 2

Si le résultat est un nombre entier, il vous donne la position de la médiane Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19 e et 20 e scores)

Si ces deux scores diffèrent, on prend leur moyenne

34
Q

Médiane et intervalles de classe

A

Pas approprié pour des intervalles de classe
L’intervalle médian ne crée pas nécessairement deux moitiés égales

35
Q

Moyenne

A

La moyenne est la somme de tous les scores, divisée par le nombre de scores. Elle a des propriétés importantes

La somme des déviations est égale à zéro Minimise les déviations carrées

Comparé aux autres mesures centrales

Représente la quantité que tout le monde aurait si la caractéristique était distribuée équitablement Changer un score change la moyenne

Le même changement pourrait laisser le mode et/ou la médiane inchangés

Degrés de liberté illustrés

36
Q

moyenne : La somme des déviations est égale à

37
Q

moyenne : … est égale à zéro

A

La somme des déviations

38
Q

la moyenne minimise

A

les déviations carrées comparé aux autres mesures centrales

39
Q

Changer un score a quelle influence sur les 3 tendances centrales

A

change la moyenne mais les 2 autres pourraient rester inchangés

40
Q

Quelle tendance choisir pour données nominales

41
Q

Autre échelles: dépend!

Plus représentatif?

42
Q

Milieu?

43
Q

Sensibilité à tous les scores?

44
Q

… peu utiles avec distribution bimodale

A

moyenne et médiane

45
Q

… peu utiles avec distribution bimodale

A

mode et médiane

46
Q

Pourquoi la dispersion?

A

Puisque les scores varient, combien représentative est une mesure de tendance centrale?

Connaître l’étendue des données est un élément d’information important

La dispersion est une mesure de la variabilité entre les scores

47
Q

L’étendue

A

distance entre le score le plus élevé et le score le plus bas

48
Q

Problèmes avec l’étendue

A

Basée sur seulement deux mesures
Et pas n’importe lesquelles: les plus extrêmes!

Augmente avec la taille de l’échantillon
De nouveaux scores ne feront jamais réduire l’étendue

Par contre, un nouveau score qui change le minimum ou le maximum augmente l’étendue

49
Q

Étendue interquartile

A

Corrige certains problèmes de l’étendue
Utilise les 25 e et 75 e centiles pour son calcul
Peu sensible aux scores extrêmes
Plus stable en fonction de la taille de l’échantillon
Devrait diminuer quand l’échantillon grossit si la variable a une distribution “normale” dans la population
Rarement utilisée, sauf dans les graphiques boîte-etmoustaches
Permettent d’identifier visuellement les valeurs aberrantes / extrêmes

50
Q

L’écart-type

A

L’écart-type (s dans la population, s dans un échantillon) est la racine carrée de la déviation carrée moyenne

Les formules diffèrent pour population et échantillon

51
Q

Variance

A

Un indicateur de dispersion très commun, utilisé dans une variété de procédures (non la moindre: analyse de la variance)
Est le carré de l’écart-type

52
Q

apprendre symboles