Statistiques descriptives et inférentielles Flashcards

1
Q

Le but de toutes les statistiques descriptives est de

A

décrire, de façon condensée (parfois un seul nombre), un ensemble de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

… la valeur des scores individuels d’un échantillon

A

on veut rarement savoir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

les stats descriptives impliquent l’idée de

A

communication : On s’intéresse à des moyens standardisés de transmettre l’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Rôle du tableau

A

condense l’info en colonnes et rangées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Première rangée identifie

A

le contenu des colonnes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

première colonne identifie

A

le contenu des rangées (optionnel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Important pour les tableaux (5)

A

Numéros séquentiels (Tableau 1, 2, 3…)
Titre bref et clair
Numéro et titre au dessus, centré, lignes séparées
Seulement trois lignes horizontales(*)
Aucune ligne verticale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

tableau de distribution d’effectifs simple est idéal pour

A

variables nominales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

ordre des rangées dans un tableau de distribution d’effectifs simple

A

choix perso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

consignes distribution d’effectifs regroupés
- chaque score est associé à
- le nombre d’intervalles doit
- à utiliser avec des variables ___ ou ___
- intervalles de taille ______
- intervalles __________ aux ________ si besoin

A
  • un (et un seul) intervalle de classe
  • condenser l’info sans masquer des détails importants (tension économie-détail)
  • intervallerapports
  • constante
  • ouverts aux extrémités si besoin
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

distribution cumulative d’effectifs regroupés

A

La fréquence rapportée est celle de l’intervalle de classe courant PLUS celle(s) de l’(des) intervalle(s) précédent(s)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

distribution relative d’effectifs regroupés

A

La fréquence rapportée est non pas absolue (i.e., le nombre de scores de la classe) mais relative (i.e., la proportion de scores dans la classe rapportée)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Maximum et minimum dans une proportion

A

1 et 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

une proportion est

A

un nombre de choses particulières divisé par le nombre total de choses incluant les choses particulières (e.g., nombre d’hommes divisé par nombre de personnes = proportion d’hommes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vous décidez comment organiser vos données

Mais toujours avec le but de

A

résumer / simplifier l’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

données qualitatives : Puisque les scores se distinguent en fonction de leur essence, ils ne peuvent pas (2)

A

Ils ne peuvent se toucher lorsque représentés le long d’une dimension Ne peuvent pas être liés par des lignes ou autres connecteurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

données qualitatives : les scores se distinguent en fonction de leur …

A

essence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

vrai ou faux
il y a une manière logique d’ordonner des variables quantitatives sur un continuum

A

faux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

vrai ou faux
Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum (tel l’abscisse d’une figure)

On les met,

A

au choix, en ordre alphabétique, en ordre d’effectifs, en ordre selon les choix de réponse…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

À noter sur le graphique à bâtons : (3)

A

*Pas de cadre autour du graphique (les seules lignes sont celles identifiant les axes)

*Pas de contact entre les bâtons

*Légende à texte aligné à gauche sous le graphique, débutant par Figure #. où # est séquentiel

22
Q

Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques

A

à bâtons ou secteurs, à moins de transformer les scores en mesures nominales ou ordinales

23
Q

Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques à bâtons ou secteurs, mais plutôt

A

des polygones de fréquences ou des histogrammes

24
Q

Caractéristiques des polygones de fréquences

A

Il y a un point dans l’espace 2D pour chaque intervalle de classe

  • Le point est positionné au dessus du centre de l’intervalle le long de l’abscisse : Les étiquettes doivent référer à cette valeur centrale
  • La fréquence de l’intervalle de classe est représenté par la position du point selon l’ordonnée - Généralement un intervalle vide à chaque bout (pas d’intervalle ouvert)

Des lignes joignent les points voisins

25
Histogramme
Très semblable aux polygones Plutôt qu’un point, une barre horizontale est placée à la hauteur adéquate au-dessus de chaque intervalle de classe La largeur de la barre correspond à la largeur de l’intervalle Des lignes verticales (une de chaque côté) joignent la barre à l’abscisse
26
Graphiques à bâtons pour groupes
Utiles pour illustrer la relation entre variables indépendantes et dépendantes E.g., score d’anxiété moyen (VD) par sexe et technique de relaxation (VIs) Par convention, VDs représentées par axe y, VIs le long de l’axe des x
27
Graphiques à dispersion
Représentent le score sur deux variables pour chaque membre de l’échantillon Une variable est assignée à x, l’autre à y Pour chaque participant, un point représente son score sur les deux variables
28
Par mesure ou tendance centrale, on réfère à
un nombre qu’on prétend typique ou représentatif d’un ensemble de scores
29
Mode
Le mode est le score qu’on observe le plus souvent Votre meilleure prédiction pour une personne inconnue si vous ne savez rien d’autre - Une distribution peut avoir deux modes ou plus, en quel cas, on dit qu’elle est bimodale ou multimodale, respectivement - Pas approprié pour des intervalles de classe : le score modal n’est pas nécessairement dans l’intervalle modal
30
Mode et intervalles de classe
Pas approprié pour des intervalles de classe : le score modal n’est pas nécessairement dans l’intervalle modal
31
Une distribution peut avoir deux modes ou plus En quel cas, on dit qu’elle est
bimodale ou multimodale, respectivement
32
Médiane
La médiane est le score au milieu d’une distribution ordonnée La moitié des scores en dessous, la moitié au dessus Quoiqu’une proportion de scores peuvent être égaux à la médiane Pour calculer: Mettre les scores en ordre de grandeur Calculer (n + 1) / 2 Si le résultat est un nombre entier, il vous donne la position de la médiane Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19 e et 20 e scores) Si ces deux scores diffèrent, on prend leur moyenne Pas approprié pour des intervalles de classe L’intervalle médian ne crée pas nécessairement deux moitiés égales
33
Pour calculer la médiane
Mettre les scores en ordre de grandeur Calculer (n + 1) / 2 Si le résultat est un nombre entier, il vous donne la position de la médiane Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19 e et 20 e scores) Si ces deux scores diffèrent, on prend leur moyenne
34
Médiane et intervalles de classe
Pas approprié pour des intervalles de classe L’intervalle médian ne crée pas nécessairement deux moitiés égales
35
Moyenne
La moyenne est la somme de tous les scores, divisée par le nombre de scores. Elle a des propriétés importantes La somme des déviations est égale à zéro Minimise les déviations carrées Comparé aux autres mesures centrales Représente la quantité que tout le monde aurait si la caractéristique était distribuée équitablement Changer un score change la moyenne Le même changement pourrait laisser le mode et/ou la médiane inchangés Degrés de liberté illustrés
36
moyenne : La somme des déviations est égale à
zéro
37
moyenne : ... est égale à zéro
La somme des déviations
38
la moyenne minimise
les déviations carrées comparé aux autres mesures centrales
39
Changer un score a quelle influence sur les 3 tendances centrales
change la moyenne mais les 2 autres pourraient rester inchangés
40
Quelle tendance choisir pour données nominales
mode
41
Autre échelles: dépend! Plus représentatif?
mode
42
Milieu?
médiane
43
Sensibilité à tous les scores?
moyenne
44
... peu utiles avec distribution bimodale
moyenne et médiane
45
... peu utiles avec distribution bimodale
mode et médiane
46
Pourquoi la dispersion?
Puisque les scores varient, combien représentative est une mesure de tendance centrale? Connaître l’étendue des données est un élément d’information important La dispersion est une mesure de la variabilité entre les scores
47
L’étendue
distance entre le score le plus élevé et le score le plus bas
48
Problèmes avec l’étendue
Basée sur seulement deux mesures Et pas n’importe lesquelles: les plus extrêmes! Augmente avec la taille de l’échantillon De nouveaux scores ne feront jamais réduire l’étendue Par contre, un nouveau score qui change le minimum ou le maximum augmente l’étendue
49
Étendue interquartile
Corrige certains problèmes de l’étendue Utilise les 25 e et 75 e centiles pour son calcul Peu sensible aux scores extrêmes Plus stable en fonction de la taille de l’échantillon Devrait diminuer quand l’échantillon grossit si la variable a une distribution “normale” dans la population Rarement utilisée, sauf dans les graphiques boîte-etmoustaches Permettent d’identifier visuellement les valeurs aberrantes / extrêmes
50
L’écart-type
L’écart-type (s dans la population, s dans un échantillon) est la racine carrée de la déviation carrée moyenne Les formules diffèrent pour population et échantillon
51
Variance
Un indicateur de dispersion très commun, utilisé dans une variété de procédures (non la moindre: analyse de la variance) Est le carré de l’écart-type
52
apprendre symboles