Cours 5 - Concepts statistiques Flashcards
Qu’est-ce que révèle le tableau de fréquence?
Le nombre et/ou le pourcentage de personnes se situant à l’intérieur de chaque classe (intervalle).
Qu’est-ce qu’il faut déterminer pour construire une distribution groupée de données?
Le nombre de classes à utiliser et la largeur de ces classes qui doivent être identiques.
On insère ensuite le nombre d’observations (fréquence) dans chaque classe.

Qu’est-ce qu’un histogramme?
Représentation graphique en “tuyaux d’orgue” de la distribution de fréquence.
- Chaque tuyau représente une classe
- La hauteur du tuyau indique la fréquence de la classe correspondante
- Exemple: voir la partie hachurée de la figure ci-dessous

Qu’est-ce qu’un polygone de fréquences?
Représentation graphique en ligne brisée de la distribution de fréquences.
- Pour tracer le polygone, on joint les points milieu du sommet des rectangles adjacents par un segment de droite
- Le polygone est fermé aux deux bouts en le prolongeant sur l’axe horizontal
- Exemple: voir la ligne foncée de la figure ci- dessous

Définition de Mode
Résultats les plus fréquents.
Par exemple, le mode est 13 dans la distribution suivante: 10, 10, 12, 12, 13, 13, 13, 18, 19; car on retrouve 13 trois fois, ce qui est le résultat le plus fréquent.
Définition de Médiane
Résultat au centre de la distribution.
Par exemple, la médiane est 19 dans la distribution suivante: 2, 7, 16, 19, 20, 25, 27; car il y a trois résultats de part et d’autre de 19. Dans une distribution normale, correspond au 50e centile.
Définition de Moyenne
La moyenne utilisée en psychométrie est une étendue ou zone où se retrouve la majorité des résultats; ce qui est différent de la moyenne arithmétique
La moyenne arithmétique (Σxi/n) est la mesure de tendance centrale la plus utile.
Comment mesurer l’étendue?
On la mesure en soustrayant le minimum du maximum.
Par exemple, dans la distribution suivante: 10,12,15,18,20; l’étendue de la distribution est 10, car on soustrait 10 (le minimum) de 20 (le maximum).
Quelle est la mesure de dispersion la plus utile?
L’écart-type ou déviation standard.
Qu’est-ce que l’écart-type ou déviation standard?
Racine carrée de la variance qui elle consiste dans la sommation au carré des Xi moins la moyenne, divisée par n-1.
Par exemple, dans la distribution suivante: 7, 8, 15 où la moyenne est 10; (7-10) au carré+ (8-10) au carré+(15-10) au carré = (-3) au carré+(-2) au carré+(+5) au carré = 9+4+25=38 divisé par 3-1 = 19(variance) et racine carrée de 19 = 4,36 (écart-type).

Qu’est-ce que le skewness (asymétrie)?
Nous renseigne si la majorité des sujets ont des résultats faibles (skewness positif), normaux (skewness = 0), ou élevés (skewness négatif).
Cette mesure varie de moins l’infini, à plus l’infini, en passant par 0.

Qu’est-ce que la kurtose (voussure ou aplatissement de la courbe)?
Nous renseigne si les sujets ont des résultats également répartis du plus faible au plus élevé (kurtose négative ou distribution platycurtique), des résultats normaux (kurtose = 0), ou des résultats concentrés aux alentours du mode (kurtose positive ou distribution leptocurtique). Cette mesure varie aussi de moins l’infini, à plus l’infini, en passant par 0.

Distribution normale et score standard

Quelle est la formule du score standard Z?
Le score individuel moins la moyenne arithmétique, divisé par l’écart-type. Par exemple, si vous avez 46 à un examen dont la moyenne est 50 et l’écart-type est 10, votre score Z = 46-50/10 = -4/10 = -0,4

En quoi les scores standards Z sont-ils utiles?
Utiles lorsque l’on compare des individus provenant de groupes différents qui n’ont pas nécessairement les mêmes moyennes, mais des distributions semblables « pour distributions différentes : scores standards normalisés Z que l’on étudiera plus tard ».
Par exemple, grâce aux scores standards Z, on peut comparer les résultats, à une même matière, de deux étudiants dans deux écoles différentes.
Quel est l’objectif de la corrélation?
Quantifier la relation entre deux mesures, c’est-à-dire de mesurer à quel point deux mesures varient simultanément.
À quoi peut être attribuable la corrélation entre deux variables?
- À une relation de cause à effet (par exemple: un coup de marteau sur le pouce cause de la douleur)
- À une cause commune (par exemple: la chaleur fait augmenter le nombre de noyades et la vente de crème glacée au Québec)
- À une relation fortuite (fausse corrélation) (par exemple: résultat à examen et âge).
Qu’est-ce que le coefficient r?
On peut quantifier la force de la relation entre deux variables (ou tests psychologiques) à l’aide d’un coefficient de corrélation (qui va de –1 à +1). Ce coefficient r est égal à la somme des produits des scores standards Z de chacune des deux mesures, divisé par le nombre de sujets moins 1.
Par exemple d’un échantillon fictif, un individu a des scores standards Z de 0,5 à la variable X et de 1,0 à la variable Y « les distributions de X et Y sont semblables » et un autre individu a des scores standards Z de 1,0 à la variable X et de 0,4 à la variable Y, la corrélation entre les variables X et Y est rxy = (0,5x1,0y) + (1,0x0,4y)/2-1 = 0,9/1 = ,90.

Quel coefficient de corrélation est le plus utilisé?
Le coefficient de corrélation de Pearson.
Quels sont les deux types de variables dépendantes?
- Variables discontinues
- Variables continues
Quels types de variables peuvent être les variables discontinues?
- Nominales
- Qualitatives
- Quantitatives
- Ordinales
Qu’est-ce qui est utilisé avec les variables discontinues?
Lorsque vous avez un temps de mesure vous employez un chi-carré de conformité avec une variable discontinue.
Pour deux variables discontinues, vous employez un chi-carré d’indépendance. Pour deux temps de mesure (deux variables discontinues), vous employez un McNemar.
Qu’est-ce que les variables continues?
Des variables à intervalles égaux, par exemple les réponses des sujets à un questionnaire utilisant une échelle de Likert ou le quotient intellectuel, ou des variables de rapport, par exemple l’âge.
Avec les variables continues, vous pouvez potentiellement employer tous les tests paramétriques et non paramétriques autres que le chi-carré et le McNemar.
Exemple de variable dépendante et indépendante

Quoi faire lorsque la distribution d’une variable dépendante continue est normale?
Et dans le cas contraire?
Vous pouvez employer les tests paramétriques T et ANOVA.
Dans le cas contraire, vous devez employer des tests non paramétriques, si les distributions sont franchement anormales (asymétries plus petites que -1 ou plus grandes que +1). Toutefois, ces tests sont robustes, i.e tolèrent une légère anormalité (asymétries entre -1 et +1).
Quoi faire pour tester la normalité de la distribution?
Vous pouvez employer le test de Kolmogorov-Smirnov avec plus de 50 sujets ou le test de Shapiro-Wilk avec 50 sujets et moins.
Qu’est-ce que l’égalité des variances?
Lorsqu’on compare au moins 2 groupes (VI), les variances des VD continues doivent être égales (homogènes) pour pouvoir employer les tests paramétriques. Dans le cas contraire, vous devez employer des tests non paramétriques, sauf avec les tests T et les analyses de variance dont les effectifs des groupes sont égaux. L’égalité des variances est testée avec le test de Levene (p doit être plus grand que ,05).
Plan de recherche

Qu’est-ce qu’un plan à groupes indépendants?
Pour un plan à une variable indépendante à deux niveaux, vous employez le test T à groupes indépendants (test paramétrique) ou le Mann-Whitney (test non paramétrique)
Pour un plan à une variable indépendante à deux niveaux ou plus, vous employez une ANOVA simple à groupes indépendants (test paramétrique) ou Kruskal-Wallis (test non paramétrique).
Pour un plan à deux variables indépendantes ou plus, vous employez une ANOVA factorielle inter-sujets (test paramétrique qui n’a pas d’équivalent non paramétrique).
Qu’est-ce qu’un plan à mesures répétées?
Pour un plan à deux temps (pré-test et post-test) vous employez un test T pairé (test paramétrique) ou un Wilcoxon (test non paramétrique)
Pour un plan à deux temps ou plus, vous employez une ANOVA simple à mesures répétées (test paramétrique) ou un Friedman (test non paramétrique).
Pour un plan à plus d’une variable indépendante vous employez une ANOVA factorielle intra-sujets (test paramétrique qui n’a pas d’équivalent non paramétrique)
Qu’est-ce qu’un plan combiné?
Pour un plan combiné, vous employez une ANOVA pour plans combinés (test paramétrique sans équivalent non paramétrique).