module 6 : les statistiques Flashcards
Les indicateurs de tendance centrale et de dispersion sont utilisés pour
décrire une distribution.
qu’est-ce que la tendance centrale
fait référence à des mesures qui permettent de localiser le centre d’une distribution de scores. Spécifiquement, l’objectif d’une mesure de tendance centrale est de résumer en un seul nombre la valeur typique ou la plus représentative d’un ensemble de scores. Il existe trois mesures de tendance centrale : moyenne, mode et médiane.
qu’est-ce que la moyenne
représente la mesure la plus courante de tendance centrale. Elle se calcule en additionnant les valeurs observées de chaque participant divisées par le nombre de participants observés.
qu’est-ce que le mode d’une série d’observations
est la valeur la plus fréquente d’un ensemble de données. Le mode est rarement employé seul pour mesurer la tendance centrale, parce qu’avec un petit nombre d’observations, chaque valeur est unique. Dans ce cas, il n’y a pas de mode.
qu’est-ce que la médiane d’une série d’observation
l’observation du milieu d’une distribution de scores, c’est-à-dire à la valeur de part et d’autre de laquelle se situe la moitié des observations. Pour la mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant. La position de la médiane se calcule tel qu’indiqué dans la diapositive, selon que le nombre de scores est pair ou impair.
En général, on préfère utiliser la moyenne à la médiane parce que
la moyenne est calculée en utilisant un maximum d’informations de toutes les
2
observations. En effet, le calcul de la moyenne fait intervenir les valeurs de toutes les observations, alors que la médiane représente l’information d’une seule observation. De plus, une partie importante des tests statistiques repose sur la moyenne. Toutefois, le désavantage de la moyenne est qu’elle est très sensible aux valeurs extrêmes, alors que la médiane ne l’est pas du tout.
quelles sont les mesures de dispersion?
la variance et l’écart-type mesurent quoi ?
mesurent la dispersion (ou l’écart) de chaque observation autour de la moyenne.
pk le signe utilisé pour représenter la variance d’une population diffère de celui utilisé pour un échantillon
Cela est dû au fait que le calcul de la variance varie légèrement lorsqu’il s’agit d’un échantillon.
v ou f : il est commun d’exprimer les paramètres d’une distribution par sa moyenne et son écart-type
vrai
qu’est-ce que la distribution de normale?
distribution théorique « en forme de cloche » et est appelée normale parce qu’elle représente bien la distribution de plusieurs phénomènes observés dans la nature (p. ex. : la taille, le poids, l’âge, la capacité intellectuelle, etc.). Cette distribution est dite « théorique », car il est rare qu’une distribution de scores soit « parfaitement normale ». Si cela s’avérait être le cas, la courbe de distribution des scores serait parfaitement symétrique, unimodale et en forme de cloche autour de la moyenne.
La xxx est un principe clé sur lequel sont basés plusieurs tests statistiques?
distribution normale
comme dans toute distribution qui tend à être normale, on observe :
un pourcentage plus élevé de données près de la moyenne et un pourcentage de plus en plus faible à mesure que l’on s’en éloigne, en allant vers les extrémités de la distribution. Dans cet exemple, le programme informatique a surimposé une courbe (en noir) sur l’histogramme de la distribution, montrant ce que serait une distribution théorique « parfaitement normale ». On constatera qu’avec 480 observations, cette distribution est très proche de la normalité parfaite, donc probablement très représentative de la population d’où elle est tirée : l’ensemble des personnes ayant une lésion médullaire au Québec.
L’exemple à la droite de la diapositive présente des données d’âge d’un groupe de personnes ayant subi une arthroplastie du genou (n=30). L’histogramme montre une distribution beaucoup moins symétrique que la précédente et, donc, plus éloignée d’une distribution normale. Évidemment, il n’y a pas que les représentations graphiques qui nous permettent de déterminer la normalité d’une distribution.
À l’aide de la moyenne et de l’écart-type, on peut en savoir davantage sur la « normalité » d’une distribution, car la distribution normale théorique possède des caractéristiques définies sur le plan du pourcentage d’observations (scores) que l’on devrait retrouver dans un intervalle connu.
v ou f : on ne sera pas surpris de retrouver un pourcentage plus élevé de données près de la moyenne et un pourcentage plus faible vers les extrémités de la distribution
vrai
v ou f : 2 % des scores d’une distribution normale devraient se retrouver au-dessus de deux écarts-types de la moyenne
vrai
si une distribution est normalement distribuée, le % de scores dans un écart défini est connu
comment faire la comparaison de deux distributions de scores
écessite l’utilisation d’une échelle unique à toutes les distributions. Pour ce faire, les scores de chaque distribution sont transformés en score Z à partir de la moyenne et de l’écart- type de leur distribution respective (équation ci-contre). Le score Z d’un score x de la distribution correspond au nombre d’écarts-types en dessous ou au- dessus de la moyenne de la distribution. L’unité de mesure de la nouvelle échelle n’est plus des années, des degrés ou autres, mais des écarts-types. À noter que la transformation d’une distribution en scores Z ne change pas la forme de la distribution, mais sa moyenne devient 0 et son écart-type (s) égale 1.
v ou f : En lien avec la notion de « pourcentages sous la courbe normale », nous pouvons calculer la probabilité d’obtenir un score supérieur ou inférieur à un score Z donné dans une distribution
vrai
Donc, chaque score de la distribution a été transformé en score Z et, par exemple, le score le plus bas (x = 32 degrés) donne un score Z de -2,3 soit, à 2,3 écarts-types de la moyenne. La probabilité (p) d’obtenir un score inférieur à 32° dans cette distribution est donnée par le « pourcentage sous la courbe normale », qui peut être obtenu avec une grande précision à partir d’une table de scores Z.
à quoi correspond la distribution des moyennes échantillonnages?
correspond à la distribution de plusieurs échantillons provenant de la même population
la distribution des moyennes échantillonnages est un estimé précis de la moyenne de la population
vrai
Nomme une façon de pouvoir obtenir une estimation plus précise de la moyenne de la population
tirer plusieurs échantillons (disons dix échantillons) et de déterminer la moyenne et l’écart-type de ces dix moyennes d’échantillons.
qu’est-ce que l’erreur-type de la moyenne
l’indice de dispersion des moyennes échantillonnales.
si nous avions tiré dix échantillons, l’erreur-type serait la valeur de l’écart-type de la distribution des dix moyennes.
Les statisticiens ont développé une formule simple pour obtenir l’erreur-type de la moyenne pour un échantillon, elle se calcule à partir de quoi?
qui se calcule à partir de l’écart-type (s) et du nombre d’observations (n) de la distribution.
Maintenant que nous avons identifié un indice de dispersion associé à la moyenne d’une population, il est possible de déterminer, pour une distribution de scores d’un échantillon, un intervalle dans lequel il y a une certaine probabilité de trouver cette moyenne. Comment se nomme ce concept?
intervalle de confiance de la moyenne d’un échantillon
qu’est-ce que l’intervalle de confiance de la moyenne d’un échantillon
l’intervalle autour de la moyenne d’un échantillon (p. ex. X = 77,6° d’amplitude articulaire) à l’intérieur duquel on obtient une probabilité (en pourcentage) de trouver la vraie moyenne de la population.
Le calcul de l’intervalle de confiance autour d’une moyenne et dans lequel il y a une probabilité connue de trouver la vraie moyenne de la population est relativement simple ( 4 étapes) :
1) Calcul de la moyenne de l’échantillon pour la variable d’intérêt (ex. : l’amplitude articulaire);
2) Calcul de l’erreur-type de la moyenne (SEM) à partir de l’écart-type et du nombre de scores;
3) Identification du score Z qui correspond à la probabilité désirée (pourcentage de chance de trouver la vraie moyenne);
4) Cette identification doit se faire à partir d’une table de scores Z et, dans les exemples que nous utilisons (68, 90 et 95 %), ces scores z sont respectivement de 1.00 1.645 et 1.960 (voir dans les formules ci-dessus).
qu’est-ce que le concept de différence significative?
la probabilité que les moyennes des deux échantillons soient semblables à celles des populations d’ou elles proviennent