module 3 Flashcards
qu’est- ce que les statistiques descriptives
-Des méthodes qui permettent de représenter, d’une façon relativement sommaire, des informations colligées dans une base de données, sous la forme de variables avec des échelles de mesure.
- ces méthodes présentent le contenu d’une variable de trois façons :
1) par distribution de fréquence (tableau ou graphique)
2) par des indicateurs de tendance centrale, 3) par des indicateurs de dispersion.
statistique descriptives : distribution de fréquence
- Fréquence absolue (Nb de fois qu’il apparait)
> Diagramme en feuilles (peu pas avoir bcp de participant)
> Histogramme - Fréquence relative (en pourcentage d’observations)
> Pourcentage
> Pourcentage groupé (EX; de 12 à 24 ans il y a 50%)
> Histogramme
-Un tableau de distribution de fréquence donne la fréquence absolue et relative, mais prend bcp de place donc utiliser moins souvent
Distribution de fréquence groupée
Dans un souci de concision et de clarté pour le lecteur, plusieurs méthodes peuvent être utilisées afin de documenter les mêmes informations dans un format adéquat. Le désavantage de cette méthode est que certaines informations sont présentées avec moins de précision.
histogramme et méthodes graphique pourquoi
Considérant les limites et l’utilité relative des tableaux de fréquences, des méthodes graphiques ont été développées pour présenter des distributions de fréquence et l’histogramme est certainement la plus connue. Comme les histogrammes utilisent souvent les regroupements de valeurs, on y perd en précision mais on y gagne sur la vue d’ensemble de la distribution, et visuellement, l’histogramme permet d’apprécier la normalité de la distribution.
distribution de fréquence : diagramme à feuille
Ce type de diagramme est souvent généré par les programmes informatiques de statistiques (SASTM, SPSSTM) et est un compromis entre le tableau de fréquence et l’histogramme. Ce type de graphique comporte à la fois l’avantage d’offrir une représentation visuelle des données sans avoir le désavantage de la perte d’information reliée à l’utilisation de l’histogramme.
distribution de fréquence : diagramme à bande
Il s’agit de représenter la distribution des scores sur une échelle (dans le présent exemple sur la verticale) à l’aide d’une boîte avec 2 moustaches (inférieure et supérieure) dont les 5 courtes lignes horizontales correspondent aux valeurs des quatre quartiles (exprimés en rang centile).
indicateurs de tendance centrale et de dispersion
- Lorsque l’on veut décrire l’illustration graphique d’une distribution avec des indices mathématiques.
- l’objectif d’une mesure de tendance centrale est de résumer en un seul nombre la valeur typique ou la plus représentative d’un ensemble de scores.
les trois mesure de tendance central
- la moyenne, le mode et la médiane.
- Lorsqu’une distribution est parfaitement normale, la moyenne, le mode et la médiane ont la même valeur.
qu’est-ce que la mode
Le mode d’une série d’observations est la valeur la plus fréquente d’un ensemble de données. Le mode est rarement employé seul pour mesurer la tendance centrale parce qu’avec un petit nombre d’observations, chaque valeur est unique
calcul médiane
voir diapo 15
mesure de dispersion
- Étendue :
Différence entre la valeur la plus petite et la plus grande d’une distribution. - Variance :
Indice de la variabilité des scores d’une distribution autour de la moyenne (s2 ou s2). - Écart-type :
Indice de la variabilité des scores d’une distribution autour de la moyenne (s ou s). Il s’agit de la racine carrée de la variance.
Calcul de la variance et de l’écart-type
voir diapo 17
Concept de distribution normale
- Distribution de fréquence d’une variable symétriquement distribuée autour de la moyenne selon une courbe normale.
- Importance du concept :
La distribution normale est un principe clé sur lequel sont basés plusieurs tests statistiques.
loi sur laquelle de nombreux test sont basé
la distribution normal
exemple de distribution normal
- Comme dans toute distribution qui tend à être normale, on observe un pourcentage plus élevé de données près de la moyenne et un pourcentage de plus en plus faible à mesure que l’on s’en éloigne vers les extrémités de la distribution.
- Si moins symétrique = plus éloigné de la distribution normal
Score z et distribution normale standardisée
Cette transformation (voir la formule dans la diapositive) permet de comparer des distributions de scores en utilisant une échelle unique (z). Toutes les distributions de scores (p.ex. âge, poids, taille, amplitude articulaire) peuvent être transformées en score z, facilitant ainsi leur comparaison.
la distribution d’échantillonnage
La distribution d’échantillonnage représente la distribution des moyennes de plusieurs échantillons tirés d’une même population alors que la distribution normale représente la distribution des valeurs de plusieurs individus d’un même échantillon.