cours 5 Flashcards
Qu’est-ce que l’analyse exploratoire des données?
Elle constitue l’étape préliminaire à toute analyse statistique, même la plus sophistiquée
Elle aide à orienter les analyses subséquentes (paramétriques vs. non paramétriques)
On s’attarde habituellement à trois aspects: les mesures de tendance centrale, les mesures de dispersion et la distribution des résultats
Qu’est-ce que les mesures de tendance centrale?
Elle est une mesure qui indique où se trouve la majeure partie des données ou scores d’une distribution.
Elle est un effort de synthèse : représenter un ensemble sur la base d’un seul indicateur
C’est une mesure de groupe…
Quels sont les 3 types de mesures de tendance centrale?
mode, médiane, moyenne
Qu’est-ce que le mode?
C’est la valeur la plus fréquente d’un ensemble de données (celle qui revient le plus souvent), il peut avoir 1 mode, plusieurs mode ou aucun mode Ex: 20, 21, 20, 24, 25, 20, dans ce cas-ci le mode sera 20
Qu’est-ce que la médiane?
Ça correspond à l’observation du milieu, c’est-à-dire la valeur de part et d’autre de laquelle se situe la moitié des observations. Pour la mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant et coupe 50/50
Ex: 26, 25, 43, 67, 18
Si on le met en ordre croissant: 18, 25, 26, 43, 67 , la médiane est donc 26
Qu’est-ce que la moyenne?
Elle représente la mesure la plus courante de tendance centrale des observations. Elle se calcule en additionnant les valeurs observées de chaque individu, somme divisée par le nombre de sujets observés.
Ex: 20, 20, 40, 30 on additione tout et on divise par le nombre de valeurs (20+20+40+30)/4= 27,5
Qu’est-ce qui pourrait faire en sorte que la moyenne et la médiane ne sont pas pareils?
Les valeurs extremes
Qu’est-ce que les mesures de dispersion?
-Les mesures de dispersion sont des indices qui caractérisent l’étalement des valeurs d’une distribution d’une variable autour d’une valeur centrale.
-Les mesures de tendance centrale ne peuvent pas décrire pleinement une distribution de scores.
-Les indices de dispersion permettent de savoir si les scores individuels se rapprochent ou s’éloignent beaucoup des mesures de tendance centrale.
-Les mesures de dispersion ne permettent pas de comparer des distributions qui ne sont pas sur la même échelle (ex : prix des bananes et prix de voitures)
Quelles sont les 3 principales mesures de dispersion?
L’étendu, la variance, l’écart type
Qu’est-ce que l’écart-type?
Racine carrée de la variance. C’est la plus utilisée dans le cas de la description de variables continues. L’écart-type est une mesure de dispersion qui indique à quel point les valeurs d’un ensemble de données s’écartent en moyenne de la moyenne de cet ensemble
Que signifie un écart type élevé? Et au contraire un écart type faible?
Un écart-type élevé signifie que les valeurs sont très dispersées, tandis qu’un écart-type faible indique qu’elles sont proches de la moyenne.
Qu’est-ce que l’étendue?
indique entre quelles valeurs les résultats varient (de minimum à maximum)
Que signifie une étendue élevé?
Plus l’étendue est grande, plus les valeurs sont dispersées.
Qu’est- ce que la variance?
Elle mesure la dispersion de chaque observation autour de la moyenne (doit pas savoir le calcul pour l’exam)
Qu’est-ce que la distribution?
-Les valeurs de chaque cas pour une variable donnée
-Typiquement, les réponses sont ordonnées
Qu’est-ce qu’un fractile?
Séparent la distribution en groupes égaux
Quel type de fractile est la plus fréquent?
Le quartile (divise par 4)
Qu’est-ce que le kurtose (k) ?
C’est une mesure d’aplatissement de la distribution
Quels sont les 3 types et à quoi ressemblent-ils?
Mesokurtique (k=0): Normale
Leptokurtique (k>0): haute et mince
Platykurtique (k<0): basse et large
Qu’est ce que la symétrie (skewness)?
C’est une mesure d’asymétrie de la distribution
Quels sont les 3 types d’asymétrie et à quoi ressemble leur courbe?
Asymétrie positive: pointe de la courbe vers l’axe des y
Pas d’asymétrie: La normale pointe de la courbe au centre
Asymétrie négative: pointe de la courbe à l’opposé de l’axe des y
Pour une courbe asymétrie négative dans quel ordre serons la moyenne, le mode et la médiane?
Moyenne - Médiane - Mode
Pour une courbe asymétrie positivedans quel ordre serons la moyenne, le mode et la médiane?
Mode - Médiane - Moyenne
Lorsque le N est de moins de 30, notre variable est par défaut… paramétrique ou non paramétrique?
non paramétrique
Lorsque la distribution de notre variable est non normale… paramétrique ou non paramétrique?
non -paramétrique, Cela dit, on peut accorder du lousse à cette restriction.
Une variable nominale ou ordinale est automatiquement… paramétrique ou non paramétrique?
non -paramétrique
Quelles sont les quatre manières de distribution des résultats?
Fractile, distribution normale, kurtose, symétrie