analyses Flashcards
quel est le but de toutes les statistiques descriptives
Le but de toutes les statistiques descriptives est de décrire, de façon condensée (parfois un seul nombre), un ensemble de données, pas d’inférer !!!(statistique inférentielle)
lors de statistique descriptive st ce qu’on s’intéresse à la valeur des scores individuels d’un échantillon
non
les statistiques descriptive impliquent l’idée de ________
implique l’idée de communication, on s’intéresse à des moyens standardisés de transmettre l’information
qu’est ce qu’un tableau
Condensent l’information en colonnes et rangées
qu’est ce que la première rangée des tableaux
La première rangée identifie le contenu des colonnes
qu’est ce que la première colonne dans les tableaux
La première colonne identifie le contenu des rangées (optionnel)
comment doit être le titre des tableaux
bref et clair
les tableaux sont énuméré avec des numéros ________
séquentiels
maximum de ligne horizontale dans un tableau
3
maximum de ligne verticale dans un tableau
0
le numéro de tableau et le titre doit être situé où
au dessus, centré, lignes séparées
est ce que l’ordre des rangée a un certain ordre obligatoire
non, choix personnel
les tableau de distribution d’effectifs simple sont idéal pour les variables ________
nominales
avec quels types de variables au utilise la distribution d’effectifs regroupés
variables intervalle-rapports
dans une ditribution d’effectifs regroupés. les intervalles sont de taille ________
constante
est ce qu’il est possible qu’il y ai des intervalles ouverts aux extrémités dans une distribution d’effectifs regroupés
oui
dans une distribution d’effectifs regroupés, chaque score est associé à un seul……
intervalle de classe
le nombre d’intervalles dans la distribution d’effectifs regroupés doit condenser l’indo sans ……
masquer des détails importants
dans une distribution cumulative d’effectifs regroupés, la fréquence rapportée est celle de l’intervalle de classe _______ plus celle(s) de l’(des) intervalle(s) ____________
courant
précédent(s)
dans une distribution relative d’effectifs regroupés, la fréquence rapportée est non pas absolue (i.e., le nombre de scores de la classe) mais ________
relative (i.e., la proportion de scores dans la classe rapportée)
qu’est ce qu’une proportion
une proportion est un nombre de choses particulières divisé par le nombre total de choses incluant les choses particulières (e.g., nombre d’hommes divisé par nombre de personnes = proportion d’hommes)
Minimum: 0.0
Maximum: 1.0
est ce que les tableaux sont flexibles
oui
est ce que dans un tableau, il est possible de combiner fréquences absolues ou relatives dans un schème cumulatif
oui, très flexible
on décide de comment on organise nos données dans nos tableaux mais toujours dans le but de quoi
but de résumer/simplifier l’information
x =
y =
x = abscisse
y = ordonnée
est ce qu’il y a une manière logique d’ordonner des variables qualitatives sur un continuum
non
comment on met les données qualitatives
On les met, au choix, en ordre alphabétique, en ordre d’effectifs, en ordre selon les choix de réponse…
les scores des données qualitative se distingue en fonction de quoi
leur essence
Puisque les scores des données qualitatives se distinguent en fonction de leur essence ( 2) par rapport aux figures
- Ils ne peuvent se toucher lorsque représentés le long d’une dimension
- Ne peuvent pas être liés par des lignes ou autres connecteurs
quel type de graphique est très rare en psychologique
graphique à secteurs
dans quelles situations on utilise pas des graphiques à bâtons ou à secteurs
avec des mesure à intervalles ou à rapports
alors comment on pourrait utilisé des graphiques à bâtons ou à secteurs avec des mesure à intervalles ou à rapports
À moins de transformer les scores en mesures nominales ou ordinales
E.g., taille en format “petit, moyen, et grand”
quels sorte de graphiques on utilise avec des mesures à intervalles et à rapports
On utilise plutôt des polygones de fréquences ou des histogrammes
qu’est ce qu’un polygone de fréquence
Il y a un point dans l’espace 2D pour chaque intervalle de classe
où est positionné le point dans les polygones de fréquences
Le point est positionné au dessus du centre de l’intervalle le long de l’abscisse
les étiquettes doivent référer à quoi par rapport aux polygones de fréquences
Les étiquettes doivent référer à cette valeur centrale ( soit le point est positionné au dessus du centre de l’intervalle le long de l’abscisse)
la fréquence de l’intervalle de classe est représenté par quoi dans les polygones de fréquences
La fréquence de l’intervalle de classe est représenté par la position du point selon l’ordonnée
l’intervalle et vide ou ouvert dans les polygones de fréquences
Généralement un intervalle vide à chaque bout (pas d’intervalle ouvert)
comment sont joint les points voisins dans des polygones de fréquences
Des lignes joignent les points voisins
les histogrammes sont semblable à quoi
aux polygones
qu’est ce qui change entre les histogrammes et les polygones
Plutôt qu’un point, une barre horizontale est
placée à la hauteur adéquate au-dessus de
chaque intervalle de classe
la largeur de la barre dans un histogramme corresponds à quoi
à la largeur de
l’intervalle
Des lignes ____________ (une de chaque côté)
joignent la barre à l’abscisse
verticales
les graphiques à bâtons pour groupes sont utiles pour quoi
Utiles pour illustrer la relation entre variables indépendantes et dépendantes
les vds dans les graphiques à bâtons pour groupes sont sur l’axe des x ou y
y
les vis dans les graphiques à bâtons pour groupes sont sur l’axe des x ou y
x
qu’est ce que représentent les graphiques à dispersion
Représentent le score sur deux variables pour chaque membre de l’échantillon
dans les graphiques à dispersion, qu’est ce qui est représenter sur l’axe des x et y
Une variable est assignée à x, l’autre à y
Pour chaque participant, un point représente son score sur les deux variables ou sur une seule variable dans les graphiques à dispersion
les deux variables
par mesure ou tendance centrale, on réfère à quoi
on réfère à un nombre qu’on prétend typique ou représentatif d’un ensemble de scores
quelles sont les trois mesures plus communes en psychologie
Mode
Médiane
Moyenne
qu’est ce que le mode
Le mode est le score qu’on observe le plus souvent
quoi utilisé comme meilleure prédiction pour une personne inconnue si vous ne savez rien d’autre
le mode
combien de modes peut avoir une distribution
Une distribution peut avoir deux modes ou plus
distribution avec deux mode est appelés comment
bimodale
distribution avec plusieurs mode est appelés comment
multimodale
le mode n’est pas approprié pour quoi, pourquoi
pour des intervalles de classe
car le score modal n’est pas nécessairement dans l’intervalle modal
qu’est ce que la médiane
La médiane est le score au milieu d’une distribution ordonnée
quel est le synonyme de la médiane
50e centile
est ce qu’une proportion de scores peuvent être égaux à la médiane
oui
comment calculer la médiane
- Mettre les scores en ordre de grandeur
- Calculer (n + 1) / 2
- Si le résultat est un nombre entier, il vous donne la position de la médiane
- Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19e et 20e scores) Si ces deux scores diffèrent, on prend leur moyenne
la médiane n’est pas approprié pour quoi
pourquoi
Pas approprié pour des intervalles de classe
Car l’intervalle médian ne crée pas nécessairement
deux moitiés égales
qu’est ce que la moyenne
La moyenne est la somme de tous les scores,
divisée par le nombre de scores. Elle a des
propriétés importantes
la somme des déviations dans la moyenne est égale à quoi
0
la moyenne minimise quoi
Minimise les déviations carrées
Comparé aux autres mesures centrales
la moyenne représente la quantité de quoi
Représente la quantité que tout le monde aurait si la caractéristique était distribuée équitablement
est ce que changer un score change obligatoirement la moyenne
oui
est ce que changer un score change obligatoirement la le mode ou la médiane
non
est ce que les degrés de liberté sont illustrés dans la moyenne
oui
quelle mesure de tendance centrale montre les degrés de liberté
moyenne
comment sont le mode, la moyenne et la médiane dans une distribution normale
Dans une distribution normale, la moyenne, la médiane et le mode sont identiques
quand les données sont nominales, quelle donnée centrale choisir
mode
quelle mesure de tendance centrale est la plus représentative
le mode
quelle mesure de tendance centrale se trouve au milieu
médiane
quelle mesure de tendance centrale est sensible à tous les scores
moyenne
avec une distribution bimodale, quelles mesure de tendance centrale sont peu utile (2)
moyenne et la médiane
quelles mesure de tendance centrale est plus représentative avec des données biaisées
mode et médiane
qu’est ce qui est un élément d’information important par rapport aux données
connaître l’étendue des données
qu’est ce que la dispersion
La dispersion est une mesure de la variabilité entre les scores
qu’est ce que l’étendue
L’étendue est la distance entre le score le plus élevé et le score le plus bas
quels sont les problèmes avec l’étendue (2)
- Basée sur seulement deux mesures ( en plus ces les deux les plus extrêmes)
- Augmente avec la taille de l’échantillon
De nouveaux scores ne feront jamais réduire l’étendue
Par contre, un nouveau score qui change le minimum ou le maximum augmente l’étendue
est ce que des nouveaux scores permettent de faire réduire l’étendue
jamais
qu’est ce qui peut faire augmenter l’étendue
un nouveau score qui change le minimum ou le maximum augmente l’étendue
l’étendue interquartile corrige quoi
Corrige certains problèmes de l’étendue
- Peu sensible aux scores extrêmes
- Plus stable en fonction de la taille de l’échantillon
quel quartile l’étendue interquartile utilise pour son calcul
Utilise les 25e et 75e centiles, en d’autres mots, les 50% de scores du milieu servent à évaluer l’étendue interquartile
est ce que l’étendue interquartile est sensible aux scores extrêmes
non
quand est-ce que l’étendue interquartile est plus stable, en fonction de quoi, est ce qu’elle diminue ou grossit quand l’échantillon grossit
Plus stable en fonction de la taille de l’échantillon
Devrait diminuer quand l’échantillon grossit si la variable a une distribution “normale” dans la population
est ce que l’étendue interquartile est souvent utilisé
Rarement utilisée, sauf dans les graphiques boîte-et-moustaches
qu’est ce que permet l’étendue interquartile dans un graphique de boîte-et-moustaches
Permettent d’identifier visuellement les valeurs aberrantes / extrêmes
qu’est ce que l’écart type
L’écart-type (s dans la population, s dans un échantillon) est la racine carrée de la déviation carrée moyenne
- donne une idée de l’ampleur avec laquelle les valeurs d’un ensemble de données s’écartent de la moyenne de ces donnée
est ce que la formule est la même pour calculer l’écart type de la population et de l’échantillon
Les formules diffèrent pour population et échantillon
la variance est un indicateur de quoi
Un indicateur de dispersion très commun, utilisé dans une variété de procédures (non la moindre: analyse de la variance)
la variance est le carré de quoi
de l’écart type
qu’est ce que permet les statistiques inférentielles
Méthodes qui vous permettent d’évaluer la probabilité que ce que vous observez dans votre échantillon est vrai dans la population
les statistiques inférentielles testent qu’elle hypothèse
Testent l’hypothèse nulle H0 et vous donnent la probabilité qu’elle soit vraie selon vos résultats
on rejette H0 si sa probabilité est inférieur à quoi
0,05
La question “mais quel test utiliser?” est toujours solutionnée par deux simple contraintes
- La nature des scores (nominal, ordinal…)
- Ce qu’on veut savoir des données (différence ou relation…) en lien avec le plan de recherche
L’étudiant-e super bien éduqué-e va commencer par regarder quoi
la forme de la distribution pour s’assurer qu’un test non paramétrique n’est pas plus indiqué
stats = ?
outils