Module 3 Flashcards
Quels sont les 3 façons de représenter le contenu d’une variable?
1- Par distribution de fréquence
2-Par des indicateurs de tendance centrale
3- Par des indicateurs de dispersion
Quelle est la différence entre la fréquence absolue et la fréquence relative?
La fréquence absolue est le nombre de fois qu’un score apparaît dans une distribution de fréquence tandis que la fréquence relative correspond au pourcentage d’observations (participant) qui ont obtenu ce score
Vrai ou faux?
les tableaux de fréquence sont très complet c’est pourquoi ils sont très utilisés.
faux
ils sont peu utilisés parce qu’ils prennent trop de place avec de gros échantillons
Quel est le désavantage d’une distribution de fréquence groupée?
Certaines informations sont présentes avec moins de précision
Vrai ou faux?
Lorsque le nombre de participant est élevé il est avantageux d’utiliser un histogramme
vrai
Quelles sont les 4 méthodes utilisées pour représenter les données?
1- Tableaux
2-Histogramme
3-Diagramme en feuille
4-Diagramme en boîte
Que représente les 5 courtes lignes sur le diagramme en boîte?
représente la valeur des quatre quartiles (exprimés en rang centile)
Quels sont les avantages du diagramme en boîte?
- Donne une vue d’ensemble peu importe le nombre de score
- Puisqu’il utilise les rangs centiles à titre de points de démarcation, on sait que la proportion des scores inclus entre 2 points est de 25%
- il y a 50% des scores à l’intérieur de la boîte
- il y a toujours 50% des scores au-dessus et en-dessous de la ligne médiane
- des valeurs extrêmement éloignées des valeurs attendues sont illustrées par des cercles ou des étoiles
Quand est-il utile d’utiliser des indicateurs de tendances centrale et de dispersion?
lorsqu’on veut décrire la distribution avec des indices mathématiques
Vrai ou faux?
Lorsqu’une distribution est parfaitement normale, la moyenne, le mode et la médiane ont la même valeur?
vrai
En général, est ce qu’on préfère utiliser la médiane ou la moyenne?
la moyenne
cependant elle est très sensible aux valeurs extrêmes
Quelles sont les 3 mesures de dispersion?
- étendue
- variance
- écrat-type
Vrai ou faux?
La distribution normale théorique est en forme de pente linéaire?
faux
elle est en forme de cloche
On retrouve combien de pourcentage des scores avec un écart type en dessous de la moyenne?
68%
On retrouve combien de pourcentage des scores avec 2 écarts types en dessous de la moyenne?
96%
On retrouve combien de pourcentage des scores avec 3 écart type en dessous de la moyenne?
99%
Qu’est ce que la distribution d’échantillonnage?
Elle représente la distribution des moyennes de plusieurs échantillons tirés d’une même population
Quelle est la mesure de dispersion de la distribution d’échantillonage?
c’est l’erreur standardisée de la moyenne (SEM)
Qu’est-ce que l’intervalle de confiance?
C’est l’intervalle dans lequel la moyenne de la population a une probabilité de se trouver.
Normalement, la valeur de P est de 95%
utilise la moyenne, l’écart-type et le nombre de participant de l’échantillon pour trouver l’intervalle dans lequel la moyenne de la population devrait se trouver
Qu’est ce que le concept d’erreur significative?
C’est la vérification que la différence entre les moyennes de 2 échantillons est statistiquement significative
Qu’est-ce que le niveau alpha?
C’est la probabilité de conclure que les moyennes sont différentes alors qu’elles sont équivalentes.
Elle est généralement de 5%
il y a donc seulement 5% de chance que la différence entre les moyennes soit due à une erreur d’échantillonnage et pas une vraie différence
Quelles sont les conditions pour utiliser les tests paramétriques?
- utilisent la moyenne, l’écart-type et la variance
- Doit avoir ses prémisses:
1. Distribution normale de la variable
2. Homogénéité des variances (écart-type)
3. Indépendance et dépendance
Quels sont les facteurs influençant les tests paramétriques?
1) écart entre les moyennes d’échantillons comparées
2) la taille des échantillons
3) la dispersion des données
* les deux derniers points ont une influence sur l’erreur standardisée de la moyenne*
quand utilise t-on les tests non-paramétriques?
Lorsque les prémisses ne sont pas respectées ou utilisés avec les échelles de mesure nominale/ordinale
Par exemple, lorsque le nombre de participant est petit
Quels sont les 4 critères de sélection pour choisir le tests statistiques pour l’analyse des différences?
- respect des prémisses de base
- types d’échelles de mesure
- nombre d’échantillon
- types d’échantillons (dépendants ou indépendant)
Quel test est utilisé si on compare les moyennes de 2 échantillons différents indépendant ?
Le test-t données indépendantes
Quel test est utilisé si on compare les moyennes de 2 échantillons indépendants différents mais que les prémisses ne sont pas respectées?
Le test mann-whitney
Quel test est utilisé en présence de plus de 2 échantillons indépendants qui respectent les prémisses?
test analyse de la variance (ANOVA)
Quel test utilisé en présence de plus de 2 échantillons indépendants qui ne respectent pas les prémisses?
test Kruskal-Wallis
Quel test est utilisé si la variable d’intérêt est mesurée à partir d’une échelle de mesure nominale dichotomique ?
Chi-carré
pour analyse échantillon de 2 échantillon ou plus
Quel test utilisé lorsque le même groupe de participant est mesuré 2 fois (la première mesure est utilisée comme contrôle de la deuxième)?
Le test-t pour échantillon dépendant
Quel test est utilisé si les prémisses ne sont pas respectées en présence de 2 échantillons dépendant et qui se base sur la différence entre les 2 observations d’un même participant?
le wilcoxon signed rank test
Quel test est utilisé lors d’une expérimentation a plus de 2 temps de mesure et dont les prémisses sont respectées?
L’analyse est basée sur les différences entre les temps de mesure
l’analyse de la variance à mesure répétée (ANOVA à mesure répétées)
Quel test est utilisé lorsque les prémisses ne sont pas respectées et que le test est basé sur le rang des observations plutôt que sur leurs valeurs?
Test ANOVA de Friedman
À quoi sert un coefficient de corrélation?
Il permet de déterminer la direction et la force de relation entre 2 variables et si elle est statistiquement significative
Vrai ou faux?
Le coefficient de Pearson est utilisé pour des variables ayant une échelle nominale ou ordinale?
Faux
Entre deux variables ayant des échelles par intervalle ou proportionnelle
Est-il possible de calculer un coefficient de corrélation si le graphique de la corrélation semble curviligne?
Non, il faut que la relation soit linéaire
Quand utilise t-on un coefficient de corrélation de Spearman?
Si une des deux échelles est de type ordinal