Cours 1 Flashcards
Qui suis-je?
Se concentre sur une seule variable pour en décrire les caractéristiques principales (sans examiner les relations avec d’autres variables).
Analyse univariée
Vrai ou faux?
L’analyse univariée est utile pour comprendre la forme d’une distribution, y compris des éléments comme l’asymétrie (skewness), la kurtosis, et les valeurs extrêmes.
Vrai
Vrai ou faux?
L’analyse univariée permet de produire des résumés statistiques pour plusieurs variables, comme la moyenne, la médiane, la variance et l’écart-type
Faux
L’analyse univariée permet de produire des résumés statistiques pour une seule variable, comme la moyenne, la médiane, la variance et l’écart-type .
Nommez trois mesures de tendance centrale
Moyenne, mode, médiane
Nommez trois mesures de dispersion
écart-type, variance, écart total ou étendue total
Nommez les deux limites associées à l’analyse univariée.
-Absence d’analyse de relations (uniquement avec analyses bivariées ou multivariées);
-Informations limitées (pas d’informations sur la causalité ou les relations entre variables)
Qui suis-je?
Examine deux variables simultanément pour comprendre la relation qui les unit.
Analyse bivariée
La corrélation est une analyse…
…bivariée
La régression simple est une analyse…
…bivariée
L’analyse bivariée est souvent utilisée pour mesurer la _______ _______ entre deux variables.
-Relation
-Linéaire
Nommez un exemple d’analyse bivariée portant sur les relations linéaires entre deux variables.
corrélation de Pearson
Analyse de l’association
Pour des variables _______, des méthodes comme les
______(3) et le test du _______ sont utilisées pour analyser la ______ de l’association entre deux variables.
-catégorielles
-tableaux de contingence
-khi-deux (χ²)
-force
De quel type de corrélation s’agît-il?
une variable augmente, l’autre augmente également
Corrélation positive
De quel type de corrélation s’agît-il?
une variable augmente, l’autre diminue
Corrélation négative
De quel type de corrélation s’agît-il?
proche de zéro, pas de relation entre les variables
Corrélation nulle
Quelles sont les limites de l’analyse bivariée?
-Corrélation ne signifie pas causalité: Une corrélation entre deux variables n’implique pas nécessairement qu’il existe une relation causale entre elles. D’autres méthodes d’analyse, comme les expériences ou les études longitudinales, sont nécessaires pour tester la causalité (Cohen, 1988).
- Relations non linéaires : L’analyse bivariée avec la corrélation de Pearson est limitée aux relations linéaires. Si la relation entre les variables est non linéaire, des méthodes plus avancées sont nécessaires pour la capturer.
Si je ne peux pas utiliser ma moyenne et que je veux faire une étude de corrélation, je peux effectuer…
…Une corrélation polychorique
Vrai ou faux?
Une corrélation polychorique utilise la moyenne comme substitut de la variance dans la formule.
Faux.
Une corrélation polychorique utilise la médiane comme substitut de la moyenne dans la formule.
Comment se nomme une corrélation utilisant le mode comme mesure de tendance centrale?
Corrélation tétrachorique
Quelle est la différence entre les analyses multiples et les analyses multivariées?
Le type des variables :
Indépendantes = multiples
Dépendantes = multivariées
Vrai ou faux?
L’analyse multivariée
examine plusieurs variables à la fois pour explorer les relations entre elles et identifier des modèles.
Vrai
Quelles sont les conditions d’application de l’analyse multivariée?
*Analyse de la variance simultanée (examine plusieurs variables dépendantes);
*Réduction dimensionnelle (ACP, AFE, AFC - réduit la complexité de données);
Quelles sont les possibilités d’interprétation (analyses) des résultats pour les analyses multivariées?
*Régression multivariée (plusieurs variables indépendantes sur 2 ou + dépendantes);
*Analyses factorielles (identifie les relations sous-jacentes entre les variables);
Quelles sont les limites des analyses multivariées?
*Complexité des modèles (beaucoup variables peut rendre un modèle trop complexe);
*Hypothèses strictes (nécessite normalité des résidus et l’absence de multicolinéarité).
Qu’est-ce que la multicolinéarité?
Multicolinéarité: quand deux variables (ou plus) sont fortement corrélées.
Vrai ou faux?
La moyenne arithmétique se propose à représenter tous les résultats d’un ensemble de données .
Vrai
Quelles sont les conditions d’application de la moyenne?
*Échelle de mesure appropriée (intervalle ou rapport);
*Absence d’asymétrie excessive (sensible aux valeurs aberrantes);
*Distribution unimodale (plus pertinente avec une seule mode);
*Égalité des variances (comparer plusieurs moyennes, variances équivalentes)
Comment interpréter la moyenne?
*Représentation de la tendance centrale (pas toujours une observation « réelle »);
*Sensibilité aux valeurs extrêmes (augmente la moyenne du groupe);
*Utilisation dans les comparaisons (couramment utilisée pour comparer des groupes)
Quelles sont les limites de la moyenne?
-Sensibilité aux valeurs extrêmes (fournir une image trompeuse de la tendance centrale);
-Non-représentativité dans les distributions asymétriques (ne représente pas le groupe).
Qu’est-ce que la médiane?
Mesure de tendance centrale qui divise un ensemble de données en deux parties égales (données ordonnées).
Vrai ou faux?
La moyenne offre une meilleure représentation des données que la médiane lorsque les données sont asymétriques.
FAUX!
La médiane offre une meilleure représentation des données que la moyenne lorsque les données sont asymétriques.
Vrai ou faux?
La médiane est davantage sensible aux données aberrantes que la moyenne.
Faux
La médiane est une mesure plus robuste face aux données aberrantes
Vrai ou faux?
La médiane implique des données ordinales.
Vrai
Comment peut-on interpréter la médiane?
*Représentation de la tendance centrale (lorsque la distribution est asymétrique);
*Robustesse face aux valeurs extrêmes (ne prend pas en compte des valeurs extrêmes);
Quelles sont les limites de l’utilisation de la médiane comme mesure de tendance centrale?
*Moins d’informations que la moyenne (ne tient pas compte de la taille des écarts entre les valeurs);
*Pas toujours représentative (distributions symétriques, la moyenne peut offrir une meilleure représentation de l’ensemble des données, car elle tient compte de toutes les valeurs).
Qu’est-ce que le mode?
Valeur ou catégorie qui apparaît le plus fréquemment
Quelle est la seule mesure de tendance centrale appropriée pour des données catégorielles?
Le mode
Quelles sont les conditions d’application du mode?
*Données catégorielles ou nominales (la seule mesure de tendance centrale appropriée pour des données catégorielles);
*Données multimodales (plusieurs modes – distribution plus complexe);
Comment interpréter le mode?
*Représentation de la catégorie la plus fréquente (identifie la catégorie le plus fréquente);
*Multiple modes (indique une complexité ou une hétérogénéité au sein des données);
Quelles sont les limites
de l’utilisation du mode?
*Insuffisance pour les données numériques continues (pas une mesure utile au contexte);
*Pas toujours représentatif (le mode ne tient pas compte des autres données).
Vrai ou faux?
La variance est la meme chose que l’écart-type. La seule différence c’est que l’écart-type est multiplié par lui-même.
Vrai
Vrai ou faux?
La racine carrée de la variance est le mode.
Faux
La racine carrée de la variance est l’écart-type
Vrai ou faux?
La psychologie veut expliquer la moyenne.
Faux
La psychologie veut expliquer la variance.
Qu’est-ce que la variance?
mesure l’étendue à laquelle les valeurs d’un ensemble de données s’écartent de la moyenne (écart-type au carré)
Quelles sont les utilité de l’application de la variance?
*Mesure de la dispersion (variabilité des données continues);
*Analyse des différences (analyse les différences entre plusieurs ensembles de données);
La variance est…
a) une mesure de dispersion
b)l’écart-type au carré
c)sensible aux valeurs extremes
d)toutes ces réponses
e)aucune de ces réponses
D
Comment interpréter une faible variance?
Faible variance (faible dispersion et donc une plus grande homogénéité );
Comment interpréter une variance élevée?
Élevée variance (valeurs sont très dispersées et donc plus grande hétérogénéité);
Quelles sont les limites de la variance? (2 réponses) (À quoi ils sont sensibles ?)
-Sensibilité aux valeurs extrêmes (peut fausser la mesure de la dispersion);
-Unité carrée (ses unités sont exprimées au carré des unités de l’ensemble de données d’origine, ce qui peut rendre l’interprétation moins intuitive).
Qu’est-ce que l’écart-type (ET)?
indique à quel point les valeurs d’un ensemble de données sont dispersées autour de la moyenne (la racine carrée de la variance).
Quelles sont les conditions d’application de l’écart-type? (2 réponses)
*Données continues (intervalle, rapport, par convention mesure ordinale);
*Variabilité autour de la moyenne (Plus il est faible, plus les données sont concentrées autour de la moyenne);
Comment interpréter un faible écart-type?
*Faible écart-type (peu de dispersion dans les données – peu de variabilité);
Comment interpréter un écart-type élevé?
*Écart-type élevé (valeurs sont très dispersées par rapport à la moyenne);
Vrai ou faux?
L’écart total est une mesure de tendance centrale.
Faux
Mesure de dispersion
Quelles sont les limites de l’écart-type? (2 réponses)
*Sensibilité aux valeurs extrêmes (donner une fausse image de la dispersion réelle);
*Nécessité d’une distribution symétrique (interprétable avec distribution normale).
Vrai ou faux?
L’écart total est sensible aux données extremes.
Vrai
Qu’est-ce que l’écart-total?
défini comme la différence entre la valeur maximale et la valeur minimale.
L’écart total meure la _________ et est un indicateur de la _______.
-dispersion
-variabilité
Comment interpréter un écart total élevé?
Écart total élevé (grande amplitude, suggérant une large dispersion);
Comment interpréter un écart-total faible?
Écart total faible (petite différence, suggérant que les données sont concentrées);