Intra Flashcards
Une caractéristique essentielle pour la corrélation et la régression
La variance
Années quantitatives vs qualitatives + le meilleur?
Quantitative:
+ de données
Peut faire médiane
+ fréquent
Qualitatives:
Données plus petites
Pas un de meilleur, ça dépend de la situation
Comment fonctionne les recherches?
On part d’observation, puis hypothèse + vérifier si valide
Déf. variable
Tout ce qui varie
Opposé: constante
Déf. unité d’analyse
Entité qui fournit l’information sur la variable
2 types de variable
Indépendante (x)
Variable prédictrice
Ce qui déclenche une réaction
Dépendante (y)
Variable résultante
Suit influence de x
4 types d’échelle de mesure
Nominale:
Catégorie d’entité
Dichotomique ou multichotomique
AUCUNE opération mathématique
Ordinale:
A une gradation
On perd la distance, connait juste la position (connait pas l’écart)
Plus grand/plus petit seulement
Intervalle:
Gradation entre les chiffres
Écart entre réponse le même
Addition/soustraction
Proportions:
Donne le + d’infos, peut distinguer différence
Écart entre réponses le même
Zéro absolu existe!
Addition/soustraction/multiplication/division
Est ce qu’on peut passer d’échelle en échelle
Oui, mais seulement de proportion à nominale pas le contraire
(passer à des échelles avec - infos)
Échelle de Likert
Échelle ordinale, mais avec des chiffres pour préciser que l’écart est le même
(si juste les mots = ordinal, mais avec les chiffres = intervalle)
Importance vue d’ensemble
Si on fait questionnaire avec question ordinal, mais veut faire régression après = pas possible
Validité vs fidélité
Validité:
Mesure le bon concept
Fidélité:
Résultats devraient être similaires
Utilité de recueillir en forme de variable
Permet de résumer une grande quantité d’infos dans quelque chose de simple
Descriptive vs inférentielle
Descriptive:
Décrit un échantillon
Inférentielle:
Déterminer qlqch d’une population grâce à un échantillon
Catégories peuvent créer de 2 façons
Relié à la théorie
Catégorie intuitive
Ce qu’il faut s’assurer dans un tableau de fréquence avec catégorie
Que 2 chiffres ne sont pas dans la même catégorie
inclu/exclu
Histogramme et variables
Ligne horizontale:
Ligne x
Abscisse
Ligne vertical:
Ligne y
Ordonnée
3 caractéristiques des distributions
Étendue
Forme (symétrie/aplatissement)
Tendance centrale
Déf. étendue
Différence entre valeur minimale et maximale
Asymétrie déf.
Asymétrie positive:
La droite qui va vers le bas va vers le positif
+ de score faible
Asymétrie négative:
La droite qui va vers le bas va vers le négatif
+ de score élevé
Aplatissement déf.
Leptokurtique (leap):
Pic vers le haut
Kurtose positive
Platykurtique:
Plateau vers le haut
Kurtose négative
Caractéristiques distribution normale (4)
-Majorité des scores sont au centre
-Courbe normale est un polygone de fréquence
-Beaucoup de phénomènes naturels se distribuent de cette manière
Symétrique (asymétrie et aplatissement = 0)
Unimodale
Moyenne, mode et médiane presque identique
Atteint jamais 0
Tendance centrale déf.
Le centre d’une distribution de fréquence (valeur typique d’une observation)
Mesure de tendance centrale
Moyenne
Médiane
Mode
Déf. mode
Score le plus fréquent
Différents types de mode
Unimodale, bimodale et multimodale
Déf. médiane
Partage la distribution en 2 groupes égaux
Pas affecté par scores extrêmes!
Déf. moyenne (4)
-Plus utilisée
-Influencé par valeurs extrêmes et sensible aux changements
-Fait le moins d’erreur
-Erreur moyenne à 0!
Déf. déviance
Différence entre valeur observé et la moyenne
Tendance centrale et niveau de mesure
Nominale: mode
Ordinale: Mode et médiane
Intervalle et Proportions: Mode, médiane et moyenne
Est ce que la moyenne est toujours la meilleure mesure?
Non! pas si valeur extrême
Devrait on utiliser la moyenne dans une distribution bimodale ou multimodale
Non parce qu’elle va tomber dans le milieu
Devrait on utiliser la moyenne dans une distribution leptokurtique ou platykurtique
Leptokurtique = ok
Platykurtique = moins bon
Quelle mesure de tendance centrale utilisée selon l’asymétrie
Asymétrie nulle:
Mode=Md=Moyenne
Asymétrie négative:
Mode = meilleure
Md = meh
Moyenne = nope
Asymétrie positive:
Moyenne = meilleure
Md = meh
Mode = nope
Lorsqu’il y a une grande variance est ce que la moyenne est bonne
La moyenne devient un moins bon estimateur
(pourrait exister des sous-groupes)
DONC utiliser moyenne avec écart-type
Caractéristiques variance (4)
Plus la variance est grande, plus le phénomène est intéressant
Valeur minimal = 0 (constante)
Valeur maximal = infini
Peut pas être plus bas que 0
Déviance vs variance
Déviance:
Différence entre UNE valeur observée et sa moyenne
Variance:
Degré de différence entre les observations et la moyenne
Formule déviance vs au carré vs variance
Déviance:
une valeur - moyenne et additionné pour toutes les données
Mettre au carré:
Pour ne pas que ça donne zéro
Variance:
Même chose mais divisé par population - 1
Variance peut JAMAIS être NÉGATIVE
Comment interpréter variance
Si proche de 0:
Moyenne = peu d’erreur d’estimation
Science = peu intéressant
Si loin de 0
Moyenne= plus d’erreur d’estimation
Science= intéressant
Si = 0
Constante
Plus il y a d’observations loin de la moyenne, plus la variance va être élevé
Si on rajoute des valeurs proches de la moyenne s va diminuer
Déf. écart-type
Plus simple à comprendre que la variance
On l’obtient en prenant la racine carré de la variance
Une variance plus grande = écart-type plus grand
Déf. coefficient de variabilité
Interpréter variance si les moyennes ne sont pas identiques
Écart-type/moyenne
Variable avec CV plus grand = peut détecter différences individuelles entre les observations
Trois stratégies pour interpréter une observation à partir de sa position
Rang absolu
Percentile
Score Z (valeur étalon)
Rang absolu déf. avantage et désavantage
Transformation des valeurs en position (rang)
Avantage:
Facile à comprendre
Utile pour faire choix
Désavantage:
Mesure ordinale donc perd précision
Taille entre les rangs est inconnu
Peut être interprété seulement si on connait n
Percentile déf. + avantage et désavantage
Positionne les gens par rapport aux autres observations
Avantages:
Comparer un score à une norme
Facilement compréhensible
Fournit plus de détails que le rang absolu
Désavantage:
Percentile est moins adaptée aux petits échantillons
Sensible aux déviations
Score z déf.
Positionne les gens par rapport à la moyenne
Prend en compte la variabilité pas comme le percentile
Tient en compte tendance centrale et différences individuelles (variabilité)