Cours 2 Flashcards
Def. étendue
Différence entre valeur min et valeur max d’une distribution
Def. variance
-Statistique qui décrit le degré avec lequel les observations sont différentes de la moyenne de la variable mesurée (et le degré de différence entre les données)
OU
-Estimé de la variabilité moyenne entre les données
Lorsque les valeurs sont davantage différentes, la moyenne est-elle un bon estimateur de la distribution des données?
Non
Pour entamer une étude, est-il mieux d’avoir un constante ou une variable?
Variable
Vrai ou faux : plus une variable démontre de la variation et des différences, moins elle est intéressante à étudier
Faux. Plus une variable démontre de la variation et des différences, plus elle est intéressante à étudier (si tous sont pareils, on n’a aucun objet d’étude)
Lorsqu’il y a bcp de variance, comment peut-on calculer la moyenne?
À l’aide d’une mesure de dispersion (comme la variance, l’écart-type, etc.)
Vrai ou faux : la moyenne sera un moins bon type de tendance centrale lorsque les valeurs de la distribution sont différentes (bcp de variance), même si X = Mo = Md et que la distribution est unimodale. Explique pourquoi
Vrai. Plus de valeurs aux extrêmes, donc moins bien représentatif, car les valeurs ne sont pas toutes aux alentours de la moyenne (proche d’elle)
Par rapport à la variance, qu’elle est sa valeur:
a) minimale
b) maximale
a) 0 (aucune variance, constante, toutes les données sont égales à la moyenne)
b) théoriquement infinie
Étapes pour trouver la variance (s^2)
1) Obtenir la déviance (distance entre chaque valeur de la distribution et la moyenne)
2) On met au carré tous les écarts à la moyenne obtenus
3) On fait la moyenne des résultats obtenus en ajoutant -1 en dessous de la division
Def. de la somme des différences au carré
Résultats de la mise au carré de tous les écarts à la moyenne obtenus
Lorsque la variance (s^2) est faible et s’approche de 0, explique l’effet sur la moyenne et sur le niveau d’intérêt
-Valeurs sont proches de la moyenne, donc la moyenne est utile à effectuer (elle représente bien les données)
-Variable = moins intéressante sur plan scientifique
Lorsque la variance (s^2) est forte, explique l’effet sur la moyenne et sur le niveau d’intérêt
-Valeurs sont loins de la moyenne, donc la moyenne est moins utile à effectuer (elle représente mal les données)
-Variable = + intéressante sur plan scientifique
Caractéristiques de la variance (s^2)
-Jamais négative
-Quand = 0, la distribution est constante: la distribution n’est plus une variable, mais une constante (aucune différences)
-Indique le degré d’homogénéité des réponses à la variable
Def. écart-type (s)
Indique différence moyenne entre les valeurs d’une distribution et leur moyenne
Vrai ou faux : l’écart-type (s) est conceptuellement identique à la variance
Vrai, mais plus facile à interpréter.
Est-ce que l’écart-type (s) est proportionnel à la variance?
Oui. Une variance + grande produit un écart-type + grand
Pourquoi on doit trouver la variance pour déterminer l’écart-type (s)?
Car ça nous permet d’éliminer les chiffres négatifs et les mettant au carré
Comment s’obtient l’écart-type (s)?
En faisant la racine carrée de la variance
Qu’est-ce qui résulte de l’écart-type (s)?
On a notre moyenne avec une différence moyenne de + ou - l’écart type (ex. on a mangée 100 poutines au fil des cinq dernières semaines avec une différence typique moyenne de plus ou moins 38 poutines dépendamment des semaines)
Pour 2 variables qui ont la même moyenne, laquelle est meilleure pour détecter les différences individuelles entre les observations?
a) Celle qui a une variance + petite
b)Celle qui a une variance + grande
b) Celle qui a une variance + grande
Comment interpréter la variance si les moyennes ne sont pas identiques?
À l’aide du coefficient de variabilité
Def. coefficient de variabilité (CV)
-Statistique qui permet la comparaison du niveau de variabilité des variables qui n’ont pas la même moyenne et variance numérique
Formule du coefficient de variabilité (CV)
CV = s / X
La variable qui a le + grand CV comporte-t’il + ou - de variabilité?
+ de variabilité, c’est proportionnel
Plus il y a d’observations loin de la moyenne, plus la variance (s^2) et l’écart-type seront:
a) élevés
b)faibles
a)
La distribution est plus grande, il y a donc + de variabilité
L’ajout d’observations proche de la moyenne aura quel effet sur la variance (s^2) et l’écart-type (s)?
Cela va réduire la variance (s^2) et l’écart-type (s)
À quoi sert le positionnement des observations?
Il sert à comparer une observation par rapport aux autres observations de la distribution, cela nous permettra de mieux décrire l’observation étudiée
Quelles sont les 3 stratégies de positionnement?
- Rang absolu
- Percentile
- Valeur étalon
Def. rang absolu
-Convertit les données en échelle ordinale
-Transforme scores en nombres qui représentent leur position (ex. 91 = meilleure note, donc son rang absolu est 1), du + petit au + grand ou vice-versa
Étapes pour déterminer le rang absolu
- Comptez le nb total des observations
- Triez les observations en ordre de grandeur
- Associez un rang à chaque valeur
Si 2 observations ont la même valeur en ce qui concerne le rang absolu, quelle est la procédure?
On associe le rang mitoyen. Par exemple, si 2 personnes dans une classe ont une note de 74% et que le rang absolu est entre 4 et 7, le rang mitoyen sera de 5,5 (5 + 6/2)
Si + de 2 observations ont la même valeur en ce qui concerne le rang absolu, quelle est la procédure? Par exemple, si 12 personnes dans une classe ont une note de 74% et que le rang absolu est de 11 à 22
Par exemple, si 12 personnes dans une classe ont une note de 74% et que le rang absolu est de 11 à 22 =
1. 22 - 11 = 11
2. 11/2 = 5.5
3. 11 + 5.5 = 16.5
Le rang absolu sera donc 16.5
Avantages du rang absolu
Facile à comprendre et à calculer
Désavantages du rang absolu
- Mesure ordinale, donc on ne sait pas l’écart entre chaque valeur (ex. meilleure note = 91, rang 1 / 85 = rang 2 / 71 = rang 3)
- Peut être interprété slm si on connaît le nombre total d’observations
Utilité du rang absolu
Pour faire un choix
-Pour les médailles dans une compétition sportive
-Pour l’admission aux programmes d’études (ex. on prend juste les 10 meilleurs)
Def. percentile
-Positionne une observation par rapport à la proportion des autres observations qui obtiennent une valeur égale ou inférieure à l’observation étudiée
Ex.: un enfant se situe au 20e percentile au sujet de son poids = l’enfant n’est pas lourd comparé aux autres enfants de son âge, car slm 20% des enfants ont un poids égal ou inférieur au sien
-Distribution divisée en 100 parties égales
Calcul pour déterminer percentile
- Convertir chq valeur en pourcentage (proportions)
- Créer une distribution cumulative des proportions
- Calculer le percentile = proportion cumulative en dessous de la valeur x + la moitié de la proportion à la valeur x
Percentile = % cumulatif inférieur à x + (0,5 * % de x)
Calcul pour déterminer le % cumulatif
Valeur convertie en % +
% cumulatif inférieur au % cumulatif qu’on est en train de calculer
Comment le percentile doit-il être arrondi?
Il doit être arrondi à l’entier
Ex.: 97e percentile
Utilité du percentile
-Comparer un score à une norme (ex. déterminer si le poids d’un enfant est dans la norme comparé aux autres enfants de son âge)
Les percentiles sont-ils + adaptés au petits ou aux grand échantillons?
Aux grands échantillons, car la proportion de chaque fréquence sera plus élevée au niveau d’un petit échantillon, ce qui ne représente pas bien la situation
Ex.: 4/10 = 40% et 4/1000 = 0,4%
Avantages du percentile
-Facile à comprendre et à calculer
-Fournit + de détails que le rang absolu (proportion avant et après)
Désavantages du percentile
-Sensible aux déviations à la normalité
-Préférable pour les grand échantillons
-Incapable de nous indiquer directement la distance absolue entre les observations (ex. selon un échantillon une personne de 50 ans peut être dans le 38e et une de 51 ans dans le 63e, mais la personne de 51 ans n’est pas 2x + âgée que celle de 50 ans)
Quelle est la médiane du:
a) Percentile
b) Quartile
a) 50e percentile
b) 2e quartile
Def. étendue interquartile
Différence entre Q3 (entre 3e et 4e quartile) et Q1 (entre 1e et 2e quartile)
Def. positionnement par standardisation (valeur étalon, score-z, T, etc.)
Positionnement de chq observation par rapport à la moyenne
Est-ce qu’une grande valeur étalon est plus proche ou plus loin de la moyenne?
Elle est plus loin
Quelles sont les 3 utilités principales de la valeur étalon?
- Comparer 1 personne sur 2 variables (moyenne dans 2 cours différents)
- Décrire 1 personne sur une variable à 2 moments (moyenne de l’exam intra et final)
- Comparaison de 2 personnes sur 2 variables (moyenne de 2 personnes différentes dans 2 cours différents)
Quel est l’avantage la valeur étalon par rapport au percentile?
Elle prend en considération la variabilité, ce que le percentile ne fait pas
Lorsqu’on calcule l’écart à la moyenne, qu’est-ce que nous indique:
a) son signe
b) sa taille
Exactement la même chose que pour score-z
a) le signe indique si la valeur est inférieure ou supérieure à la moyenne
b) la taille détermine si la valeur est proche ou loin de la moyenne
Le score-z est-il proportionnel à la variabilité?
Non, plus la variabilité est grande, plus l’écart-type est grand et plus le score-z sera faible
Tu as la même note dans deux cours différents:
- Dans le cours 1, l’écart-type (s) est de 7
- Dans le cours 2, l’écart-type (s) est de 14
Laquelle est la plus forte?
La note du cours 1
Lorsque les observations sont toutes exprimées en z:
a) Quelle est la valeur de la moyenne
b) Quelle est la valeur de l’écart-type
a) 0
b) 1
Quelle est la valeur obtenue lorsqu’on calcule la somme des score-z de toute la distribution
0
Comment comparer deux notes dans deux cours différents qui ont des moyennes différentes
Standardiser la distribution, c’est-à-dire convertir la distribution en valeur étalon
Pour standardiser, la distribution doit-elle être:
a) Normale (pas d’asymétrie)
b) Unimodale
a) Non, pas nécessairement
b) Oui, obligatoirement
Quels sont les critères pour retrouver la valeur originale (x) à l’aide de l’équation pour trouver le score-z?
On doit avoir accès à la moyenne, à l’écart-type et au score-z
Def. valeur stannine (T)
- Autre façon de visualiser le score-z
- Lorsque z = 0, T = 50 (quand on a un score égal à la moyenne)
- Lorsque z = 1, T = 60 (quand on a un score égal à un écart-type, valeur stannine: s = 10)
Interprétation des stannines:
- T > 50
- T < 50
- T = 50
- T > 50 = performance au-dessus de la moyenne
- T < 50 = performance en-dessous de la moyenne
- T = 50 = performance moyenne