Examen 2 Flashcards
Selon Vessereau, la statistique « ne s’appuie pas toujours sur des faits très nombreux, mais sait, par une analyse subtile, tirer parti d’un petit nombre de données judicieusement choisies » Expliquez ce que cela signifie sous l’angle inférentiel.
À partir de données provenant d’un petit échantillon, il est possible d’extrapoler un constat général pour l’ensemble d’une population. On note toutefois qu’il y a une possible marge d’erreur.
Sous l’angle descriptif
Cela renvoie à la sélection judicieuse de quelques données qui résument bien une situation : par exemple, les valeurs maximale et minimale d’une distribution pour obtenir l’étendue, ou encore la valeur du point milieu des scores ordonnés pour repérer la médiane, etc.
Le salaire de Sidney Crosby augmente de 12 millions à 15 millions, avec cette augmentation, il demeure le joueur le mieux payé. Décrivez si cela a un impact sur l’écart-type et l’étendue interquartile, expliquez pourquoi àl’aide du calcul de ceux-ci
Cela a un impact sur l’écart-type puisque la somme des scores est plus grande modifiant ainsi la moyenne à la hausse. Comme l’écart-type constitue la moyenne des écarts à cette moyenne, la modification de 12 à 15 millions a un grand impact sur cette mesure. Sur l’étendue interquartile, par contre, Sidney Crosby se retrouve déjà dans le dernier quartile, soit le plus élevé. Comme l’étendue interquartile correspondant au calcul Q3-Q1, son salaire fait partie du Q4, son augmentation ne fait donc pas modifier la mesure.
La réussite (par exemple scolaire, etc.) peut être mesurée de différentes façons (niveaux de mesure), donnez un exemple qualitatif et quantitatif. (Il faut que tu spécifies aussi quel niveau de mesure (ex: ordinale, de ratio, etc.), que tu nommes la variable choisie et que tu dises des valeurs potentielles de réponses).
1. La réussite scolaire: qualitatif ordinal Pas du tout réussi Peu réussi Quelque peu réussi Réussi Très réussi Extrêmement réussi
2. La réussite scolaire: quantitatif d’intervalle Moins de 30% Entre 30 et 59% Entre 60 et 89 90 et plus
Est-ce pertinent de mesurer le pourcentage cumulatif pour une variable d’intervalles?
Oui, car le pourcentage cumulatif est pertinent à partir du moment où les valeurs peuvent être ordonnées. Il est donc possible pour les variables ordinales, d’intervalles et de ratio.
La couleur des yeux est une constante? (Vrai ou faux, pourquoi?)
Faux, car elle peut varier selon les répondants. Une personne peut avoir les yeux bleus et une autre, les yeux bruns.
Les salaires au public sont plus hétérogènes que les salaires au privé? (Vrai ou faux, pourquoi)
Vrai, selon la distribution, si l’écart-type est élevé, alors les résultats sont dispersés et hétérogènes. Alors que si l’écart-type est bas, les résultats sont agglomérés et homogènes.
L’écart type des résultats d’une évaluation individuelle a plus de chance d’être petit que celle d’une évaluation réalisée en équipe? (Vrai ou faux, pourquoi)?
Faux, lorsque les évaluations sont réalisées en équipe, il y a moins de scores, donc la probabilité que les scores soient plus dispersés est moins grande que si l’évaluation était réalisée individuellement.
Qu’est-ce que ça veut dire « mutuellement exclusive » et « collectivement exhaustive »?
Mutuellement exclusives, les catégories ne se chevauchent pas.
Collectivement exhaustif, l’ensemble des catégories inclut tous les cas possibles
(…) est le processus par lequel nous trouvons les valeurs d’une variable pour des cas différents.
La mesure
Question sur l’asymétrie (Vrai ou faux): le mode se situe entre la moyenne et la médiane dans une asymétrie?
Faux, le mode sera plus grand que la médiane dans une asymétrie à gauche et plus petit que la médiane dans une asymétrie à droite.
Quand la distribution est symétrique, la moyenne, la médiane et le mode sont pareils.
Quand la distribution est asymétrique vers la gauche, la moyenne est plus basse que la médiane. (Moyenne, médiane, mode)
Quand la distribution est asymétrique vers la droite, la moyenne est plus élevée que la médiane. (Mode, médiane, moyenne)
Un salaire passe de 20 000$ à 25 000$, l’augmentation est de combien de pour cent?
L’augmentation est de 25%
(25 000-20 000) x100 / 20 000.
En quelle marque de voiture avez-vous le plus confiance? Toyota, Honda, etc. Quel est le niveau de mesure?
Qualitatif nominale
Comment calcule-t-on la moyenne? Quelles sont ses forces et faiblesses?
La somme des scores divisé par le nombre de scores total.
Force: la plus représentative et démocratique, car chaque score a son mot à dire, a de l’influence sur la distribution. Permet d’équilibrer la distribution
Faiblesse: Fragile quant aux scores déviants
Le sexe est une constante? Vrai ou faux, expliquez
Faux. La constante est “quelque chose qui ne varie pas” (Fox, 1999 : 9), tandis que le sexe (masculin / féminin) “varie” d’un cas à l’autre.
À quoi renvoie le mot statistique?
Renvoie à des informations résumés numériquement mais aussi aux méthodes qui permettent de résumer.
Différence entre unité d’analyse et Cas?
- l’Unité d’analyse est la personne, l’objet ou l’événement sur lequel porte l’analyse.
- Le cas sont les unités réelles à partir desquelles les données sont colligées.
Quels sont les deux types de statistiques?
- Statistiques descriptives
2. Statistiques inférentielles
Différence entre les statistiques descriptives et les statistiques inférentielles?
Descriptive : résume l’information (graphique et logo)
Inférentielle : Généralise un constat à partir des données d’un échantillon
Pourquoi se bâtir sur des échantillons?
Il est difficile de recueillir des informations sur une population entière
Qu’est-ce que la mesure?
Le processus par lequel nous trouvons les valeurs d’une variable pour des cas différents
valeurs mesurées : score
Qu’est-ce qu’une échelle?
L’ensemble des valeurs d’une variable
Quels sont les trois types de mesure centrale?
Mode
Médiane
Moyenne
Est-ce que l’asymétrie affecte la médiane?
Non, la médiane est préférable à la moyenne dans le cas de distribution hautement asymétrique
Qu’est-ce qu’une variable?
Caractéristique au propriété qui peuvent prendre plus d’une valeur
Variable à la propriété de varier
Quels sont les 4 niveaux de mesure
Variable nominale (valeurs et attributs diffèrent des autres) Variable ordinale (dont les valeurs peuvent être ordonnées) Variable d'intervalle (valeurs données mais elles se mesurent également à l'aune d'une unité de mesure fixe ou standard. Variable de ratio (se mesure grâce à une unité standard zero non-arbitraire)
Qu’est-ce qu’une constante?
Quelque chose qui ne varie pas
Qu’est-ce qu’un paramètre?
Un paramètre est un résumé basé sur une population , c’est une caractéristique d’une population qui caractérise un échantillon.
Qu’est qu’un niveau de mesure?
Les variables sont classées selon la façon dont elles mesurent, ce qu’on appelle les niveaux de mesure (nominal, ordinal, d’intervalle, ratio)
Qu’est-ce qu’une variable dichotomique?
Une variable dichotomique a deux valeurs à l’origine. Elle a subi un regroupement par lequel le nombre de valeurs à l’origine a été réduit à deux.
Est-ce que les variables ordinales sont un niveau de mesure supérieur aux variables nominales?
Non, c’est la variable ration parce qu’on peut interpréter et sélectionner plusieurs tests statistiques.
Qu’est-ce qu’une variable continue?
Une variable continue peut revêtir différentes fractions entre le nombres entiers (ex : note globale)
Qu’est-ce qu’une variable discrète?
Une variable discrète ne peut revêtir qu’un nombre limité de valeurs entières.
Différence entre analyse univariée, bivariée et pluvariée
- Méthode qui permet d’analyser une à la fois
- Relation entre deux variables
- Lien entre trois variables et plus
Étendues Interquartile (description, forces et faiblesses)
Mesure de dispersion robuste en présence d’une distribution asymétrique (Q3-Q1)
Force : + stable que l’étendue.
Faiblesse : N’utilise qu’une partie de l’information disponible et non toutes les valeurs
Étendue (description, forces et faiblesses)
Mesure de dispersion sommaire qui calcule simplement l’écart entre les valeurs minimales et maximales.
Forces : facilité de calcul, évaluation rapide
Faiblesse : mesure grossière (infirme partie des infos)
Médiane (description, forces et faiblesses)
La valeur qui divise en deux parties égales un ensemble de données de scores. (milieu/point central)
Forces : plus robuste, résiste aux scores déviants
Faiblesses : elle tient compte de la position des scores et non pas des valeurs.
Mode (description, forces et faiblesses)
Le score qui apparait le plus souvent
Moyenne (description, forces et faiblesses)
La mesure de tendance centrale que l’on obtient en additionnant tous les scores et en divisant cette somme par le nombre de scores.
Forces : Représentative, démocratique et équilibre
Faiblesses : Scores déviants
Mesure tendance centrale
Servent à préciser l’allure générale d’une distribution (valeur typique ou représentative d’un ensemble de scores)
Mesure de variations
Aident à évaluer si les valeurs sont concentrées ou dispersées
Variation
Mesurer la divergence des scores par rapport à un score typique, le score moyen.
Score moyen
Renvoie à l’utilisation de la moyenne comme point de référence à partir duquel on mesure les écarts
Écart type (description, forces et faiblesses)
L’écart type constitue la moyenne des écarts
Forces : Représentative et réaliste (plus adéquat pour les données simples)
Faiblesses : Fragile aux scores déviants
Écart type élevé
Dispersé et hétérogène
Écart type bas
Homogène et aggloméré
Variance
Plus utile en analyse bivariée et multivariée
Propriétés mathématiques supérieures