Analyse statistique des données Flashcards
Que signifie “Statistique”?
Une discipline qui s’intéresse à l’analyse quantitative de la réalité
Que signifie “paramètre”?
Un calcul effectué auprès de la population
Que signifie “indice statistique”?
Calcul sur l’échantillon
Qu’est-ce qu’une analyse inférentielle?
Tests statistiques permettant d’estimer les caractéristiques de la population telles qu’elles sont mesurées à partir d’échantillions
**Tjrs avec échantillon car impossible de demander à toute la population
Quels sont les objectifs des statistiques?
- Représenter un grand nombre de données sous forme d’un ou quelques nombre (ex: la moyenne)
- Généraliser aux populations les caractéristiques mesurées à partir d’échantillons
- Prendre des décisions (confirmer ou rejeter l’hypothèse)
Quelles sont les différents types d’échelle de mesure?
- Nominale: numéro pas important, qu’on ne calcule pas (ex: postes TV)
- Ordinale: Likert (Tout à fait en accord)
- Intervalle: Chiffres
En quoi consiste une analyse descriptive?
Faire ressortir comment les données se distribuent pour pouvoir synthétiser l’ensemble des données
Quels sont les principaux indices statistiques (calcul sur l’échantillon) qui nous intéressent dans l’analyse descriptive?
- Indices de tendances centrales (moyenne, médiane
- Indices de dispersion (étendue, variance, écart-type)
- Indices de distribution (fréquences, asymétrie, aplatissement)
Quels sont les indices de tendance centrale?
- Moyenne
- Médiane
- Mode
Qu’est-ce que la moyenne?
Additionner tous les éléments d’un ensemble et diviser par le nombre d’éléments additionnés
Qu’est-ce que la médiane? Quand est-elle utile?
C’est le point milieu d’un ensemble ordonné de données.
Utile lorsqu’il y a des valeurs extrêmes (ex: étude sur la situation économique des étudiants et un participant a gagné à la loterie)
Qu’est-ce que le mode?
La valeur qui a la fréquence la plus élevée est celle qui est endossée par le plus de participants (ex: majorité des étudiants ont 80%)
Quels sont les indices de dispersion?
- l’étendue
- la variance
- l’écart-type
Qu’est-ce que l’étendue?
Écart entre la valeur la plus petite et la valeur la plus grande
Qu’est-ce que l’étendue?
Écart entre la valeur la plus petite et la valeur la plus grande
Qu’est-ce que la variance?
La variabilité de la distribution des données: (somme des écarts à la moyenne)2/ N-1
En quoi consiste la distribution de fréquences?
Comptabilise le nbr d’unités d’observation se trouvant dans chaque catégorie (nominale) ou pour chaque valeur ou classe (ordinale ou continue)
(Diagramme à bâton, histogramme, courbe normale)
Qu’est-ce que la courbe normale?
Un modèle probabiliste pour comparer ???
Qu’est-ce que l’asymétrie de la distribution?
- Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
- Bimodale
Qu’est-ce que l’asymétrie de la distribution?
- Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
- Bimodale
Pourquoi est-il important de savoir s’il y a aplatissement de la distribution ou asymétrie de la distribution?
Parce qu’on n’utilisera pas la loi normale!
Qu’est-ce que la Courbe T?
C’est la loi de student avec des petits échantillons mais se rapproche de la loi normale
Qu’est-ce que l’erreur de type 1?
C’est le rejet de hypothèse nulle (absence de différence entre GE et GT) alors que H0 est vraie = on déclare qu’il y a différence entre GE et GT, donc que les résultats sont significatifs
Qu’est ce que l’erreur de type 2?
On ne rejette pas H0 alors que c’est faux donc on ne déclare pas les résultats significatifs alors qu’ils le sont