cours 2: les graphiques Flashcards
quelle est la différence entre un échantillon et une population
un échantillon : une collection d’individus tirés d’une population
VS
une population: un ensemble de personnes /objet avec une caratéristique
qu’est-ce qui est plus pratique dans une recherche entre une population et un échantillon et pourquoi
un échantillon est plus pratique car il est + économique/pratique/facile d’accès/rapide et permet d’étendre à la population
quel est le problème central de l’échantillonnage
il existe toujours une possibilité de problème d’échantillonnage et donc un échantillon non représentatif
quelle est la différence entre une statistique et un paramètre
statistique: calculer une moyenne sur un échantillon
VS
paramètre: calculer la moyenne sur une population
quelle Manœuvre décrit l’échantillon
la statistique descriptive
quelle Manœuvre étend à la population les résultats
les statistiques inférentielles
comment on appelle calculer une moyenne sur un échantillon
une statistique
comment on appelle calculer une moyenne sur une population
un paramètre
qu’est-ce qu’une mesure de tendance centrale
c’est une mesure qui indique la valeur typique de la série de donnée(score typique ou du milieu)
quel sont les différentes mesures de tendance centrale
-moyenne
-médiane
-le mode
la moyenne
-possible de la calculer manuellement,
-on ne l’utilise pas comme estimation de la moyenne sur population entière car elle est très sensible aux scores extrêmes
la médiane
-valeur qui coupe l’échantillon en deux parts égales
-remplace parfois la moyenne car elle est peu sensible aux valeurs extrêmes
-on ordonne les scores du plus petit au plus grand puis attribution de rang
la mode
-c’est la valeur la plus fréquente
-peu sensible aux scores extrêmes car c’est le score du milieu
-mais ne peut pas être utilisé avec certaines variables (catégorielles)
quels sont les critères pour choisir la bonne mesure de tendance centrale
-la pertinence: doit donner un bon indicateur de la valeur typique(toujours verifier la pertinence des résultats
qu’est-ce que le théorème central limite
si l’échantillon sur lequel se base notre estimation est très grand, alors il est plus probable que l’estimation de la moyenne qui en découle soit juste
qu’est-ce que l’erreur d’échantillonnage
ce qu’il se passe quant on doit choisir un échantillon(peut se tromper sur l’estimation = importance de la théorie des sondages
le diagramme en bâton
représente les effectifs/nombre de fois que chaque modalité/score de variable à été observé sur un échantillon
- facile détecter les erreurs/valeurs aberrantes
-utile pour montrer comment les données sont distribuées et ses caractéristiques essentielles ce qui est particulièrement important dans les statistiques inférentielles
le diagramme en tige et feuille
- rôle similaire à l’histogramme
-fait une lecture directe de la distribution des variables et permet une lecture de toutes les valeurs
boite à moustache
permet de détecter automatiquement les valeurs extrêmes et lire en partie la distribution
-mais très difficile de rendre compte d’une distribution bimodale
diagramme de dispersion
-permet d’examiner la relation entre deux variables
-en général, quand l’une des variables augmente, l’autre aussi
-lorsque deux échantillons donnent deux variables différentes le plus gros des deux est probablement le plus véridique
-très sensible aux erreurs d’échantillonnage
une distribution peut être considérée normale quand
-elle est symétrique à la moyenne
-les queues rencontrent l’axe des x seulement à l’infini
-à une forme de cloche
vrai ou faux: plus grand est l’échantillon, moins la distribution semble normale
faux: plus grand est l’échantillon, plus la distribution semble normale
qu’est-ce que la variation des scores
à quel point les différentes valeurs sont éloignées les unes des autres dans les scores
comment mesurer la variation des scores
avec:
-l’étendue
-l’Écart-type
-la variance
l’étendue
différence entre la plus grande et la plus petite valeur
-pas très informative sur la distribution générale
l’ecart type
mesure de dispersion plus informative
-mesure l’écart entre les valeurs d’une variable et la moyenne ou racine carré de la variance
quel est le problème de l’Ecart type
la moyenne est le score du milieu et fait que certains résultats sont positifs et d’autres négatifs ce qui fait que la sommation des la répatition est égale à 0
quelle est la solution du problème de l’ecart type
les mettre au carré ce qui rend toutes les valeurs positives= calcul de la moyenne au carré
=mêne à la variance
qu’est-ce qui est à regarder pour voir si une distribution est normale ou pas en statistique
-l’aplatissement
-l’asymétrie
-la distribution (l’aspect de celle-ci )
comment on appelle une courbe:(kurtosis)
a. pointue
b. aplatie
c. entre les deux
a. leptokurtique
b. platykurtique
c. mésokurituqe
qu’est-ce que l,asymétrie et comment elle se caractérise
-distribution dont le pic ne se trouve pas au centre de la distribution
-asymétrie négative: si partie gauche descend plus lentement que la droite
-asymétrie positive =l’inverse
qu,est-ce qu’une distribution bimodale
qui représente deux pics de modes (deux sous-populations différente dans la pop globale)
-elle est non-normale