Les analyses Flashcards
Tableaux et figures
Mesures centrales
et Dispersion
a) Statistiques descriptives
b) Statistiques inférentielles
Statistiques descriptives
Arbre de décision , type d’analyse et Cartes de recettes
a) Statistiques descriptives
b) Statistiques inférentielles
Statistiques inférentielles
Le but de toutes les statistiques descriptives est de ____________ de façon ____________ (parfois un seul nombre), un ensemble de données.
On veut rarement savoir la valeur des scores individuels d’un échantillon.
décrire, condensée
Les statistiques descriptives Impliquent l’idée de communication = On s’intéresse à des moyens ______________________ de transmettre l’information
standardisés
La fréquence rapportée est non pas absolue (le nombre de scores de la classe) mais relative (la proportion de scores dans la classe rapportée)
Exemple de tableau
a) distribution d’effectifs simple
b) distribution d’effectifs regroupés
c) distribution cumulative d’effectifs regroupés
d) distribution relative d’effectifs regroupés
tableau distribution relative d’effectifs regroupés
*Chaque score avec sa fréquence d’effectifs
*Score sans effectif peut être omis
*Idéal pour variables nominales
Exemple de tableau
a) distribution d’effectifs simple
b) distribution d’effectifs regroupés
c) distribution cumulative d’effectifs regroupés
d) distribution relative d’effectifs regroupés
distribution d’effectifs simple
Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques à bâtons ou secteurs. À moins
de transformer les scores en mesures nominales or ordinales Ex : taille en format “petit, moyen, et grand”
On utilise plutôt ….
des polygones de fréquences ou des histogrammes
Dans une distribution normale, la moyenne, la médiane et le mode sont identiques
Mais quelle choisir?
Données nominales: ______
mode (autres ne font pas de sens)
moyenne, médiane et le mode
Mais quelle choisir?
Plus représentatif? _______
Milieu? __________
Sensibilité à tous les scores? _______
Plus représentatif? Mode
Milieu? Médiane
Sensibilité à tous les scores? Moyenne
moyenne, médiane et mode
Mais quelle choisir?
Forme de la distribution
bimodale ? __________
avec données biaisées? _____________
bimodale : mode
Mode et médiane plus représentatives avec données biaisées
Distance entre le score le plus élevé et le score le plus bas
L’étendue
Quels sont les Problèmes avec l’étendue ?
Basée sur seulement deux mesures et pas n’importe lesquelles: les plus extrêmes!
Augmente avec la taille de l’échantillon (De nouveaux scores ne feront jamais réduire l’étendue. Par contre, un
nouveau score qui change le minimum ou le maximum augmente l’étendue.)
Utilise les 25e et 75e centiles pour son
calcul.
Peu sensible aux scores extrêmes. Plus stable en fonction de la taille de l’échantillon.
Devrait diminuer quand l’échantillon grossit si la variable a une distribution “normale” dans la population.
Étendue interquartile
Corrige certains problèmes de l’étendue
Rarement utilisée, sauf dans les graphiques boîte-et moustaches Permettent d’identifier visuellement les valeurs aberrantes / extrêmes
Étendue interquartile
Décrit la dispersion ou la variation des données dans un ensemble de données. Indique à quel point les valeurs d’un ensemble de données sont éloignées de la moyenne.
écart-type
Un faible écart-type signifie que les données sont ____________de la moyenne, tandis qu’un écart-type élevé indique que les données sont ______________ de la moyenne.
Un faible écart-type signifie que les données sont proches de la moyenne, tandis qu’un écart-type élevé indique que les données sont largement dispersées autour de la moyenne.
V ou F
L’écart-type est souvent utilisé en statistique pour évaluer la variabilité ou la stabilité des données
V
Indicateur de dispersion très commun, utilisé dans une variété de procédures : le carré de l’écart-type
Variance
Méthodes qui vous permettent d’évaluer la probabilité que ce que vous observez dans votre
échantillon est vrai dans la population.
a) Statistiques descriptives
b) Statistiques inférentielles
Statistiques inférentielles
Testent l’hypothèse nulle H0 et vous donnent la probabilité qu’elle soit vraie selon vos résultats Règle générale: on rejette H0 si sa probabilité est inférieure à 0.05
Quel test fait quoi et, en premier lieu, lequel choisir
Statistiques inférentielles
La question “mais quel test utiliser?” est toujours solutionnée par deux simples contraintes :
1- La nature des ______________
2- Ce qu’on veut savoir des______________ en lien avec le plan de recherche
1- La nature des scores (nominal, ordinal…)
2- Ce qu’on veut savoir des données (différence ou relation…) en lien avec le plan de recherche
L’étudiant-e super bien éduqué-e va …
a) Choisir le bon test t dans le menu SPSS
b) Commencer par regarder la forme de la distribution pour s’assurer qu’un test non paramétrique n’est pas plus indiqué.
Commencer par regarder la forme de la distribution pour s’assurer qu’un test non paramétrique n’est pas plus indiqué.
Un chevauchement important rend difficile la détection d’une ______________réelle, augmentant ainsi le risque de conclure à tort qu’il n’y a pas d’effet (erreur de type _____).
Un chevauchement important rend difficile la détection d’une différence réelle, augmentant ainsi le risque de conclure à tort qu’il n’y a pas d’effet (erreur de type II).