Cours 11 - Analyses Flashcards
But stats descriptives:
Décrire de façon condensée un ensemble données
Stats descriptives impliquent quelle idée?
Implique l’idée de communication
* moyens standardisés de transmettre l’information
Propriété tableaux:
Condensent l’information en colonnes et rangées
* Première rangée identifie le contenu des colonnes
* Première colonne identifie le contenu des rangées
Éléments essentiels tableaux:
- # séquentiel centré
- Titre bref & clair centré
- 3 lignes horizontales
- Aucune ligne verticale
Distribution effectifs simples tableaux:
*Chaque score avec sa fréquence d’effectifs *Score sans effectif peut être omis
*Idéal pour variables nominales
*Ordre des rangées = choix personnel
Distribution effectifs regroupés tableaux:
- Chaque score est associé à un intervalle de classe
- Le nombre d’intervalle doit condenser l’info sans masquer des détails importants
- Variables intervalle- rapports
- Intervalles de taille constante
- Intervalles ouverts aux extrémités si besoin
C’est quoi distribution cumulative?
fréquence rapporté (intervalle courant) + (intervalle précédent)
Comment ordonner variables qualitatives?
Choix, ordre alphabétique, effectifs, choix rep
Est-ce que les données qualitatives sur figures peuvent se toucher et être liés par lignes/connecteurs?
Non
Éléments graphique bâtons:
- Pas de cadre autour du graphique (only identifiant axes)
- Pas de contact entre les bâtons
- Légende à texte aligné à gauche sous le graphique, débutant par Figure #. où # est séquentiel
Quel graph est rare en psyho?
Secteurs
Quelles variables peuvent pas être sur graph bâton/secteurs?
Intervalles & rapports
Quel graph pour variable intervalle et rapport?
Polygones de fréquences ou histogrammes
Éléments polygones fréquences:
- point dans l’espace 2D pour chaque intervalle de classe (ou rang)
* positionné au dessus du centre de l’intervalle le long de l’abscisse
* étiquettes doivent référer à cette valeur médiane
* fréquence de l’intervalle de classe est représenté par la position du point selon l’ordonnée
* un intervalle vide à chaque bout (pas d’intervalle ouvert) - Des lignes joignent les points voisins
Éléments histogrammes:
- Semblable aux polygones
* barre horizontale est placée au-dessus de chaque intervalle de classe
* largeur de la barre correspond à la largeur de l’intervalle - Des lignes verticales (une de chaque côté) joignent la barre à l’abscisse
Les graph à bâton par groupe servent à quoi?
Illustrer relation entre VI et VD
Éléments graph à dispersion:
Représentent le score sur deux variables pour chaque membre de l’échantillon
Définition mesures centrales:
Nombre typique ou représentatif d’un ensemble de scores
3 mesures plus communes méthode centrale:
Mode
Médiane
Moyenne
Définition mode:
Le mode est le score qu’on observe le plus souvent
Est-ce qu’une distribution peut avoir plusieurs modes?
Oui –> bimodale/multimodale
Mode ps utile pour quoi?
Intervalles de classe
Définition médiane:
La médiane est le score au milieu d’une distribution ordonnée
Comment calculer médiane?
- Mettre les scores en ordre de grandeur
- Calculer (n + 1) / 2
* nombre entier = médiane
* fraction (e.g., 19.5) = entre quels scores trouver la médiane (i.e., les 19e et 20e scores)
Définition moyenne:
La moyenne est la somme de tous les scores, divisée par le nombre de scores
Propriétés moyenne:
- somme des déviations est égale à zéro
- Minimise les déviations carrées (Comparé aux autres mesures centrales)
- Représente la quantité que tout le monde aurait si distribuée équitablement
- Changer un score change la moyenne
Définition distribution:
Mesure de la variabilité entre les scores
Définition étendue:
Distance entre score max et min (max-min)
Désavantages étendue:
- Basé sur deux mesures
- Augmente avec taille échantillon (jamais réduire)
Qu’est-ce qui corrige des problèmes de l’étendu?
Étendu interquartile (25 et 75)
Avantages étendue interquartile:
- peu sensible score extrêmes
- plus stable selon taille échantillon
L’étendue interquartile est utilisée quand?
Graph boite moustache
Formules écart-type:
Population: 𝛔= √((X-𝛍)²/N)
Échantillon: s= √(∑(X-X)²/n-1)
Définition écart-type:
Racine carrée de la déviation carrée de la moyenne
C’est quoi la variance?
Sd²
Définition degré liberté:
Nb variables aléatoires qui peuvent être déterminées par équation (n-2)
C’est quoi stats inférentielles?
Méthode permet évaluer probabilité que les observations échantillon soient vraies dans population
Comment définir quel tests?
- Nature scores (variables)
- Résultats obtenus (différence/relation)
Arbre décision sert à quoi?
Choisir test
Tests:
Pearson r –> corrélation (-1;1)
Régression linéaire –>
Test-t ind –> moy deux groupes
Test-t app –> ensemble mesures diffèrent
Test-t unique –> moy groupe diffère d’une valeur
ANOVA un facteur –> 2 moy égales
ANOVA factorielle –> effets principaux et interaction
Khi2 –> nb observations dans catégories diffèrent
Khi2 contingence –>relation 2 variables nominale
Test binomial –> évènement binaires conforment probabilismes
Mann-Whitney U –> différence rangs entre groupes ind
Wilcoxon –> différence rang entre groupe appariés
Spearman –> degré association 2 variables ordinales