Cours 5 - Statistiques descriptives Flashcards
Qu’est-ce qui constitue l’étape préliminaire à toute analyse statistique, même la plus sofistiquée? (aide l’analyse préliminaire des données paramétriques et non paramétriques)
L’analyse exploratoire des données
Quels sont les trois aspects de l’analyse exploratoire?
- Les mesures de tendance centrales
- Les mesures de dispertion
- La distribution des résultats
Qu’est-ce que la tendance centrale?
Mesure qui indique ou se trouve la majorité des données ou scores d’une distribution
Quel aspect de l’analyse exploratoire vise à représenter le score typique d’une distribution? (effort de synthèse)
La tendance centrale
Quels sont les trois mesures de tendance centrale?
- Mode
- Médiane
- Moyenne
Je suis la valeur la plus fréquente d’un ensemble de données d’une série d’observation. Je suis rarement employé seul pour mesurer la tendance centrale, parce qu’avec un petit nombre d’observations, comme c’est le cas dans notre exemple, chaque valeur est unique. Dans ce cas, je n’existe pas.
Qui suis-je?
Le mode
Je correspond à l’observation du milieu, c’est-à-dire la valeur de part et d’autre de laquelle se situe la moitié des observations. Pour me mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant.
Qui suis-je?
La médiane
Je représente la mesure la plus courante de tendance centrale des observations. Je me calcule en additionnant les valeurs observées de chaque individu, somme divisée par le nombre de sujets observés.
Qui suis-je?
La moyenne
Quel aspect de l’analyse exploratoire peut être un objectif de recherche en soi?
La dispersion
Quel aspect de l’analyse exploratoire sert entre autres à différencier/comparer des groupes?
La tendance centrale
Qu’est-ce qui caractérise l’étalement des valeurs d’une distribution d’une variable autour d’une valeur centrale?
Les mesures de dispesion
Vrai ou Faux
Les mesures de tendance centrale peuvent décrire pleinement une distribution de scores
Faux
Qu’est-ce qui représente l’écart entre les valeurs des résultats, dun minimum au maximum?
L’étendue
Quels sont les trois principales mseures de dispersion?
- L’étendue
- La variance
- L’écart-type
À quoi correspond la mesure de dispersion relative : coefficient de variation ?
Écart-type/Moyenne
plus élevé = plus dispersé (les gens s’entendent moins bien)
Utile pour comparer les distributions de différents groupes (pas nécessairement sur la même échelle)
Elle mesure la dispersion de chaque observation autour de la moyenne. Elle se calcule d’abord en faisant la différence entre chaque observation et la moyenne. Ces différences sont ensuite élevées au carré afin que les chiffres positifs et négatifs ne s’annulent pas. On additionne ensuite ces écarts élevés au carré . La somme des carrés des écarts est alors divisée par le nombre total d’observations moins une (n-1). Je suis peu utile seule.
Qui est-elle?
La variance
Racine carrée de la variance. C’est la plus utilisée dans le cas de la description de variables continues.
Qui est-elle?
Écart-type
Quelle est la première étape pour mesurer la distribution?
Ordonner les données
Qu’est-ce qui sépare la distribution en groupes égaux?
Les fractiles
Quel type de fractile est le plus courant?
Le quartile (groupes de 25% des valeurs) - 4 groupes
En terme de distribution, laquelle est un idéale, mais que l’on ne voit pratiquement jamais en criminologie?
La distribution normale
À quoi sert le Kurtose?
Mesure d’applatissement de la distribution
Qu’est-ce que la règle du pouce?
Si K est de plus ou moins 0,5, -» mésokurtique
Même chose pour s
Quels sont les trois types d’applatissement?
- Leptokurtique (K»0)
- Mesokurtique (K=0) - distribution normale
- Platykurtique (K«0)
Quels sont les trois types de symétries/asymétries?
- Asymétrie négative (s»0)
- Symétrie (s=0) plus ou moins 0,5
- Asymétrie positive (s«0)
Quel type de symétrie est le plus courant en criminologie?
L’asymétrie négatuve
Vrai ou Faux
Une variable nominale ou ordinale est automatiquement paramétrique
Faux - elle est non paramétrique
Vrai ou Faux
Lorsque notre N (échantillon) est de moins de 30, notre variable est par défaut non paramétrique
Vrai
Vrai ou Faux
Lorsque la distribtuion de notre variable est non normale : paramétrique
Faux - Non paramétrique
Un peu de lousse ok si asymétriquqe, mais pas si plusieurs pics