Stats 2 Flashcards
Une statistique désigne (2)
- Un ensemble de données d’observations
- La science qui consiste en leur recueil, leur traitement et leur interprétation.
Définition statistique descriptive
Partie de la statistique qui consiste à décrire et à résumer l’information contenue dans un ensemble de données, sous forme de tableau, de graphique ou à l’aide de mesures telles que la moyenne ou la variance.
On utilise également le terme “statistique descriptive” pour qualifier ces dernières (la moyenne et l’écart-type sont des statistiques descriptives).
Définition théorie des probabilités
Une branche des mathématiques qui se consacre à l’étude des phénomènes ou expériences aléatoires.
La théorie des probabilités est formée de lois mathématiques qui décrivent le comportement des phénomènes relevant du hasard.
Quel est l’inférence statistique ?
Un ensemble de règles logiques qui permet de tirer des conclusions au sujet d’une hypothèse de recherche ou d’une population à partir d’un échantillon de la population (comprendre les liens entre population et échantillon)
Approfondir la notion de représentativité de l’échantillon.
Sur quoi est basée l’inférence statistique?
Théorie des probabilités.
Ce sont les lois de la probabilité qui permettent de quantifier l’incertitude (ou la certitude) des conclusions obtenues dans un échantillon.
Objectifs de faire des stats (2)
Statistiques descriptives
Inférence statistique
À partir de quoi les statistiques descriptives sont elles produites ?
Échantillon (doit être représentatif de la population)
Quels sont les 2 types de données ?
Quantitative et qualitative
Nommer 2 types de variables/données quantitatives
Continues
Discrètes (# entiers)
Nommer 2 types de variables/données qualitatives
Nominales (pas d’ordre)
Ordinales (ordre)
Vrai ou faux : on peut toujours connaître la distance qui sépare 2 variables quantitatives
Vrai
Vrai ou faux : on ne connaît jamais la distance qui sépare 2 variables ordinales
Faux
Distance parfois pas connue et peut varier
Vrai ou faux : on connaît la distance entre 2 variables nominales
Faux
On ignore la distance
Comment peut-on présenter des données ?
Distribution de fréquence (histogramme, tableau de fréquence)
Peut-on faire un histogramme avec des variables qualitatives ?
Non. Pas de suite entre les variables
Qu’est-ce qu’on peut déterminer avec un histogramme ? (à part constater la distribution des fréquences de façon plus visuelle)
si la distribution suit une loi unimodale ou bimodale
si la distribution est symétrique ou asymétrique
si la distribution possède des valeurs aberrantes
Deux catégories de paramètres qui permettent de caractériser une distribution
Paramètres de position
Paramètres de dispersion
Renseignent sur l’ordre de grandeur des valeurs et les valeurs centrales autour desquelles se regroupent les observations.
Nommer les paramètres de position
Moyenne arithmétique
Médiane
Mode
Nommer les paramètres de dispersion
Étendue
Quartiles
Variance
Écart-types
Quel paramètre de position est largement affecté par les données aberrantes ?
moyenne
Comment détermine-t-on la médiane
On ordonne les valeurs par ordre croissant
Pour un nombre pair d’observations, on fait la moyenne des deux observations centrales
Pour un nombre impair d’observations, la médiane est la valeur centrale
Valeur qui représente le sommet de la courbe
mode
Il y a toujours un mode dans chaque échantillon
Faux, parfois les petits échantillons n’ont pas de mode.