Chapitre 1: Probabilités et Statistiques : Qu'est-ce que c'est ? Flashcards
Qu’est-ce qu’une donnée?
Faits et chiffres qui sont collectés, analysés, résumés et interprétés
Qu’est-ce qu’un élément?
Entités auprès desquelles les données sont collectées
Qu’est-ce qu’une variable (caractère)?
Caractéristiques des éléments que l’on désire étudier
- Colonne d’un tableau
- Qualitative ou quantitative
Qu’est-ce qu’une modalité (k)?
Différentes valeurs que peuvent prendre une variable
Qu’est-ce qu’une observation?
L’ensemble des mesures collectées pour un élément particulier est une observation
*Ligne d’un tableau
Qu’est-ce qu’une variable qualitative nominale?
Catégorie de variable où il n’y a pas de hiérarchie (homme/femme, langues parlées)
*Possible d’utiliser un code numérique
Qu’est-ce qu’une variable qualitative ordinale?
Catégorie de variable où il y a un ordre. Les nombres indiquent des rangs et non des quantités
(niveau d’études, niveau de douleur)
Qu’est-ce qu’une variable quantitative discrète?
Variable qui peut prendre un nombre fini de modalités ou un nombre infini dénombrable de valeur (1,2,3,4,5..)
*Nombre d’étudiants dans une classe, nombre de frères et soeurs
Qu’est-ce qu’une variable quantitative continue?
Variable qui peut prendre n’importe quelle valeur dans un intervalle de réels (nombre infini indénombrable, valeurs très proches)
*taille, revenu
Quels sont les principales échelles de mesure?
Ratio, intervalle,ordinale, nominale
Qu’est-ce qu’un ratio ?
Les nombres représentent des quantités réelles sur lesquelles toute les opérations mathématiques peuvent être exécutées.
- Possède un zéro absolu qui signifie rien
- Salaire, nombre de personnes dans une classe, taille, température kelvin
Qu’est-ce qu’un intervalle ?
Entre des nombres égaux qui peuvent être additionnés ou soustraits.
- Le zéro est arbitraire (il signifie une valeur, elle existe)
- Température celcius
Quels sont les 4 grands volets de la statistique?
- La collecte des données
- Les statistiques descriptives
- L’inférence statistique
- La décision statistique
Qu’est-ce qu’une source de données primaire ?
Collecte de données par observations/sondage/expérimentation.
Qu’est-ce qu’une source de données secondaire ?
Compilation de données imprimées ou électroniques.
Qu’est-ce que l’inférence statistique?
Ensemble des méthodes qui permettent de tirer des conclusions sur la population à partir d’une information partielle provenant d’un échantillon
Qu’est-ce qu’une population ?
L’ensemble de tous les individus concernés par l’étude.
N= taille de la population
mu (u)= moyenne de la population
mu (û) = estimation de u qui est inconnu au départ
Qu’est-ce qu’un échantillon?
Sous-ensemble de la population.
n=taille de l’échantillon
x avec barre au dessus = moyenne de l’échantillon
Qu’est-ce qu’un individu ou unité statistique?
Chaque élément de la population ou de l’échantillon.
Qu’est-ce que mu (u) ?
moyenne de la population
Qu’est-ce que mu (û) ?
estimation de la moyenne de la population inconnue au départ
Qu’est-ce que n?
taille de l’échantillon
Qu’est-ce que N?
taille de la population
Quels sont les 5 grandes caractéristiques de l’inférence statistique ?
- Stats + probabilités
- Estimation des paramètres d’une population
- Estimation par intervalle de confiance
- Test d’hypothèse
- Régression linéaire
Quelles sont les trois étapes du traitement des données statistiques (statistique descriptive) ?
- Données en tableau
- Représentation graphique
- Calcul de la moyenne, variance, médiane, etc.
Qu’est-ce que x avec barre au dessus ?
= moyenne de l’échantillon
Qu’est-ce que la fréquence absolue?
Nombre d’unités présentant une valeur x.
fi
Qu’est-ce que la fréquence relative cumulée?
Fi/n où n = taille de l’échantillon
Qu’est-ce que la fréquence relative absolue ?
fi/n où n=taille de l’échantillon
Qu’est-ce que la fréquence cumulée ?
Fréquence cumumulée des valeurs qui sont inférieures ou égales à xi. (Fi)
Quand des données doivent-elles être groupées ?
Quand la variable est continue ou qu’elle peut prendre un grand nombre de valeurs différentes (même si elle est driscrète).
Qu’est-ce que la distribution de fréquence ?
Fonction qui fait correspondre la fréquence absolue de chaque valeur de x à x.
–> Résumé des données sous forme de tableau
Quel type de graphique doit-on utilisé pour les données non groupées ?
Diagramme en bâton
x= valeur de la variable discrète ou donnée qualitative
y=Bâton de longueur proportionnelle à la fréquence de chaque variable
Quel type de graphique doit-on utilisé pour les données groupées ?
Histogramme
*Rectangles juxtaposées dont chacune des bases est égale à l’intervalle de chaque classe et dont la hauteur est proportionnelle à la fréquence de la classe correspondante
Quel type de graphique doit-on utilisé pour la fréquence relative cumulée?
Ogive
Que peut représenter un diagramme circulaire ?
Fréquence relative de données groupées ou non groupées
Que peut représenter un polygone de fréquence?
Distribution des fréquences sous forme de courbe
- Peut servir pour les fréquences relatives
- Doit commencer et finir par 0
Qu’est-ce qu’un estimateur ponctuel ?
Statistiques d’échantillon qui permettent d’estimer des paramètre inconnus d’une population
Qu’est-ce qu’une statistique d’échantillon ?
Mesures numériques calculées à partir de données issues d’un échantillon
Qu’est-ce qu’une caractéristique de position (tendance centrale) ?
Permet d’obtenir une idée de l’ordre de grandeur des valeurs de la série
*Moyenne, médiane, mode, percentiles (fractiles, quantiles)
Qu’est-ce qu’une caractéristique de dispersion ?
Fluctuation et étalement des valeurs observées
*Étendue, variance, écart-type
Qu’est-ce que la moyenne ?
Statistique la plus utilisée, affectée par les valeurs extrêmes
*Échelle de mesure: intervalle et ratio
Qu’est-ce que la moyenne pondérée ?
Valeur de la moyenne lorsque les observations n’ont pas toutes la même importance
*Note finale moyenne pour un cours en fonction de la pondération de chaque examen
Qu’est-ce que la médiane ?
Valeur centrale lorsque les données sont classées en ordre croissant
Pair: moyenne des 2 observations centrale
impair:(n+1)/2
- Insensible aux valeurs extrêmes
- Échelle de mesure: ordinal, intervalle et ratio
Qu’est-ce que le mode (Mo) ?
La valeur la plus fréquente dans une série
*Il peut en avoir plusieurs ou aucun
Qu’est-ce que le 85e percentile ?
Valeur dont au moins 85% des autres valeurs sont inférieures ou égales à celle-ci
Qu’est-ce qu’un quartile ?
1/4 du percentile
Q1: p=25
Q2: p=50 (médiane)
Q3: p=75
Qu’est-ce que l’étendue interquartile ?
Mesure l’étendue de la moitié centrale des observation
- Pas affectée par les valeurs extrêmes
- Q3-Q1
Qu’est-ce que la variance ?
Étalement d’une série par rapport à la moyenne
*Écart-type au carré
*Échelle de mesure: intervalle et ratio
Qu’est-ce que l’écart-type ?
Étalement d’une série par rapport à la moyenne
*Racine carrée de la variance
*Échelle de mesure: intervalle et ratio
Qu’est-ce que le coefficient de variation ?
Représentativité de la moyenne selon l’ensemble des observations (%)
- Utiliser quand les séries n’ont pas la même moyenne
- Petit = population homogène
- Échelle de mesure: intervalle et ratio
Qu’est-ce que l’étendue ?
max-min
*Échelle de mesure: ordinal, intervalle et ratio
Qu’est-ce qu’une donnée en coupe transversale?
données collectées au même moment
Qu’est-ce qu’une série temporelle ?
données collectées sur plusieurs périodes de temps