intra Flashcards
statistique
- Ensemble des données concernant une catégorie de faits,
un phénomène ou un groupe d’individus. - Ensemble des méthodes qui ont pour objet la collecte, le traitement et l’interprétation des données
- Variable aléatoire en
fonction des observations et construite à
partir d’un échantillon - statistique (domaine), une statistique (test,
paramètre), des statistiques (données)
élément
Unité qui compose la population. Entité concrèteidentifiable sans ambiguité et dénombrable sur laquelle on
mesure ou observe un ou plusieurs traits
population statistique
- Ensemble des éléments représentés par l’échantillonnage.
- au moins une caractéristique commune et exclusive, permettant de reconnaître et distinguer la pop
statistique.
population cible
L’ensemble des éléments visés par une problématique scientifique
échantillon
Fragment d’un ensemble prélevé pour juger de
cet ensemble.
fraction d’une pop statistique sur
laquelle des mesures (ou observations) sont effectuées
dans le but de connaître les propriétés de cette pop.
tirage aléatoire
Pour généraliser les conclusions à la pop statistique,
l’échantillon doit être représentatif:
- Mélange des éléments
- Échantillonnage probabiliste (aléatoire)
- Sélection par quota
échantillonnage aléatoire simple
Prélever au hasard et de façon indépendante n unités
d’échantillonnage dans une population de N éléments. n/N.
échantillonnage aléatoire simple, étape
- constituer une base de sondage (liste des éléments)
- numéroter les éléments du premier au Nième
- tirer au sort n éléments avec un générateur de nombres aléatoires
avec ou sans remise
échantillonage avec et sans remise
- Chaque élément échantillonné est remis dans la population et peut être sélectionné à nouveau
- Chaque élément échantillonné est retiré de la population et ne
peut être sélectionné à nouveau
variable
Toute caractéristique mesurable ou observable sur un élément d’échantillonnage (var. propre) ou sur son
environnement
variable aléatoire
dont la valeur est le résultat d’un
processus aléatoire (stochastique). Pour un élément donné, la valeur précise prise par une variable aléatoire n’est pas
connue avant qu’une observation n’ait été faite.
variable controlé
dont la valeur est déterminée par
l’expérimentateur et connue de façon précise.
type de biais
- Biais de sélection
Erreurs de couverture
Erreurs de réponse
Erreurs de non-réponse
biais de selection
Résulte d’une sélection non-aléatoire des unités d’échantillonnage
biais, erreurs de couverture
proviennent d’une mauvaise définition de la pop statistique.
Éléments inclus alors qu’ils ne devraient pas, exclus alors qu’il devraient être inclus, ou inclus plus d’une fois (exemple: superposition partielle de parcelles)
biais, erreurs de reponse
causées par une mauvaise mesure des éléments (erreur de lecture, mauvaise calibration de
l’instrument, mauvaise identification sur le terrain)
biais, erreur de non-réponse
résultent de la non-détection d’individus présents au sein d’une unité
d’échantillonnage
précision vs justesse vs exactitude
La précision d’une estimation d’un paramètre quantifie le niveau de variation (dispersion) entre les
estimations qui auraient été obtenues suite à plusieurs échantillonnages de la pop statistique.
La justesse résulte d’une absence de biais.
L’exactitude est à la fois affectée par les biais et les
erreurs d’échantillonnage. Exact = juste + précis
l’erreur d’éhantillonnage
C’est une erreur aléatoire (pas systématique)
Sources d’erreurs: temporelle, spatiale, ou due à
l’échantillonnage.
Elle est nulle seulement quand l’échantillonage est
exhaustif (recensement)
précision et exactitude
exactitude, éviter les biais:
Randomisation
Réplication
Pour accroître la précision:
Réplication (augmenter n!)
Contrôle de la variation (stratification, covariables)
présentation donné, série statistique simple
Une seule variable (mesurée) pour un
ensemble d’éléments.
Si la variable est qualitative ou semi-quantitative,
chaque catégorie représente une classe
d’observations. On dénombre les éléments des classe, représente en tableau de contingence ou de diagramme en bâtons (variable semi quant, quant et discrete).
règle de Sturge et Yule
sturge: 1+3.3log n
yule: 2.5∜n
histogramme
variable quantitative et continu. identifier borde: max-min/nb de classe
diagramme a moustache
donnée quantitative, médiane, ecart, étendu, valeur aberrante.
série statistique double
Correspond à un ensemble d’éléments pour lesquels on a mesuré deux variables.
il faut au moins une variable aléatoire.
La seconde variable peut être aléatoire ou contrôlée. graphique: histogramme, bâton ou moustache, surtout dispersion si variable quantitative.
paramètre de distribution
- Paramètres de position: valeurs centrales autour
desquelles se groupent les valeurs observées - Paramètres de dispersion: renseignent quant à
l’étalement de la distribution des valeurs autour des
valeurs centrales.
paramètre de position. moyenne
x = moyenne de la distribution théorique des éléments x: est la moyenne arithmétique des n éléments tirés d’une population finie ou infinie. Pour les variables quantitatives continues, la moyenne arithmétique calculée sur les données brutes est toujours plus précise. très affecter par les valeurs extrêmes
paramètre de position, médiane
Symbole: Mex
Valeur de l’observation qui se situe au centre de la série statistique classée en ordre croissant. La médiane
sépare la série en deux groupes égaux. Si n est pair, la médiane est entre les deux valeurs centrales, la moyenne. moins affecter par extrême, moins d’info que moyenne
paramètre de position, mode
Symbole: Mox
Valeur d’une variable ayant la plus grande fréquence. Une distribution peut être polymodale s’il y a plusieurs fréquence nettement plus élevée que celles des autres classes. difficile a calculer, facile a identifier, pas affecter par extrême,
paramètre de dispersion, variance
Symbole: s2x pour un échantillon
s2 (sigma au carré) pour une population entière (statistique)
ou distribution théorique
- Mesure la variabilité des valeurs autour de la moyenne. degré de liberté: n-1. pour eliminer le biais du calcule de moyenne
propriété de la variance
- Si tous les xi sont égaux, la variance est nulle
- Variance augmente quand variabilité augmente
- Il faut au moins deux observations pour estimer la variance, sinon n – 1 est 0
- Unités de la variance sont celles de la variable au carré
paramètre de dispersion, ecart type
Symboles: s pour une pop ou distribution théorique et sx pour un échantillon
paramètre de dispersion, coefficient de variation
CV constitue une mesure de dispersion relative (%), contrairement à la variance et à l’écart type qui sont des mesures de variation absolue. Donc, CV permet de comparer la variation de variables exprimées dans des unités physiques ou des échelles différentes.
indicateur de forme, coefficient d’asymétrie
symbole: g1
Mesure le manque de symétrie d’une distribution.
Valeurs: 0 pour une distribution symétrique
> 0 pour une distribution allongée vers la droite
< 0 pour une distribution allongée vers la gauche
indicateur de forme, coefficient d’aplatissement
symbole: g2
Mesure le degré d’aplatissement d’une distribution.
Valeurs: 0 normale
( mésocurtique)
> 0 leptocurtique (plus pointue)
< 0 platicurtique (plus aplatie)
= -1.2 uniforme (toutes classes égales)
leptocurtique=
^m moy, var dif
platycurtique= diff moy, ^m var
probabilité
probabilité= nombre de cas favorable/nombre de repetition N.
fréquence relative d’un evenement
la fréquence relative d’un événement dans
la population statistique.
La fréquence relative d’un événement dans
un échantillon aléatoire dont l’effectif est n, à mesure que n s’approche de l’effectif de la population statistique.
distribution d’échantillonnage et de probabilité
Dist. d’échantillonnage :
- Fréquence relative (ou proportion)
de chacun des événements
possibles dans un échantillon.
Dist. de probabilités :
- Fréquence relative (ou proportion)
de chacun des événements
possibles dans une population
statistique.