Examen 1 Flashcards
Approche descriptive
Décrire population statistique
Décrire un système à l’étude (effet de plusieurs variables environnementales)
Ne permet pas d’expliquer les relations mais décrit très bien.
Approche expérimentale
Contrôle du système (variables stables)
Pour établir des relations de cause à effet
(en faisant varier une certaine variable)
Variables quantitatives
Quantités véritables (peut déterminer des différences et des rapports)
(Continues = (-infini, +infini) Discrète = (nb entiers seulement))
Variables de rang ou semi-quantitative
Catégorie
(l’intervalle entre les différentes valeurs est inconnu ou variable)
Variables qualitatives
Peut pas être classé selon un ordre
ex: sexe
Statistique
: Caractéristiques d’un échantillon (inférence)
Paramètre
Caractéristiques d’une population statistiques
(vraie moyenne absolue)
(pas d’inférence)
Statistiques descriptives
- Permet avoir la localisation d’une distribution (tendance centrale)
- Permet de savoir l’ampleur de la distribution et la variabilité (mesure de dispersion).
Permet de mieux comprendre et décrire les données.
Unité d’échantillonnage
Plus petits éléments sur lequel on va mesurer des variables (pas tjr ind.)
(longueur de salamandre ou parcelle (pas arbre)) (chaque unité peut avoir plusieurs variables (longueur, masse, sexe))
Échantillon
Unité d’échantillonnage choisi dans la population statistiques
(doit être échantillon aléatoire = représentatif)
Population cible
Ensemble des individus qui nous intéressent.
Peut-être plus grand ou égal à la population statistique (Salamandre de tout le Canada/USA)
Inférence statistique
Caractériser la «population statistique» à partir d’un sous-ensemble plus petit appelé «échantillon»
(Peut être fait juste si l’échantillon est représentatif (aléatoire) -> calculer pour représenter toute la population statistique)
Médiane
Valeur centrale d’une série de données (autant de valeurs inférieures que supérieures)
(les données doivent être placées en ordre croissant)
Mode
La classe correspondant au plus grand nombre d’observations
Quantiles
Points qui divisent les données en fractions égales prédéterminées
En 2 = médiane en 4 = quartiles et en 100 = centiles
Étendue
La différence entre la plus grande valeur et la plus faible
Écart-type
Racine carré de la variance
Variance
Somme des carrés/n-1
Somme des carrés
Somme de toutes les valeurs – la moyenne
Indice de diversité
Pas possible de calculer la dispersion pour des variables nominales (sexe, espèce)
Indice de Shannon permet d’évaluer la diversité
La seule façon d’avoir un échantillon représentatif est:
Avoir un échantillon représentatif avoir un échantillon aléatoire
Estimateur
Expression mathématique qui permet d’estimer un paramètre de la population statistique à partir des données de l’échantillon
(formule théorique sans valeurs)
Estimation
la valeur (le résultat) de l’estimateur pour un échantillon particulier (formule avec valeurs)
Calcul de la probabilité
Donne la probabilité de voir apparaitre un évènement de probabilité p n fois au cours de n tirages identiques et indépendants.
Distribution normale
-Pour les variables continues
-L’aire sous la courbe est toujours = 1
Symétrique autour de la moyenne (50% chaque côté de la moyenne)
-On cherche l’air sous la courbe (faut centrer et réduire (calculer z) et chercher dans la table)
-La table donne toujours les probabilités à GAUCHE de la valeur z POSITIVE
Distribution binomiale
Distribution pour des variables discontinues ou binaire
Donne la probabilité de voir apparaitre un évènement de probabilité p n fois au cours de n tirages identiques et indépendants.
Définition intervalle de confiance
L’intervalle de confiance d’un paramètre au niveau de probabilité (1 - a) est un intervalle (central) qui a une probabilité (1 - a) de contenir le paramètre.
Estimation par intervalle
Déterminer la précision de l’estimation du paramètre faite à partir de l’échantillon en déterminant l’intervalle de confiance du paramètre.
Niveau de confiance
1 - a
Distribution d’échantillonnage
distribution de toutes les moyennes (ex : les masses moyenne de 1000 échantillons de manchots)
La distribution d’échantillonnage des moyennes = distribution normale
Distribution de données = 1 échantillon
Écart type de la distribution d’échantillonnage
Erreur-type
Erreur type = Précision de l’estimation = distribution d’échantillonnage (plusieurs moyennes)
L’erreur type varie selon la taille de l’échantillon (il devient plus précis)
Comment choisir si on utilise la distribution normale (z) ou de t Student
Distribution normale : zcrit (si éch > 100) (SI POPULATION)
Distribution de t Student : tcrit (si éch > 100 ou < 100) (surtout t utilisé) (paramètre provient échantillon)
Zcrit et Tcrit varie selon quoi
zcrit varie en fonction de a et ne varie pas en fonction de n (n > 100)
tcrit varie en fonction de a et du degré de liberté (n – 1) donc change selon la taille de l’échantillon
Calculer intervalle de confiance d’une proportion
Loi binomiale (long et chiant)
1. Calculer la distribution binomiale (ex : probabilité 0-10)
2. Pour trouver limite inférieure = utiliser fréquence cumulée (cumulation probabilités)
3. Pour trouver limite supérieure = utiliser fréquence rétro-cumulée
4. Trouver où est /2
5. Trouver la valeur entre 2 P cumulé
6. Présenter la valeur et divisé par n pour présenter valeur relative
Loi normale (plus simple)
Calcul intervalle de confiance de la variance
1 méthode : Utilisation de la loi du X2 (khi 2)
Intervalle de confiance écart-type = √Limites