Cours 3 - Estimation, incertitude, probabilité et loi de distribution Flashcards
Quel est la formule pour déterminée la probabilité d’un événement A?
P (A) = N (A) / N (omega), où
P (A) = probabilité de l’événement A
N (A) = Cas favorables
N (omega) = cas possible (univers)
Quel est la règle des additions des probabilités quand les événements sont mutuellements exclusifs? Quand les événements ne sont pas mutuellements exclusifs?
P (A ou B) = P (A) + P (B) quand ils sont mutuellements exclsuif
P (A ou B) = P (A) + P (B) - P (A et B) quand ils ne sont pas mutuellements exclusifs
Quel est la règle de multiplication des probabilités quand les événements sont indépendants? Quand les événements sont dépendants?
P (A et B) = P (A) * P (B) quand les événements sont indépendants
P (A suite à B) = P (A et B) / P (B) quand les événements sont dépendants
Qu’est-ce que la loi Normale? Quelle est la formule pour la loi Normale? Que veux dire chaque variable?
La loi Normale est une distribution de probabilité où la moyenne, la medianne et le mode sont combinés. Elle permet de calculer la probabilité d’obtenir un événement en particulier. La formule associée est:
f(X) = (1 / ((racine-caréé)2pi * sigma)) * e^(-0.5)(X - mu/sigma)^2, où:
f(X) = probabilité de fréquence de la variable
X = valeur de la variable
mu = moyenne de la population de référence
sigma = l’écart type de la population de référence
Quelle est la formule de la loi Normale standardisée? Que représente chaque variable?
Z = (X - mu) / sigma, où Z = le nombre d'unités séparant X de la moyenne X = la valeur qu'on souhaite transformer mu = moyenne de la population de référence sigma = l'écart type de la population de référence
Nommez les deux principes sur lesquels on doit basé une inférence statistique.
- La moyenne d’un échantillon est un estimateur non-biasé de la moyenne de la population
- Le théorème central limite, selon lequel les moyennes de nombreux échantillons de la même population sont distribuées selon la loi Normale.
Quelle est la formule pour l’erreur standard? Que représente chaque variable?
Erreur standard = s / (racine-carée de n), où
s = l’écart-type
n = l’effectif de la population
Comment est-ce qu’on peut diminuer l’erreur standard?
En ayant un plus gros n (un plus gros effectif)
Qu’est-ce que l’intervalle de confiance?
Un intervalle dans lequel on s’attend à trouver la moyenne de la population. On est confiant à 95% que la vrai moyenne de la population se trouve dans cet intervalle.
Vrai ou Faux: L’intervalle de confiance est une probabilité. Il y a donc 95% des chances que notre intervalle contient la moyenne de la population.
Faux: L’intervalle de confiance n’est pas une probabilité. L’intervalle de confiance signifie que 19 fois sur 20, la moyenne va être dans notre intervalle.
Quelle est la formule pour calculé l’intervalle de confiance selon la distribution Normale? Que représente chaque valeur?
X_ - z (alpha/2) * (sigma / (racine-carée)n), est plus petit ou égale à, mu, est plus petit ou égale à X_ + z (alpha/2) * (sigma / (racine-carée)n), où
X_ = la moyenne (la bar devrait être sur x)
z (alpha/2) = la valeur seuil Z (selon la distribution Normale, = 1.96)
sigma = l’ecart type (peut aussi être représenté par s)
n = l’effectif de la population.
sigma / (racine-carée)n = l’erreur standard
Quelle distribution doit être utilisé quand l’écart-type de la population est inconnu?
La distribution Student.
Que sont les différences entre la distribution Normale et la distribution Student?
- La valeur z de la distribution Normale est remplacée par la valeur t dans la distribution Student
- Le kurtosis de la distribution Student est beaucoup plus faible que celui de la distribution Normale
- Plus la taille d’échantillon est grande, plus on se rapproche d’une distribution Normale (et donc on s’éloigne d’une distribution Student)
Qu’est-ce qu’un degré de liberté? Quelle est la formule associée aux degrés de liberté? Que représente chaque variable?
Degré de liberté: nombres de valeurs aléatoires qui ne peuvent être déterminées ou fixées par équation. La formule associée est:
dl = n - 1, où
n = nombre de variables
dl = degrés de liberté.