3. Probabilités, lois de distribution, estimation et incertitude Flashcards

1
Q

ℙ[A] = N(A) / N(Ω)

A

Probabilité d’obtenir A = rapport entre nombre cas favorable A et nombre cas possible Ω (univers cas possible)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Évènement indépendant

A

Réalisation de A affecte pas probabilité réalisation de B

Nom : indépendant, mutuellement exclusif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

A ∪ B

A

Union d’événements indépendants A et B
Implique réalisation de A ou B ou AB
Calcul ℙ[A ∪ B] = ℙ[A] + ℙ[B]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

A ∩ B

A

Intersection d’événements indépendants
Implique réalisation de A et B
Intersection nulle si A et B imcompatible
Calcul : ℙ[A ∩ B] = ℙ[A] × ℙ[B]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Évènement dépendant

A

Réalisation A affecte probabilité realisation de B (intersection non nulle)
A et B lié réalisation commune aux 2 univers
Dû dépendance doit soustraire partie commune -> veut que 2 se réalise, juste 1
Calcul : ℙ[A ∪ B] = ℙ[A] + ℙ[B] − ℙ[A ∩ B]
1. Trouver ℙ[A]
2. Trouver ℙ[B]
3. Trouver ℙ[A ∩ B] (probabilité de l’intersection de A et B)
4. Appliquer ℙ[A ∪ B] = ℙ[A] + ℙ[B] − ℙ[A ∩ B]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Probabilité conditionnelle

A

Probabilité dont calcul dépend information additionnelle
Calcul avec évènement dépendant : ℙ[A|B]=ℙ[A sachant B]
Soit probabilité de A étant donné on connait information événement B
Ex : somme 7 si premier dé 3
Calcul : ℙ[A|B] = ℙ[A∩B] / ℙ[B]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Permutation sans répétition

A

Classement ordonné de k éléments distincts
Calcul : Pk = k × (k−1) × (k−2) × … × (1) = k! (k factoriel) -> donne nombre tota permutation
Vs arrangement : compte tous groupes taille k = n
RStudio : permn(), avecpackage : combinat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Arrangement sans répétition

A

Nombre arrangements ordonnées distincts k possible à partir échantillon taille n
Calcul Aᵏn = n! / (n−k)!
Vs permutation : compte tous groupes taille k < n
Ex : k = paire de lettres (2) et n = 5 lettres, k = 4 personnes et n = 5 chaises

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Arrangement avec répétition

A

Nombre arrangements ordonnées distincts k possible à partir échantillon taille n
Calcul : Arangements avec répétition=nᵏ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Combinaison

A

Classement non ordonné de k éléments, sans remise, choisis parmi n éléments
Calcul : Cᵏn = n! / k! x (n−k)! -> si n ≥ k
Vs permutation/arrangement : considère par ordre (permutation)
RStudio : combn ()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Objectif principal statistique

A

Estimer dans certain intervalle de confiance propriété population à partir échantillon
Probabilité permet établie modèle théorique : modélise effet hasard population( H0)

Donc, probabilité permet estimer;

  • Étendue variabilité naturelle
  • Si processus dévie effet attendu dû hasard
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Processus valider/infirmer hypoth;se en statistique paramétrique

A
  1. Modélise effet hasard sur population avec distribution de probabilité
  2. Échantillonne population pour obtenir données
  3. Estime paramètres population à partir données
  4. Calcul intervalle de confiance pour paramètres estimés
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Loi de distribution

A

Beaucoup propriété biologique suivent distributions fréquence issus lois naturelles dont caractéristiques mathématiques définies

Plus connue : loi de distribution Normale
Autres : loi Log-Normale, binomiale, de Poisson, de Student, …

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Distriubtion Normale

A

Émerge si processus mesuré soumis effet aléatoire additif -> +/- totalement dû hasard
Additif : toujours même à chaque fois
Ex : dsitribution billes

Représente aussi ditribution de fréquence moyenne calculée sur nombreux échantillons indépendants même population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Expérience Michelson/Morley

A

1881-1887
But : démontrer existence éther luminifère
Résultat : met en doute existence éther, mais pas capable expliquer vitesse constante lumière
Données conforme distribution Normale
Donc, variation mesure juste dû hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Forme distribution Normale

A

Loi Normale comprte 2 paramètres

  1. Moyenne μ
  2. Écart-type σ

Fonction de densité variable X suit Normale avec μ ∈ ℝ et σ ∈ (0,∞) (X suit N(μ,σ))
-> N(X) = (1 / (√2π)σ) x e^(1 / 2 x ((X−μ) / σ)^2)

Dépend juste de μ, σ et X

17
Q

Symétrie - Normale -

A
N(X) toujour symétrique
Donc, moyenne = médiane = mode
Peut séparer distribution en 2 à la moyenne
Propotion valeurs gauches/droites égale
Peu importe μ et σ
18
Q

Probabilité - Normale -

A

Pour dustribution Normale 68.27% (2 x 34.13%) valeurs entre X = −σ et X = σ
Soit à ±σ de moyenne
Donc, probabilité avoir X à ±σ avec échanitllonnage hasard = 68.27%
Mathémathique : ℙ[−σ ≤ X ≤ σ] = 0.3413 + 0.3413 = 0.6826

Si à ±2σ, ℙ[X ≤ −2σ] + ℙ[X ≥ 2σ] = 0.0455
Donc, 4.55% avoir échantillon à ±2σ

19
Q

Valeurs extrêmes

A

Valeurs à plus de 3σ de la moyenne

20
Q

Valeurs dans distribution Normale

A

Un peu plus 2/3 valeurs -> ±σ
Un peu plus 95% valeurs -> ±2σ
Presque 99.9% valeurs -> ±3σ

21
Q

Distribution Normale standardisée : Z

A

Autres noms : distribution Normale centrée réduite
Toute distribution X suit Normale de μ et σ peut être standardisée
Soit, être rapportée loi Normale standard où μ = 0 et σ = 1
Calcul : Z = (X − μ) / σ
X devient Z
Z exprimé en termes σ
Permet obtenir probabilités à partie table loi Normale

22
Q

Propriétés de Z

A
  1. Notation
  2. Complémentation des probabilités
  3. Symétrie des probabilités
23
Q

Notation

A

ℙ[Z≤x] = Φ(x)
x souvent appelé valeur seuil
Valeurs de Φ(x) dans table loi Normale
Pour un Φ(x), lit probabilités en regardant 1ère colonne/1ère rangée
Ex : Φ(1) = 0.8413, valeur au croisement rangée 1,0 et colonne 0,00

24
Q

Complémentation des probabilités

A

Valeur maximale probabilité = 1
Donc, pour x quelconque
ℙ[Z ≥ x] = 1 − ℙ[Z ≤ x] = 1−Φ(x)

25
Q

Symétrie des probabilités

A

Distribution Normale est symétrique

ℙ[Z ≥ x] = ℙ[Z ≤ −x] = Φ(−x) = 1−Φ(x)

26
Q

Calcul probabilité avec loi Normale

A
  1. Si variable suit Normale μ ≠ 0 et σ ≠ 1 -> standardise
  2. Utilise propriété Z pour calculer probabilité
    RStudio : pnorm()
27
Q

Estimation

A

Valeurs estimée jamais égale valeur réelle

Dû inclfuence hasard sur échantillonnage

28
Q

Distribution d’échantillonnage

A

Distribution fréquence valeurs estimées à partir nombreux échantillons si échanitllonnage infini possible
Moyenne distrubution échantillonnage devrait être égale moyenne population

Plus échanitllon (n) = moyenne plus précise -> distribution moins étendue
Plus écart-type petit (σ) = moyenne plus précise -> distribution moins étendue

Important : σ 1 échantillon > σ plusieurs échantillons (distribution échantillonnage)

29
Q

Erreur standard

A

Écart-type de la distribution d’échantillonnage
Calcul : SE = S / √n
Où -> SE : erreur standard, S : écart-type, n : effectif

SE plus faible que S et proportionnelle racine de N
Donc, grand gain précision 3-20, mais diminue après

30
Q

Intervalle de confiance

A

Possède niveau de confiance α
Donc, si répète échantillonnage plusieurs fois avec même effectif, vrai moyenne dans intervalle de confiance x%
Ex : intervalle 95% -> pour 20 échantillons : 19 dans intervalle (95%), 1 hors (5%)

Augmentation taille effectif = diminution intervalle
Diminution écart-type = diminution intervalle

31
Q

Intervalle de confiance (écart-type connu)

A

Estime avec : 2SE

X¯ − Z(α/2) x σ/√n ≤ μ ≤ X¯ + Z(α/2) x σ/√n
Où, X¯ : moyenne
n : effectif (nombre observations)
σ : écart-type population
Z(α/2) : valeur seuil

32
Q

Z(α/2) : valeur seuil

A

Valeur Z définie intervalle de confiance
Soit intervalle où variation dû hasard
α : seuil de confiance
Calcul : α = 1 - intervalle de confiance

33
Q

Z = X¯ − μ / σ(X¯)

A

Standardisation de la moyenne d’une population
Où, X¯ : moyenne échantillons (distribution d’échantillons)
μ : moyenne population
σ(X¯) : écart-type population

34
Q

Valeur t de Student

A

Calcul : t = X¯ − μ / SE

Notation : t(dl,α/2)
Retrouve en fonction de dl et α/2 dans table de Student

35
Q

Distribution de Student

A

Permet estimer intervalle confiance lorsque écart-type population pas connu
Issu remplacement de σ(X¯) par SE
Propriété principale : plus n grand = plus incertitude interval petit
Ressemble beaucoup Normale, mais kurtosis plus fort

Vs Normale : degré de liberté (df ou dl)
Calcul : dl = n - 1
Soit, égale nombre observation moins nombre de paramètre à estimer

Puisque dl change selon effectif -> 1 distribution de Student/dl

36
Q

Intervalle de confiance (écart-type population inconnu)

A

Utilise t(dl,α/2) comme valeur seuil au lieu de Z(α/2)
Calcul : X¯ − t(dl,α/2) x S/√n ≤ μ ≤ X¯ + t(dl,α/2) x S/√n
Où : X¯ : moyenne échantillon
n : effectif (nombre observations)
S : écart-type échantillon
t(dl,α/2) : valeur seuil Student

Obtient intervalle de confiance plus grand

37
Q

Théroème contrale limite

A

Moyenne plusieurs échantillons suite toujours distribution Normale