Variables Aléatoires Et Lois De Proba Flashcards
Qualitative ( def + 2 categories)
Prendre des modalités
Nominales: on nomme par catégorie ( ex couleur des yeux)
Ordinale: on classe, on hiérarchise, on ordonne
Ex classement au concours
Quantitative ( def + 2 categories)
= prend des valeurs
- discrète : on compte ( ex nb d’enfants par femme)
- continue: on mesure ( ex poids, taille)
Variables à deux modalités synonymes
Binaires, binomiale, booléennes, dichotomiques
Discretiser
On transforme une variable continue en QT discrète ( on remplace les intervalles par leur centre)
Catégoriser
On transforme une variable QT en QL ordinale ( on prend des valeurs qu’on regroupe en classes qu’on peut ensuite ordonner)
outils de représentation d’une QL univariée
- diagramme circulaire/ camembert
- diagramme en barre
- tableau de fréquence
outils de représentation d’une QT discrète
- diagramme en barre
- boîte à moustache
outils de représentation d’une QT continue
Boîte à moustache
Histogramme
outils de représentation de QT x QT
Nuage de points
QL x QL
Tableau de contingence
QT x QL
Box and whisker plots / diagramme de Tukey
Différence histogramme et diagramme
Histogramme: les barres sont continues
Diagramme en barres: il y a une séparation entre les barres
=> Comme l’histogramme est continu, il représente bien une variable QT continue
2 grands types de paramètres pour résumer une variable aléatoire
- position: espérance, maximum, minimum, quantiles
- dispersion: variance, étendue, intervalle interquartile
Espérance
= la moyenne
Ε(Χ)=ΣΡ(Χ₁) × Χi
C’est un paramètre de position
Variance
“Moyenne des carrés des écarts à la moyenne”
=> Paramètres de dispersion
Var = E (X²) - [E(X)]²
Écart type
( ou deviation standard)
=> Paramètre de dispersion
SD= σ= √Var
Loi de Bernoulli ( def + espérance, variance et écart type )
Une variable aléatoire de Bernoulli permet de décrire les comportements d’une variable binaire, qui ne prend que 2 valeurs par exemple: le succès (1) et l’échec (0). Elle est définie par p la probabilité d’obtenir un succès. q=1-p. q et p sont donc complémentaires
• E(X) = p
• Var = pq= p(1-p)
• SD = √pq
Loi binomiale ( def + espérance, variance et écart type)
Une loi binomiale est la répétition de n épreuves de Bernoulli de manière identique et indépendante.
Il y a deux paramètre p la probabilité du succès et n le nombre de répétitions de l’épreuve. La variable k représente le nombre de succès
• E(X) = np
• Var = npq
• SD = √npq
Calcul de la probabilité d’obtenir k succès:
P(X = k) =combinaison de k parmi n x p^k x q**(n-k)
C ( k/n) = n! / ( n - k)! k!
k!=1x2x3x4x5x……xk
Triangle de pascal
Lorsque p=0,5
Loi de poisson
=> Concerne les variables discrètes avec des événements rares.
- Utile lorsqu’une population est très importante et que la probabilité de réalisation d’un événement est infime.
( La loi binomiale reste juste mais difficile d’utilisation.)
En revanche, cette loi ne donne qu’une approximation de la probabilité.
- Il n’y a qu’un seul paramètre lambda = E = Var
- Par conséquent SD = √lambda
P(X=k) = (e ^ (- lambda) * lambda ^ k) /(k!)
Cas discrets ( 2 types)
Loi binomiale
Loi poisson
Cas continu
Loi Normale
Cette loi possède 2 paramètres µ la moyenne et sigma l’écart type.
Elle a une distribution en cloche, appelée courbe de Gausse
La courbe est donc centrée en µ et présente deux points d’inflexion µ-sigma et µ+sigma
Pour cette loi, la probabilité de se trouver dans un intervalle est égale à l’aire sous la courbe entre les deux bornes de l’intervalle. C’est pour cela qu’on utilise le terme densité de probabilité. La probabilité d’être égal à un nombre est de 0.
Donc P(A<X<B) = P(A≤x≤B)
Calcul de l’aire sous la courbe
Méthode statistique
=> Pour toute variable de paramètres ( µ; σ) :
1) on centre m: soustrait µ
2) on réduit: diviser par σ
X-µ / σ = Z score = statistique = p-value
Ainsi on obtient une variable suivant une loi Normale centrée-reduite, de paramètres (0,1)
Théorème central limite
” la somme de variables aléatoires indépendantes converge vers une loi Normale, quelles que soient les distributions de ces VA