5. Comparaisons et relations entre variables qualitatives Flashcards

1
Q

Proportion

A

Fraction population présente caractéristique particulière
Définit par : p
Propriété : 0 < p < 1
Probabilité échantillonner individu = proportion individu dans population de k groupe
Calcul : p1 + p2 + ⋯ + pk = ∑(k, i=1) pi = 1
p1 = #1 / k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Il est possible à partir d’un échantillon…

A
  1. Estimer proportion population
  2. Calculer intervalle de confiance
  3. Tester hypothèse statistiques
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Loi binomiale

A

Permet estimer observations commune ou rare
À partir calcul probabilité d’occurence
Selon loi densité probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Conditions loi binomiale

A
  1. Échanitllon aléatoire/indépendant
  2. Valeurs peut appartenir à 2 catégories
  3. Nombre n fixe de valeurs (effectif fixe)
  4. Probabilité appartenir groupe 1 = p
  5. Probabilité appartenir groupe 2 = 1 - p
  6. Probabilité appartenir 1 ou 2 même pout tous éléments échantillon
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Succès

A

Observation choisie
Représente individus font partis groupe 1 ou 2
Ex : faire partie groupe 1 = p -> faire partie groupe 2 = 1 - p
ou
faire partie groupe 2 = p -> faire partie groupe 1 = 1 - p

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Fonction de masse - Loi binomiale -

A

Équivaut fonction densité variable continue mais pour variable discrète
Calcul : ℙ [X = k] = Ckn x p^k x (1−p)^(n−k)
Où, X : # k de succès dans n
Ckn : # combinaions permet obtenir k succès dans n
p^k : probabilité obtenir k succès successifs
(1−p)^(n−k) : probabilité obtenir n-k échecs

Multiplie car applique « et »

R : dbinom (k, size = n, prob = p)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Démarche - Loi binomiale -

A
  1. Vérifie conditions
  2. Définit variable aléatoire X (# succès)
  3. Calcul probabilité (avec loi binomial : ℙ [X = k] = Ckn x p^k x (1−p)^(n−k))
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Estimation proportion p

A
Pour estimer vrai proportion catégorie dans population doit définir ;
- Moyenne attendue 
   Calcul : 𝔼[X] = n x p
   Où, n : effectif
          p : probabilité
- Erreur standard
   Calcul : SEp = √((p x (1−p))/ n)

Plus n augmente = plus distirbution resserre autour moyenne (p) -> plus estimation précise
Dû SEp diminue proportionnellement √n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Intervalle de confiance p

A

Pour conclure intervelle confiance autour vrai p population
Diminue avec augmentation de n

Intervalle de confiance de Wald
Calcul : p − Z(α/2) x √(p x (1−p)/n) ≤ p attendue ≤ p + Z(α/2) x √(p x (1−p)/n)
Où, p : proportion
α : seuil de significativité

Existe d’autres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Test binomial

A

Permet appliquer proriétés distirbution binomiale pour tester significativité proportion
Significativité proportion : différence par rapport hasard
Doit avoir juste 2 valeurs possibles : Succès ou Échec
Cherche déterminer si fréquence relative (p) succès conforme nulle (p0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Procédure Test hypothèse - Loi binomiale -

A
  1. Définir résultat attendu (ex : gènes S surreprésentés sur X)
    Défini variable -> ex : Y = nombre de gènes S sur X
  2. Définir H0/H1 avec traductions mathématiques
  3. Calcul statistiques du test
    Pour test binomial -> nombre de succès
  4. Seuil du test (α=…%)
  5. Calcul p-value (p−value = ℙ [Y ≥ Yobs])
    Selon loi binomiale (ℙ [X = k] = Ckn x p^k x (1−p)^(n−k)))
    Avec : dbinom (x = 0: … , size = … , prob = ….)
  6. Conclu (p < a ou non -> rejet/ou non H0)

R : binom.test ()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Propriétés loi du χ^2 (khi-carré ou khi-2)

A
  1. Distribution probabilité de somme carré variable aléatoires continues indépendante
    suivent loi Normale centrée réduites
    Déf : χ^2 = z1^2 + z2^2
  2. Valeurs toujours positives et fonction densité pas symétrique
  3. Comporte degré de liberté (v/dl)
    Correspond # variables aléatoires continues dont fait somme carré
    Mais retire 1 dl + #paramètre estimé : dl = # catégorie - 1 - #paramètre estimé

Fonction densité chenge selon dl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Probabilité de χ^2

A

Utilise table χ^2 ou R pour trouver probabilité variable aléatoire dans distrubiton χ^2

Table χ^2 : besoin α et dl

R : pchisq ()
Donne valeur type : ℙ [X ≤ χ^2critique]
Utilise lower.tail = FALSE pour ℙ [X > χ^2critique]

χ^2 dit critique si délimite α

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Test d’ajustement du χ^2

A

Extension généralisée test binomial pour comparer proportion si plus de 2 catégories
Utilisé pour variables qualitatives et quantitatives discrètes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Statistique du test pour χ^2

A

Mesure écart entre fréquences observés (F(obs)) et fréquences attendues (F(att)) selon modèle nul pour chaque catégorie (i)
Calcul : (F^i(obs) − F^i(att))^2 / F^i(att)

Remarque

  • Possible différences entre fréquences réparties autour 0 -> suit loi normale
  • Juste positif dû carré -> évite +/- annulent

Donc statisitque du test χ^2 -> valeur de χ^2
Calcul ; χ^2(dl=k−1) = ∑(k, i=1) (F^i(obs) − F^i(att))^2 / F^i(att)
Où, k : # catégories

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Démarche - Test d’ajustement du χ^2 à loi binomiale -

A
  1. Définit résultat attendu
    Ex : si naissance arrive hasard durant semaine, p naissance par jour = p jour semaine
    (modèle proportionnel)
  2. Définir H0/H1 avec mathématiques
    Selon mp, H0 : p même et H1 : p pas même
  3. Calcul statistique du test (χ^2(dl=k−1) = ∑(k, i=1) (F^i(obs) − F^i(att))^2 / F^i(att))
    Présente F(obs), p0, F(att) et carré écart dans tableau
  4. Seuil du test (α)
  5. Calcul p-value (ℙ[χ^2(dl=6) > χ^2calculée] )
    Utilise R : pchisq ()
    Peut estimer avec table χ^2 selon valeur de χ^2calculée
  6. Conclu
    χ^2calculée > χ^2critque alors p < α - > rejette H0

R : chisq.test ()

17
Q

Conditions test d’ajustement χ^2

A
  1. Échantillonnage aléatoire et indépendant
  2. Aucune catégories fréquence attendue < 1
  3. Max 20% catégories fréquence attendue < 5
18
Q

Test binomial vs test χ^2

A

Test binomial : compare 1 échantillon à proportion
Test χ^2 : compare nombreux échantillons à distribution de probabilité

Test binomial : définit p a priori
Test χ^2 : définit p selon données

19
Q

Distribution de poisson

A

Permet décrire comportement nombr évènement sur intervalle temps/espace fixé
Évènement indépendant homogène dans temps/espace -> même chance produire
Calcul : ℙ [X = k] = (e^(−λ) x λ^x) / k!
Où, λ : moyenne variable X -> soit # succès

Peut calculer variance pour mesurer dispersion
Variance = λ
Si variance < λ -> surdispersés
Si variance > λ -> regroupés

20
Q

Démarche - Test d’ajustement du χ^2 à loi Poisson -

A
  1. Définir résultats attendu
    Défini variable aléatoire (ex : X = # extinction par unité de temps)
  2. Définir H0/H1
    Ex : H0 = X suit Poisson, H1 = X suit pas Poisson
  3. Calcul statistiques du test
    a) Calcul moyenne pondérée λ
    b) Calcul fréquence attendue (F(att) = ℙ[X = k] x n)
    Où, n : unité de temps/espace
    ℙ[X = k] : loi poisson
    c) Calcul statistiques du test χ^2 (χ^2 calculée)
    Si correspond pas conditions χ^2 -> combine catégories
  4. Fixe seuil significativité (α)
  5. Identifie valeur critique (χ^2 critique)
    Selon α et dl
  6. Conclu caractère aléatoire de X
21
Q

Tableau de contingence

A

Permet évaluer/détecter dépendance entre 2 variables qualitatives binaires
Toujour 2 facteurs avec 2 options

Toujours total pour colonnes et lignes

22
Q

Test d’indépendance du χ^2

A

Utiliser souvent pour tester relations entre 2 variable qualitatives/quentitatives discrètes
Similaire test ajustement χ^2 -> juste cas spécial

Peut être utiliser pour plus de 2 valeurs

23
Q

Démarche - Test d’indépendance du χ^2 -

A
  1. Définir résultat attendu
  2. Définir H0/H1
  3. Calcul statistique du test
    Besoin 2 tableaux : fréquence observé + fréquence attendue
    a) Calcul fréquence attendue -> à partir données
    Calcul : F(att, [i,j]) = ℙ[ligne i] × ℙ[colonne j] × Total
    Soit (Total ligne i × Total colonne j)/Total
    b) Calcul statistique de test χ^2 (χ^2 calculée)
  4. Seuil de significativité (α)
  5. Identifie valeur critique χ^2critique
  6. Conclu caractère aléatoire de X
24
Q

Contribution relative de chaque écart

A

Permet déterminer quel catégorie est responsable manque d’indépendance
Calcul : Contribution = χ^2 calculée v1 / χ^2 calculée tot x 100

25
Q

Calcul du coefficient de contingence

A

Quantifie force relation entre 2 facteurs
Varie entre 0 et 1
Plus relation forte = plus proche de 1
Calcul : coefficient = √(χ2calculée / (χ2calculée + n))