Chi squared test of Hardy-Weinberg Flashcards
Grunderna för HW principen?
Hardy-Weinberg-principen innebär att både allelfrekvens och genotypfrekvens är i jämvikt om inte en störning inträffar
Så hur testar vi om de faktiskt är i jämvikt?
Vi använder ett Chi-kvadrat-test!
Men hur vi beräknar våra frihetsgrader är annorlunda
Genom att ta det totala antalet genotypiska klasser och subtrahera dem med tillgängliga alleler
Df = genotypiska klasser - alleler
STEG 1: Det är lättast att lära genom exempel. I det här fallet vill vi studera allelfrekvensen av sicklecellanemi hos barn i en liten del av Ghana.
756 barn inte påverkats (SS), 200 barn är bärare (SB) och 144 barn är påverkade (BB), detta leder till totalt 1100 barn.
Låt oss beräkna de förväntade allelfrekvenserna
För att kunna beräkna Hardy-Weinberg chi-kvadrat behöver vi beräkna de förväntade allelfrekvenserna.
S = p = ((2 x SS) + (SB)) / (2 x totalt)
- S = p = ((2 x 756) + (200)) / (2 x 1100) = 1712 / 2200 = 0,778
- För S är vår allelfrekvens 0,778, vilket också betecknas med p
B = q = ((2 x BB) + (SB)) / (2 x totalt)
- B = q = ((2 x 144) + (200)) / (2 x 1100) = 488 / 2200 = 0,222
- För B är vår allelfrekvens 0,222, vilket också betecknas med q
Snabbtest för att kontrollera om beräkningarna är korrekta?
För att se om dina beräkningar är korrekta, addera dina p- och q-värden så att de blir lika med 1. Om inte, gå tillbaka till dina beräkningar.
STEG 2: Nu när vi har våra förväntade andelar kan vi hitta våra förväntade värden i populationen för de som inte påverkats, bärare och de som påverkats.
p = 0,778
q = 0,222
Med det förväntade värdet på p = 0,778 måste vi ta reda på de som inte påverkats. Så i populationen måste vi kvadrera p-värdet och multiplicera det med totalen.
p^2 x totalt = 0,778^2 x 1100 = 665,8
För att ta reda på populationen av bärare måste vi multiplicera 2 gånger p gånger q gånger totalen
2pq x totalt = 2 x 0,778 x 0,222 x 1100 = 379,9
För att ta reda på populationen av de som påverkats måste vi kvadrera q-värdet och multiplicera det med totalen.
q^2 x totalt = 0,222^2 x 1100 = 54,2
Vad är chi-square formeln?
Chi-kvadrat är en summering av observerat minus förväntat i kvadrat, dividerat med förväntat
ꭓ2 = ∑ (observerat - förväntat)^2 / förväntat
STEG 3:
Härifrån är det en grundläggande plug and chug in i chi-square formeln (kopplar in och kör)
Chi-kvadrat är en summering av observerat minus förväntat i kvadrat, dividerat med förväntat
Inte påverkade (SS)
- Observerat: 756
- Förväntat: 665,8
Bärare (SB)
- Observerat: 200
- Förväntat: 379,9
Påverkade (BB)
- Observerat: 144
- Förväntat: 54,2
ꭓ2 = ∑ (observerat - förväntat)^2 / förväntat
ꭓ2 = ((756 - 665,8)^2 / 665,8) + ((200 - 379,9)^2 / 379,9) + ((144 - 54,2)^2 / 54,2)
ꭓ2 = 12,21 + 85,2 + 148,8 = 246,21
df = (3 genotyper) - (2 alleler) = 1
När vi adderar våra respektive värden och beräknar våra frihetsgrader (df) med tre genotyper och två alleler, finner vi att våra beräknade chi-kvadrat värden är 246,21
Kritiskt vs tabell
ꭓ2 = 246,21
Jämför vi detta värde med det kritiska tabellvärdet är 246,21 betydligt större än tabellvärdet på 3,84 vid 95%, därför kan vi förkasta vår nollhypotes, vilket visar att allelerna inte är i jämvikt i denna population