statistica inferentiala Flashcards
Inferența statistică
este o judecată statistică, prin care vedem dacă rezultatele eșantionului se pot generaliza pe întreaga populație
….este o procedură a statisticii inferențiale prin care se trag anumite concluzii privind ipotezele asupra unei populații pe baza informațiilor oferite de eșantioane
testarea ipotezelor
putem afirma lucruri fără eroare?
nu, avem o anumită probabilitate acceptată, mai mare de 95% pentru a fi acceptată o ipoteză
ce este p?
reprezintă pragul de semnificație pentru ca ipoteză să fie acceptată, să fie cel puțin egal cu 0,05
probabilitate de a greși
care sunt tipurile de ipoteze?
- specifică-prin care se prezumă că există o diferență semnificativă între eșantioane
- nulă-prin care se prezumă că nu există nici o diferență între eșantioane (mediile sunt egale)
tipuri de ipoteze specifice
- unidirecțională-prin care se specifică cine are diferența mai mare (media unui eșantion este mai mare decât al celuilalt)
- bidirecțională-prin care nu se specifică cine are diferența mai mare (nu știm care medie este mai mare, dar una este mai mare decât cealaltă)
ce facem când nu găsim o diferență semnificativă
suspendăm decizia
cu ce se ocupă inferența statistică
- verificarea ipotezelor
2. estimarea parametrilor
tipuri de erori în verificarea ipotezelor
- eroarea de tip I-acceptăm ipoteza specifică specifică, când cea nulă e adevărată
- eroarea de tip II-acceptăm ipoteza nulă, când cea specifică este adevărată
ce tipuri de calcule de comparație a eșantioanelor avem?
- calcule parametrice
2. calcule neparametrice
care sunt criteriile prin care alegem calculele?
- normalitatea distribuțiilor
- omogenitatea varianțelor
- numărul de participanți (N)-mărimea eșantioanelor
- tipul de eșantioane
cum vedem omogenitatea varianțelor?
testul Levene din spss
ce calcule/criterii/teste parametrice avem pentru două eșantioane independente?
- testul z-măsurare de interval, distribuții normale, varianțe omogene, ambele eșantioane mai mari de 30
- testul t-măsurare de interval, distribuții normale, varianțe omogene, unul sau ambele eșantioane mai mici de 30 , și celălalt mai mare de 30
ce teste neparametrice avem pentru două eșantioane independente?
- testul chi pătrat (X^2)-măsurare nominală
- Testul U Mann-Whitney-măsurare de interval, distribuții non-normale, ambele eșantioane mai mici sau egale cu 20
- testul sumei rangurilor-măsurare de interval, distibuții non-normale, ambele eșantioane mai mari cu 20
- proba medianei-măsurare de interval, distribuții non-normale, un eșantion mai mare cu 20 și unul mai mic
formula testului z
modul de z egal cu m1-m2/radical din varianța1 supra N1+varianța 2 supra N2
algoritm de calcul testul z
- calculăm mediile eșantioanelor
- calculăm varianțele
- calculăm z
- calculăm pragul de semnificație pentru z-ul calculat
pragul de semnificație pentru testul z
- z<1.96-p nesimnificativ, p>0,05
- z=1.96-p=0,05
- z=2,58-p=0,01
- z>2.58-p<0,01
formula testului t
modul de t egal cu m1-m2/radical din varianță (1 supra N1+1 supra N2), se reunesc eșantioanle și se calculează varianța
algoritm de calcul testul t
- calculăm mediile eșantioanelor
- calculăm varianța întregului eșantion
- calculăm t
- calculăm n-n=N1+N2-1
- ne uităm în tabel la n-ul corespunzător
- determinăm p
cine este n?
n sau gradele de libertate, este o măsură de precauție statistică
ce se întâmplă la eșantioane mari cu testul t?
testul t devine testul z
formula testului X^2 (fără tabel)
X^2=suma de (fobs-fteoretice)^2/fteoretice
f teoretice=N1 +N2+…+Nn/n
algoritm de calcul test X^2 (fără tabel)
- calculăm f teoretice
- calculăm X^2
- calculăm n, n=K-1, k=numărul de categorii
- căutăm în tabel n-ul corespunzător
- determinăm p
formula X^2 (cu tabel)
X^2=(ad-bc)^2*T/(a+b)(c+d)(a+c)(b+d), T=total general
algoritm de calcul X^2 (cu tabel)
- ordonăm datele crescător
- facem tabelul X^2
- calculăm X^2
- calculăm n, n=(rânduri-1)(coloane-1)
- căutăm în tabel n corespunzător
- determinăm p
algortim de calcul proba medianei (N par)-mediană teoretică
- reunim N1 cu N2
- ordonăm datele crescător
- calculăm locul medianei-obținem mediană teoretică
- alcătuim tabelul X^2, cu o coloană cu scorurile inferioare medianei și o coloană cu scoruri superioare medianei
- calculăm X^2 cu formula cu tabel
- calculăm n
- ne uităm în tabel la n corespunzător
- determinăm p
algoritm de calcul proba medianei (N impar)-mediană reală
- reunim N1 cu N2
- ordonăm crescător datele
- calculăm locul medianei- mediană reală
- facem două tabele X^2, unul cu o coloană cu scoruri inferioare și egale cu mediana și o coloană cu scoruri superioare medianei, și un tabel cu o coloană cu o coloană cu scoruri inferioare medianei și o coloană cu scoruri superioare și egale cu mediana
- calculă X^2 pentru ambele tabele
- calculăm n
- ne uităm în tabel la n corespunzător pentru cel mai mic X^2
- determinăm p
cum se comunică rezultatele pentru testul z sau t (specializat)
- m1 și m2
- varianța 1 și varianța 2 sau varianța
- N1 și N2 și n
- z sau t obținut
- rpb
- rpb^2, indicele mărimii efectului
cum se comunică rezutatele pentru testul z sau t (narativ)
Într-o cercetare a fost comparat (fenomenul studiat), pe două eșantioane independente: unul de (eșantion1), cu N1, altul de (eșantion 2), cu N2.
Mediile obținute sunt m1 și m2, cu varianțele 1 și 2.
Diferența este semnificativă, z sau t obținut (n), p.
Indicele mărimii efectului rpb^2, ne arată existența unei diferențe importante ( sau nu, dacă p nesemnifcativ și suspendăm decizia) între cele două eșantioane.
care sunt metodele parametrice pentru a compara două eșantioane perechi?
Testul t pentru eșantioane perechi-măsurare înainte și după
- se calculează mărimea efectului (rpb^2)-care măsurare este mai puternică
care sunt condițiile pentru a folosi măsurările parametrice (două eșantioane perechi)?
Se verifică după fiecare măsurare omogenitatea varianțelor și normalitatea distribuției
care sunt metodele neparametrice pentru a compara eșantioane perechi?
- Testul T-Wilcoxon-măsurare de interval
2. Textul X^2-măsurare nominală
Algoritmul de calcul pentru Testul T-Wilcoxon?
- se face un tabel cu participanti, diferitele variabile, diferența intre cele două măsurători, ranguri și ranguri pozitive și negative
- se calculează diferențele între cele două măsurători și se numără numărul de diferențe diferite de 0 (N)
- se acordă ranguri pentru diferențele diferite de 0, cel mai mic fiind cea mai mică diferență-dacă avem diferențe egale, se face medie între ranguri
- se separă rangurile + și -
- se calculează fiecare sumă a rangurilor
- se determină Tobținut ca cea mai mică sumă a rangurilor
- ne uităm în tabelul Wilcoxon, pentru N-ul nostru, p=0,05-Tcritic, Tobț
Care sunt metodele parametrice de a compara 3 sau mai multe eșantioane?
ANOVA
- simplă sau factorială (uni, bi, multi)
- > 30-40 participanți, pentru a obține o distribuție normală
Algoritm de calcul ANOVA?
- calculăm Fglobal sau Fomnibus-ne spune dacă între grupuri există cel puțin o diferență, dar nu și unde
- etapa comparațiilor post-hoc (identificarea unde există diferența)
- N diferit-testul t protejat Fisher (lipsit de eroare)
- N egal-testul Tukey HSD (diferență onest obținută)
Ce eroare poate apărea când nu comparăm corect eșantioanele?
Eroarea setului de comparație sau Eroarea comparațiilor multiple-când comparăm două câte două; creșterea artificială a pragului de semnificație
Algoritm pentru estimarea intervalului de medie pentru populație?
- calculăm media și abaterea standard
- calculăm eroarea standard a mediei (E)-eroarea pe care am face-o dacă luăm media eșantionului drept media populației
- stabilim limitele de încredere pentru m (nu stabilim media ci intervalul de încredere pentru m populație)
- limitele se fac la un anumit prag de semnificație
p=0,05-limitele sunt m-1,96E și m+1,96E
p=0,01-limitele sunt m-2,58E și m+2,58E
Formula Eroare standard a mediei?
E=abaterea standard a eșantionului/radical din N al eșantionului
Ce teste neparametrice avem pentru a compara 3 eșantioane?
- Testul H Kruskal-Wallis (H este un indicator pentru diferențe) sau Testul U generalizat-pentru eșantioane independente
- Testul X^2 Friedman-pentru eșantioane perechi
- 3 măsurători-cel puțin 10 participanți
- cel puțin 4 măsurători-cel puțin 5 participanți