Teoreettinen tilastotiede Flashcards
Kehittää matemaattisia malleja reaalimaailman ilmöihin liittyvien tietojen analyysia varten
Teoreettinen tilastotiede
Kehittää matemaattisia malleja reaalimaailman ilmöihin liittyvien tietojen analyysia varten
Soveltava tilastotiede
käyttää teoreettisen tilastotieteen kehittämiä malleja data-analyysiin
Deskriptiivinen, kuvaileva tilastotiede:
numeerisia tai kvantitatiivisia tietoja, joita voidaan kuvailla ja esitellä. Tilastografiikka, tilastolliset tunnusluvut, tilastolliset mallit
Tilastollinen inferenssi eli päättely:
Tekee johtopäätöksiä numeeristen tai kvantitatiivisten tietojen perusteella. Tilastolliset mallit, tilastollinen testaus.
Mitä kyselytutkimuksiin sisältyy?
- Selvitetään mielipiteitä, asenteita ja tottumuksia. Voidaan selvittää miten ihmiset kokevan jonkin asian tai mitä he ajattelevat ilmiöstä.
otantamenetelmiä (5kpl):
- Satunnaisotanta (arvonta)
- Systemaattinen otanta (arvot valitaan säännöllisin välein. poimintaväli.)
- Ositettu otanta (jaetaan mahdollisimman homogeeniseen, eli samankaltaiseen ryhmään. poimitaan jokaisesta ositteesta eli ryhmästä osaotos.)
- Ryväsotanta (jaetaan mahdollisimman heterogeeniseen, eli monimuotoiseen ryhmään. Poimitaan satunnaisen yhden ryhmän Kaikki yksiköt.)
- Moniasteinen otanta (Otanta tehdään useissa vaiheissa.)
Tilastotieteen nimiä eri tieteenaloilla:
biometria/biostatistiikka, demometria, ekonometria, epidemiologia, kemometria
Validiteetti
Ilmentää kohteena olevaa ominaisuutta oikein ja tarkoituksenmukaisesti.
Reliaabeli
luotettavuus. Tulos ei muutu jos se toistetaan.
Ordinaali
järjestys: onko ominaisuutta enemmän tai vähemmän kuin jollakin toisella kohteella.
Nominaali
laatu. Mihin luokkaan kohde kuuluu.
Intervalli
välimatka. Kuinka paljon kahden kohteen ominaisuudet eroavat toisistaan.
Kvalitatiivinen
Laadullinen (quality)
Kvantitatiivinen
Quantity, numeraalinen
Diskreetti
Erillisiä arvoja, ei jatkuvia
Aritmeettinen keskiarvo
ihan tavallinen keskiarvo. Käytetään erottamaan muista keskiarvon tyypeistä kuten mediaanista tai painotetusta keskiarvosta.
Varianssi
mitta, joka kuvaa kuinka paljon data-arvot poikkeavat keskiarvostaan. Keskihajonnan neliö.
Keskihajonta
kuvaa, kuinka paljon arvot keskimäärin poikkeavat keskiarvosta. Mittaa aineiston hajontaa tai vaihtelua.
Normaalijakauma
Todennäköisyysjakauma, suurin osa arvoista keskittyy keskiarvon ympärille ja arvot jakautuvat symmetrisesti. Keskihajonta kertoo tässä jakaumassa, kuinka leveä tai kapea käyrä on.
Fraktiili
Tilastollinen mittari, joka jakaa aineiston osiin tai osajoukkoihin. Kertoo, kuinka monta prosenttia havainnoista on alle tietyn arvon
Kvartiilit
ensimmäinen kvartiili (Q1) on se arvo, jonka alapuolella on 25 % havainnoista, toinen kvartiili (Q2) on mediaani (50 %) ja kolmas kvartiili (Q3) on se arvo, jonka alapuolella on 75 % havainnoista.
desiili
Jakavat aineiston kymmeneen osaan, jolloin ensimmäinen decilit (D1) on se arvo, jonka alapuolella on 10 % havainnoista.
Täristys
Jitter, esim. hajontakuvioissa jitteriä käytetään erottamaan pisteitä hieman toisistaan
korrelaatiokerroin
Coefficient of correlation. Mitataan muuttujien välisen yhteyden voimakkuutta.
Yleisiä mittausvirheitä (3kpl)
Mittausmenetelmien epätarkkuus, mittausvälineiden epätarkkuus, mittaukseen vaikuttavat häiriöt
Luokkaväli
Luokan todellisen ylärajan ja alarajan erotus