Abstract/The Problem of outliers/General approaches and outstanding questions Flashcards
Mitä tämä tutkimus tutkii?
Miten tilastolliset poikkeavat havaintoarvot voidaan löytää psykofyysisissä aineistoissa, joissa aiheiston jakauma on tuntematon
Mitä tässä tutkimuksessa esitellään?
8 eri laskukaavaa poikkeavien havaintoarvojen tunnistamiseen
Mikä oli tutkimuksen mukaan paras metodi?
Sn
Miksi Sn oli paras tapa tunnistaa poikkeavuudet?
→ herkempi kuin suositummat testit jotka on yleensä laskettu keskiarvosta keskihajonnan perusteella
→ robustimpi kuin ei-parametriset testit jotka on laskettu prosenttipisteiden ja kvartaalivälien perusteella
Mitä tarkoittaa robustisuus?
robusti/vakaa. Tilastollisen menetelmän kykyyn sietää poikkeavuuksia aineistossa (esim mediaani ja keskiarvo verrattuna, mediaani robustimpi koska ei reagoi paljoakaan poikkeaviin havaintoarvoihin)
Mitä korkeampi breaking point (hajoamispiste) sitä parempi on..?
robustisuus
Sensitiivisyys / hit rate ?
Kyky tunnistaa OIKEIN poikkeava arvo (outlier)
Spesifisyys
Menetelmän kyky tunnistaa OIKEIN todellinen havaintoarvo
False Alarm rate / 1-spesifisyys
“väärä hälytys”
VÄÄRIN tunnistettu todellinen havaintoarvo
Tunnistetaan siis oikein mitattu arvo virhearvoksi
Mitä ovat poikkeavat arvot (=outliers)?
Tilastolliset poikkeavuudet ovat virheen seurauksena syntyneitä, kokonaisdatasta selvästi eroavia lukuarvoja
Mistä tilastolliset poikkeavuudet voivat johtua?
Teknisestä virheestä
Viallisesta litteroinnista (=puhtaaksi kirjoittamisesta)
(usein tämä on syynä) Osallistuja (koehenkilö) ei ole kykenevä tai halukas suorittamaan annettu tehtävä halutulla tavalla
→ esim. tylsyyden, väsymyksen, huonojen ohjeiden tai feikkaamisen takia
Miten poikkeavat havaintoarvot vaikuttavat tutkimuksen tuloksiin? (Kaksi esimerkkiä)
a) Tekemällä samankaltaiset populaation näyttämään erilaisilta
b) Tekemällä erilaiset populaatiot näyttämään samanlaisilta
Miksi tilastolliset poikkeavuudet ovat ongelma?
Ne voivat vaikuttaa voimakkaasti tilastollisen testin tuloksiin
Mitä parametriset testit vaativat?
Normaalijakauman
Mitkä on epäparametristen testien hyvät puolet?
- Korkea breaking point eli menetelmä hajoaa vasta kuin x määrä aineistosta on outliereita (esim. x=50%)
- ei yleisesti vaikuta äärimmäiset tilastolliset poikkeavuudet