Abstract/The Problem of outliers/General approaches and outstanding questions Flashcards

1
Q

Mitä tämä tutkimus tutkii?

A

Miten tilastolliset poikkeavat havaintoarvot voidaan löytää psykofyysisissä aineistoissa, joissa aiheiston jakauma on tuntematon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Mitä tässä tutkimuksessa esitellään?

A

8 eri laskukaavaa poikkeavien havaintoarvojen tunnistamiseen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Mikä oli tutkimuksen mukaan paras metodi?

A

Sn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Miksi Sn oli paras tapa tunnistaa poikkeavuudet?

A

→ herkempi kuin suositummat testit jotka on yleensä laskettu keskiarvosta keskihajonnan perusteella
→ robustimpi kuin ei-parametriset testit jotka on laskettu prosenttipisteiden ja kvartaalivälien perusteella

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Mitä tarkoittaa robustisuus?

A

robusti/vakaa. Tilastollisen menetelmän kykyyn sietää poikkeavuuksia aineistossa (esim mediaani ja keskiarvo verrattuna, mediaani robustimpi koska ei reagoi paljoakaan poikkeaviin havaintoarvoihin)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mitä korkeampi breaking point (hajoamispiste) sitä parempi on..?

A

robustisuus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Sensitiivisyys / hit rate ?

A

Kyky tunnistaa OIKEIN poikkeava arvo (outlier)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Spesifisyys

A

Menetelmän kyky tunnistaa OIKEIN todellinen havaintoarvo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

False Alarm rate / 1-spesifisyys

A

“väärä hälytys”

VÄÄRIN tunnistettu todellinen havaintoarvo

Tunnistetaan siis oikein mitattu arvo virhearvoksi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Mitä ovat poikkeavat arvot (=outliers)?

A

Tilastolliset poikkeavuudet ovat virheen seurauksena syntyneitä, kokonaisdatasta selvästi eroavia lukuarvoja

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Mistä tilastolliset poikkeavuudet voivat johtua?

A

Teknisestä virheestä
Viallisesta litteroinnista (=puhtaaksi kirjoittamisesta)
(usein tämä on syynä) Osallistuja (koehenkilö) ei ole kykenevä tai halukas suorittamaan annettu tehtävä halutulla tavalla
→ esim. tylsyyden, väsymyksen, huonojen ohjeiden tai feikkaamisen takia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Miten poikkeavat havaintoarvot vaikuttavat tutkimuksen tuloksiin? (Kaksi esimerkkiä)

A

a) Tekemällä samankaltaiset populaation näyttämään erilaisilta

b) Tekemällä erilaiset populaatiot näyttämään samanlaisilta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Miksi tilastolliset poikkeavuudet ovat ongelma?

A

Ne voivat vaikuttaa voimakkaasti tilastollisen testin tuloksiin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Mitä parametriset testit vaativat?

A

Normaalijakauman

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Mitkä on epäparametristen testien hyvät puolet?

A
  • Korkea breaking point eli menetelmä hajoaa vasta kuin x määrä aineistosta on outliereita (esim. x=50%)
  • ei yleisesti vaikuta äärimmäiset tilastolliset poikkeavuudet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Epäparametristen testien huonot puolet?

A
  • Eivät ole yhtä herkkiä kuin parametriset testit
  • käyttöä ja ominaisuuksia ei tunneta hyvin
  • eivät ole yhtä tarkkoja verrattuna parametrisiin testeihin
17
Q

Mitä jotkut tutkijat tekevät tilastollisille poikkeavuuksille?

A

He poistavat ne manuaalisesti

18
Q

Mikä on tilastollisten poikkeavuuksien manuaalisesti poistamisen ongelma?

A
  • altis vääristymille ja tutkijoiden virheille
  • estää muita toistamasta tutkimusta tarkasti ja arvioimasta sitä
  • prosessi ei ole perusteltu tai tarkkaan määritelty
19
Q

Missä tilanteessa on helppo tunnistaa poikkeama?

A

Jos tunnetaan aineiston jakauma –> voidaan asettaa tietty kynnysarvo siihen, mikä on poikkeama koska osataan ennustaa jokaisen arvon todennäköisyys aineistossa

20
Q

Mikä tekee outlierien tunnistamisesta hankalaa?

A

Se että aineiston todellinen jakauma harvoin tunnetaan

21
Q

Mitä tutkijoiden on tehtävä jos aineiston jakaumaa ei tunneta etukäteen?

A

Tutkijat joutuvat käyttämään erilaisia menetelmiä tilastollisten poikkeavuuksien paikannukseen

22
Q

Mikä ongelma on eri kaavoissa kun etsitään poikkeavuuksia?

A

Jotkut kaavat johtavat erilaisiin tuloksiin

23
Q

Millaista dataa tässä tutkimuksessa on käytetty?

A

Simuloitua, eli data ei ole oikeaa

24
Q

Mihin muuttujaan perustuvat menetelemät toimivat heikosti?

A

Keskihajontaan

25
Q

Mihin muututjaan perustuvat menetelmät toimivat hyvin?

A

Mediaaneihin

26
Q

Mitkä asiat ovat haluttuja mittarissa joka tunnistaa hyvin poikkeavuudet aineistossa?

A
  1. Korkea hit rate (sensitiivisyys)
  2. Matala false alarm rate (1-spesifisyys)
  3. Robustisuus poikkeavien lukuarvojen ja aineiston lukumäärän vaihtelua kohtaan
27
Q

Tutkimuksen tavoitteet?

A
  1. Kuvailla tällä hetkellä saatavilla olevia eri metodeja, joilla on mahdollista paikantaa tilastollisia poikkeavuuksia (datassa jossa otosjakauma on tuntematon)
  2. Käyttää simulaatioita (esimerkkitilanteita) arvioidakseen miten hyvin eri metodi suoriutuu tyypillisessä psykofyysisessä kontekstissa