Tölfræði frá grunni / 4 Flashcards
Hvað er Lýsistærð (statistic)?
Lýsistærð er tala sem verður reiknuð með einhverjum ákveðnum hætti út frá mælingunum okkar.
Dæmi um lýsistærðir eru lýsistærðin meðaleinkunn, reiknuð út frá öllum lokaeinkunnum.
Hvað eru vísar (indexes) ?
Gerum ráð fyrir að við höfum b mælingar á tiltekinni breytu, Tölurnar 1,…,n, sem mælingarnar eru tölusettar eftir kallast vísar (e. indixes) mælinganna.
Hvað er Miðja mælinga (central tendency)?
Þegar við finnum miðju mælinga fyrir tiltekna breytu reiknum við út þá tölu sem er samtímis næst öllum mælingunum á breytunni okkar í einhverjum skilningi. Til þess eru nokkrar ólíkar aðferðir sem geta gefið ólíkar niðurstöður.
Hvað er Miðja spannar (mid range)?
Miðja spannar er meðaltal stærstu og minnstu mælinganna. Hún er gífurlega viðkvæm fyrir útlögum (breytist mikið eftir því hvort og hvaða útlagar eru í mælingunum) og því ekki mikið notuð í tölfræðiúrvinnslu. Hún getur þó verið gagnleg ef mælingarnar dreifast þétt um miðjuna. Eingöngu er hægt að lýsa talnabreytum með miðju spannar.
Hvað er Tíðasta gildi (mode)?
Tíðasta gildið er sú útkoma sem oftast kemur fyrir í mælingunum okkar. Það er sú eina af lýsistærðunum fyrir miðju sem er fjallað um í þessari bók sem er hægt er að nota til að lýsa óröðuðum flokkabreytum. Hins vegar er ekki við hæfi að reikna tíðasta gildið þegar mældar eru samfelldar talnabreytur.
Hvað er Miðgildi (median)?
Miðgildi er sú mæling sem er í miðju mælisafnsins ef þeim er raðað í stærðarröð. Helmingur mælinga í safninu eru minni en miðgildið og helmingur er stærri. Útlagar hafa lítil sem engin áhrif á miðgildi og einnig gefur það góða mynd af miðju mælinganna þó dreifing þeirra sé skekkt. Miðgildi er því mikið notað til að lýsa miðju mælinga. Miðgildi má nota til að lýsa öllum talnabreytum en einnig röðuðum flokkabreytum.
Hvað er Meðaltal (mean, arithmetic mean)?
Meðaltal er án vafa algengasta lýsistærðin fyrir miðju mælinga. Þó er það viðkvæmt fyrir útlögum og einnig gefur það ekki rétta mynd af miðju mælinganna ef dreifing þeirra er skekkt. Meðaltal er eingöngu hægt að reikna fyrir talnabreytur.
Hvað er Vegið meðaltal (weighted mean)?
Þegar meðaltal er reiknað fá allar mælingarnar sama vægi. Í sumum tilfellum viljum við gefa mælingunum misjafnt vægi, þá er talað um vegið meðaltal. Vegið meðaltal er eingöngu reiknað fyrir talnabreytur.
Miðgildi vs meðaltal?
Útlagar geta haft mikil áhrif á meðaltal. Hins vegar hafa þeir ekki mikil áhrif á miðgildi og því er miðgildi betri mælikvarði á miðju gagna ef útlagar eru í gagnasafninu.
Hvað er Breytileiki mælinga (spread)?
Breytileiki mælinga er aðferð sem lýsir því hversu nálægt miðju sinni mælingarnar liggja.
Hvað er Spönn/dreifisvið (e. range)?
Spönn er mismunur stærstu og minnstu mælingarinnar. Hún er því mjög viðkvæm fyrir útlögum og þar að auki er hún eingöngu reiknuð út frá tveimur af mælingunum okkar. Gildi allra hinna mælingana skipta engu!
Hvað er Fjórðungamörk (e. quartiles)?
Sé miðgildi notað til að lýsa miðju mælinga er yfirleitt við hæfi að nota fjórðungamörk til að lýsa breytileika þeira. Fjórðungamörkin eru þrjú.
Hvað er Fimm tölu samantekt (e. five number summary)?
Fimm tölu samantekt er afar hnitmiðuð og fljótleg leið til að gefa miklar upplýsingar um bæði miðju og breytileika gagnanna. Fyrir vikið er hún mikið notuð.
Fimm-tölu samantekt samanstendur af minnsta gildi (e. min), fjórðungamörkunum og stærsta gildi (e. max), þ.e.a.s.
Hvað er Fjórðungaspönn (e. interquartile range) ?
Fjórðungaspönn er reiknuð út frá fjórðungamörkunum, nánar til tekið mismunur fyrsta og þriðja fjórðungamarksins. Líkt og fjórðungamörkin ætti því að nota hana þegar miðgildi en ekki meðaltal er notað til að lýsa miðju mælinganna. Ólíkt spönn er fjórðungaspönn ekki viðkvæm fyrir útlögum og því mun áreiðanlegri mælikvarði á breytileika mælinga. Fjórðungaspönn er eingöngu við hæfi að reikna fyrir talnabreytur en ekki raðar flokkabreytur.
Hvað er Prósentumörk (e. percentiles) ?
Hugmyndin að baki prósentumörkum (e. percentiles) er svipuð og sú að baki fjórðungamörkum nema í stað þess að skoða eingöngu mörkin við 25% eða 75% mælinganna getum við leyft hvaða hlutfall sem er.