Tölfræði próf 1 Flashcards
Tölfræði skiptist í tvennt
lýsandi tölfræði
ályktunar tölfræði
orsakasamhengis dæmi
ef við skiptum öllum upp, jan, feb, mars og áfram og skiptum síðan árinu upp í fjóra hópa, og skoða hverjir eru í landsliðinu þá eru það þeir sem að eru fæddir fyrr á árinu vegna þess að það er talið inn í landsliðið frá árum og dags.
hvernig vitum við hvort það sé orksaka samhengi eða ekki
með tilraunum
jákvæð fylgni
ef tölurnar fara báðar upp eða báðar niður (ferðast eins)
neikvæð fylgni
ef ein talan fer upp fer hin niður
gott dæmi um jákvæða fylgni
lærir mikið og færð góða einkun
gott dæmi um neikvæða fylgni
því meira sem þú drekkur því lærri einkun færðu
Aðferðir sem byggja ekki á tilviljun
Hentugleika úrtak
Matsúrtak
Kvóta úrtak
Snjóboltaúrtak
Hentugleika úrtak
Byrjunarskref
ekki handahófskennt
DÆMI: Þarft kanski að tala við háskólanema og bara fínt þessir mættu í tíma tala bara við þá,
Matsúrtak
velur sérfræðing á einhverju sviði
t,d, færð fólk sem drekkur mikið af orkudrykkjum, það gangast ekkert að spurja þá sem að drekka ekki orkudrykki
Kvóta úrtak
getur búið til kvóta
t.d. passa að hafa svipað hlutfall af kynjum
Snjóboltaúrtak
Velja fólk af handahafi og fáum þá til þess að biðja aðra um að taka þátt, mjög sniðugt þegar verið er að vinna með eithvað sjaldgæft
Aðferðir sem byggja á tilvitnun
einfalt handahófskennt úrtak
kerfisbundið úrtak
lagskipt úrtak
klasa úrtak
Einfals handahófskennt úrtak
Velja alveg random
Kerfisbundið úrtak
listi yfir fólk og maður velur t.d. 10 hvern aðila
- passa þarf ða þetta sé ekki í neinni röð
Lagskipt úrtak
fyrst skipt í úrtak t.d. ákveða hversu amrga ljóshærða, hversu marga rauðhærða og fleira og síðan velja random í þá flokka
Klasa úrtak
skipta upp í hópa, velja svo random hópa og spurja þá
Mean
Meðaltal
Median
Miðgildi
Hverskonar skekkja er það ef að meðaltalið er hærra en miðgildið?
Ef að meðaltalið er hærra en miðgilið er það jákvæð skekkja og svo öfugt
Hvað sýnir histogram
sýnir betur t.d. dreifingu launa
Hvað er gott að nota boxplot í ?
ef verið er að bera sama nokkrar dreifingar, t.d. hjá nokkrum fyrirtækjum
Hvað þarf compact alpha talan að vera til þess að það sé í lagi að sameina einhverjar breytur
0.7 eða meira
Hvað sýnir skewness okkur
skekkju
ef skewness er - tala?
er neikvæð skekkja
Finna meðaltal og miðgildi launa?
ýta á exploration, descriptives, draga laun yfir í efri reitin og upp kemur tafla
búa til histogram og boxplot
ýta á exploration, færa laun yfir, ýta á plots og velja histogram og boxplot
búa til nýja breytu sem heitir heildar ánægja, breytan á að vera meðaltal allra ánægju breyta starfsmanna
Búa til nýja breytu (computed variable), skýra heildar ánægja og velja fx takkan
- velja MEAN formúluna
- velja allar ánægju breyturnar
Mikilvægt aðs etja kommur á milli ánægjubreyta
Búa til töflu sem sýnir heildar ánægju skipt eftir menntun
- ýta á exploration
- descriptives
- setja heildar ánægju í reitin variables
- setja mentun í split by reitin
Hvað verður síst fyrir áhrifum af útlögum
Miðgildið
Hvaða hugtak er notað sem lýsandi hutak fyrir dreifiingu í tölfræði
Spönn
SKotur á svefni hefur áhrif á getu til að framkvæma flókið atferli. hvernig tilgáta er þetta?
Einhliða tilgáta eða stefnu tilgáta
Hvað merkið hugtakið marktækni þegar unnið er með tölfrlði gögn
að hægt sé að álykta yfir á þýðið frá úrtakinu
Hvað á við um lögun dreifingarinnar á þessum mælingum? 5;5;6;7;8;9;10;4;3;2;1;0
Dreifingin er samhverf.
Frétt hjá..segir frá því að rannsókn á vegum HÍ. Niðurstöður byggjá á símakönnun þar sem tekið var 3000 manna slembiúrtak úr þjóðskrá meðal kvenna af öllu landinu frá 18-80 ára. Results: 46% kvenna hafi verið beittar ofbeldi eih tímann frá 16 ára aldri. Hvaða vandamál koma upp varðandin framsetningu á essari frétt?
Grunnlínu vantar
Mean
Meðaltal
Median
Miðgildi
Hvað er tölfræði
Fræðigrein fjallar um söfnun, flokkun, greiningu og túlkun gagna
type 1 villa
False positive, að trúa að það sé mynstur þegar það er ekkert
Type 2 villa
að trúa að það sé ekki mynstur þegar það er mynstur
Þýði
það mengi sem til er til skoðunar eða álykta skal um
úrtak
hluti af þýðinu sem notast er við til að draga ályktanir um þýði
Hverjir eru helstu flokkar gagna
Meigindleg og eigindleg
Meigindleg
tölur, mælingar. annaðhvort strjálar eða samfelldar breytur
Eigindleg
lýsa eiginleikum sem ekki á að nota í útreikningum
strjál breyta
tekur aðeins ákveðnin stök gildi
Samfelld breyta
getur tekið öll gildi sem liggja á ákveðnu bili
Flokkabreyta
Er beyta sem táknar heilan flokk t.d. aldursbil þar sem að eitt gildi hennar er fjöldi alra sem eru á aldrinum 15-20 ára
hvernig er breytum oft skipt?
í skýri eða svartbreytur
hvað er slembival
það þýðir að velja handahófskennt þennig að öll viðfangsefni eru jafn líkleg að verða valin
Einfalt slembiúrtak
veljum einstaklinga af handahófi úr öllu þýðinu
orskasamband
þegar gildi einnar breytu hefur áhrif á þau gildi sem önnur breyta mun taka, bara stýrðar tilraunir. t.d. tengsl á milli sölu á ís og heitari veðurs
jafnabilakvarði
munur á milli flokka er stöðugur, færsla frá 2-3 er sú sama og frá 42-43
útlagar
mæligildi sem er mjög ólíkt öðrum mæligildum í sama gagnasafni
ef meðaltal er hærra en miðgildi er XXX skekkja
jákvæð
Data variables
þessa breytur innihalda gögn annaðhvort gögn hlaðin úr gagnaskrá eða sláð inn af notandanum
Meðaltal
niðurstaðan þegar deilt er í sumu talna með fjölda þeirra
Hvort er betra að nota meðaltal eða miðgildi
þegar dreifingin er samhverf er betra að nota meðaltal
þegar dreifingin er skekkt eða með frávillin er betra að nota miðgildið