Kap 1-3 del 1 Flashcards

1
Q

Vad är Data och varför används det?

A

Sammanställningar av fakta och siffror från olika källor och används för att förbättra företags lönsamhet och konsumentupplevelse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad används Affärsstatistik till?

A

utveckla bättre marknadsstrategier, fördjupa kundengagemang, öka effektivitet inom inköp, minska kostnader, identifiera marknadstrender, och hantera risker och bedrägerier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är de Tre nödvändiga stegen för att göra bra statistik?

A
  1. välja rätt data,
  2. använda lämpliga statistiska verktyg,
  3. tydligt kommunicera resultaten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vilka två huvudgrenar finns inom statistik?

A

deskriptiv och inferensstatistik. (inferentiell)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad innebär Deskriptiv statistik?

A

fokuserar på att sammanfatta viktiga aspekter av en datamängd genom att samla in, organisera och presentera data i form av diagram och tabeller. Dessutom beräknas numeriska mått som sammanfattar data genom att exempelvis ge medelvärden osv.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad innebär Inferensstatistik?

A

Att dra slutsatser om en stor datamängd (population) baserat på en mindre datamängd, ett urval.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vilka två huvudtyper av insamlad data finns?

A

tvärsnitts data och tidsseriedata.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hur samlas Tvärsnitts data in?

A

Genom att registrera en egenskap hos många ämnen vid samma tidpunkt utan hänsyn till när det samlats in.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur samlas Tidsseriedata in?

A

Över flera tidsperioder och fokuserar på vissa grupper, händelser eller objekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad innebär Strukturerad data?

A

Den visas i ett fördefinierat rad-kolumn format och är objektiv, inte öppen för tolkning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad innebär Ostrukturerad data?

A

Den passar inte in i rad-kolumnformatet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är Big data?

A

Informationsresurser med hög volym, hög hastighet och/eller hög variation som kräver kostnadseffektiva, innovativa former av informationsbehandling som möjliggör förbättrad insikt, beslutsfattande och process automatisering.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vilka är de tre karaktärsdragen för big data?

A

Volym, Hastighet, variation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad avser sanningsenligheten?

A

trovärdigheten och kvaliteten på data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad är en Variabel?

A

En egenskap som skiljer sig från objekt till objekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilka två typer av variabler finns det?

A

Kategorisk (kvalitativ) variabel., visar kategorier. Numerisk (kvantitativ) variabel, visar siffror.

14
Q

Vilka två grupper är numeriska variabler indelade i?

A

diskreta och kontinuerliga.

14
Q

Vad är en diskret variabel?

A

En variabel som antar ett räknebart värde. Behöver inte vara heltal.

14
Q

Vad är en kontinuerlig variabel?

A

En variabel som karaktäriseras av oändligt många värden inom ett intervall.

15
Q

Vilka fyra huvudsakliga mätskalor finns det?

A
  • nominal, ordinal (för kategoriska)
  • intervall, kvot. (för numeriska).
15
Q

Beskriv Nominalskalan?

A

representerar den minst sofistikerade nivån av mätning. Variablerna kan bara kategoriseras eller grupperas.

15
Q

Beskriv Ordinalskalan?

A

Är lite starkare nivå av mätning då vi både kan kategorisera variablerna och rangordna dem med avseende på någon egenskap.
Svaghet: vi kan inte tolka skillnaden mellan de rangordnade resultaten eftersom de faktiska numren som används är godtyckliga.

15
Q

Beskriv intervallskalan?

A

På intervallskalan kan variabeln både kategoriseras, rangordnas och vi kan hitta meningsfulla skillnader mellan dem.
Nackdel, värdet noll väljs godtyckligt. nollpunkten återspeglar inte fullständig frånvaro från det som mäts.

15
Q

Beskriv Kvotskalan?

A

Den starkaste mätnivån. Den har samma egenskaper som intervallskalan plus en verklig nollpunkt vilket gör att man kan tolka förhållanden mellan observationer.

15
Vilka två strategier finns för att hantera saknade värden?
- Uteslutning strategin: observationer med saknade värden utesluts från efterföljande analys. - Imputationsstrategin: De saknade värdena ersätts med några rimliga importerade värden, numeriska: medelvärde, kategoriska: vanligaste värdet.
16
Vad kallas processen att ta bort delar av en datamängd som är relevanta för analys?
Att göra delmängder.
16
Vad kan Delmängder också användas för?
Att eliminera observationer som innehåller saknade värden, låg kvalitativa data eller orimliga värden. Ibland innebär delmängder att utesluta variabler som innehåller överflödig information eller variabler med överdrivna mängder saknade värden.