Kap 1-3 del 1 Flashcards

1
Q

Vad är Data och varför används det?

A

Sammanställningar av fakta och siffror från olika källor och används för att förbättra företags lönsamhet och konsumentupplevelse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad används Affärsstatistik till?

A

utveckla bättre marknadsstrategier, fördjupa kundengagemang, öka effektivitet inom inköp, minska kostnader, identifiera marknadstrender, och hantera risker och bedrägerier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är de Tre nödvändiga stegen för att göra bra statistik?

A
  1. välja rätt data,
  2. använda lämpliga statistiska verktyg,
  3. tydligt kommunicera resultaten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vilka två huvudgrenar finns inom statistik?

A

deskriptiv och inferensstatistik. (inferentiell)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad innebär Deskriptiv statistik?

A

fokuserar på att sammanfatta viktiga aspekter av en datamängd genom att samla in, organisera och presentera data i form av diagram och tabeller. Dessutom beräknas numeriska mått som sammanfattar data genom att exempelvis ge medelvärden osv.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad innebär Inferensstatistik?

A

Att dra slutsatser om en stor datamängd (population) baserat på en mindre datamängd, ett urval.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vilka två huvudtyper av insamlad data finns?

A

tvärsnitts data och tidsseriedata.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hur samlas Tvärsnitts data in?

A

Genom att registrera en egenskap hos många ämnen vid samma tidpunkt utan hänsyn till när det samlats in.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hur samlas Tidsseriedata in?

A

Över flera tidsperioder och fokuserar på vissa grupper, händelser eller objekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad innebär Strukturerad data?

A

Den visas i ett fördefinierat rad-kolumn format och är objektiv, inte öppen för tolkning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad innebär Ostrukturerad data?

A

Den passar inte in i rad-kolumnformatet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är Big data?

A

Informationsresurser med hög volym, hög hastighet och/eller hög variation som kräver kostnadseffektiva, innovativa former av informationsbehandling som möjliggör förbättrad insikt, beslutsfattande och process automatisering.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vilka är de tre karaktärsdragen för big data?

A

Volym, Hastighet, variation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad avser sanningsenligheten?

A

trovärdigheten och kvaliteten på data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vad är en Variabel?

A

En egenskap som skiljer sig från objekt till objekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilka två typer av variabler finns det?

A

Kategorisk (kvalitativ) variabel., visar kategorier. Numerisk (kvantitativ) variabel, visar siffror.

14
Q

Vilka två grupper är numeriska variabler indelade i?

A

diskreta och kontinuerliga.

14
Q

Vad är en diskret variabel?

A

En variabel som antar ett räknebart värde. Behöver inte vara heltal.

14
Q

Vad är en kontinuerlig variabel?

A

En variabel som karaktäriseras av oändligt många värden inom ett intervall.

15
Q

Vilka fyra huvudsakliga mätskalor finns det?

A
  • nominal, ordinal (för kategoriska)
  • intervall, kvot. (för numeriska).
15
Q

Beskriv Nominalskalan?

A

representerar den minst sofistikerade nivån av mätning. Variablerna kan bara kategoriseras eller grupperas.

15
Q

Beskriv Ordinalskalan?

A

Är lite starkare nivå av mätning då vi både kan kategorisera variablerna och rangordna dem med avseende på någon egenskap.
Svaghet: vi kan inte tolka skillnaden mellan de rangordnade resultaten eftersom de faktiska numren som används är godtyckliga.

15
Q

Beskriv intervallskalan?

A

På intervallskalan kan variabeln både kategoriseras, rangordnas och vi kan hitta meningsfulla skillnader mellan dem.
Nackdel, värdet noll väljs godtyckligt. nollpunkten återspeglar inte fullständig frånvaro från det som mäts.

15
Q

Beskriv Kvotskalan?

A

Den starkaste mätnivån. Den har samma egenskaper som intervallskalan plus en verklig nollpunkt vilket gör att man kan tolka förhållanden mellan observationer.

15
Q

Vilka två strategier finns för att hantera saknade värden?

A
  • Uteslutning strategin: observationer med saknade värden utesluts från efterföljande analys.
  • Imputationsstrategin: De saknade värdena ersätts med några rimliga importerade värden, numeriska: medelvärde, kategoriska: vanligaste värdet.
16
Q

Vad kallas processen att ta bort delar av en datamängd som är relevanta för analys?

A

Att göra delmängder.

16
Q

Vad kan Delmängder också användas för?

A

Att eliminera observationer som innehåller saknade värden, låg kvalitativa data eller orimliga värden. Ibland innebär delmängder att utesluta variabler som innehåller överflödig information eller variabler med överdrivna mängder saknade värden.