Kap 1-3 del 1 Flashcards
Vad är Data och varför används det?
Sammanställningar av fakta och siffror från olika källor och används för att förbättra företags lönsamhet och konsumentupplevelse.
Vad används Affärsstatistik till?
utveckla bättre marknadsstrategier, fördjupa kundengagemang, öka effektivitet inom inköp, minska kostnader, identifiera marknadstrender, och hantera risker och bedrägerier.
Vad är de Tre nödvändiga stegen för att göra bra statistik?
- välja rätt data,
- använda lämpliga statistiska verktyg,
- tydligt kommunicera resultaten.
Vilka två huvudgrenar finns inom statistik?
deskriptiv och inferensstatistik. (inferentiell)
Vad innebär Deskriptiv statistik?
fokuserar på att sammanfatta viktiga aspekter av en datamängd genom att samla in, organisera och presentera data i form av diagram och tabeller. Dessutom beräknas numeriska mått som sammanfattar data genom att exempelvis ge medelvärden osv.
Vad innebär Inferensstatistik?
Att dra slutsatser om en stor datamängd (population) baserat på en mindre datamängd, ett urval.
Vilka två huvudtyper av insamlad data finns?
tvärsnitts data och tidsseriedata.
Hur samlas Tvärsnitts data in?
Genom att registrera en egenskap hos många ämnen vid samma tidpunkt utan hänsyn till när det samlats in.
Hur samlas Tidsseriedata in?
Över flera tidsperioder och fokuserar på vissa grupper, händelser eller objekt.
Vad innebär Strukturerad data?
Den visas i ett fördefinierat rad-kolumn format och är objektiv, inte öppen för tolkning.
Vad innebär Ostrukturerad data?
Den passar inte in i rad-kolumnformatet.
Vad är Big data?
Informationsresurser med hög volym, hög hastighet och/eller hög variation som kräver kostnadseffektiva, innovativa former av informationsbehandling som möjliggör förbättrad insikt, beslutsfattande och process automatisering.
Vilka är de tre karaktärsdragen för big data?
Volym, Hastighet, variation.
Vad avser sanningsenligheten?
trovärdigheten och kvaliteten på data.
Vad är en Variabel?
En egenskap som skiljer sig från objekt till objekt.
Vilka två typer av variabler finns det?
Kategorisk (kvalitativ) variabel., visar kategorier. Numerisk (kvantitativ) variabel, visar siffror.
Vilka två grupper är numeriska variabler indelade i?
diskreta och kontinuerliga.
Vad är en diskret variabel?
En variabel som antar ett räknebart värde. Behöver inte vara heltal.
Vad är en kontinuerlig variabel?
En variabel som karaktäriseras av oändligt många värden inom ett intervall.
Vilka fyra huvudsakliga mätskalor finns det?
- nominal, ordinal (för kategoriska)
- intervall, kvot. (för numeriska).
Beskriv Nominalskalan?
representerar den minst sofistikerade nivån av mätning. Variablerna kan bara kategoriseras eller grupperas.
Beskriv Ordinalskalan?
Är lite starkare nivå av mätning då vi både kan kategorisera variablerna och rangordna dem med avseende på någon egenskap.
Svaghet: vi kan inte tolka skillnaden mellan de rangordnade resultaten eftersom de faktiska numren som används är godtyckliga.
Beskriv intervallskalan?
På intervallskalan kan variabeln både kategoriseras, rangordnas och vi kan hitta meningsfulla skillnader mellan dem.
Nackdel, värdet noll väljs godtyckligt. nollpunkten återspeglar inte fullständig frånvaro från det som mäts.
Beskriv Kvotskalan?
Den starkaste mätnivån. Den har samma egenskaper som intervallskalan plus en verklig nollpunkt vilket gör att man kan tolka förhållanden mellan observationer.
Vilka två strategier finns för att hantera saknade värden?
- Uteslutning strategin: observationer med saknade värden utesluts från efterföljande analys.
- Imputationsstrategin: De saknade värdena ersätts med några rimliga importerade värden, numeriska: medelvärde, kategoriska: vanligaste värdet.
Vad kallas processen att ta bort delar av en datamängd som är relevanta för analys?
Att göra delmängder.
Vad kan Delmängder också användas för?
Att eliminera observationer som innehåller saknade värden, låg kvalitativa data eller orimliga värden. Ibland innebär delmängder att utesluta variabler som innehåller överflödig information eller variabler med överdrivna mängder saknade värden.