Föreläsning 2 Flashcards
Regression
Studerar hur starkt sambandet är
Vad menas med “deduktivt resonerande”?
- En form av logiskt resonemang där man drar specifika slutsatser utifrån allmänna premisser eller påståenden
Det ideala hypotestestet
De hypoteser vi tror är sanna –> faktiskt sanna
De hypoteser vi tror är falska –> faktiskt falska
Vad är alfanivå?
Gränsen för signifikans i statistiska tester
- Tröskeln för att bestämma när man ska förkasta nollhypotesen (H0)
- Hur ofta vi är beredda att ta falska resultat som sanna - sätts ofta till 5%
Vi vet inte andelen hypotser som vi testar innan som är sanna!!!!
Hur stor andel av sanna hypotser vårt test korrekt identifierar som sanna beror på beror på deras effektstorlek - vilket vi ofta inte vet i förväg
Replikering
Får vi samma resultat när vi testar igen?
- Det är viktigt att välja ett test som är bra på att avgöra avvikelser från nollhypotesen
När vi förkastar nollhypotsesen talar vi inte lägre om hypotser vi tror är falska, utan endast de som vi tror är sanna som vi fått stöd för
Samplingfördelning
Hur fördelningen ser ut i vårt i olika stickprov som tas ur vår population (estimat)
- Sannolikhetsfördelning för en statistika (ex.v. medelvärde) vid upprepad stickprovstagning från en population
- Exempelvis medelvärden
- Fördelningen mellan stickprov
Vad är den centrala gränsvärdessatsen?
Den centrala gränsvärdetssatsen säger att “om vi beräknar medelvärdet av ett stort antal slumpmässigt fördelade tal, så kommer detta medelvärde att närma sig en normalfördelning”
Vad betyder väntvärdesriktiga?
Det genomsnittliga eller förväntade värdet över ett stort antal upprepade försök
Vad är estimat?
Värdet vi uppskattar i populationen baserat på resultaten i våra stickprov är vårt estimat
Vad är “stora talens lag?”
Bra estimat kommer att hamna närmre populationsvärdet desto större n är
Vad är standardfelet?
Standardavvileksen i samplingfördelningen
- avgränsar specifika percentiler
Ju mindre standardfel, desto större sannolikhet att medelvärdet i vårt stickprov..
…befinner sig nära populationens medelvärde
Konfidensintervall
Nivån av säkerhet kring uppskattningen
- Vanligtvis 95%
- “95% av uppskattningarna kommer innehålla det sanna medelvärdet”
T-test
Används för att se om det finns en signifikant skillnad mellan medelvärdena för två stickprov (alternativ om ett stickprovsmedelvärde skiljer sig från ett tidigare känt värde)
T-fördelning
- Samma form som normalfördelning men representerar högre osäkerhet
- Används när popualationens standardavvikelse inte är känd och måste uppskattas från stickprovet
- Ju fler frihetsgrader, desto mer lik normalfördelningen
Signifikanstestning
En metod inom statistiken som används för att avgöra om en observerad effekt är statitiskt signifikant, det vill säga om den sannolikt inte inträffar av slumpmässiga skäl
Vad är en ensidig prövning?
- Forskaren är endast intresserad om det finns ett statisktiskt samband i en viss riktning
- Riktad hypotes
Exempel på spridningsmått
- Standardavvikelse
- IQR
- Kvartilavstånd
- Variationsbredd
- Varians
Vad är en korrelationskoefficent?
Mäter graden av linjär relation mellan två variabler. Används för att kvantifiera styrkan och riktningen av sambandet mellan två variabler.
I vilka sammanhang kan typvärde vara ett bra redovisning av centralmått?
- Bra när datamängden har en skev fördelning
- Medelvtärdet påverkas mer av extremvärden
När är medelvärde ett lämpligt centralmått att använda?
- Vid symmetrisk fördelning
- Normalfördelning
- Statistiska tester (jämföra grupper)
Konfidensintervall, definition
Uppskattning av det sanna värdeområdet för en parameter i en population
- används för att kommunicera osäkerheten i våra mätningar