Tentfrågor Flashcards

Question

**Faktorladdning**

Answer 1

(faktor): En linjär kombination av orginalvariabler. "Faktoranalysen räknar ut hur mycket varje faktor påverkar varje observerad variabel, den s.k. faktorladdningen." En faktors faktorladdning är korrelationen mellan en variabel och en faktor, dvs. hur mycket som en variabel samvarierar med den bakomliggande faktorn. Detta är ett tal mellan -1 och 1. Det spelar ingen roll om positiv eller negativ, man ignorerar tecknet. Ju högre faktorladdning (ju längre från noll) desto mer säger man att en variabel "laddar på" en faktor. Det är alltså frågan om ett tests samband med en faktor. Varje test har olika laddning i de faktorer som framkommer vid faktoranalys. Enligt saunders (2009:102) är Faktorladdning alltså korrelationen mellan orginalvariabeln och faktorerna. Faktorladdning är nyckeln till att förstå naturen av en särskild faktor.

Answer 2

Processen att manipulera eller justera faktorsaxlarna i syfte att uppnå en enklare och pragmatiskt mera meningsfull faktorslösning.

Answer 3

Matematiskt oberoende (ingen korrelation mellan) faktoraxlar. (t.ex. rätvinkliga eller 90 grader)

Answer 4

En faktorrotation där faktorerna extraheras så att deras axlar justeras till 90 grader. Alla faktorer är då ortogonala till (oberoende av) alla andra faktorer. Korrelationen mellan faktorerna är 0.

Answer 5

Korrelation är ett begrepp inom statistik som anger styrkan och riktningen av ett samband mellan två variabler. Det kallas även korrelationskoefficient, eller bivariat analys.

Answer 6

I en **multipel regressionsanalys** kan man vilja ta med **kvalitativa oberoende** variabler. Kvalitativa variabler är variabler som befinner sig på datanivån nominaldata. Kvalitativa oberoende variabler kan bara **anta två värden, exempelvis ja eller nej**. Exempel på en kvalitativ oberoende variabel kan vara kön. För att kunna använda kvalitativa oberoende variabler i en regressionsanalys används dummy variabler där de **två egenskaperna ges koden 0 eller 1**. En dummy variabel är en variabel med bara två möjliga värden, koderna för dessa två värden är 0 och 1. Om vi exempelvis gör en regressionsanalys där vi vill skatta värdet på småhus så kan "har pool" vara en kvalitativ oberoende variabel där ja åsätts koden 1 och nej åsätts koden 0. Det är möjligt att ha fler än två koder för en dummy variabel.

Answer 7

* Ett ofta använt ord för hur stor del av variationen som kan förklaras enligt ovan är förklaringsgrad. Determinationskoefficienten kan ses som ett mått på denna. Obs! Ordet ”förklaras” får inte förstås så att det föreligger ett orsakssamband – även om det kan vara så. * Förklaringsgrad är proportionen av den totala variationen i den beroende variabeln, Y, som kan förklaras av variationen i den oberoende variabeln, X. En förklaringsgrad på 70% innebär att vi kan förklara 70% av variationen i den beroende variabeln med variationen i den oberoende variabeln. Förklaringsgraden är korrelationskoefficienten i kvadrat, förklaringsgrad anges i procent. Förklaringsgrad är ett viktigt nyckeltal inom korrelationsanalys. * Vid linjär regressionsanalys, ett mått på hur stor del av den totala variationen hos den beroende variabeln (se under oberoende variabel) som förklaras av den regressionsmodell som används. Vanliga skrivsätt för determinationskoefficienten är R2 och Rˆ2, som båda läses ”R två” eller ”R upphöjt till två”. För fallet med observationer på bara två variabler är determinationskoefficienten lika med kvadraten på produktmomentkorrelationskoefficienten, dvs. r2xy.

Answer 8

Visar vad det förväntade värdet är, när det oberoende variabeln har värdet 0 • X-intercept, the point where a line crosses the x-axis • Y-intercept, the point where a line crosses the y-axis

Answer 9

Finns det ett samband mellan lycka och pengar??? Ett svårdefinierat begrepp som enklast kan åskådliggöras med hjälp av diagram. Ex: Vart och ett av de två punktdiagrammen nedan beskriver sambandet mellan två variabler, x och y. Av diagrammen visar det vänstra ett tydligt linjärt samband. Det högra visar ett mycket tydligt samband som inte är linjärt. Sådana samband kallas ibland för krökta. Vardagligt skulle man kanske kunna säga att ett samband är linjärt om det statistiska materialet, avbildat som ett punktdiagram, väl ansluter sig till en (tänkt) symmetriaxel (ett slags linje). Så är det till vänster ovan, men inte till höger.

Answer 10

I ett spridningsdiagram anges skalan för den beroende variabeln på den vertikala y-axeln och skalan för den oberoende variabeln på den horisontella x-axeln. Den beroende variabeln är den variabel som blir prognostiserad eller skattad av den oberoende variabeln. Den beroende variabeln beror på den oberoende variabeln. Den oberoende variabeln är den variabel som utgör basen för prognostisering eller skattning av den beroende variabeln. Den oberoende variabeln påverkar den beroende variabeln. I ett spridningsdiagram ritas punkter in som motsvarar ett värde på den oberoende respektive den beroende variabeln. Ett spridningsdiagram kan visa på ett samband mellan den oberoende variabeln och den beroende variabeln. Ett positivt samband innebär att en ökning i värdet för den oberoende variabeln ger en ökning i värde för den beroende variabeln. Ett negativt samband innebär att en ökning i värde för den oberoende variabeln ger en minskning i värde för den beroende variabeln.

Answer 11

Matematisk term för en komponent i en multiplikation. Faktorn är oftast inte direkt mätbar, utan latenta variabler - en hypotetisk konstruktion. ex. intelligens, ångest, inflation. • Man kan inte mäta ex. intelligens direkt utan man mäter de egenskaper man tror (hypotetiskt) påverkas av faktorn intelligens. • sammansätter flera variabler för att få en faktor

Answer 12

Korrelation är ett begrepp inom statistik som anger styrkan och riktningen av ett samband mellan två variabler. Det kallas även korrelationskoefficient, eller bivariat analys. Korrelationen uttrycks som ett värde mellan 1 och -1, där 0 anger inget samband, 1 anger maximalt positivt samband och -1 anger maximalt negativt samband. För att ta ett exempel, säg att vi vill uttrycka sambandet mellan rikedom och lycka, och att vi har lyckats mäta dessa företeelser i en numerisk skala. En stark positiv korrelation, till exempel 0,9, betyder då att ju rikare man är, desto lyckligare är man - eller annorlunda uttryckt, ju lyckligare man är, desto rikare är man. En stark negativ korrelation, som -0,9, betyder i stället att ju rikare man är, desto mindre lycklig är man. En korrelation på eller nära 0 betyder att det inte finns något linjärt samband mellan de två variablerna. Däremot är ett korrelationsvärde på eller nära 0 möjligt att få när det finns ett icke-linjärt samband. Ett exempel på detta vore om både höga och låga värden på rikedom hade samband med höga värden på lycka. Det innebär att även om samband och korrelation ibland används som synonymer, så är egentligen korrelation en specialsituation av samband. 0.1-0,29 → svag korrelation 0,3-0,49 → medel 0,5-1 → stark

Answer 13

In geometry, the centroid, geometric center, or barycenter of a plane figure or two-dimensional shape X is the intersection of all straight lines that divide X into two parts of equal moment about the line. Informally, it is the "average" (arithmetic mean) of all points of X. The definition extends to any object X in n-dimensional space: its centroid is the intersection of all hyperplanes that divide X into two parts of equal moment. **centroid clustering method medelavstånd av alla variabler I alla kluster** **DVS. mittpunkten I ett kluster**

Answer 14

For the centroid clustering method, the dissimilarity between cluster A and cluster B is represented by the distance between the centroid for the cases in cluster A and the centroid for the cases in cluster B. Note that this distance is not mathematically equivalent to the average of the distances used in the average linkage method. Also note the SPSS warning below about using squared Euclidean distance rather than Euclidean distance for this procedure.

Answer 15

Det som mäts kan beskrivas med ett kontinuerligt varierande numeriskt värde, och det finns ett entydigt sätt att definiera ett nollvärde. Därmed kan man jämföra storleken mellan de olika värdena. Exempel är kroppslängd mätt i centimeter. En person kan vara dubbelt så lång som en annan. Även temperatur mätt i kelvin mäts enligt en kvotskala eftersom nollpunkten här är absolut och det inte finns några negativa temperaturvärden mätt i grader Kelvin. Endast för variabler som mäts enligt en kvotskala är det meningsfullt att multiplicera och dividera mätvärdena. **Variabel Skaltyp=alla olika skalnivåer ,nominal, ordinal, intervall, kvot. Påverkar sättet framställa och analysera data materialet**

Answer 16

Kommualitet ger svar på om det är någon ide att börja köra en faktoranalys.

Answer 17

Är ett gränsvärde som kan vara både minimi eller maximivärde, allting som är utanför detta ignoreras. (används tillexempel i diskriminantanalys)

Answer 18

En variabel är något som kan ändras. Inom matematiken och datavetenskapen betecknar den ett namngivet objekt som används för att representera ett okänt värde, till exempel ett reellt tal. Variabler används i öppna utsagor. De kan anses stå i motsats till konstanter som är oföränderliga, liksom till parametrar som hålls konstanta under en given process eller beräkning.

Answer 19

I statistiken är en utanförliggare en iakttagelse som är numeriskt på avstånd från resten av data. Avvikare kan definieras som: * En avvikande observation eller avvikare, är en som verkar avvika markant från andra medlemmar av provet.

Answer 20

Kallas även lamda, * Till varje faktor finns ett egenvärde. Egenvärde är en matematisk term men kan tolkas som den del av den totala variansen som förklaras av den faktorn. * Den första faktorn har det högsta egenvärdet, den andra faktorn har den näst största o.s.v **• Tumregel: alla faktorer vars egenvärde är större än ett behålls. **

Answer 21

Korrelationen mellan ursprungsvariabeln och de skapade faktorerna. faktor egenvärde ju högre förklaringsförmåga en viss faktor har, desto högre är dens genvärde.

Answer 22

Man kan minska på effekten av dessa ovannämnda problem med en relativt enkel teknik. Rotera axlarna, koordinatsystemet, medsols och bibehåll axlarna vinkelräta tills ett tydligt mönster fås. Vid ortogonal rotation roteras axlarna med bibehållande av vinkelräthet mellan dem. Faktorerna är okorrelerade. När man gör en rotation av axlarna erhåller man en rotaterad faktormatris.

Answer 23

Axlarna roteras utan att bevara rätvinkligheten mellan dem. Vid oblique (sned) korrelation avspeglar vinkeln mellan axlarna korrelationen mellan faktorerna. Om vinkeln mellan axlarna ligger nära 0, tolkas det som en hög korrelation mellan faktorerna.

Answer 24

Positivism (fr. positivisme), benämning på olika filosofiska riktningar som strävat efter att grunda tänkandet på "fakta", det vill säga kunskap som baseras på sinneserfarenhet. Genom empiriska studier försöker forskaren hitta egenskaper hos studieobjektet som återkommer också i andra fall och situationer. När man kartlagt ett tings regelbundenheter ger detta möjlighet att förutsäga, och ingripa i, ett skeende. Det som kan förutsägas (till exempel att jorden kommer att snurra ett varv runt solen under nästa år) är det som kan betraktas som kunskap. Det som inte kan vägas eller mätas betraktas som mindre intressant och man tenderar att se verkligheten som linjär.

Answer 25

Reliabilitet väger mätinstrumentets pålitlighet och kan mätas genom att göra upprepade mätningar.

Answer 26

Validitet innebär att forskaren mätt det som arbetet avser mäta.

Answer 27

Den dominerande ansats är en deduktiv forskningsansats, som innebär att testa existerande teori och jämföra det med verkligheten. En induktiv forskningsansats är motsatsen till deduktiva forskningsansatsen, den innebär att samla data och utveckla teori med hjälp av den insamlade datan. En abduktiv forskningsansats innebär oftast att samla data genom till exempel en intervju eller enkät och utformar ny teori som grundar sig på undersökningen.

Answer 28

Ett t-test är ett sätt att pröva om medelvärdet skiljer sig mellan två grupper, men t-testet är inte lämpligt när man behöver jämföra många grupper. T-testet är till för att testa om skillnaden mellan två grupper är signifikant. T-test används när du har två grupper (män och kvinnor) och två set av data (före och efter) och man vill jämföra medelvärdet av någon variabel. Det finns två metoder: paired sample t-test eller repeat measures och independent sample tests. Den förra används då man har samma grupp och man önskar studera dem under två tidpunkter T1 och T2. Data samlas in under två tillfällen. Den senare tekniken används då man har två oberoende grupper (män och kvinnor). I detta fall samlar du in data under ett tillfälle. När man vill studera medelvärden av någon variabel mellan två oberoende grupper kan man använda sig av independent-sample t-test Exempel på forskningsfråga: Finns det en signifikant skillnad mellan den genomsnittliga.

Answer 29

Den här metoden möjliggör variansanalys med två oberoende variabler och en beroende variabel. Fördelen är att man kan testa om det förekommer en sk. interaktionseffekt. Det vill säga om du misstänker att en oberoende variabel påverkas av en annan variabel. Man kan också testa för sk. main effect, den totala effekten av varje oberoende variabel. Det finns två slag av denna variansanalys: mellan grupper (om grupperna är olika, t.ex. olika fakulteter) och upprepade mätningar (när de testade har studerats under två tillfällen). Den här tekniken används om du vill jämföra skillnaderna mellan gruppernas medelvärde på ytterligare en dimension. I exemplet ovan studerade vi ju skillnaderna mellan fakulteterna, men om vi ännu skulle önska vet aom kvinnor och män har olika åsikt (utöver fakulteterna.

Answer 30

MANOVA används när man vill jämföra hur ett antal olika, men relaterade beroende faktorer påverkas i dina grupper. När man gör en variansanalys och probvärdet är under signifikansnivån lönar det sig och göra antingen Bonferroni eller Scheffe-test. Dessa är post Hoc test.

Answer 31

Regressionsanalys, korrelationsanalys och faktoranalys beskriver samband!! Hur mycket den oberoende variabeln påverkar den beroende variabeln. Används för att förklara och för att prognostisera. y=a+bx,

Answer 32

Vid enkel linjär regression utgår man från att en rät linje kan anpassas till data och regressionsekvationen är då där y (vertikal) är den beroende (den som påverkas) variabeln och x (horisontell) är den oberoende (den som påverkar). Interceptet med y-axeln a och lutningen b beräknas så att felet jämfört med observerade data blir så litet som möjligt. Felet kan beräknas med exempelvis minstakvadratmetoden eller maximum likelihood. F-värdet i en regressionsanalys • F-värdet anger om regressionsmodellen som helhet är statistiskt signifikant eller ej. • Ett ”högt” F-värde innebär att de oberoende variablerna kan förklara variationen i residualerna, vilket vi inte vill. Beta= i en regressionsanalys är regressionskoefficienten av X.

Answer 33

Med hjälp av faktoranalys kan man reducera en stor mängd data till mera hanterlig mängd för att sedan kunna analysera materialet vidare. Helst skall samplet vara större än 150. Korrelationen mellan variabler borde vara över 0.3. Man antar också att förhållandet är lineärt. * *Vad du behöver:** kontinuerliga variabler som korrelerar med varandra. * *Vad den gör:** identifierar en mindre mängd faktorer som representerar ett förhållande bland en större grupp variabler. **Lättare att tolka omfattande datamaterial.** **Beskriver variationen mellan observerade och korrelerade variabler.** Component matrix: är den ursprungliga matrisen, en rotated component matrix görs för att datan skall vara mer lätt förstådd och rangordnas så att den lägsta och hösta accepterade värdet kan hittas....

Answer 34

Klusteranalys är en **metod för att gruppera individer eller variabler** i okända grupper. Klusteranalysmetoden är **explorativ till sin natur** och intresset är att finna homogena grupper. Inom företagsvärlden är man intresserade av att segmentera och då kan man använda sig av klusteranalysmetoden. Observera att undersökaren bestämmer på vilka variabler objekten skall jämföras på. Ex. hushåll, företag och bilar Två typer av kluster: * *1. Hierarkisk klustrering** a. Agglomerativ metoden - Börjar med n st kluster dvs. att alla observationer är sitt eget kluster. - Sedan kan man börja föga ihop klustren b. Divisive metod - börjar med ett kluster - börja sedan dela upp klustren **2. Icke hierarkisk klustrering** * K-means- anger hur många kluster du vill ha . * Du använder bara den datan du har/inte bakomstående, * Kom ihåg när vi talar om kluster så **centroid**!!!

Answer 35

(diskriminant kommer från de latinska ordet avsöndra /avskilja) * Då en beroende variabel är kategoriserad används den i analys. Beroende variabeln är gift och ogift dvs två stycken beroende variabler= två-grupps diskriminatanalys Multipel diskriminantanalys=flera kategorier Icke metrisk och kategorisk är samma= bra, bättre bäst, metrisk och kontinuerlig= siffervärden, alla samband har alla kontinuerliga medan skillnader har oftast en kontinuerlig och en kategorisk Syfte: - att klassificera individen i två eller flera grupper på basen av vissa variabelvärden. - Att skapa en diskriminantfaktor och räkna ut ett cut off- värde Linear discriminant analysis (LDA) and the related Fisher's linear discriminant are methods used in statistics, pattern recognition and machine learning to find a linear combination of features which characterizes or separates two or more classes of objects or events. The resulting combination may be used as a linear classifier, or, more commonly, for dimensionality reduction before later classification. LDA is closely related to ANOVA (analysis of variance) and regression analysis, which also attempt to express one dependent variable as a linear combination of other features or measurements.[1][2] In the other two methods however, the dependent variable is a numerical quantity, while for LDA it is a categorical variable (i.e. the class label). Logistic regression and probit regression are more similar to LDA, as they also explain a categorical variable. These other methods are preferable in applications where it is not reasonable to assume that the independent variables are normally distributed, which is a fundamental assumption of the LDA method. Rather than the ANOVA categorical independent variables and a continuous dependent variable, discriminant analysis has continuous independent variables and a categorical dependent variable.[3]

Tentfrågor Flashcards

(61 cards)