Alle inductieve technieken Flashcards
Meervoudige Regressie (Multiple Regression)
Doel: Meervoudige regressie wordt gebruikt om de relatie te modelleren tussen één afhankelijke variabele en meerdere onafhankelijke variabelen.
Gebruik: Het wordt gebruikt wanneer je wilt begrijpen hoe verschillende factoren gezamenlijk invloed hebben op een resultaat. Bijvoorbeeld, hoe inkomens, opleidingsniveau en leeftijd samen invloed hebben op de consumententevredenheid.
Voorbeeld: Je onderzoekt hoe de werkdruk (X1), gezondheid (X2) en ervaring (X3) invloed hebben op de productiviteit (Y).
Logistische Regressie (Logistic Regression)
Doel: gebruikt om de waarschijnlijkheid van een gebeurtenis (gebeurtenis / geen gebeurtenis) te voorspellen. Het is een variant van de regressieanalyse die wordt gebruikt wanneer de afhankelijke variabele binair is (bijvoorbeeld ja/nee, succes/mislukking).
Gebruik: Dit wordt vaak gebruikt voor het voorspellen van kans op een gebeurtenis, bijvoorbeeld het voorspellen van de kans dat iemand ziek wordt op basis van leeftijd, geslacht, en rookgedrag.
Variantianalyse (ANOVA)
Doel: ANOVA wordt gebruikt om te testen of er statistisch significante verschillen zijn tussen de gemiddelden van drie of meer groepen. Het is een uitbreiding van de t-toets voor meerdere groepen.
Gebruik: Het wordt gebruikt wanneer je wilt weten of verschillende behandelingen (of groepen) verschillende effecten hebben op een afhankelijke variabele.
Zowel onafh. als afh. variabele zijn categorisch
Voorbeeld: Vergelijken van de gemiddelde klanttevredenheid tussen drie verschillende productgroepen.
Soorten:
Eénweg ANOVA: Vergelijkt de gemiddelden van drie of meer groepen op één onafhankelijke variabele.
Tweeweg ANOVA: Vergelijkt de gemiddelden van groepen op basis van twee onafhankelijke variabelen.
Factoranalyse (Factor Analysis)
Doel: Factoranalyse wordt gebruikt om een groot aantal variabelen te reduceren tot een kleiner aantal onderliggende factoren die de meeste variatie in de gegevens verklaren.
Gebruik: Het wordt vaak gebruikt om de complexiteit van een dataset te vereenvoudigen en om patronen te identificeren die niet direct zichtbaar zijn.
Voorbeeld: Als je een enquête hebt met veel vragen over klanttevredenheid, kan factoranalyse helpen om de verschillende vragen te groeperen op basis van onderliggende dimensies zoals servicekwaliteit, prijs, en gebruiksgemak.
Factoranalyse zoekt naar de onderliggende factoren die de variatie in de data verklaren (latent concepten).
Clusteranalyse zoekt naar groepen van objecten die intern vergelijkbaar zijn, zonder expliciete verklaringen voor de onderliggende variatie.
Clusteranalyse (Cluster Analysis)
Doel: gebruikt om objecten te groeperen die vergelijkbaar zijn in verschillende aspecten, zodat de objecten in dezelfde groep meer op elkaar lijken dan met objecten in andere groepen.
Soorten:
* K-means clustering: Verdeel de data in 𝑘 clusters op basis van de dichtstbijzijnde gemiddelde waarden.
* Hierarchische clustering: Bouw een hiërarchie van clusters op, zonder vooraf een aantal clusters in te stellen.
Voorbeeld: Segmentatie van klanten op basis van koopgedrag.
Factoranalyse zoekt naar de onderliggende factoren die de variatie in de data verklaren (latent concepten).
Clusteranalyse zoekt naar groepen van objecten die intern vergelijkbaar zijn, zonder expliciete verklaringen voor de onderliggende variatie.
Structurele Vergelijkingsmodellen (SEM: Structural Equation Modeling)
Doel: SEM is een geavanceerde techniek die zowel path analysis als factoranalyse combineert om complexe relaties tussen meerdere variabelen te modelleren. Het wordt gebruikt voor het begrijpen van directe en indirecte relaties tussen variabelen.
Gebruik: Het is handig voor het testen van theoretische modellen waarin de relaties tussen variabelen zowel direct als indirect kunnen zijn.
Voorbeeld: Het modelleren van de relaties tussen klanttevredenheid, merkloyaliteit, en herhaalaankopen.