Methoden und Instrumente Flashcards
Anwendungsfelder KDD
Database Marketing
RFM-Analyse
Cross Selling
Balanced Score Card
KDD-Prozess
Ermittelt Zusammenhänge in Daten die über reine Aggregation und Wiedergabe hinausgehen.
Bildet ein Modell das Zusammenhänge abbildet.
Zusammenhänge sind valide, neuartig, potentiell nützlich und leicht verständlich
Prozess:
Vorbereitende Schritte -> DM -> Nachbereitende Schritte
Ziel: Muster in Datensätzen erkennen und explizit machen. Gewonnene Informationen müssen durch Erfahrung und Anwendungszusammenhänge angereichert werden um Status von Wissen zu erreichen und somit zur Entscheidungsfindung beitragen zu können.
4 Grundaufgaben von KDD
- Bildung von Gruppen
* Anwendungsfall Clusteranalyse - Erklärung von Gruppen
* Anwendungsfall Klassifizierungsverfahren - Erklärung von Zusammenhängen
* Anwendungsfall Regressionsanalyse - Beschreibung von Zusammenhängen
* Anwendungsfall Assoziationsanalyse
KDD-Prozess nach Fayyad
9 Schritte
- Problemdefinition
- Auswahl der Daten
- Bereinigung und Aufbereitung der Daten
- Reduktion oder Projektion
- Auswahl der Aufgabe (implizit. Methodengruppe)
- Auswahl des Algorithmus
- Data Mining
- Interpretation
- Verwendung
Einordnung KDD in Managementkreislauf
KDD wird zum integralen Bestandteil der Informationsbeschaffung im Rahmen der Entscheidungsvorbereitung zu der auch die Alternativenbewertung zu zählen ist
KDD-Prozess ist nicht unabhängig sondern im Kontext des übergeordneten Managementprozesses (Kreislauf von Entscheidungsproblemen, Entscheidungsvorbereitung, Entscheidungen und Wirkungsanalyse) zu sehen.
KDD-Prozess unterstützt den Managementprozess besonders in der Entscheidungsvorbereitung und der Wirkungsanalyse
Phase 1: Vorbereitende Schritte - Allgemein
Entscheidungsproblem (wohl (MDP) oder schlecht sturkturiert) ist Auslöser
# garbage in - garbage out
vorbereitende Schritte
Auswahl repräsentativer Daten für Grundgesamtheit
Datenqualitätsprobleme unschädlich machen
Daten aggregieren bis für Untersuchung erforderliche Granularität erreicht ist
Konstruktion abgeleiteter Variablen für mehr Aussagekraft
Entfernen von irrelevanten oder irreführenden Variablen
# Min. 2 Handlungsalternativen für ein Entscheidungsproblem
# 1. Phase von großer Bedeutung für gute Ergebnisse
Entscheidungsprozess aus Führungssicht 6 Schritte
- Soll-Ist-Vergleich daraus abgeleitet Problemstellung sowie Ursachenanalyse für Problem
- Handlungsalternativen zusammengestellt, Günstige Alternativen werden untersucht.
- Bewertung der Handlungsalternativen hinsichtlich Zielsetzung
- Auswahl Alternative nach Analyse und Diskussion
- Durchführung der Handlungsalternative
- Analyse der Erkenntnisse, evtl. Ableitung neuer Entscheidungsprozesse
Entscheidungsvariable
Festlegung durch Unternehmen möglich
Projektplan für KDD
# Analyse und Beschreibung der Ressourcen # Analyse der Anforderungen # Analyse der Beschränkungen # Analyse der Risiken
Auswahl der Daten
- Benötigte Daten zuvor als relevant identifizierte Daten - Problematik der Datenversorgung * Technische * Organisatorische * Rechtliche Datenquellen * DWH * Sonstige