KDD Prozess Flashcards

1
Q

KDD Prozess (9 Schritte)

A

KDD-Prozess ist interaktiv und iterativ und umfasst zahlreiche Schritte mit vielen Entscheidungen, die vom Benutzer getroffen werden.

  1. Verständnis für Andwendungsdomäne und das entsprechende Vorwissen entwickeln und das Ziel des KDD-Prozesses aus Sicht des Kunden identifizieren
  2. Erstellung eines Zieldatensatzes: Auswahl eines Datensatzes oder die Konzentration auf eine Teilmenge von Variablen oder Datenproben, an denen die Entdeckung durchgeführt werden soll
  3. Datenbereinigung und -vorverarbeitung.
    - Entfernung von Noise
    - Sammeln der nötigen Informationen zur Modellierung
    - Umgang mit fehlenden Daten
  4. Datenreduktion und -projektion: Finden nützlicher Merkmale zur Darstellung der Daten je nach Ziel der Aufgabe. Reduktion der Anzahl der betrachteten Variablen auf ein effektives Maß.
  5. Anpassung der Ziele des KDD-Prozesses an eine bestimmte Data-Mining-Methode z.B. Verdichtung, Klassifikation, Regression, Clustering
  6. Explorative Analyse und Modell- und Hypothesenauswahl: Auswahl des Data-Mining-Algorithmus und Auswahl der Methoden die für die Suche nach Datenmustern verwendet werden sollen. Umfasst Entscheidung, welche Modelle und Parameter geeignet sein könnten
  7. Data Mining: Suche nach Pattern von Interesse in einer bestimmten Darstellungsform oder einem Set solcher Darstellungen.
  8. Interpretation der gewonnen Muster, wobei möglicherweise zu einem der Schritte 1 bis 7 für eine weitere Iteration zurückgekehrt wird. Visualiserung der extrahierten Muster und Modelle, falls möglich
  9. Handeln auf Grundlage der entdeckten Muster
How well did you know this?
1
Not at all
2
3
4
5
Perfectly