Data Mining Flashcards
Was ist Data Mining
ist die Analyse einer großen Menge von Daten durch automatische oder halbautomatische Methoden, um aussagefähige Muster und Regeln zu finden
Grundlegende Annahmen beim Data Mining
Aus der Vergangenheit lässt sich die Zukunft vorhersagen
Daten enthalten das , was wir vorhersagen wollen
Daten sind verfügbar - mögliche Schwierigkeiten: > Daten werden nicht erfasst > Daten gehören einem anderen Bereich > Daten sind im falschen Format
Data mining ist nicht immer erfolgreich
Das entdeckte Wissen widerspricht dem bekannten Wissen
Das entdeckte Wissen führt zu falschen Entscheidungen
Widerstand in den Organisationen
Ergebnisse können für eine Aktion zu spät kommen
Erfolg von Data Mining hängt ab von… / Was braucht man
gute Werkzeuge
fähige Analytiker
fundierte Methodik
Projektorganisation
Data Mining ist ein Prozess, der mehrere Tools und verschiedene Fähigkeiten benötigt
Warum Data Mining
aus den Daten eines DWH können mit DM bestimmte Rückschlüsse und Zusammenhänge erkannt werden
> Einkaufsverhalten für bestimmte Produkte in Bezug zu einer bestimmten Klientel
DM vs OLAP (Online Analytical Processing)
OLAP
- betont anfragegetriebene Analysen
- Antworten auf explizite Fragen
Data Mining
- Untersuchung und Analyse wird von Maschinen angetrieben
- Antworten auf implizite Fragen
Beispiele von DM-Anwendungen
Betrugserkennung
- Identifikation von betrügerischen Transaktionen
> Reduziertes Risiko, Kostenersparnis
Fertigung
- Gründe für Fertigungsprobleme erkennten
Internet
- personalisierte Angebote, Kaufempfehlungen
Aufgaben von Data Mining
Segmentierung
> Gibt es Gruppen von Kunden mit ähnlichem Verhalten
Klassifikation
> Zu welcher Gruppe gehört dieser Kunde
Ausreißer-Erkennung
> Wie erkennt man Benutzung gestohlener Kreditkarten
Abhängigkeitsanalyse
> Wie reagierten meine Kunden auf die letzte Marketingaktion
Prognose / Vorhersage
> Welche Kunden könnte ich demnächst (warum) verlieren?
Data Mining Unterscheidungskriterium
Explorativ
- Buttom Up
- mit Daten starten
- Versuch etwas zu finden, was wir noch nicht kennen
Zielgerichtet
- Top Down
- getrieben von Zielen und/oder Hypothesen
- erkläre eine bestimmte Beziehung
- sage den Wert eines Feldes voraus
Zielgerichtet oder explorativ
DM beinhaltet normalerweise Aspekte von beiden Seiten:
- exploratives DM versucht, Beziehungen der Daten zu erkennen
- Zielgerichtetes DM versucht, diese Beziehungen zu erklären