BI & Data Science Flashcards
Was sind Daten?
Eine Menge von Zeichen (Liste oder Abfolge).
Mehrzahl: Datum
D = „25“
Was sind Informationen
Daten mit einem klar definierten Kontext
Z.B.: Fc Bayern 2:1 BVB
Der Kontext beschreibt, wo die Daten herkommen, was sie beschreiben und wie sie erzeugt wurden
Was ist Wissen?
Wenn mehrere Informationen in einem bewussten Vorgang und nach klaren Regeln miteinander kombiniert wird
Was sind Entscheidungen?
Wenn Informationen und Wissen eingesetzt werden um eine daraus eine Aktion abzuleiten.
Im Datenumfeld entscheiden die „Agenten“
Was ist „Business Intelligence“?
Die Nutzung von Daten um daraus betriebswirtschaftliche Entscheidungen abzuleiten.
Ziele müssen zuvor klar definiert werden
-> Datifizeirung: Der intensive Wille Daten zu sammeln
-> Die aufgebaute Datenanalyse Infrastruktur ständig verbessern
Was sind „Kennzahlen“?
- messbare Größen
- wirtschaftlich bedeutsam
- quantifizierbar (z.B. in Zahlen)
Beispiele:
Absolute Kennzahl -> Fahrzeit, Gesamtkosten
Relative Kennzahl -> mit Maßeinheit (Stückkosten) // -> ohne Maßeinheit (Rendite, Krankenstand)
Welche Dimensionen der Datenqualität gibt es? (4)
- Vollständigkeit
- Aktualität
- Relevanz
- Korrektheit
Was ist „Data Mining“?
Die Suche nach unbekannten Muster oder Beziehungen im Datenbestand des DWH
Allgemeine Anforderungen an die Referenzarchitektur eines DWH?
- idealtypisch gestaltet
- primär Funktionsorientiert
Anforderungen an das DWH: (4)
- Unabhängigkeit zwischen den Datenquellen und Auswertungssystemen (Verfügbarkeit, Belastung)
- Dauerhafte Bereitstellung der Daten
- Flexibilität
- Skalierbarkeit
Was machen „Monitore“ im DWH?
Sie entdecken und melden Änderungen der Datenquellen an den DWH-Manager
- triggerbasiert
- Zeitstempelbasiert
- Log basiert
Was machen „Extraktoren“ im DWH?
Sie selektieren und transportieren Daten aus den Quellen in den Arbeitsbereich
- periodisch
- auf Anfrage
- ereignisgesteuert
- sofortig
Was machen „Transformatoren“ im DWH?
Sie vereinheitlichen, bereinigen, integrieren, konsolidieren, aggregierten und ergänzen die Daten
- Datentypen anpassen
- Konvertierungen
- Vereinheitlichung
- Umrechnung
Was machen „Ladekomponenten“ im DWH?
Sie laden die transformierten Daten aus einem Bereich/DB in den nächsten
Welche Arten der „Datenbereinigung“ gibt es?
Data Scrubbing: Unzulänglichkeiten in Daten erkennen und beseitigen (Regelbasiert)
Data Auditing: Mit Data Mining Zusammenhänge in Daten finden und Regeln ableiten