Einheit 8 Flashcards
Nutzen Datenanalyse
Nur durch eine effiziente und
effektive Datenanalyse
können Sie aus Daten einen
Wettbewerbsvorteil
generieren.
Stichwort: Entscheidungsunterstützung
Big Data
Unter Big Data (engl.: big data) versteht man Datenkollektionen,
deren Größe die Fähigkeiten einzelner Rechnersysteme überschreiten,
um diese Datenmenge zu speichern, zu durchsuchen, zu analysieren
und zu verwalten.
4 Vs of Big Data
Volume: MEnge
-gesamte Menge an Daten steigt rasant
Velocity: Geschwindigkeit: erhöhtes Datenaufkommen pro Sekunde
Variety: Vielfalt
-Vielfalt an neuen Daten und Datentypen
Veracity: Bestimmtheit:
-Grad der Richtigkeit der Daten
strukturierte vs unstrukturierte Daten
Strukturierte Daten:
-Maschinell oder manuell für bestimmten
Kontext aufbereitete Daten
-Aufbereitung der Daten basiert auf einem
Schema oder einer Kodierung
-> u.a. relevant für Suchmaschinen
Unstrukturierte Daten:
Daten, die vom Datentyp zwar
zugeordnet werden können, jedoch
(noch) keine weiteren identifizierbaren
Informationen bereitstellen.
-> Semantisch noch nicht für die Maschine aufbereitet
Datenquellen Big Data
Operationale Daten
Historische Daten
Internet of Things Daten
Web & Social Media Daten
Log Dateien von Systemen
-Klickpfade von Kundenverhalten auf Websites
-Fehlercodes von Server Responses (500, 404 etc.)
Sensor Daten
-Wetter Daten (Temperatur, Druck, Luftfeuchtigkeit, etc.)
-Lärmdaten, Luftqualität, etc.
Webbasierte Dokumente
-E-Mail, Website Inhalte, Nachrichten, etc.
-Daten mit geobasierten Inhalten
-GPS-Koordinaten wie z.B.: Points of Interests, Strecken, etc.
Multimedia
-Videos, Audio, Bilder, Grafiken, Animationen, etc.
Soziale Medien
-Kommentare, Likes, Shares, etc.
Interne und externe Daten
Interne Daten:
-operative Informationssysteme
-Datenbanken
-Dokumente
Externe Daten:
-soziale Medien & andere Netzwerke
-externe Organisationen
-externe Speicher
-diverse Quellen
Open Data
Datennutzung, -weiterverbreitung
und -weiterverwendung ohne
Einschränkung.
Bereitstellung in
maschinenlesbarem Format.
Keine Einschränkungen:
Jede/r sollte die Möglichkeit haben, die
Daten zu nutzen, zu modifizieren, sie mit
anderen zusammenzuführen und
weiterzugeben, auch zu kommerziellen
Zwecken. à ermöglicht durch Lizenzen
Wiederverwendbarkeit
vgl oben
Freie Nutzbarkeit
Frei nutzbar heißt jedoch nicht gratis
bzw. frei verfügbar oder frei zugänglich. Es
können Kosten entstehen durch Erstellung,
Pflege und Veröffentlichung.
Business Intelligence
Wir haben die Daten. Wie können wir mit diesen Daten effizient und
systematisch Entscheidungen unterstützen?
Business-Intelligence (Abkürzung: BI) beschreibt ein integriertes,
betriebsindividuell zu entwickelndes Gesamtkonzept zur ITUnterstützung
des Managements. „Intelligence“ ist Wissen, welches durch die Erfassung, Integration, Transformation, Speicherung, Analyse
und Interpretation geschäftsrelevanter Information generiert wird.
beispiel:
kein einzelnes Anwendungssystem, sondern eine Architektur von aufeinander abgestimmten Anwendungen
Entscheidungsunterstützungssystems
Im Kontext von Business Intelligence Systemen, welche eher generisch gedacht sind, kann für domänenspezifische Anwendungen noch weiter abgegrenzt werden.
Ein klassisches Entscheidungsunterstützungssystem (Abkürzung: EUS, engl.: decision support system) hilft vor allem Fachspezialisten
(Beratern, Stäben) bei der Entscheidungsvorbereitung für eng
abgegrenzte Aufgabenstellungen.
Schwerpunkt ist die Untersuchung
möglicher Handlungsalternativen mit mathematischen Methoden und
Modellen (Prognosen, Simulationen und Optimierungen).
englische
Bezeichnung Decision Support System (Abkürzung: DSS) ist auch
im deutschen Sprachraum gebräuchlich.
Beispiel:
Anwendungssysteme, die für spezifische Branche bei der Entscheidungsfindung unterstützen
zb Lufthansa Systems in Luffahrtsbranche
zb Nielsen IQ, Branche: Konsumgüter des täglichen Bedarfs zb Shelf Architect, Smart Store
5 Komponenten Business Intelligence Systems
1 Datenquellen
2 Datensammlung- und transformation
3 Datenbereitstellung
4 Datenanalyse
5 Daten- & Informationszugriff
Datensammlung und -transformation
Bevor mit den operationalen Daten analytisch gearbeitet werden kann, müssen diese in ein kompatibles Format umgewandelt werden:
Komponente die als Schnittstelle zwischen Ursprungsdaten und Zieldatenbank dient.
In mehreren Schritten werden die Daten
extrahiert (z.B.: 1:1 Kopie in eine
Arbeitsdatenbank) um dann transformiert
(clean, merge, translate etc.) zu werden, um
schließlich in eine Zieldatenbank geladen zu werden.
-> Extract, Transform, Load (ETL)
Datenbereitstellung
(3) Die Datenbereitstellung findet über eine
Datenbank statt. Hier kann unterschieden werden:
(a) Data Warehouse / Data Mart
-> Konzepte, um große Datenmengen zentral,
einheitlich und konsistent zu organisieren (Data Warehouse) bzw. Teile daraus bereitzustellen (Data
Mart).
(b) Data Lake
-> Konzepte, um große Datenmengen in ihrer Ursprungsform mit unterschiedlichen Datentypen und Strukturen zu speichern. Die Bereitstellung findet meist über verteilte Datenbanken in Server-
Clustern statt. Aufbereitung bei konkretem Bedarf.
Datenanalyse
(4) Datenanalyse
Ebene in der mithilfe von methodischen
Grundlagen des Data-Science, Fragestellungen bearbeitet werden:
(a) Online Analytical Processing (OLAP)
-> Konzepte zur Formulierung und Auswertung
von komplexen Datenabfragen auf Basis von multidimensionalen Modellen.
(b) Data Mining
-> Techniken um mit vorhandenen
Datenbeständen (unstrukturiert od. strukturiert) analytischen Fragestellungen nachzugehen.
Zum Beispiel die Erkennung von unbekannten Zusammenhängen, Mustern oder Trends.
Daten- und Informationszugriff
(5) Daten- & Informationszugriff
Zugriff und Präsentation von Informationen über verschiedene Schnittstellen zu
webbasierten Portalen (Dashboards, Simulationen), spezialisierten Applikationen
oder geteilten Datensätze (und viele andere).
Arbeit mit Daten und Zahlen
verschiedensten Komponenten
eines Business Intelligence
Systems steckt vor allem viel
integrative Datenarbeit, um
u.a. für das Management
Reports einfach zugänglich zu
machen.
Dahinter steht ein Prozess der
auch bekannt als OSEMN ist
(Obtain, Scrub, Explore,
Model, Interpret)
Berufsbild:
Data-Scientist
-> Hochschulstudium der
Wirtschaftsinformatik
-> Sehr gute Kenntnisse über
Mathematik, Statistik und
Datenbanksystemen
Aufgaben:
Beschreibung, Diagnose und
Vorhersage von
Zusammenhängen, Muster
und Trends.
Datenintegration,
Modellbildung, -auswertung
und Ergebnisdarstellung