(6) Big Data Flashcards
Was ist Big Data?
- Big Data befasst sich mit der Erzeugung, Verknüpfung und Auswertung von großen Datenmengen (Größe, Komplexität, Schnelllebigkeit)
- Mathematische Verarbeitung von Daten zur Gewinnung von W´keiten
- Die Berücksichtigung der Roh-Daten ermöglicht das Erkennen von Zusammenhängen und Einzelheiten, die sonst in der Masse untergegangen wären
- besonders flexibel Analyse von unstrukturierten oder teilstrukturierten Massendaten
- Verwendung besonders großer Datenmengen, die mit herkömmlichen Datenanalyseverfahren nicht mehr möglich ist
- Höhere Performance (Echtzeiz Auswertung) -> Fehleranalysen flexibler & schneller
- Verzicht auf Stichproben (Verlust der Genauigkeit)
Was umfasst Big Data?
Basiert auf Zusammenwirken folgender Faktoren: • Gestiegenes Datenvolumen • Sehr unterschiedliche Datenformate • Wachsende Anzahl von Datenquellen • Auswertung in Echtzeit • Zunehmend mehr Nutzer von BI Software • Polystrukturiertheit der Daten => Höhere Erwartungshaltung an Analyse komplexer Zusammenhänge & Performance des Systems
Neuere Trends:
• Cloudsysteme und Optimierung der Datenspeicherung
Beispiel: Dataclysm
Wooderson’s Gesetz:
• Frauen präferieren ca. bis zum 30. Lebensjahr ältere Männer, danach aber jüngere Männer
• Männer präferieren konstant 20 Jährige
Physical attractiveness and received messages per week:
• Zusammenhang zwischen physischer Attraktivität und erhaltenen Anfragen in der Woche
• Höchste Perzent erhält unverhältnismäßig die höchste Anzahl an Anfragen
• Betrifft jedoch mehr die attraktivsten Frauen
• Die Attraktivität von Männern hat keinen Einfluss auf die Anzahl der Einladungen zu einem Bewerbungsgespräch
=> Umgekehrt bei Frauen (Gründe: Personaler sind meist Männer, Halo-Effekt: attraktive Menschen werden öfter als Intelligent, Kompetent & Vertrauenswohl eingeschätzt)
• Attraktive Menschen haben größere Netzwerke auf die sie zurückgreifen können
Fazit:
• Mit Hilfe der Daten lässt sich Algorithmus verbessern -> höhere Kompatibilitätsrate & Kundenzufriedenheit
• meiste Werbung bei attraktiven Menschen schalten, da dort der traffic am höchsten ist -> höhere Werbeeinnahmen (Wettbewerbsvorteil)
Pro und Kontra von Big Data
Pro:
• Transparenz
• Große Datenmengen in Echtzeit
• Geringer Kostenaufwand
• Prognose- und Frühwarnsystem (Google Grippe Trends)
• Vorteile für Unternehmen (Kundenverhalten, Kundenzufriedenheit)
• Individualisierung wird ermöglicht
• Erleichterung im Alltag (Fix my street)
Kontra:
• Gefahr der Überwachung (Gläserner Mensch)
• informationeller Missbrauch: auf Big Data beruhende Vorhersagen zu nutzen um Menschen für nur vorhergesagtes Verhalten verantwortlich zu machen
• methodologische Probleme: Unzuverlässigkeit und Fehleranfälligkeit (liefert nur Korrelationen, keine Kausalitäten)
• Datenschutz und Datenmissbrauch
Datenschutz und Datenmissbrauch - Methoden zur Auswertung personenbezogener Daten
- Tracking:
• Verfolgung einer Person anhand eines bestimmten Merkmals und Auswertung der Metadaten (z.B. Handy) - Scoring:
• Zahlenmäßige Beurteilung von vermeintlichen Eigenschaften der Person mit dem Ziel Vorhersagen über die Zukunft zu treffen - Profilbildung und Klassifizierung
=> Mögliche Einschränkung der persönlichen Entscheidungs- und Handlungsfreiheit
Maßnahmen zum Schutz der Persönlichkeitsrechte
Ethische Überlegungen:
• Big Data Kodex
Rechtliche Rahmenbedingungen:
• EU-Datenschutzverordnung
• Datenschutzrichtlinien in Deutschland
Anforderungen an Statistikprogramme:
• Privacy by Design
Selbstschutz