(6) Big Data Flashcards

1
Q

Was ist Big Data?

A
  • Big Data befasst sich mit der Erzeugung, Verknüpfung und Auswertung von großen Datenmengen (Größe, Komplexität, Schnelllebigkeit)
  • Mathematische Verarbeitung von Daten zur Gewinnung von W´keiten
  • Die Berücksichtigung der Roh-Daten ermöglicht das Erkennen von Zusammenhängen und Einzelheiten, die sonst in der Masse untergegangen wären
  • besonders flexibel Analyse von unstrukturierten oder teilstrukturierten Massendaten
  • Verwendung besonders großer Datenmengen, die mit herkömmlichen Datenanalyseverfahren nicht mehr möglich ist
  • Höhere Performance (Echtzeiz Auswertung) -> Fehleranalysen flexibler & schneller
  • Verzicht auf Stichproben (Verlust der Genauigkeit)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was umfasst Big Data?

A
Basiert auf Zusammenwirken folgender Faktoren:
• Gestiegenes Datenvolumen
• Sehr unterschiedliche Datenformate
• Wachsende Anzahl von Datenquellen
• Auswertung in Echtzeit
• Zunehmend mehr Nutzer von BI Software
• Polystrukturiertheit der Daten 
=> Höhere Erwartungshaltung an Analyse komplexer Zusammenhänge & Performance des Systems

Neuere Trends:
• Cloudsysteme und Optimierung der Datenspeicherung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Beispiel: Dataclysm

A

Wooderson’s Gesetz:
• Frauen präferieren ca. bis zum 30. Lebensjahr ältere Männer, danach aber jüngere Männer
• Männer präferieren konstant 20 Jährige

Physical attractiveness and received messages per week:
• Zusammenhang zwischen physischer Attraktivität und erhaltenen Anfragen in der Woche
• Höchste Perzent erhält unverhältnismäßig die höchste Anzahl an Anfragen
• Betrifft jedoch mehr die attraktivsten Frauen
• Die Attraktivität von Männern hat keinen Einfluss auf die Anzahl der Einladungen zu einem Bewerbungsgespräch
=> Umgekehrt bei Frauen (Gründe: Personaler sind meist Männer, Halo-Effekt: attraktive Menschen werden öfter als Intelligent, Kompetent & Vertrauenswohl eingeschätzt)
• Attraktive Menschen haben größere Netzwerke auf die sie zurückgreifen können

Fazit:
• Mit Hilfe der Daten lässt sich Algorithmus verbessern -> höhere Kompatibilitätsrate & Kundenzufriedenheit
• meiste Werbung bei attraktiven Menschen schalten, da dort der traffic am höchsten ist -> höhere Werbeeinnahmen (Wettbewerbsvorteil)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pro und Kontra von Big Data

A

Pro:
• Transparenz
• Große Datenmengen in Echtzeit
• Geringer Kostenaufwand
• Prognose- und Frühwarnsystem (Google Grippe Trends)
• Vorteile für Unternehmen (Kundenverhalten, Kundenzufriedenheit)
• Individualisierung wird ermöglicht
• Erleichterung im Alltag (Fix my street)

Kontra:
• Gefahr der Überwachung (Gläserner Mensch)
• informationeller Missbrauch: auf Big Data beruhende Vorhersagen zu nutzen um Menschen für nur vorhergesagtes Verhalten verantwortlich zu machen
• methodologische Probleme: Unzuverlässigkeit und Fehleranfälligkeit (liefert nur Korrelationen, keine Kausalitäten)
• Datenschutz und Datenmissbrauch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Datenschutz und Datenmissbrauch - Methoden zur Auswertung personenbezogener Daten

A
  1. Tracking:
    • Verfolgung einer Person anhand eines bestimmten Merkmals und Auswertung der Metadaten (z.B. Handy)
  2. Scoring:
    • Zahlenmäßige Beurteilung von vermeintlichen Eigenschaften der Person mit dem Ziel Vorhersagen über die Zukunft zu treffen
  3. Profilbildung und Klassifizierung

=> Mögliche Einschränkung der persönlichen Entscheidungs- und Handlungsfreiheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Maßnahmen zum Schutz der Persönlichkeitsrechte

A

Ethische Überlegungen:
• Big Data Kodex

Rechtliche Rahmenbedingungen:
• EU-Datenschutzverordnung
• Datenschutzrichtlinien in Deutschland

Anforderungen an Statistikprogramme:
• Privacy by Design

Selbstschutz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly