Computational Social Sciences (11) Flashcards
Computational Social Science =
endeavour to understand human communication by using automation in observational, theoretical and experimental research
CSS: content
- lange and complex data sets
- digital traces and other “naturally occurring” data
- requires algorithmic solution to analyse
- re-testing old theories with new approach
doppelte Relevanz von CSS
-
Werkzeugkasten der KoWi
- können für Studien eingesetzt werden
-
Gegenstand der KoWi
- man untersucht z.B. Algorithmen con Suchmaschinen oder auf Social Media
- Problem: Tech-Unternehmen geben Algorithmen nicht Preis
- Ziel der Forschung: diese geheimen Algorithmen aufdecken und analysieren
Algorithmus =
Regelwerk für schrittweises Verfahren bzw. Folge von Anweisungen zur Lösung eines Problems (z.B. Rezept)
Big Data beinhaltet
- Volume
- Variety
- Velocity
- Veracity
Big Data: Volume
große Datenmenge, oft Peta- oder Exabytes
Big Data: Variety
Vielfalt der Datenstrukturen
(nicht nur Zahlendatenbanken, sondern Text, Audio, Video etc.)
Big Data: Velocity
Geschwindigkeit, mit der Daten entstehen und sich dynamisch entwickeln
Big Data: Veracity
“Wahrhaftigkeit” von Daten
(Herkunft, inhaltliche Gültigkeit)
→ Bias aus Analyse der Big Data
Datafizierung =
man kann Menschen durch Daten erfassen
Digitalisierung vs. Datafizierung
- Datafizierung ≠ Digitalisierung, da auch schon vorher möglich
- Digitalisierung vereinfacht jedoch Datafizierung maßgeblich
- Sammlung der Daten durch Suchmaschinen, Bewegung (Maps), Webnutzung, Social Media (Instagram), Kommunikation (WhatsApp)
Künstliche Intelligenz (KI) =
Artificial Intelligence (AI)
Teilgebiet der Informatik, die sich mit Nachbildung intelligenten Denkens, Verhaltens bei Maschinen beschäftigt
Machine Learning =
ein Teilbereich der KI
künstlicher Prozess, bei dem Computer anhand von vorgegebenen Parametern und Datenmaterial Wissen generieren, indem sie Algorithmen auf große Datenmengen anwenden
NLP =
natural language processing
Anwendung von Machine Learning auf geschriebene und gesprochene Sprache, um sie für Computer verarbeitbar zu machen → Unterkategorie von ML
ein Teilbereich des Machine Learnings, dieses ist wiederum Teil der KI
Beispiele für AI-generated content
- Roboterjournalismus (Wetter, Sport, Aktienberichte anhand von Daten)
- online-Produktbeschreibungen
- Handschrifterkennung
- Prognosemodelle, z.B. für Erkrankungen, Straffälligkeit
Telemetrie =
Messeinrichtungen, die an Fernseher angeschlossen werden, erfassen alls An-, Um- und Ausschaltvorgänge
→ “People Meter”
(automatisierte Beobachtung)
Datenspuren =
Daten, die aus natürlichem Verhalten von Menschen durch automatisierte Beobachtungsverfahren erfasst und gespeichert werden
Bsp. Navigationshandlungen im Internet ( Page Visits, Scroll Depth, Time Spent etc. )
(automatisierte Beobachtung)