V08 - Statistik und Data Science Flashcards
Welche Statistik Arten gibt es? (V08F05)
○ Deskriptive Statistik
○ Induktive Statistik
○ Explorative Statistik
Wozu dient die deskriptive Statistik? (V08F05,F06)
○ Ordnen, beschreiben und darstellen von Daten mit statistischen Methoden zur Schlussfolgerung durch Menschen (passiert im Kopf).
○ Suchen nach Trends/Mustern
○ Grundlage für explorative und induktive Statistik
Wozu dient die induktive Statistik? (V08F05,F07)
○ Ziel: Verallgemeinerung der Beschreibung einer Teilmenge der Daten auf Grundgesamtheit
○ Allgemein gültige Rückschlüsse auf Basis der “repräsentativen” Stichprobe ziehen
○ Induktiv = “aus eigener Forschung eine Theorie ableiten”
Wozu dient die explorative Statistik? (V08F05)
○ erkundende Statistik
○ Besonderheiten und Zusammenhänge in Daten suchen.
○ Das Auffinden von unbekannten Strukturen und Zusammenhängen in Daten zur Generation von neuen Hypothesen (in der Regel vor einer vollständigen, induktiven Statistik)
Wie ist ein statistisches Problem definiert? (V08F18)
○ Ein statistisches Problem liegt vor, falls ein Zufallsvorgang potenziell zu stochastischen Schwankungen von Daten und Statistiken führt und dadurch bedingt interpretatorische Unsicherheiten entstehen.
○ Beispiel: Von 50 zufällig befragten Studierenden präferieren 30 die Mensa. Dies entspricht einem Anteil von 60%. Bedeutet dies, dass von allen 12 000 Studierenden an dieser Uni genau 7200, also exakt 60%, die Mensa präferieren?
Was macht man in der Statistik zur Datengewinnung und Aufbereitung? (V08F26)
○ Statistische Versuchsplanung
○ Stichprobentheorie
○ Primär- und Sekundärstatistiken
○ Datenaufbereitung
Was sind spezielle Analysemethoden und Instrumente in der Statistik? (V08F26)
○ Deskriptive und induktive Methoden
○ Explorative Datenanalyse und Data Mining
Wie steht Statistik mit Data Science in Verbindung? (V08F??)
○ In den ersten Schritten des KDD Modells kann Statistik angewendet werden
○ Bei Analyse des Problems und Auswahl der Daten beispielsweise
Wie steht Statistik mit Data Science in Verbindung? (V08F??)
○ In den ersten Schritten des KDD Modells kann Statistik angewendet werden
○ Bei Analyse des Problems und Auswahl der Daten beispielsweise
Wann sind Ergebnisse in der Statistik signifikant? (V08F18)
○ Wenn die Irrtumswahrscheinlichkeit einer angenommenen Hypothese (bezüglich auf Grundgesamtheit) nicht über einem festgelegten Niveau liegt
○ wenn der beobachtete Effekt (die angenommene Hypothese) wahrscheinlich nicht zufällig aufgetreten ist. Man kann dann davon ausgehen, dass der Effekt auch in der entsprechenden Grundgesamtheit besteht
○ Eine Stichprobe (bsp. Umfrage) muss entsprechend häufig oder großflächig angelegt sein