1 Flashcards
Identifikationskriterien
Bsp: Bundestagswahl Wahlprognose
Die statistischen Einheiten müssen sachlich, räumlich, und zeitlich voneinander abgegrenzt sein.
Sachlich : Wahlberechtigte Bürger
Räumlich : BRD
Zeitlich: Tag der Umfrage
Merkmal
Bsp: Angestellter
Als Merkmal wird eine Eigenschaft einer statistischen Einheit bezeichnet, die in einer statistischen Analyse betrachtet wird.
Die statistische Einheit wird auch als merkmalsträger bezeichnet.
Statistische Einheit: Angestellter
Merkmale: alter, Familienstand, Wohnort
Merkmalsausprägung
Bsp: Geschlecht
Die Werte oder Kategorien , die ein Merkmal annehmen kann, werden als merkmalsausprägungen bezeichnet.
Merkmal: Geschlecht
Ausprägung: männlich / weiblich
Merkmalswert / Beobachtungswert
Bsp: Merkmale: Geschlecht / Beruf
Adrian
Eine an einer bestimmten Stat. Einheit festgestellte merkmalsausprägung wird merkmalswert oder Beobachtungswert genannt = eine bestimmte merkmalsausprägung
Männlich / Student
Methoden der Datenerhebung
Befragung: telefonisch, postalisch, persönlich
Beobachtung
Experiment
Persönliche Befragung
Vorteile / Nachteile
Missverständliche und falsche Antworten durch direktes nachfragen der Interviewer ausgeschlossen werden
Hoher finanzieller und Organisatorischer Aufwand
Telefonische Befragung
Vor und Nachteile
Gleiche Vorteile wie Pers. Befragung
Geringere Kosten , schnelle Durchführung
Anzahl Antwortverweigerungen können hoch sein
Postalische Befragung
Vor und Nachteile
Keine interviewerfehler oder Einfluss des Interviewer
Nachträgliche Korrektur der Antworten nicht möglich
Wenn rücklaufquote zu gering = sys. Verzerrung
Beobachtung
Einfachste Form durch Zählung Messung , wobei die Problematik in messgenauigkeit liegt.
Systematische oder zufällige Messfehler
Zufälliger oder statistischer Fehler ist häufig ein konglomerat vieler elementarfehler ( ablesefehler … )
Experiment
Hypothese wird aufgestellt, die mittels durchgeführter Beobachtungen untermauert oder widerlegt werden soll.
In WiWi ist das häufig sehr aufwendig und nur schwer umsetzbar
Vollerhebung ( totalerhebung )
In Stat. Erhebung alle Einheiten einer Stat. Masse berücksichtigt
Teilerhebung
stichprobenerhebung
Wird nur ein Teil der Einheiten erfasst
Primärerhebung
Vorteil
Datenmaterial wird mittels Befragung, Beobachtung oder Experiment gewonnen
Angepasst auf spezielle Bedürfnisse
Sekundärerhebung
Vorteile
Wird auf vorhandenes datenmaterial bspw. statistisches Bundesamt zurückgegriffen.
Kostengünstiger
Nominalskala
Unterscheidet Merkmale nur nach Gleichheit oder Verschiedenheit.
Keine Rangordnung
Qualitative Merkmale
Unterscheidung nominaler Merkmale ist qualitativer Art.
Daher heißen nominalisierte Merkmale auch qualitative Merkmale
Binäre ( dichotome ) Variable
Bsp Geschlecht
Merkmal Nur die Ausprägung : Eigenschaft vorhanden oder nicht vorhanden
Wird mit 1 oder 0 kodiert.
Männlich =^ 1
Weiblich =^ 0
Ordinal und rangskala
( intensitätsmässige merkmale )
Bsp bleistift / Rating
Liegt vor wenn die merkmalswerte neben der qualitativen Unterschiedlichkeit eine natürliche Rangordnung besitzt
Trotzdem ordinalskalierte Merkmale = qualitative Merkmale
Kann keine konkrete Aussage über den absoluten Wert gemacht werden ( Bleistift mit Härtegrad 2 muss nicht doppelt so hart sein wie der mit Härtegrad 1)
Ratingagenturen ( aaa, aa… )
Statistische Einheit
+ Bsp.: Ermittlung von Aktienkursen
Die statistische Einheit ( Element, Untersuchungseinheit, merkmalsträger ) ist der Träger der Informationen, die in einer Stat. Untersuchung interessant sind.
Einheit: Aktien
Metrische Skala
Kardinalskala
Besitzt ein Merkmal die Eigenschaft eines ordinalen Merkmals und ist zusätzlich noch die Interpretation der Abstände zweier Versch. Merkmalsausprägungen möglich, so kann das Merkmal auf einer metrischen Skala ( Kardinalskala ) gemessen werden
Intervallskala
Bsp
Abstände zwischen Ausprägungen können verglichen werden
Kein natürlicher sondern willkürlich gewählter Nullpunkt liegt vor
Willkürliche Einheit
Beispiel : Temperatur in Celsius oder Fahrenheit / gregorianischer Kalender ( Christus )
Verhältnisskala
Bsp
Zusätzlich zur Intervallskala können hier auch Verhältnisse verglichen werden
Natürlicher Nullpunkt / willkürliche Einheit
Bsp: Gewicht , Länge , Temperatur in Kelvin
Absolutskala
Bsp
Natürliche Einheit und natürlicher Nullpunkt
Liegt verhältnisskala vor die nicht von den Einheiten abhängt ( existiert natürliche Einheit )
Z.B Anzahl von Personen
Quantitative Merkmale
Merkmale auf Verschiedenen Skalen messen ?
Ordinalskalierte Variablen sind qualitativ.
Metrische Merkmale sind quantitativ.
Bei Inkaufnahme eines informationsverlustes lassen sich metrische Merkmale auch auf einer ordinal oder nominalskala messen .
Ein Merkmal kann immer auf einer Skala mit niedrigerem Niveau gemessen werden , jedoch nicht auf einer Skala mit höherem Niveau.
Diskretes Merkmal
Endlich viele oder höchstens abzählbar unendlich viele Ausprägungen besitzt
Nominal und ordinalskalierte Merkmale sind stets diskret
Einwohnerzahl, Lottozahlen , Steuerklasse,Geschlecht
Stetiges ( kontinuierliches ) Merkmal
Überabzählbar viele Ausprägungen, in einem bestimmten Bereich können unendlich viele Werte angenommen werden ( nachkommastellen)
Bsp: Gewicht , Einkommen , Größe , Lebensdauer
Skalentransformation
Kann als Abbildung von einer Menge Merkmalsausprägungen in eine andere Menge Merkmalsausprägungen angesehen werden.
Ordnungseigenschaften der Skala bleiben erhalten.
Eineindeutige skalentransformation
Wird bei jedem Wert der alten Skala genau ein Wert der neuen Skala zugeordnet
Monotone skalentransformation
Rangordnung der Skalenwerte bleibt erhalten
Lineare skalentransformation
Nutzen lineare Funktionen der Form ( y = a + bx )
Das Verhältnis der Abstände zwischen den Skalenwerten bleibt erhalten
Skalentransformation
Tabelle
Jede zulässige skalentransformation muss eineindeutig sein
Jede zulässige Transformation einer ordinalskala muss mind. Streng monoton sein
Jede zulässige Transformation einer metrischen Skala muss linear sein
Klassierung
Klassierend von Merkmalsausprägungen stellt einer Zusammenfassung Beobachter Merkmalsausprägungen zu einer Klasse dar, vorgegebene Ordnung bleibt erhalten.
Es sollten disjunkte Klassen mit möglichst gleicher breite gewählt werden
Disjunkt: Mengen ohne gemeinsames Element
Maximale Anzahl Klassen
Bei n Merkmalswerten sollte die Anzahl der Klassen( Wurzel aus n ) nicht überschreiten
Der Übersichthalber nicht mehr als 20 Klassen
Untere und obere Klassengrenze
Intervall
Untere Klassengrenze der j-geb klasse wird angegeben mit ( x*j-1
Obere Klassengrenze ( x*j )
Gesamtzahl der Klassen mit ( m )
( xj-1 , xj ]
Intervalle Mathematik
- [a,b]
- (a, b ]
- Enthält sowohl a als auch b
- enthält das a nicht , jedoch das b
Rest ist analog
Klassenbreite
Delta (xj) = xj - x*j-1
Die klassenbreite Delta x*j der j-rein klasse ist als Differenz zweier aufeinanderfolgender klassengrenzen definiert .
Klassenmitte
Die Klassenmitte x*j wird mit
xj = ( xj-1 + x*j ) / 2
Angegeben.
Offene randklasse
Ist die erste oder letzte der geordneten Klassen, wenn keine untere bzw. obere Klassengrenze vorhanden ist
Absolute Häufigkeit
hj = h(xj)
Anzahl der Beobachtungswerte, die diese Ausprägung aufweisen.
Relative Häufigkeit
fj = f(xj) = hj / n
Anteil der der Häufigkeit einer merkmalsausprägung xj an der Gesamtzahl der Beobachtungswerte
Häufigkeitsverteilung
Ist eine Zuordnung, die zu jeder vorhandenen merkmalsausprägung oder merkmalsklasse angibt, wie häufig diese vorkommt
Eindimensionale Häufigkeitsverteilung
Bsp
Univariate Häufigkeitsverteilung
Statistische Reihe, deren Beobachtungen aus nur einem Merkmal bestehen ( eindimensional )
Schulabschluss
Mehrdimensionale Häufigkeitsverteilung
Bsp.
Multivariate Häufigkeitsverteilung
Mehrere Merkmale gleichzeitig betrachtet
Schulabschluss und Geschlecht
Graphische Darstellung von Daten
Diagramme sollten als Ergänzung zur Tabelle dienen, sie nicht ersetzen.
Diagramme
Stab-/Säulendiagramm
Balkendiagramm
Kreisdiagramm
Linien-/kurvendiagramm
Angabe der rechteckhöhe
Liegen ungleiche klassenbreiten vor, so gibt die Höhe der Rechtecke keine Auskunft über die klassenhäufigkeiten, welche proportional zur Fläche der Rechtecke sind.
Die Angabe der rechteckhöhe rhj der Klasse j hängt davon ab, ob man absolute oder relative Häufigkeit verwendet
Relativ
rhj= fj / bj
Absolut
rhj= hj / bj
- histogramm kann falsch interpretiert werden wenn Klassen unterschiedlich Breit sind
Metrische Skala
Metrische Merkmale werden zwischen stetig und diskret unterschieden
Diskretes Merkmal kann wie ein ordinales Merkmal dargestellt werden
Häufigkeitsverteilungen Stetiger Merkmale werden mittels Histogramme veranschaulicht, zuvor muss klassenbildung erfolgen
Summenhäufigkeit
Die summenhäufigkeit einer merkmalsausprägung oder einer oberen Klassengrenze eines wenigstens ordinal messbaren merkmals ist die zugeordnete Häufigkeit aller Beobachtungswerte, die diese merkmalsausprägung bzw. diese Klassengrenze nicht überschreiten
Absolute summenhäufigkeit H ( x )
Hj = H ( xj ) = E ( j’ =1, j ) hj’
E= summenzeichen
Relative summenhäufigkeit
Fj= F (xj) = Hj / n = E ( j’ = 1, j) fj’