MCfragen 1- 25 Flashcards
- Der Mittelwert ergibt sich aus einer Untersuchung aus dem Produkt von Median und Varianz.
> > falsch
• Der Mittelwert wird berechnet, indem man alle Daten addiert und durch ihre Anzahl teilt. • Um die Varianz zu berechnen braucht man den Mittelwert.
• Mittelwert und Varianz werden zusammen berichtet, da sie alleine keine gute Info liefern. • Median ist ein anderes Maß der zentralen Tendenz. Dafür nimmt man Wert in der Mitte
• der Median wird immer gemeinsam mit dem Interquartilbereich berichtet
• die Varianz oder Streuung und der Interquartilbereich sind Streuungsmaße
• Streuungsmaße geben an, wie weit Verteilung auseinander geht (wie sehr Werte streuen)
- Die zentrale Tendenz kategorischer Daten, wie zum Beispiel Größe, Gewicht und Zeit, kann zum Beispiel durch die Berechnung des Mittelwerts angegeben werden.
> > falsch
• kategorische Daten sind qualitative Eigenschaften also Augenfarbe, Geschlecht, etc.
• Größe, Gewicht & Zeit sind quantitative Daten
• bei kategorischen/qualitativen Daten nimmt man den Median oder Modalwert
• bei numerischen/quantitativen Daten nimmt man den Modal-, Median oder Mittelwert
- Durch die Skaleneigenschaft der Varianz ist es möglich, dass die Umrechnung aller Messwerte in eine andere Einheit, zum Beispiel Meter in Kilometer, die Varianz aller Messwerte lediglich um das Dreifache der Umrechnungseinheit erhöht.
> > falsch
• wenn man alle Werte mit demselben Faktor multipliziert (also z.B. um aus Metern Kilometer zu machen), ergibt das eine ver-b2−fachung der Varianz (das bedeutet, man muss die Varianz mit dem Faktor hoch 2 multiplizieren)
- Die Varianz ist nur dann gleich Null, wenn alle Messwerte genau gleich sind.
> > richtig
• Varianz ist die quadratische Abweichung (Distanz) aller Messwerte von ihrem Mittelwert • wenn alle Werte gleich sind, ist Mittelwert auch derselbe und es gibt keine Abweichung
- Die Berechnung des Medians erfordert mindestens rangordbare Daten.
> > richtig
• Der Median ist immer der Wert in der Mitte einer Reihe
• damit man eine Reihe erstellen kann, müssen die Daten rangordbar sein
• das geht z.B. bei numerischen Daten (Gewicht) oder bei ordinalen kategorischen Daten
(Gefahrenstufen, Schulnoten)
• aber nicht bei anderen kategorischen Daten, wie Augenfarbe oder Geschlecht
• bei einer ungeraden Anzahl von Werten ist der Median der Wert in der Mitte
• bei einer geraden Anzahl, ist Median der Mittelwert von den beiden Werten in der Mitte
- Mithilfe der aus einer Stichprobe gewonnenen deskriptiven Statistik  schätzen wir den Mittelwert der Grundgesamtheit.
> > richtig
•  = Mittelwert der Stichprobe, μ = Mittelwert der Grundgesamtheit
• von  schließt man auf μ und von der Streuung der Stichprobe s auf die wahre Streuung σ
- Der Schätzfehler hängt von dem Umfang der betrachteten Stichprobe und dem häufigsten einzelnen Wert, dem Modalwert, der Verteilung ab.
> > falsch
• der Schätzfehler passiert beim Schließen von  auf μ (Schätzung mit Unsicherheit belastet) • Schätzfehler wird im Mittel umso größer,…
1. je kleiner unsere Stichprobe (also n) ist
2. je größer die Streuung σ des Merkmals in Grundgesamtheit ist (je mehr Größe variiert) • um von  auf μ schließen zu können, ist es entscheidend, dass die Auswahl der
Versuchspersonen zufällig (randomisiert) erfolgte
- Die numerischen Werte der Streuung variieren zwischen -1 und +1.
> > falsch
• die Streuung kann niemals negativ (also kleiner als Null) sein
• sie kann unendlich groß werden, je nach der Distanz der Messwerte von ihrem Mittelwert
- Sind die Randhäufigkeiten ausreichend groß, kann eine Wahrscheinlichkeit auch negative Werte annehmen.
> > falsch
• Wahrscheinlichkeit p bewegt sich immer nur zwischen 0 und 1 (also 0% und 100%)
• die Größe der Randhäufigkeiten an sich ist nicht relevant für die Wahrscheinlichkeit • es geht nur um die Beziehung der Randhäufigkeiten zueinander: also dass z.B. 70 von
insgesamt 100 Münzwürfen Zahl ergabenp = .70
- Unter der bedingten Wahrscheinlichkeit p(a|b) versteht man die Wahrscheinlichkeit des Eintretens eines Ereignisses b unter der Bedingung, dass ein Ergebnis a bereits eingetreten ist.
> > falsch
• genau andersherum: das hintere ist immer bereits eingetreten, also gegeben (b)
• es müsste heißen: die bedingte Wahrscheinlichkeit a gegeben b, ist die Wahrscheinlichkeit
des Eintretens eines Ereignisses a, unter der Bedingung, dass Ergebnis b bereits eingetreten
- Die Wahrscheinlichkeit p (rot|BMW) gibt die relative Häufigkeit roter BMWs im Verhältnis zu allen BMWs an.
> > richtig
• es ist sozusagen die bedingte Wahrscheinlichkeit dafür, dass das Auto rot ist, unter der
gegebenen Bedingung, dass das Auto ein BMW ist.
• p (rot|BMW) wäre die relative Häufigkeit roter BMWs im Verhältnis zu allen roten Autos • die Reihenfolge ist also sehr wichtig!
- σ2 gibt die Varianz in einer Stichprobe an.
> > falsch
• griechische Buchstaben beziehen sich immer auf die Grundgesamtheit (σ, σ2, μ) • für die Stichprobe verwendet man „normale“ Buchstaben (s, s2, xstrich  )
- Durch z-Transformation kann jede beliebige Normalverteilung in eine Binomialverteilung überführt werden.
> > falsch
• Durch z-Transformation kann jede beliebige Normalverteilung in eine Standardnormal-
verteilung (mit dem Mittelwert 0 und der Streuung 1) überführt werden
• durch Approximation kann man aus einer Binomialverteilung eine Normalverteilung
machen (Wahrscheinlichkeit ist dann der Mittelwert und die Streuung wird übernommen)
- Die Binomialverteilung gibt an, wie wahrscheinlich es ist, dass bei n unabhängigen Versuchen das gesuchte Ereignis mit der Wahrscheinlichkeit p genau k-mal auftritt.
> > richtig
• sie würde also z.B. die Wahrscheinlichkeit dafür angeben, dass bei 100 (n) unabhängigen
Versuchen genau 26 Mal (k) Zahl (das gesuchte Ereignis) geworfen wird
- Aus korrelativen Studien können kausale Schlüsse gezogen werden.
> > falsch
• aus korrelativen Studien können niemals kausale Schlüsse gezogen werden , da man die
Wirkrichtung oder weitere beeinflussende Variable (Covariate) nicht kennt
• aus experimentellen Studien kann man nur kausale Schlüsse ziehen, wenn die Untersu-
chungseinheiten den Stufen der unabhängigen Variable randomisiert zugeordnet wurden