Methoden der Statistik SS23 Flashcards

1
Q

Wie erstellt man ein Stabdiagramm von relativer Häufigkeit?

A

plot (h.i)

Schöner:
plot(h.i,main=“Stabdiagramm Mathekenntnisse“,ylab = “rel. Häufigkeiten“ , xlab=“bescheiden<––Selbsteinschätzung——>sehr gut“)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie kann man zwei Gruppen miteinander vergleichen und graphisch darstellen?

A

zwei Variablen

Mit dem boxplot Befehl:

Beispiel:
#eine Variante
boxplot ( daten$BUDGET, horizontal=T)

boxplot(GRO~GESCHL, data=daten, horizontal=T)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

~ steht für?

A

Steht in R für die Gegenüberstellung bzw. den Vergleich zweier Variablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie kann man den Zusammenhang der Variablen anhand eines Streidiagramms darstellen?

A
  • Standardbefehl plot liefert bei Angabe von zwei Vektoren ein Streudiagramm
    Beispiel:
    #Variante 1
    plot (daten$flaeche,daten$miete,col= alpha (“ skyblue4“,0.2), pch=16)
    #Variante 2
    plot (flaeche, miete, data= daten, col= alpha (“skyblue4 “,o.2),pch=16)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie erstellt man ein Histogramm?

A

Daten einlesen

daten<–read.csv 2(“Umfrage.csv“)

hist(daten$GEW, freq=F, xlab=“Gewicht in kg“, ylab=“Häufigkeitsdichte “,main = “Histogramm“,breaks=20)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Mit welchem Zeichen findet die Zuordnung, Summe, Division, und Mulltiplikation im RStudio statt?

A

a<—2 a wird in Liste Wert 2 zugeordnet
b<– a+2 b wird a+2=4 zugeordnet
3/0 geteilt
2*3 mal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie erstellt man einen Vektor zahlen, der alle Zahlen 1 bis 5 enthält?

A

zahlen<–1:5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie erstellt man eine Häufigkeitstabelle mit n.i, h.i., F.i und ein Stabdiagramm?

A

Datensatz einlesen danach working Directory setzen

daten<–read.csv2(“Umfrage.csv“)

n.i<–table(daten$MATHE)
#rel.Häufigkeiten
h.i<–n.i/length (daten$MATHE)
#rel. kumulative Häufigkeiten
F.i cumsum (h.i)
htab<–cbind (n.i,h.i,F.i)
htab
plot (h.i , main = “Überschrift“,ylab=“rel.Häufigkeiten,xlab=“ bescheiden bis sehr gut“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie liest und listet man einen Datensatz?

A

daten<–read.csv2(“Umfrage.csv“)
str(daten) / head (daten)

Bedeutung: str (daten) Überblick welche Variablen
head(daten) erste 6 Zeilen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Diskrete und stetige Merkmale

A

Diskretes Merkmal: zwischen beliebigen Werten gibt es eine zählbare Anzahl der Werte , z.B. Anzahl der Bevölkerung, Alter

Stetiges Merkmal: Die Anzahl der Ausprägungen ist überabzählbar. D.h. alle Werte eines Intervalls sind möglich, z.B Temperatur in °C, °F.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Relative und kumulierte Häufigkeiten

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Zeichnen sie eine Häufigkeitstabelle

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Arithmetischer Mittel

A

-anfällig für Aussreisser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Transformationssatz

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quantile

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Spezielle Quantile

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Boxplot

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Arithmetisches Mittel

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Median

A

-nicht anfällig für Aussreiser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Eigenschaften arithmetischen Mittels

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Arithmetischer Mittel berechnen

A

-mithilfe des arithmetischen Mittels berechnet man den Durchschnitt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Berechnen Sie die Dezile aus dem vorliegenden Datensatz.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Für das Merkmal “Größe” ist anzunehmen, dass die Verteilung bei Frauen und Männern unterschiedlich ausfällt. Erzeugen Sie zwei neue Variablen “GROm” (für die Größe der Männer) und “GROf” (für die Größe der Frauen).

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wie groß sind die männlichen Vorlesungsbesucher im Durchschnitt? Berechnen Sie die durchschnittliche Größe anschließend für die weiblichen Studierenden aus der Veranstaltung.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Die Werte in der Variablen “GRO” haben die Einheit Zentimeter. Erzeugen Sie eine neue Variable “GROmeter”, in der die Größe in Metern gespeichert ist.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Wie viele Telefonate hat der Nutzer geführt? Wie lange haben das längste bzw. das kürzeste Gespräch gedauert?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

1)Berechnung der durchschnittlichen absoluten Abweichung
2) Berechnung der Varianz
3) Berechnung der Standardabweichung

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

d) Berechnen Sie die Standardabweichung der Gesprächsdauer. Kennen Sie andere Streuungs- maße? Berechnen Sie zwei davon.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Üblicherweise sind die Tarife für Auslandsgespräche höher als für Inlandsgespräche. Erzeugen Sie zwei neue Variablen “bin” (Abkürzung für “Betrag und Inland”) und “baus” (Abkürzung für “Betrag und Ausland”).

31
Q

Vergleichen Sie die Mittelwerte und die Standardabweichungen der Kosten für Inlands- und Auslandsgespräche

32
Q

Streuungsparameter

33
Q

Metrische Skala

34
Q

Ordinalskala

35
Q

Nominalskala

36
Q

Stabdiagramm mit rel. Wahrscheinlichkeit und empirische Verteilungsfunktion nebeneinander

37
Q

Statistisches Merkmal

38
Q

Empirische Verteilungsfunktion

39
Q

Wie erzeugt man eine empirische Verteilungsfunktion?

40
Q

Berechnen des Medians ungerade

41
Q

Berechnen des Medians Gerade

42
Q

Frage: Besteht ein Zusammenhang zwischen Wohnsituation der Studierenden und Geschlecht

43
Q

Kontingenztafel

44
Q

Kontingenztafel mit relativen Häugkeiten:

45
Q

Zusammenhangsmaÿe für metrisch skalierte Merkmale

46
Q

Bivariante Häufigkeitsverteilungen

47
Q

Zusammenhänge Kovarianz

48
Q

Empirische Kovarianz

A
  • Zusammenhangsmass zweier Variablen
  • Anzahl der Beobachtungen
  • n Anzahl Beobachtungen
  • x Strich und y Strich sind die jeweiligen arithmetischem Mittel
49
Q

Empirische Kovarianz im Rstudio

50
Q

Empirischer Korellationskoeffizient

51
Q

a) Importieren Sie den Datensatz UmfrageWiSe2223.csv in ein neues R-Skript.

52
Q

Berechnen Sie die Kovarianz

53
Q

Korrelationskoeffizient nach Pearson

A

-bestimmt Zusammenhang zweier Variablen
-Pearson-Korrelationskoeffizient r
r E (-1;+1)
1: perfekt positiver Zusammenhang
-1:perfekt negativer Zusammenhang
r=kein „linearer“ Zusammenhang
TIPP: Tabellenschreibweise sehr hilfreich

54
Q

Korrelationskoeffizient nach Spearman

A
  • gut für ordinal und Kardinal skalierte Variable
    -Zusammenhang zwischen Variablen
    -Interpretation ähnlich zu Pearson
55
Q

Scheinkorrelation

56
Q

Ergebnismenge E eines Zufallsexperiments

57
Q

Mengenoperation

58
Q

Mengenoperation

59
Q

Mengenoperation

60
Q

Folgerungen aus den Axiomen 1 bis 3

61
Q

Konstruktion von Wahrscheinlichkeiten

62
Q

Fall a) Konstruktion von Wahrscheinlichkeitsmaÿen

63
Q

Fall b) Konstruktion von Wahrscheinlichkeitsmaÿen

64
Q

Fall c) Konstruktion von Wahrscheinlichkeitsmaÿen

66
Q

Bedingte Wahrscheinlichkeit

67
Q

Satz von Bayes

68
Q

Disjunkte Vereinigungsmenge

A

Vereinigungsmenge ohne Schnittmenge

69
Q

Satz der totalen Wahrscheinlichkeit

70
Q

Stochastische Unabhängigkeit von Ereignissen

71
Q

Zufallszahlen R Studio

72
Q

Zufallsvariablen

73
Q

Diskret und stetige Zufallsvariablen