E: Korrelations und Regressionsanalyse Flashcards
Was sind Zufallskorrelationen?
hohe festgestellte Korrelationen können reine Zufallskorrelationen sein.
Für Bravais Pearson müssen die Merkmale kardinal skaliert sein.
Richtig.
Die empirische Kovarianz s(xy) beschreibt die gemeinsame Abweichung von x und y
Richtig. Dabei darf man die Kovarianz nicht kausal interpretieren.
Der Korrelationskoeffizient nach Br-P r ist eine dimensionslose Zahl.
Ja!
r=1 bedeutet einen Perfekten negativen Linearen Zusammenhang.
Falsch!
r= -1 ist ein perfekter neg. Linearer Zusammenhang.
r=1 ist ein perf. pos. lin. Zusammenhang
r=0 es fehlt jeglicher linearer Zusammenhang.
Sind x und y unabhängig, dann ist r = 0.
Ist r = 0 , dann sind x,y unabhängig.
Falsch. Ist r = 0, kann man nicht auf die Unabhängigkeit schließen, sondern nur wissen, dass ein linearer Zusammenhang fehlt.
Kann man lineare Transformationen auf B-P anwenden?
ja, er ist invariant gegenüber Transformationen.
Mit r können wir auch die Stärke des Zusammenhangs messen!
Ja, Richtung und Art des Zusammenhangs können nur durch sxy berechnet werden, Die Stärke dann mit r, da es dimensionslos ist.
Für Kendalls Tau müssen x und y nominal skaliert sein.
Falsch, sie müssen mind. ordinal skaliert sein.
Tau beschreibt die Linearität eines Zusammenhangs.
Falsch, tau gibt nur die monotonen Zusammenhänge an ( Rang), nicht jedoch die Linearität.
tau = 1 bedeutet, dass der Zusammenhang perfekt positiv ist.
Richtig. 1 = perfekt positiv
-1 = perfekt negativ
Wieviele es von einer Sorte gleich gibt, ist entscheidend beim korrigierten Tau. Nicht , ob es Ran 4, 5 oder 6 ist.
Ja richtig. gibt es bei x 4 mal die 2 ist die 4 entscheidend.
tx = 0,5 * ( 4 * (4-1) +…)
Partielle Korrelation bezüglich Kendall und Bravais-Pearson bedeutet, dass ich ein bestimmtes Merkmal auspartialisiere, um den Einfluss dieses Merkmals zu radieren.
Ja.
Will ich nur den Einfluss von x und y ,aber nicht von z , partialisiere ich Z aus.
Was schätzen wir bei der Regressionsanalyse?
Die Zielgröße Y in Abhängigkeit von der Einflussgröße X.
Wie müssen X und Y für eine Regression skaliert sein?
Kardinal.
Die lineare Einfachregression beschreibt die Schätzung in eine Richtung.
Richtig.
Kein Zusammenhang zwischen X und Y ist dann, wenn der Graph eine Grade, waagerechte Linie ist.
Ja. Y =17
bspw.
Wir können die Summe der Abweichungen von ^y eindeutig minimieren, indem wir die Methode der kleinsten Abweichungen benutzen
Falsch, dort gibt es kein eindeutiges Ergebnis. Nur bei der Methoder der kleinsten Quadrate ist es eindeutig.
Unsere Ausgleichsgrade schätzt was?
Die Zielgröße.
Wie zeichne ich die regressionsgrade?
mit den Punkten ( 0, a^) und (xquer und yquer)
Die Regressionsgerade kann man durch den gesamten Graphen zeichnen.
Falsch. Außerhalb des datengestützten Bereichs sind Schätzungen unzulässig und daher darf man nur dort eine Zeichen wo sie Daten hat.
Das Bestimmtheitsmaß R2 gibt an, wie schlecht die R.Grade die Zielgröße schätzt ( unter der Vorraussetzung ,dass der lineare Ansatz sinnvoll ist. )
Falsch, R2 gibt an, wie gut die Gerade die Zielgröße schätzt.
Ist R2 = 1, so schätzt die Gerade die Zielgröße so gut, dass y^ = yi
Richtig.
Ist R2 = 0, so schätzt die Gerade die Zielgröße so schlecht wie das arithmetische Mittel, also y^ = yquer
Richtig.
Die Residualanlayse prüft ob die R.Gerade die Zielgröße gut schätzt.
Falsch, die Residualanalyse prüft ob ein linearer Ansatz überhaupt sinnvoll ist.
Die Summe der Residuen ergibt 0.
Summe des Produkts von y^ * e^ ist 0.
Die Summe von xi * e^ ist 0.
Ja. Summe von e^ = 0, dann ist der lineare Ansatz sinnvoll.
Ist im Residuenplot ein linearer Ansatz erkennbar, ist der lineare Ansatz nicht richtig.
Richtig.
Was ist der Unterschied zwischen einer Regressions und einer Korrelationsanalyse?
R: stat Einheiten werden abhängig von X nach Y untersucht.
K: stat. Einheiten werden simultan nach 2 Merkmalen untersucht (X,Y)
Was für ein Problem gibt es bei der Regressionsanalyse?
Ist yi = y^ = yquer, so wird R2 gleich Null sein, denn es ist eine waagerechte Gerade.
r=0,8 bedeutet, dass in 80 von 100 Fällen die Werte der zwei betrachteten merkmale übereinstimmen.
Falsch
r ist eine dimensionslose Zahl
Richtig.
Innerhalb der Regressionsrechnung lässt sich mit Hilfe des Bestimmtheitsmaß untersuchen, ob der gewählte Ansatz ( bsp. linear) als erfüllt angesehen werden kann.
Falsch. Das macht die Residualanalyse.
r verändert nicht seinen Wert, falls man die Ausgangsdaten transformiert.
Richtig
Unter einem standardisierten Datensatz versteht man einen Datensatz , den man einer speziellen nicht- linearen Transformation unterzogen hat.
Falsch.
tau ist eine Maßzahl für die Stärke des linearen Zusammenhangs der betrachteten Rangreihen.
Falsch.
r kann nicht gleich dem Wert von R2 sein.
Falsch.
Bei der linearen Einfachregression bedeutet ein Wert von R2=0, dass Null Prozent der Gesamtabweichung in y -Richtung durch die lineare Regressionsfunktion erklärt werden, dh. es gilt y^ = yquer.
Richtig.
Eine Lineartransformation des einen oder des anderen Merkmals verändert den Wert von r.
Falsch
Bei der linearen Einfachregressionsanalyse verläft eine nach der Methode der kleinsten Quadrate bestimmte Regressionsgerade stets durch die Punkte ( xquer, y quer) und (0, b^)
Falsch. ( 0 und a^)