Statistik Flashcards
Wozu benutzt man die einfaktorielle ANOVA?
Um Mittelwertsunterschiede bei einem Faktor mit p Stufen zwischen zwei oder mehr Gruppen zu untersuchen
Wozu benutzt man die zweifaktorielle ANOVA?
um Mittelwertsunterschiede zwischen mind. 2 Gruppen herauszufinden. Hier gibt es aber zwei UVn (Geschlecht, Fleisch), die die AV beeinflussen
Wie berechnet man den empirischen F-Wert?
geschätzte Treatmentvarianz (𝜎̂𝐴²) / Fehlerquadratsumme (𝜎̂² 𝐹𝑒ℎ𝑙𝑒r)
Fleisch/Peter
Wozu berechne ich die Quadratsummen?
aus QS kann ich die Varianz schätzen (Summe der quadrierten Abweichungen vom Mittelwert Summe aus (xi - x quer)²)
daraus kann ich dann den F-Wert emp berechnen, diesen mit F krit (TAB) vergleichen
Was sind die Voraussetzungen für eine ANOVA?
- Normalverteilung
- Unabhängigkeit
- Varianzhomogenität
d. Stichproben
Wie wird vom F-Wert aus die Signifikanz geprüft?
der empirische F Wert wird mit dem kritischen F Wert verglichen, wenn dieser größer ist, wird die H1 angenommen
Wie viele Hypothesen stellt man bei einer einfaktoriellen ANOVA auf?
zwei
Nullhypothese und Alternativhypothese
Wie viele Hypothesen stellt man bei einer zweifaktoriellen ANOVA auf?
sechs:
Faktor 1: H0 & H1
Faktor 2: H0 & H1
Interaktion 1& 2: H0 & H1
Varianz = Streuungsmaß
Streeung = Standardabweichung (s)
s² = Varianz
Arten von Verteilungen
Normalverteilung
o Symmetrisch um 0
o Glockenförmig
o Median, Modus und Mittelwert gleich
o Charakterisiert durch MW und Standardabweichung
o 68% der Daten liegen innerhalb einer Standardabweichung um den Mittelwert
o Definitionsbereich: -∞ bis +∞
Standardnormalverteilung
o Spezielle Form der Normalverteilung
o MW = 0 Standardabweichung = 1
o Zur Berechnung von Wahrscheinlichkeiten
o Z-Werte, um SNV zu interpretieren
o Definitionsbereich: -∞ bis +∞
Binomialverteilung
o Diskrete Verteilung, die die Anzahl der Erfolge in einer festen Anzahl von unabhängigen Bernoulli-Versuchen beschreibt
o Charakterisiert durch die Wahrscheinlichkeit eines Erfolgs (p) und die Anzahl der Versuche (n)
o Die Wahrscheinlichkeitsfunktion gibt die Wahrscheinlichkeit an, dass k Erfolge auftreten
o Definitionsbereich: 0 bis zur Anzahl der Versuche (n)
T-Verteilung
o Symmetrische Verteilung, ähnlich der Normalverteilung, jedoch mit schwereren Schwänzen
o bei kleinen SP & unbekannter Standardabweichung der GG
o Abhängig von den Freiheitsgraden, wobei größere Freiheitsgrade zu einer Annäherung an die Normalverteilung führen
o Definitionsbereich: -∞ bis +∞
F-Verteilung
o rechtssteil
o Varianzanalyse
o Vergleicht die Varianzen zwischen verschiedenen Gruppen
o Charakterisiert durch zwei Freiheitsgrade, die die Anzahl der Gruppen und die Anzahl der Beobachtungen in jeder Gruppe angeben
o Definitionsbereich: 0 bis +∞
U-Verteilung
o Kontinuierliche Verteilung
o Symmetrisch und flach
o Rangordnungsstatistik
o Beschreibt die Verteilung der Rangsummen in unabhängigen Stichprobenvergleichen
o Definitionsbereich: 0 bis 1
Chi² Verteilung
o Rechtsschief
o Abhängig von Freiheitsgraden, wobei größere Freiheitsgrade zu einer Annäherung an die Normalverteilung führen
o Die Wahrscheinlichkeitsfunktion gibt die Wahrscheinlichkeit an, dass eine bestimmte Summe von quadratischen Abweichungen auftritt
o Definitionsbereich: 0 bis +∞
Welches Skalenniveau haben UVn und AV bei der 2-F-ANOVA?
UVn min.nominal
AV intervallskaliert
Eigenschaften von Interaktionen
- Zeigen sich grafisch durch nicht parallele MW-Linien
- geht über rein additiven Haupteffekt hinaus
- positiv oder negativ - Bsp. Mentos + Cola macht mehr CO² oder Alkohol + Schlafmittel wirkt zusammen stärker oder hebt sich auf, Interaktion von beiden
- Nicht direkt beobachtbar, müssen erschlossen werden
- Diagramme werden bei signifikanter Interaktion gezeichnet
- wenn nicht signifikant = parallele Linien = keine Interaktion
Klassifikation von Interaktionen
- Odrinal
o 2x kreuzen sich nicht - Semidisordinal/hybrid
o 1x kreuzen, 1x nicht
o A bzw. b kann unabhängig von a bzw. b interpretiert werden - Disordinal
o 2x kreuzen
o Kein Faktor kann unabhängig vom anderen interpretiert werden, da Interaktion
Die Ladung einer Variable auf einem Faktor entspricht bei unkorrelierten Faktoren der Korrelation (r) zw. Var und Faktor
richtig
Wie berechnet man die Kommunalität und was sagt sie aus?
h² = Zeilensumme der quadrierten Ladungen (erst ² dann Summe)
Gibt an, welcher Varainzanteil der Variable durch alle Faktoren insg. erklärt wird
Wie berechnet man Eigenwerte und was sagen sie aus?
Spaltensumme der quadrierten Ladungen (erst ² dann Summe)
Geben an, wie viel Varianz ein Faktor erklärt,a lso wie relevant (Kaiser Guttman: Eigenwerte > 1)
Warum macht man eine Rotation der Faktoren und was entsteht dadurch?
um eine Einfachstruktur zu erhalten, die besser interpretierbar ist
eindeutigere Zuordnung der Ladungen zu den Faktoren
Durch Rotation werden große Ladungen größer und kleinere kleiner
Was ändert sich durch die Rotation und was bleibt gleich?
Es ändert sich die Aufteilung der erklärten Varianz auf die Faktoren und somit auch die Eigenwerte
Die Kommunalitäten und die Summe der Eigenwerte (insg. erklärte Varianz) bleibt gleich
Wann rechnen wir einen U-Test?
Nicht parametrisches Verfahren, als Alternative zum Student t-test, wenn Verteilung nicht bekannt (= verteilungsfreie SP)
Was misst der U-Test?
Misst ob sich zwei unabhängige Gruppen hinsichtlich ihrer zentralen Tendenz (Modus, Median, MW) unterscheiden.