Inferenzstatistik

F-Test in der einfaktoriellen Varianzanalyse

Warum nicht mehrere t-Tests rechnen?

  • Anhand von Signifikanztests kann die Frage geklärt werden, ob die beobachteten Unterschiede zwischen Stichproben auch in den entsprechenden Populationen vorkommen.
  • Wenn man zwei verschiedene Stichproben (Populationen) testet, verwendet man in der Regel den sogenannten t-Test.
  • Hat man jedoch mehr als zwei Stichproben verwendet man den F-Test der Varianzanalyse.
  • Das liegt darin begründet, dass wenn man mehrere t-Tests rechnen würde, sich auch die Wahrscheinlichkeit einer Fehlentscheidung erhöhen würde, weil der Alpha-Fehler kumuliert (aufaddiert) werden würde.

Zentrale Fragestellung der Varianzanalyse

  • Die zentrale Fragestellung der Varianzanalyse ist, ob sich zwei oder mehr Gruppenmittelwerte signifikant voneinander unterscheiden.
  • Somit untersucht die Varianzanalyse die Wirkung von einer oder mehreren unabhängigen Variablen auf eine abhängige Variable.
  • Hat man eine unabhängige Variable (UV) spricht man von einer einfaktoriellen Varianzanalyse.
  • Hat man zwei UVs spricht man von einer zweifaktoriellen Varianzanalyse.
  • Hat man mehr als 2 UVs wird von einer mehrfaktoriellen Varianzanalyse gesprochen.
  • Die unabhängige Variable hat hierbei Nominalskalenniveau.
  • Die abhängige Variable (AV) muss ein metrisches Skalenniveau aufweisen.

Grundidee des F-Tests

  • Die Grundidee des F-Tests ist, dass die gesamte Varianz der abhängigen Variable aufgeteilt wird in:
  1. die Varianz zwischen den Gruppen (hierbei spricht man auch von systematischer Varianz)
  2. und in die Varianz innerhalb der Gruppen (=Fehlervarianz, unsystematische Varianz).
  • Der F-Test drückt demnach ein Varianzverhältnis aus:
  • systematische Varianz / Fehlervarianz.
systematische Varianz

 

Hierbei handelt es sich um die Abweichung der Gruppenmittelwerte vom Gesamtmittelwert (alle Gruppen)

 

Fehlervarianz

 

Hierbei handelt es sich um die Abweichung der einzelnen Messwerte innerhalb der einzelnen Gruppen vom jeweiligen Gruppenmittelwert

 

  • Die Varianz innerhalb einer Gruppe sollte hierbei möglichst gering sein,
  • und die Varianz zwischen den Gruppen sollte so groß wie möglich sein.

Berechnung des F-Tests

Varianz zwischen den Gruppen
Varianz zwischen den Gruppen

 

 

  • Das SS steht für "sum of squares" was übersetzt soviel bedeutet wie : Summe der Abweichungsquadrate.
  • k = Anzahl der Faktorstufen
  • j = Faktorstufe
  • nj = Anzahl der Messwerte in Gruppe j (in einer Faktorstufe)
  •  ȳ = Gesamtmittelwert
  • ȳj = Mittelwert der Gruppe ( Faktorstufe) j


  • Wenn man nun davon ausgeht, dass keine Unterschiede zwischen den verschiedenen Gruppen bestehen, dann müssten die Stichprobenmittelwerte gleich dem Gesamtmittelwert (Mittelwert über alle Gruppen) sein.
Varianz innerhalb Gruppen
Varianz innerhalb Gruppen
  • k = Anzahl der Gruppen
  • nj = Anzahl der Messwerte in Gruppe j (in einer Faktorstufe)
  • yj,i = Merkmalsausprägung der i-ten Person in der Faktorstufe j
  • ȳj = Mittelwert der Faktorstufe j
  • Der F-Test wird also berechnet, indem man die Varianz zwischen den Gruppen, geteilt durch die Freiheitsgrade zwischen den Gruppen, dividiert durch
  • die Varianz innerhalb der Gruppen, geteilt durch die Freiheitsgrade innerhalb der Gruppen.

Exkurs : Freiheitsgrade

  • Wie genau Stichprobenwerte Populationsparameter schätzen hängt von den Freiheitsgraden ab.
  • Die Freiheitsgrade (df = degree of freedom) werden berechnet indem von der Gesamtanzahl der Messwerte (N) die Anzahl der Gruppen (k) subtrahiert wird.

Voraussetzungen des F-Tests

  • Die Gruppen müssen eine Normalverteilung aufweisen.
  • Die Stichproben müssen unabhängig voneinander sein.
  • Und es muss Varianzenhomogenität bestehen, d.h. die Stichproben müssen aus der gleichen Population stammen.

Interpretation

  • Der Wert den wir bei der Berechnung des F-Tests erhalten ist der F-Wert.
  • Die Frage die sich jedoch stellt ist, wie groß der F-Wert sein muss, um sagen zu können, dass das Ergebnis nicht durch Zufall zustande gekommen ist.
  • Diese Frage kann durch die F-Verteilung beantwortet werden, welche angibt, wie wahrscheinlich verschiedene F-Werte auftreten, wenn die Nullhypothese gilt.
  • Diese Wahrscheinlichkeit entspricht dem p-Wert.
  • Unser Ergebnis ist dann signifikant, wenn der F-Wert kleiner oder gleich Alpha ist.
  • In diesem Fall müssen wir die Nullhypothese zurückweisen und die Alternativhypothese annehmen.
  • Ist der F-Wert hingegen größer als unser Alpha, dann handelt es sich um ein nicht-signifikantes Ergebnis und wir können die Nullhypothese annehmen.

Effektgrößen der einfaktoriellen Varianzanalyse

  • Die Effektgrößen d, g und r können nur bei 2 Gruppen verwendet werden.
  • Die Effektgröße in der Varianzanalyse ist Eta-Quadrat (η2)
  • Die Formel zur Berechnung lautet:
  • SS (gesamt ) = SS (b) + SS (w)
  • Eta-Quadrat kann Werte zwischen 0 und 1 annehmen.
  • Wenn die Effektgröße den Wert 0 annimmt, dann bedeutet dies, dass sich die Mittelwerte der unterschiedlichen Gruppen nicht voneinander unterscheiden. Demzufolge gehen die Gesamtvariationen in den Daten nur auf die Unterschiede innerhalb der einzelnen Gruppen zurück.
  • Nimmt die Effektgröße den Wert 1 an, so bedeutet dies, dass die Gruppenmittelwerte sich unterscheiden, die Messwerte innerhalb jeder Gruppe aber identisch sind.
Konventionen 
kleiner Effekt
η2 = 0,01
mittlerer Effekt
η2 = 0,06
großer Effekt η2 = 0,14

 

 

Quellen:

 

Sedlmeier, P. & Renkewitz, F. (2008). Forschungsmethoden und Statistik in der Psychologie.München: Pearson Studium.