Inferenzstatistik

Nominalskalierte Daten

  • Der t-Test, die Varianzanalyse und die Kontrastanalyse sind allesamt Verfahren die darauf abzielen Unterschiede zwischen Mittelwerten auf Signifikanz zu testen.
  • Um Mittelwerte jedoch sinnvoll berechnen zu können muss mindestens ein Intervallskalenniveau bei den Daten vorliegen.
  • Das wiederum bedeutet, dass die abhängige Variable (AV) immer ein quantitatives Merkmal ist.
  • In der Forschung kann es jedoch auch vorkommen, dass Daten erhoben werden, die ein geringeres Skalenniveau (Nominal- oder Ordinalskalenniveau) aufweisen.
  • In diesem Fall werden demzufolge qualitative Unterschiede zwischen verschiedenen Personen erfasst und die Berechnung eines Mittelwertes ist nicht mehr sinnvoll.
  • Um diese Daten trotzdem auswerten zu können, bestimmt man die Häufigkeiten, mit denen die unterschiedlichen Ausprägungen eines bestimmten Merkmals auftreten.
  • Ein geeigneter Signifikanztest ist hierbei der Chi-Quadrat-Test.

 

Beispiel:

  • Sind psychische Störungen unter Kunststudierenden häufiger als unter Studierenden anderer Fachrichtungen?
  • Nennen Frauen häufiger als Männer "Familienplanung" als wichtigstes Lebensziel?

Voraussetzungen für Chi-Quadrat-Tests

  • Jeder Person muss eindeutig eine bestimmte Merkmalsausprägung zuzuordnen sein.
  • Außerdem dürfen die Beobachtungen nicht voneinander abhängig sein.

Anpassungstest bei 1 Variable: Chi-Quadrat

Was soll mit dem Chi-Quadrat-Test geprüft werden?

  • Mit diesem Test soll geprüft werden, ob die beobachtete Häufigkeitsverteilung einer Stichprobe signifikant von derjenigen Häufigkeitsverteilung abweicht, die man in der Population vermutet.
  • Die Nullhypothese entspircht hierbei der angenommenen Häufigkeitsverteilung in der Population.
  • Beispiel für eine Nullhypothese wäre: Alle Ausprägungen der untersuchten Variable treten in der Population gleich häufig auf.
  • Chi-Quadrat testet immer gegen die Nullhypothese.
  • Die Alternativhypothese ist in diesem Verfahren grundsätzlich eine Omnibus-Hypothese.

Berechnung

Was beinhaltet die Formel:

  • hb ist die beobachtete Häufigkeit des Ereignisses 
  • he ist die erwartete Häufigkeit des Ereignisses (sie wird folgendermaßen berechnet: (Zeilenhäufigkeit * Spaltenhäufigkeit) / N)
  • Als erstes muss laut Formel also immer die Differenz zwischen der beobachteten und der erwarteten Häufigkeit für jede Merkmalsausprägung ermittelt und quadriert werden (quadrierte Abweichung).
  • Anschließend wird die quadrierte Abweichung durch die erwartete Häufigkeit dividiert, was einer Standardisierung entspricht, d.h. die quadrierten Anweichungen werden vergleichbar gemacht indem sie nach ihrer Bedeutsamkeit gewichtet werden.
  • Als nächstes müssen die quadrierten und standardisierten Abweichungen aufaddiert werden.
  • Chi-Quadrat wird umso größer, je größer die Abweichungen zwischen erwarteten und beobachteten Häufigkeiten sind.
  • Stimmt die beobachtete Häufigkeit perfekt mit der erwarteten überein erhalten wir einen Chi-Quadrat-Wert von 0.
  • Als letztes muss der entsprechende p-Wert bestimmt werden, wozu wir jedoch die Chi-Quadrat-Verteilung benötigen.

 

Chi-Quadrat-Verteilung

Chi-Quadrat-Verteilung
Chi-Quadrat-Verteilung
  • Die Chi-Quadrat-Werte folgen einer Stichprobenverteilung (Chi-Quadrat-Verteilung) die von der Anzahl der Freiheitsgrade abhängt.
  • Ist eine Stichprobengröße N gegeben, ergeben sich aus der Anzahl der Häufigkeiten die frei variieren können, die Freiheitsgrade.
  • Die Formel zur Berechnung der Freiheitsgrade lautet: df = k - 1 (k = Merkmalsausprägungen).
  • Beispiel: N = 300, und es gibt 4 Merkmalsausprägungen , df = 4 - 1 = 3.
  • Die Chi-Quadrat-Verteilung ist immer rechtsschief, was daran liegt, dass der Chi-Quadrat zwar beliebig große Werte annehmen kann, aber auf der anderen Seite keine Werte die kleiner als 0 sind.
  • Chi-Quadrat-Werte können auch niemals negativ werden, weil der Zähler quadriert wird, und der Nenner keine negativen Häufigkeiten aufweisen kann.

Interpretation

  • Ist der p-Wert kleiner oder gleich Alpha (Signifikanzkriterium), erhalten wir ein signifikantes Ergebnis und müssen die Alternativhypothese annehmen.
  • Ist der p-Wert größer als Alpha, ist unser Ergebnis nicht signifikant und wir nehmen die Nullhypothese an.

Effektgrößen

  • Ein Problem bei der Berechnung von Chi-Quadrat ist, dass es bei steigender Stichprobengröße immer größer wird.
  • Deshalb ist es wichtig, zusätzlich die Effektgrößen zu berechnen, welche unabhängig von der Stichprobengröße sind, um Effekte verschiedener Studien miteinander vergleichen zu können.
  • Die Effektgröße bei Chi-Quadrat-Verfahren ist klein Omega (ω).
  • Die Formel ist ähnlich wie die Formel zur Berechnung des Chi-Quadrat-Wertes, nur dass man anstelle der absoluten Häufigkeiten (beobachtet und erwartet) die relativen Häufigkeiten betrachtet.
Konventionen
kleiner Effekt

ω

= .1
mittlerer Effekt

ω

= .3
großer Effekt

ω

= .5

Unabhängigkeitstest: Chi-Quadrat-Test für 2 Variablen (Kreuztabellen)

  • Wenn man zwei verschiedene nominalskalierte Variablen erhoben hat (z.B. Religionszugehörigkeit und Lieblingsfarbe), erhält man in der Analyse die Häufigkeiten der einzelnen Kombinationen der Ausprägungen beider Variablen.
  • Diese können sehr übersichtlich in sogenannten Kreuztabellen dargestellt werden.
 
Blau (B)  
Rot (R)          Grün (G)       
Evangelisch (E)
 BE
RE GE
Katholisch (K) BK RK GK
Atheist (A) BA RA GA
  • Genau wie beim Chi-Quadrat-Test für 1 Variable können wir nun prüfen, ob die beobachteten Häufigkeiten (der Merkmalskombinationen) in meiner Stichprobe von der erwarteten Häufigkeitsverteilung in der Population abweichen.
  • Die erwartete Häufigkeitsverteilung entspricht auch hierbei der Nullhypothese.
  • Beispiel Nullhypothese: Die Variablen Lieblingsfarbe und Religionszugehörigkeit hängen in der Population nicht zusammen.

 

Berechnung

  • Genau wie bei der Berechnung des Chi-Quadrat-Werts für 1 Variable werden die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten in jeder Zelle erst quadriert und anschließend durch die erwarteten Häufigkeiten dividiert.
  • Die somit erhaltenen Ergebnisse müssen dann noch über alle Zellen aufaddiert werden, dadurch erhalten wir den Chi-Quadrat-Wert.
  • Durch diese zusätzliche Aufaddierung erhalten wir demnach 2 Summenzeichen in unserer Formel, d.h. wir müssen alle Zellen in allen Zeilen und allen Spalten erfassen.

Interpretation Chi-Quadrat-Wert

  • Der Chi-Quadrat-Wert wird 1 wenn wir eine perfekte Übereinstimmung zwischen beobachteten und erwarteten Häufigkeiten vorliegen haben.
  • Und er wird umso größer, je größer die Abweichung zwischen beobachteten und erwarteten Häufigkeiten ist.

Signifikanzprüfung

  • Die Bestimmung der Freiheitsgrade erfolgt durch die Formel:
  • df = (k - 1) * (m - 1)
  • k = Ausprägung Merkmal A
  • m = Ausprägung Merkmal B.
  • In Abhängigkeit der Freiheitsgrade kann nun der kritische Chi-Quadrat-Wert bestimmt werden (hierfür gibt es spezielle tabellen die in jedem guten Statistikbuch zu finden sind).
  • Ist der gefundene Chi-Quadrat-Wert größer als der kritische dann ist unser Ergebnis signifikant  und wir müssen die Nullhypothese zurückweisen.
  • Ist der gefundene Chi-Quadrat-Wert kleiner als der kritische Chi-Quadrat-Wert, dann ist unser Ergebnis nicht signifikant und wir nehmen die Nullhypothese an.

Effektgröße

  • Siehe Effektgröße für Chi-Quadrat-Test mit 1 Variable.

2 dichotome nominalskalierte Variablen : Vierfeldertafel

  • Ein Spezialfall der Kreuztabelle ist die Vierfeldertafel.
  • Sie entsteht wenn man dichotome Variablen betrachtet.
Psychologiestudent
ja nein

Matheaufgabe

gelöst

ja
nein     

Effektgröße

  • Die Effektgröße die im Fall von 2 dichotomen Variablen verwendet werden kann ist der Phi-Koeffizient.

 

 

Quellen:

 

Bortz, J., Lienert, G.A. & Böhnke, K. (2000). Verteilungsfreie Methoden der Biostatistik. Berlin: Springer Verlag.

 

 

Sedlmeier, P. & Renkewitz, F. (2008). Forschungsmethoden und Statistik in der Psychologie.München: Pearson Studium.

 

 

 

 

Bildquellen:

 

http://www.ulrich-rapp.de/stoff/statistik/CHI-Quadrat-Verteilungen.png