Deskriptive Statistik

Korrelation (Produkt-Moment-Korrelationskoeffizient)

Definition: Korrelation

  • Eine Korrelation wird definiert als der Zusammenhang zwischen verschiedenen Variablen.

Beispiele

  • Zusammenhang zwischen Körpergröße und Körpergewicht.
  • Zusammenhang zwischen Intelligenz und Schulleistung.
  • Zusammenhang zwischen Attraktivität und Berufserfolg.

grafische Darstellung: Streudiagramme

  • Grafisch dargestellt wird der Zusammenhang zwischen zwei Variablen in einem sogenannten Streudiagramm.
  • Ein Streudiagramm ist ein Koordinatensystem, welches eine x-Achse und eine y-Achse besitzt.
  • Auf der x-Achse werden nun die Werte der einen Variable, und auf die y-Achse die der anderen Variable abgetragen. (Welche Variable auf welcher Achse abgebildet wird kann dabei willkürlich entschieden werden.)
  • Auf diese Art und Weise entsteht ein bestimmtes Muster (eine sogenannte Punktewolke).

 

Korrelationsmuster

  • Der Zusammenhang zwischen zwei Variablen kann einerseits linear und andererseits kurvilinear sein.
  • Ein linearer Zusammenhang entspricht einer Geraden, ein kurvilinearer Zusammenhang entspricht der Form einer Kurve (z.B. U-förmig).

 

linearer Zusammenhang:

  • Ein linearer Zusammenhang kann bezüglich seiner Richtung entweder positiv oder negativ sein.
  • Bei positiven Zusammenhängen gehen hohe Werte der Variable A einher mit hohen Werten der Variable B (z.B. Körpergröße und Körpergewicht)
  • Bei negativen Zusammenhängen gehen hohe Werte der Variable A mit niedrigen Werten der Variable B einher (z.B. Arbeitszufriedenheit und Fehltage).

 

positiver Zusammenhang
positiver Zusammenhang
negativer Zusammenhang
negativer Zusammenhang
  • Die Stärke des Zusammenhangs zwischen den Variablen lässt sich im Streudiagramm daran erkennen, wie nah die einzelnen Punkte an der gedachten Geraden  liegen.
  • Wenn ein perfekter Zusammenhang besteht, dann liegen alle Punkte direkt auf der Geraden, und man spricht von sogenannten deterministischen Zusammenhängen.
  • In der Psychologie lassen sich solch perfekte Korrelationen jedoch so gut wie nie finden.
  • Hier treten vorrangig probabilistische (stochastische) Zusammenhänge auf.
  • Das Maß für die Stärke und Richtung eines Zusammenhangs ist der Korrelationskoeffizient.
  • Dieser kann Werte zwischen -1 und +1 aufweisen.
  • Das jeweilige Vorzeichen kennzeichnet dabei die Richtung  und der Betrag die Stärke des Zusammenhangs.
  • Ein perfekter Zusammenhang besteht demnach wenn der Korrelationskoeffizient den Wert (+/-)1 annimmt.
  • Kein Zusammenhang hingegen besteht wenn er den Wert 0 aufweist.
perfekter Zusammenhang: r = 1
perfekter Zusammenhang: r = 1
kein Zusammenhang: r = 0
kein Zusammenhang: r = 0

Nachteil des Korrelationskoeffizient

  • Ein Hauptproblem bei der Berechnung des Korrelationskoeffizienten besteht darin, das er sehr stark von extremen Werten (Ausreißern) verfälscht werden kann.
  • Deshalb ist es wichtig, sich stets das Streudiagramm anzuschauen, da sich die Ausreißer hier leicht erkennen lassen.
  • Ein weiteres Problem stellt die Einschränkung der Variabilität (z.B. die Beschränkung einer Stichprobe auf eine bestimmte Altersgruppe) dar. Dies führt dazu, dass viele Werte, die ein Merkmal annehmen könnte, nicht auftreten in der Stichprobe. Und dies wiederum hat zur Folge, dass der Korrelationskoeffizient sich verringert.
  • Ebenfalls problematisch ist die Zusammenfassung von heterogenen Untergruppen. Ein Beispiel wäre, wenn man in einer Stichprobe Männer und Frauen hat und den Korrelationskoeffizient für beide Gruppen gemeinsam berechnet, statt einmal für die Gruppe der Frauen und einmal für die Gruppe der Männer.

 

Voraussetzung für die Berechnung des Korrelationskoeffizienten

  • Um den Korrelationskoeffizient berechnen zu können, müssen beide Variablen intervallskaliert sein

Formel zur Berechnung des Korrelationskoeffizienten

Was beinhaltet die Formel:

  • Die obere Zeile (erste Formel) besagt, dass man als erstes die Abweichungswerte berechnet, d.h. für beide Variablen müssen für jede Person die Differenzen zwischen ihrem Messwert und dem Mittelwert bestimmt werden.
  • Bei niedrigen Messwerten sind die Abweichungswerte negativ, bei hohen Messwerten hingegen positiv.
  • Als nächstes bildet man das Produkt aus den beiden Abweichungswerten (man multipliziert sie also miteinander).
  • Das Produkt wird als "Kreuzprodukt" bezeichnet.
  • Im dritten Schritt werden die Kreuzprodukte aller Personen aufaddiert (Summenzeichen).
  • Die Summe der Kreuzprodukte werden "Produkt-Moment" genannt.
  • Das Produkt-Moment nimmt bei positiven Zusammenhängen positive Werte an und bei negativen Zusammenhängen ergeben sich negative Werte. Besteht kein Zusammenhang zwischen den Variablen, dann ergibt sich der Wert 0 für das Produkt-Moment.
  • Das Produkt-Moment darf an dieser Stelle jedoch nicht als Zusammenhangsmaß interpretiert und verwendet werden.
  • Der Grund hierfür ist, dass das Produkt-Moment abhängig ist von der Anzahl der Personen.
  • Deshalb wird im vierten Schritt das Produkt-Moment durch die Anzahl der Personen dividiert. Dadurch erhält man das durchschnittliche Kreuzprodukt (welches als Kovarianz bezeichnet wird - siehe zweite Formel).
  • Das Problem der Kovarianz ist, dass sie abhängig ist von den benutzten Maßeinheiten (Beispiel: kg und cm).
  • Deshalb wird im fünften Schritt die Kovarianz dividiert durch das Produkt der Standardabweichungen der beiden Variablen (untere Formel). Dadurch erhält man den Produkt-Moment-Korrelationskoeffizient, welcher als Zusammenhangsmaß geeignet ist. (obere Formel)

Cohen´s Konventionen

  • r = 0,1 : schwacher Zusammenhang
  • r = 0,3 : mittlerer Zusammenhang
  • r = 0,5 : starker Zusammenhang

Interpretation des Produkt-Moment-Korrelationskoeffizienten

  • Der größte Fehler der begangen werden kann bei der Interpretation ist, dass eine Kausalität angenommen wird, d.h. dass die eine Variable durch die andere beeinflusst wird.
  • Die Korrelation ist lediglich eine Voraussetzung die notwendig dafür ist, dass  die Schlussfolgerung, dass Variable A die Variable B beeinflusst wird, gezogen werden kann.