Inferenzstatistik

Der Bootstrap

Grundidee

  • Die 2 am häufigsten angewendeten Verfahren der klassischen Inferenzstatistik sind die:
  1. Konfidenzintervalle
  2. und die Signifikanztests.
  • Danaben gibt es noch weitere Ansätze, die jedoch noch relativ unbekannt sind, z.B.:
  1. Der Bootstrap
  2. und die Bayes-Statistik.
  • Beim Bootstrap versucht man Populationsparameter zu schätzen, indem man wiederholt Stichproben aus einer bereits vorliegenden Stichprobe zieht.
  • Dadurch stellt er eine Alternative zur Erstellung von Stichprobenverteilungen dar und macht es möglich viele inferenzstatistische Verfahren anzuwenden.

Vorteile des Bootstrap

  • Die einzige Voraussetzung die beim Bootstrap erfüllt sein muss ist, dass die Stichprobe repräsentativ ist für die Population.
  • Damit fallen schwer prüfbare Voraussetzungen der klassischen Inferenzstatistischen Verfahren wie z.B. Normalverteilung oder Varianzenhomogenität weg.
  • Ein weiterer Vorteil ist, dass man die Stichprobenverteilung auch für beliebig komplexe Stichprobenstatistiken (z.B. Mediane, Korrelationen, Differenzen) erstellen kann.

Vorgehensweise

  1. Als erstes muss man wiederholt Werte aus der Stichprobe ziehen (mit Zurücklegen).
  2. Als nächstes berechnet man die gewünschten Kennwerte (z.B. Median, Korrelation).
  3. Anschließend werden die ersten beiden Schritte mehrmals wiederholt (z.B. 1000 mal).
  4. Die empirische Stichprobenverteilung die daraus entsteht dient als Grundlage für Inferenzen (z.B. Konfidenzintervalle).

Was ist neu am Bootstrap?

  • Neu am Bootstrap ist unter anderem, dass man eine empirisch bestimmte Stichprobenverteilunf erhält und nicht wie bei den klassischen Verfahren eine theoretisch abgeleitete Stichprobenverteilung.
  • Weiterhin neu ist, dass man die Stichprobe behandelt als wäre sie die Population.

Nachteil des Bootstrap

  • Ein großer Nachteil dieses Verfahrens ist, dass es nur mit Hilfe von groß angelegten Computersimulationen durchführbar ist.

"Erfinder" des Bootstrap

  • Eingeführt wurde der Bootstrap bereits 1977 von Brandley Efron.

 

Bildquellen:


http://news.stanford.edu/news/2007/may30/gifs/medal_efron.jpg

 

Quellen:

 

Sedlmeier, P. & Renkewitz, F. (2008). Forschungsmethoden und Statistik in der Psychologie.München: Pearson Studium.