Mediatoranalyse bei multipler Regression - Teil 2:
Bootstrapping mit PROCESS

Arndt Regorz, Dipl. Kfm. & BSc. Psychologie, Stand: 25.10.2018


In meinem vorherigen Tutorial zu den Grundbegriffen der Mediationsanalyse haben Sie das grundlegende Vorgehen bei der Mediationsanalyse und den Ansatz von Baron&Kenny kennen gelernt.

Dieser Ansatz weist jedoch mehrere Schwächen auf, die zur Entwicklung neuerer Verfahren geführt haben. Hier ist es insbesondere die Schätzung des indirekten Pfads mit Bootstrapping mit Hilfe des PROCESS-Makros für SPSS, die sich immer mehr verbreitet.

Im Wesentlichen basiert dieses Tutorial auf der PROCESS-Version 2, jedoch sind auch zahlreiche Hinweise für die Arbeit mit der Version 3 enthalten.

Inhalt

  1. Video-Tutorial
  2. Zusatzmaterialien zum Video
  3. Schätzung per Bootstrapping
  4. Effekstärke
  5. PROCESS-Makro
  6. Aufruf in SPSS
  7. Interpretation Output
  8. Ergebnisdarstellung
  9. Power (Teststärke)
  10. Serielle Mediation
  11. Parallele Mediation
  12. Ausblick: Moderierte Mediation
  13. Ausblick: Messfehler, Mehrebenen, Längschnitt, Kausalität
  14. Quellen

1. YouTube-Video-Tutorial


(Hinweis: Mit Anklicken des Videos wird ein Angebot des Anbieters YouTube genutzt.)

2. Zusatzmaterialien zum Video

Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 2) aus dem Menü
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 3) aus dem Menü

Interpretation PROCESS-Auswertung Mediatoranalyse (PROCESS Version 2; relativ wenige Änderungen zu Version 3)

Weitere Materialien für Spezialfälle (parallele Mediation, serielle Mediation) sowie den PROCESS-Aufruf über die Syntax finden Sie unten unter den jeweiligen Gliederungspunkten.

3. Schätzung per Bootstrapping

Ein neuerer Ansatz, der sich für die Prüfung von Mediationseffekten vermehrt durchsetzt, ist Signifikanztestung und Ausweis von Konfidenzintervallen für den indirekten Effekt über Bootstrapping.

Bootstrapping ist ein verteilungsfreies, nonparametrisches Verfahren. Dabei wird eine empirische Stichprobenverteilung über sehr häufig (1000 oder mehr) wiederholte Stichprobenziehung aus der vorliegenden Stichprobe heraus geschätzt. Die Annahme der Normalverteilung ist dafür nicht erforderlich.

Aus der so ermittelten empirischen Stichprobenverteilung können Konfidenzintervalle für indirekte Effekte abgeleitet werden, mit denen dann geprüft wird, ob die indirekten Effekte signifikant sind.

Wenn Sie genauer wissen möchten, wie Bootstrapping funktioniert, können Sie dies hier nachlesen: Bootstrapping bei Regression

Das Vorgehen mit Bootstrapping weist einige Besonderheiten auf:

  • Das tausendfache (oder mehr) Wiederholen der Bootstrapping-Stichprobenziehung ist zeitaufwändig, man muss durchaus einige Minuten auf das Ergebnis warten.
  • Die Ergebnisse sind zufallsabhängig. Wenn man mit den gleichen Daten die Auswertung wiederholt, können geringfügig andere Ergebnisse heraus kommen. Je größer die Anzahl der Bootstrapping-Stichproben (und damit die Auswertungszeit) ist, desto geringer fallen derartige Unterschiede allerdings aus. Durch Vorgabe eines Startwertes (Seed) für den Zufallsgenerator kann man dieses Problem jedoch lösen.

4. Effektstärke für den indirekten Pfad

Generell ist es empfehlenswert, neben den Ergebnissen von Parametertests auch die erzielten Effektstärken zu berichten. Jedoch gibt es im Bereich der Mediation für den indirekten Pfad keine allseits akzeptierte Effekstärke, die standardmäßig berichtet wird.

Stattdessen wurden verschiedene Vorschläge in der Literatur berichtet:

Beim partiell standardisierten Effekt wird der o.g. unstandardisierte indirekte Effekt durch die Standardabweichung der abhängigen Variable Y dividiert, also an der abhängigen Variable standardisiert. Dieser Effekt beantwortet also die Frage, um wie viele Standardeinheiten sich vermittelt über den Mediator die abhängige Variable verändert, wenn die unabhängige Variable sich um eine Einheit (nicht: um eine Standardabweichung) ändert.

Diese Effektstärke ist vor allem bei binären unabhängigen Variablen mit Dummycodierung (z.B. Geschlecht 0: männlich, 1: weiblich) vorteilhaft. Dann besagt sie, um wie viele Standardabweichungen sich die abhängige Variable zwischen den beiden Gruppen aufgrund des indirekten Pfads unterscheidet.

Für den vollständig standardisierten Effekt würde man dieses Ergebnis noch mit der Standardabweichung der unabhängigen Variable X multiplizieren. Für einen Vergleich zwischen verschiedenen Mediationsmodellen hat dieses Maß den Vorteil, dass es nicht mehr auf die verwendeten Skalen für X und Y ankommt.

Diese Effektstärke besagt, um wie viele Standardabweichungen sich die abhängige Variable vermittelt über den Mediator ändert, wenn sich die unabhängige Variable um eine Standardabweichung ändert. Diese Effektstärke ist nur bei nicht-kategorialen Prädiktoren sinnvoll.

Sowohl der unstandardisierte als auch der standardisierte indirekte Effekt hat keine prinzipielle Obergrenze und kann also auch Werte größer als 1.00 annehmen.

Zeitweise wurde noch K2 (kappa squared) als Effektstärkemaß als sinnvoll eingeschätzt, (siehe z.B. Field, 2013), das ist aber nach neuerem Literaturstand überholt (Baltes-Götz, 2017). Weitere Effektstärkemaße werden eher negativ eingeschätzt, so der Quotient aus indirektem und totalem Effekt oder der Quotient aus indirektem und direktem Effekt, die nur bei sehr großen Stichproben zuverlässige Werte ergeben. Von der Verwendung von R2med wird ebenfalls eher abgeraten (Baltes-Götz, 2017)

Damit bleibt es bei der Empfehlung:

  • Für dichotome Prädiktoren: Bericht des partiell standardisierten Effekts (dabei Dummycodierung verwenden oder eine andere Codierung, bei der sich beide Faktorstufen um 1 unterscheiden)
  • Für kontinuierliche Prädiktoren: Bericht des vollständig standardisierten Effekts.

Diese Effektstärken werden vom Makro PROCESS mit ausgegeben, wenn man dies beim Aufruf anfordert.

5. Das PROCESS-Makro

Die Schätzung des indirekten Pfades (und viele weitere Funktionalitäten, u.a. zur Moderation und zur moderierten Mediation) ist im PROCESS-Makro von A. Hayes implementiert. Dieses Makro ergänzt SPSS und kann aus SPSS aufgerufen werden. Sie können es sich kostenlos herunterladen unter:
PROCESS-Makro für SPSS

Die Installation der entpackten Datei process.spd erfolgt in SPSS über das Menü:
Erweiterungen->Extras->Benutzerdefiniertes_Dialogfeld_installieren.

Wenn Sie anschließend in SPSS unter Analysieren zum Untermenü der Regression gehen, werden Sie sehen, dass dort eine neue Menüposition hinzu gekommen ist: PROCESS

Auch wenn sich dieses Makro in SPSS einpasst und dort das Menü zur Regression erweitert, sind dennoch zwei Besonderheiten gegenüber dem normalen Umgang mit SPSS zu berücksichtigen:

  • Es ist anders als sonst in SPSS nicht möglich, zunächst über das Menü zur Regression die Mediationsanalyse aufzurufen und dann vor dem Start diesen Aufruf in die SPSS-Syntax zu übernehmen. Ein Aufruf per Syntax ist möglich und auch sehr zu empfehlen, aber Sie müssen direkt die Syntax eingeben bzw. hineinkopieren (siehe Beispielsyntax im folgenden Abschnitt).
  • Die zusätzlichen Befehle von PROCESS funktionieren erst dann bei einem Aufruf über die Syntax, wenn Sie vorher eine gesonderte Syntax-Datei (process.sps) gestartet haben, die diese zusätzlichen Befehle in SPSS implementiert.

6. Aufruf in SPSS mit PROCESS

Bevor Sie mit einem Syntax-Aufruf eine Mediationsanalyse mit dem PROCESS-Makro starten können, müssen Sie die Syntax-Datei process.sps aufrufen. Diese Datei sorgt dafür, dass anschließend auch die zusätzlichen Befehle von PROCESS in der Syntax von SPSS verarbeitet werden können.

Anschließend können Sie mit folgender Syntax die Mediationsanalyse starten (dabei seien die relevanten Variablennamen UV, MED und AV):

PROCESS-Version 2:
process vars=UV MED AV /y=AV /x=UV /m=MED /model=4/ total=1 /normal=1 /effsize=1.

PROCESS-Version 3:
process y=AV /x=UV /m=MED /model=4 /total=1 /normal=1 /effsize=1.

(Achtung: Vorher PROCESS-Skript starten, damit SPSS diese Befehle auch verarbeiten kann)

Wenn Sie stattdessen die Mediation aus dem Menü heraus aufrufen wollen, finden Sie hier eine Erläuterung zum Aufruf:
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 2)
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 3)

7. Interpretation des SPSS-/PROCESS-Outputs

Die Interpretation des PROCESS-Outputs bei Mediation können Sie mit der nachfolgenden Datei mit einigen Beispielen lernen und anschließend mit mehreren Aufgaben üben. Diese ist noch mit Version 2 von PROCESS erstellt, jedoch sind die Änderungen im Output relativ gering.
Interpretation PROCESS-Auswertung Mediatoranalyse

Wenn Sie PROCESS Version 3 nutzen, müssen Sie primär darauf achten, dass die Reihenfolge der Prädiktoren sich im Output teilweise geändert hat - bitte achten Sie da also auf die Beschriftung jeweils am Zeilenanfang. Dann sollte auch das Output der Version 3 mit dieser Interpretationsanleitung verständlich sein.

Außerdem erscheinen bei der Version 3 zwei neue Werte für den totalen Effekt (wenn angefordert) und den direkten Effekt, c_ps und c_cs (bzw. c'_ps und c'_cs), wenn Sie zusätzlich eine Angabe zur Effektstärke angefordert haben. Dabei steht ps für den partiell standardisierten Effekt und cs für den vollständig standardisierten Effekt. So können Sie also zusätzlich auch für den totalen Pfad und den direkten Pfad standardisierte Effektstärken angeben.

8. Ergebnisdarstellung

Für die Ergebnisdarstellung einer Mediationsanalyse mit PROCESS gibt es m.W. keinen einheitlichen Standard. Genannt werden sollte der Pfadkoeffizient des indirekten Pfades (unstandardisiert oder standardisiert), dessen Konfidenzintervall sowie ein Maß der Effektstärke.

Beispiel:
"Es ergab sich statistisch ein signifikanter indirekter Effekt vom Ausländeranteil auf Vorurteile über die Kontakthäufigkeit, b = - 1.435, Percentile Bootstrap 95% CI [- 0.847, - 2.015]. Der vollständig standardisierte indirekte Effekt betrug - 0.375."

(Für die PROCESS-Version 2 müsste dort statt "Percentile Bootstrap" "BCa" stehen, da zwischenzeitlich das Bootstrapping-Verfahren bei PROCESS geändert wurde.)

Generell ist es sinnvoll, bei der Verwendung von Bootstrapping auch die Anzahl der Bootstrapping-Stichproben zu berichten. Das kann man aber auch einmalig für alle Auswertungen machen, wenn mehrere Bootstrapping-Konfidenzintervalle in der Arbeit berichtet werden, zusammen mit dem Hinweis auf die verwendete Version von PROCESS und das konkrete Bootstrapping-Verfahren (Percentile oder BCa).

9. Power (Teststärke) bei Mediation mit PROCESS

Wenn Sie eine Mediationshypothese mit PROCESS prüfen wollen, stellt sich im Vorfeld die Frage: Wie groß muss Ihre Stichprobe sein, damit Sie einen in der Population vorhandenen Effekt auch mit hinreichender Wahrscheinlichkeit finden können? Ohne so eine Stichprobenplanung riskieren Sie, am Ende zu wenige Untersuchungseinheiten zu erheben, um den von Ihnen vermuteten Effekt überhaupt aufdecken zu können.

Leider kann man in diesem Fall gängige Software wie G*Power dazu nicht direkt verwenden. Denn es geht hier um mehrere Effekte: sowohl um den a-Pfad als auch um den b-Pfad. Je nachdem, welche Effektstärke man für diese beiden Pfade erwartet, ergibt sich dann auch ein unterschiedlicher notwendiger Strichprobenumfang.

Als Orientierung gibt es im Artikel von Fritz und MacKinnon (2007) eine simulationsbasierte Berechnung der nötigen Stichprobengröße, um eine Teststärke (Power) von mindestens .80 zu erreichen, und zwar in Abhängigkeit von der erwarteten Stärke des a-Pfades und des b-Pfades.

Die Berechnung unterscheidet sich je nach dem verwendeten Test. In der folgenden Tabelle wird der jeweils nötige Stichprobenumfang dargestellt für:

  • Sobel-Test
  • BCa-Bootstrapping
  • Perzentil-Bootstrapping
Dabei ist zu beachten, dass die PROCESS-Version 2 mit BCa-Bootstrapping gearbeitet hat, während die PROCESS-Version 3 das Perzentil-Bootstrapping nutzt.

Die Stärke der Effekte wird in der folgenden Tabelle wie folgt abgekürzt:

  • S: small (beta = .14)
  • M: medium (beta = .39)
  • L: large (beta = .59)
Die Buchstabenkombinationen sind dann so zu lesen, dass der erste Buchstabe für den a-Pfad steht und der zweite Buchstabe für den b-Pfad. Die Zeile mit der Kombination ML steht also für ein Mediationsmodell, bei dem für den a-Pfad ein mittlerer Effekt und für den b-Pfad ein großer Effekt erwartet wird. Der Wert in der Tabelle ist dann der minimal nötige Stichprobenumfang N.

Effekte (a-Pfad, b-Pfad) Sobel-Test BCa-Bootstrapping (PROCESS Vs. 2) Perzentil-Bootstrapping (PROCESS Vs. 3)
SS 667 462 558
SM 422 400 406
SL 412 385 398
MS 421 391 404
MM 90 71 78
ML 66 53 59
LS 410 396 401
LM 67 54 59
LL 42 34 36
Quelle: Fritz und MacKinnon (2007).

10. Multiple Mediation: Seriell

Häufig ist die Wirkung von einer unabhängigen Variable X auf eine abhängige Variable Y nicht über einen einzigen Mediator vermittelt, sondern über eine Kette mehrerer zwischengeschalteter Variablen. Dieser Fall der multiplen Mediation ist mit folgendem Schaubild dargestellt:

Grafik Mediatoren in Reihe


Derartige Wirkungsketten lassen sich sehr gut mit dem PROCESS-Makro testen. Der Aufruf hierzu als SPSS-Skript lautet im Falle von zwei hintereinander geschalteten Mediatoren (dabei seien die relevanten Variablennamen UV, MED1, MED2 und AV - hier ist die Reihenfolge der beiden Mediatoren wichtig):

PROCESS-Version 2:
process vars=UV MED1 MED2 AV /y=AV /x=UV /m=MED1 MED2 /model=6/ total=1 /effsize=1.

PROCESS-Version 3:
process y=AV /x=UV /m=MED1 MED2 /model=6 /total=1 /normal=1 /effsize=1.

(Achtung: Vorher PROCESS-Skript starten, damit SPSS diese Befehle auch verarbeiten kann)

Der Aufruf „per Hand“ wird in folgendem Dokument erklärt:
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 2)
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 3)

Die Interpretation des SPSS-Outputs sehen Sie hier:
Interpretation PROCESS-Auswertung Mediatoren in Serie (Version 2)
Die Anleitung basiert noch auf der PROCESS-Version 2, sollte jedoch aufgrund der relativ geringen Änderungen auch bei Verwendung von PROCESS-Version 3 verständlich sein. Insbesondere die Zeilenreihenfolge hat sich aber teilweise geändert. Außerdem hat sich auch die Reihenfolge/Benennung der indirekten Effekte geändert - hier unbedingt die Legende ("Indirect effect key") unten im Output beachten - bei zwei Mediatoren in Serie ist jetzt in der Regel der Effekt Ind3 der interessanteste (bei PROCESS Version 2 war dies noch Ind2).

11. Multiple Mediation: Parallel

Neben Modellen mit mehreren in Serie geschalteten Mediatoren sind als multiple Mediation auch Modelle mit mehreren parallel wirkenden Mediatoren möglich. Die unabhängige Variable X beeinflusst mehrere Mediatoren, die alle wiederum die abhänige Variable Y beeinflussen.

Am Beispiel von zwei parallelen Mediatoren sieht man das mit folgendem Schaubild:

Grafik Mediatoren parallel


Hier kommen im Vergleich zur seriellen Mediation aus dem vorherigen Abschnitt noch einige zusätzliche Fragestellungen und Auswertungsmöglichkeiten hinzu. Denn jetzt stellen sich auch die folgenden Fragen:

  • Ist die gesamte Mediation signfikant?
  • Welche der Teileffekte über die verschiedenen Mediatoren sind signifikant?
  • Ist ein Teileffekt signifikant größer als ein anderer?

Um derartige Fragen beantworten zu können, gibt es beim Aufruf in PROCESS eine Reihe von zusätzlichen Optionen. Die folgende SPSS-Syntax auf Basis von PROCESS ist dabei die umfangreichere Version, bei der auch Teileffekte/Pfade miteinander verglichen werden (dabei seien die relevanten Variablennamen UV, MED1, MED2 und AV):

PROCESS-Version 2:
process vars=UV MED1 MED2 AV /y=AV /x=UV /m=MED1 MED2 /model=4/ total=1 /normal=1 /effsize=1 /contrast=1.

PROCESS-Version 3:
process y=AV /x=UV /m=MED1 MED2 /model=4 /total=1 /normal=1 /effsize=1 /contrast=1.

(Achtung: Vorher PROCESS-Skript starten, damit SPSS diese Befehle auch verarbeiten kann)

Der Aufruf aus den Menüs heraus wird in folgender Datei erläutert:
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 2)
Aufruf Mediationsanalyse mit SPSS/PROCESS (Version 3)

Die Interpretation des SPSS-Outputs sehen Sie hier:
Interpretation PROCESS-Auswertung Mediatoren Parallel (Version 2)
Die Anleitung basiert noch auf der PROCESS-Version 2, sollte jedoch aufgrund der relativ geringen Änderungen auch bei Verwendung von PROCESS-Version 3 verständlich sein. Insbesondere die Zeilenreihenfolge hat sich aber teilweise geändert.

12. Ausblick: Moderierte Mediation und mediierte Moderation

Bisher haben wir nur Mediationshypothesen betrachtet. Neben der Mediation gibt es aber auch noch die Moderation als weitere Möglichkeit, wie eine Drittvariable mit der Wirkung von einer unabhängigen Variable X auf eine abhängige Variable Y zusammenhängt.

Moderation selbst ist ein ebenfalls umfangreiches Thema, das in diesem Mediations-Tutorial nicht behandelt wird. Was jedoch für das Thema Mediation relevant ist: Mediation und Moderation können in einem Modell miteinander verknüpft sein. Dabei gibt es sowohl den Fall der moderierten Mediation als auch den Fall der mediierten Moderation.

Bei der moderierten Mediation wird ein Mediationseffekt von einer weiteren Variable moderiert. Die Ausprägung von diesem Moderator ist also entscheidend dafür, ob bzw. wie stark der Mediationseffekt auftritt.

Im Gegensatz zur einfachen Mediation gibt es jetzt nicht mehr ein einziges Modell, denn die Moderation kann an verschiedenen Stellen ansetzen. So kann der a-Pfad von X zum Mediator moderiert werden, oder aber auch der b-Pfad. Und noch weitere Modelle sind möglich. Ein Beispiel für eine moderierte Mediation ist in folgendem Schaubild gezeigt:

Grafik moderierte Mediation


Bei der mediierten Moderation hingegen liegt insgesamt ein Moderationseffekt vor, der sich primär über den indirekten Mediationspfad auswirkt und weniger über den direkten Effekt.

Näheres zur moderierten Mediation und mediierten Moderation kann man bei Muller, Judd und Yzerbyt (2005) nachlesen.

Grundsätzlich kann PROCESS eine Vielzahl an Kombinationen aus Mediatoren und Moderatoren in der Analyse berücksichtigen. Die wesentliche Herausforderung dabei ist es, dass richtige Modell auszuwählen und PROCESS zur Berechnung vorzugeben.

Die verschiedenen möglichen Modelle mit ihrer für die Auswertung entscheidenden Kennnummer können Sie in der Dokumentation von PROCESS nachlesen, die es ab Version 3 allerdings anscheinend nur noch als Teil des Buchs von Hayes (2017) gibt.

13. Ausblick Messfehler, Mehrebenen, Längschnitt, Kausalität

Dieses Tutorial und das vorherige Tutorial zu Grundlagen und dem Schema von Baron&Kenny bietet die Basis für die Prüfung von Mediationshypothesen. Damit sollten Sie insbesondere für eine Bachelorarbeit auskommen.

Für komplexere Fragestellungen und insbesondere für eigene, auch experimentelle Forschung gibt es allerdings noch eine ganze Reihe weiterer Fragen im Zusammenhang mit dem Thema Mediation.

Einen Überblick über Themen wie Messfehler, Mehrebenen, Längschnitt und Kausalität in Bezug auf Mediation finden Sie im dritten Teil meines Tutorial zur Mediation: Mediatoranalyse 3: Verfahren für Fortgeschrittene

14. Quellen

Baltes-Götz, B. (2017). Mediator- und Moderatoranalyse mit SPSS und PROCESS [Rev. 170730]. Retrieved from: https://www.uni-trier.de/fileadmin/urt/doku/medmodreg/medmodreg.pdf

Field, A. (2013). Discovering statistics using IBM SPSS statistics: And sex and drugs and rock 'n' roll (4th edition). Los Angeles, CA: SAGE.

Fritz, M. S., & MacKinnon, D. P. (2007). Required sample size to detect the mediated effect. Psychological science, 18, 233-239. doi:10.1111/j.1467-9280.2007.01882.x

Hayes, A. F. (2017). Introduction to mediation, moderation, and conditional process analysis second edition: A regression-based approach. New York, NY: Guilford Publications.

Muller, D., Judd, C. M., & Yzerbyt, V. Y. (2005). When moderation is mediated and mediation is moderated. Journal of personality and social psychology, 89, 852-863. doi:10.1037/0022-3514.89.6.852

Preacher, K. J., & Hayes, A. F. (2004). SPSS and SAS procedures for estimating indirect effects in simple mediation models. Behavior research methods, 36, 717-731. doi:10.3758/BF03206553


Wie kann ich Sie weiter unterstützen?

Beratung für Datenauswertung bei Bachelorarbeit oder Masterarbeit

Welche Auswertungen sind für Ihre Fragestellung richtig und was müssen Sie dabei beachten? Schon in einer Stunde (Telefon/Skype/vor Ort) kann man viele Fragen klären. Auf meiner Seite zu Statistik-Beratung finden Sie weitere Informationen.