SEM/CFA: Item Parceling

Arndt Regorz, Dipl. Kfm. & M.Sc. Psychologie, 03.02.2023

Item Parceling kann bei Strukturgleichungsmodellen (SEM) und konfirmatorischen Faktorenanalysen (CFA) die Modelleigenschaften des Messmodells deutlich verbessern. Dieses Tutorial zeigt, was Sie mit Parceling erreichen können und welche Parcelingverfahren für Ihre Fragestellung in Frage kommen.

Inhalt

Video-Tutorial
Was ist Parceling?
Warum Item Parceling?
Parceling Verfahren 1: Unidimensionales Konstrukt
Parceling Verfahren 2: Multidimensionales Konstrukt
Modell-Fit bei Parceling
Quellen

1. Video-Tutorial

(Hinweis: Mit Anklicken des Videos wird ein Angebot des Anbieters YouTube genutzt.)

2. Was ist Parceling?

Beim Parceling werden jeweils mehrere Items zu einem Parcel (Päckchen) zusammengefasst, in der Regel durch Bildung des Mittelwertes. Es werden also sozusagen kleine Mini-Skalen berechnet. Anschließend werden diese Parcels statt der Einzelitems in das Messmodell des jeweiligen Faktors bzw. latenten Konstrukts eingeschlossen.

Beispiel 1:
Sie haben eine Skala mit neun Items. Dann könnten Sie daraus z.B. drei Parcels mit jeweils drei Items machen und statt der neun Items dann diese drei Parcels in Ihr Modell einschließen.

Beispiel 2:
Sie haben eine Skala mit fünf Items. Dann könnten Sie daraus z.B. drei Parcels dahingehend machen, dass Sie zwei 2-er Parcels bilden und das dritte "Parcel" aus einem einzelnen Item besteht (hierfür würde man i.d.R. das Item mit den besten Kennwerten nehmen, also z.B. mit der höchsten Item-Skala-Korrelation).

Aus den Beispielen ergeben sich einige einfache Faustregeln für die Parcelbildung:
a) Es werden normalerweise drei Parcels pro Konstrukt gebildet. Das hängt damit zusammen, dass ein Messmodell mit drei Items genau identifziert ist.
b) Es können Parcels unterschiedlich viele Items enthalten; das ist vor allem relevant, wenn die Anzahl der Items nicht durch 3 geteilt werden kann.
c) Ein Parcel kann auch aus nur einem Item bestehen.

3. Warum Item Parceling?

Es gibt eine Reihe von Gründen, die für Parceling sprechen, wobei diese teilweise miteinander verbunden sind bzw. aufeinander aufbauen (diese Darstellung folgt, wie auch die weiteren Abschnitte, vor allem Little et al., 2013):

Reduzierte Itemanzahl: In den Messmodellen hat man weniger Items als ohne Parceling.
Kleiner Stichproben möglich: Aufgrund der kleineren Itemanzahl hat man eine bessere Item-Sample-Ratio, was die Modellprüfung auch bei kleineren Stichproben ermöglicht als ohne Parceling.
Weniger Fit-Probleme: Die Wahrscheinlichkeit für eine erfolgreiche Schätzung steigt.
Weniger Cross-Loadings: Man hat weniger Probleme mit Kreuzladungen, bei denen ein Item auf mehrere Faktoren lädt.
Weniger Fehler-Kovarianzen: Man hat weniger Fehler-Kovarianzen - vor allem, wenn kovariierende Items im gleichen Parcel sind.
Höhere Item-Reliabilität: Die Items (hier die Parcels) haben eine höhere Reliabilität als ohne Parceling.
Höhere Kommunalität: Die Items (hier die Parcels) haben einen höheren Anteil geteilter Varianz (shared variance).

Es gibt jedoch auch Grenzen von Parceling. So ist der Einsatz von Parcels nicht sinnvoll ist, wenn es bei einer CFA vor allem um das Verständnis der Wirkung der Einzelitems geht, z.B. bei einer CFA zur Fragebogenkonstruktion. Für diesen Fall sollte man eine CFA auf Itemebene durchführen.

Wenn man Bias in der Schätzung eines Modells aufzeigen will, ist es umstritten, ob dabei Parcels eher helfen oder hinderlich sind.

4. Parceling Verfahren 1: Unidimensionales Konstrukt

Bei den verschiedenen Parceling Verfahren ist zuerst zu unterscheiden, ob man ein eindimensionales Konstrukt hat oder ein mehrdimensionales Konstrukt.

Bei einem eindimensionalen Konstrukt messen alle Items idealerweise das Gleiche, zwei Items sind also vollständig austauschbar. Hierfür gibt es vor allem die folgenden Parceling-Verfahren:

Random Parceling (Zufallsparceling)

Beim Random Parceling setzt man die Anzahl der Parcels fest und lässt den Zufall entscheiden, welches Item in welches Parcel kommt. Voraussetzungen für Random Parceling sind ein eindimensionales Konstrukt, viele Items und eine hohe Kommunalität der Items.

Allerdings birgt einfaches Zufallsparceling (eine einzige Zufallsverteilung der Items auf die Parcels) das Risiko, dass je nach zufälliger Verteilung recht unterschiedliche Ergebnisse in der CFA bzw. im SEM herauskommen können. Daher ist von diesem Verfahren eher abzuraten.

Die Probleme eines einfachen Zufallsparceling überwindet jedoch ein anderer Ansatz, bei dem nicht nur eine einzige Zufallsverteilung der Items erfolgt, sondern sehr viele (z.B. 1000). Man hat dann also 1000 verschiedene Parcelaufteilungen und führt für jede dieser Aufteilungen eine gesonderte Schätzung von CFA bzw. SEM durch und aggregiert am Ende die Ergebnisse. In R gibt es im semTools zu diesem Zweck die Funktion parcelAllocation().

Balancing Approach

Beim Balancing Approach wird die Zuordnung der Items zu den Parcels auf Basis inhaltlicher oder statistischer Charakteristika vorgenommen.

Auf Basis statistischer Kenngrößen wird beispielsweise das Item mit der höchsten Item-Scale-Korrelation zusammen mit dem Item mit der geringsten Item-Scale-Korrelation in das gleiche Item gepackt, das Item mit der zweithöchsten Korrelation zum Item mit der zweitniedrigsten, usw. Es wird also die Qualität der Items in den Parcels ausbalanciert, alle Parcels sollen gleich viele gute und weniger gute Items ("gut" im Sinne ihrer psychometrischen Qualitäten) erhalten.

Daneben ist auch ein inhaltliches Ausbalancieren möglich, bei dem evtl. Fehlerkovarianzen oder Cross-Loadings aufgrund der Itemformulierung herangezogen werden, um die Zuordnung zu den Parcels zu bestimmen.

Dabei werden Items mit Fehlerkovarianz in das gleiche Parcel eingeordnet, was die Fehlerkovarianz zum Verschwinden bringt. Items mit Cross-Loading zu dem gleichen anderen Faktor werden entweder in das gleiche Parcel oder in verschiedene Parcels eingeordnet: Bei gleichem Vorzeichen der Cross-Loading in verschiedene Parcels (was die Cross-Loadings vermindert), bei ungleichem Vorzeichen hingegen in das gleiche Parcel (damit sich die beiden Cross-Loadings zumindest teilweise gegenseitig aufheben).

Als Informationsquellen für ein ausbalanciertes Parceling kommen zum einen vorherige publizierte Forschungsergebnisse zu den Itemeigenschaften in Frage. Zum anderen kann man vorab eine multivariate CFA auf Itemlevel durchführen, um Informationen über Fehlerkovarianzen und Cross-Loadings zu erhalten (multivariat heißt hier, dass nicht nur das eine Konstrukt in die CFA einbezogen wird, sondern alle interessierenden Konstrukte zusammen).

5. Parceling Verfahren 2: Multidimensionales Konstrukt

Bei einem mehrdimensionalen Konstrukt weist der Faktor mehrere Subfaktoren oder Facetten auf, die zwar auch das Oberkonstrukt messen, aber außerdem auch noch einen bestimmten detaillierteren Aspekt dieses Oberkonstrukts. Ein Praxisbeispiel dafür ist die Messung der Persönlichkeit mit den Big5, bei der häufig unterhalb der Ebene der fünf Persönlichkeitsfaktoren noch mehrere Facetten je Faktor untersucht werden.

Für ein mehrdimensionales Konstrukt gibt es insbesondere zwei mögliche, theoriegeleitete, Verfahren zur Parcelgenerierung: Die Verwendung von facettenrepräsentativen Parcels (facet representative parceling) oder von domänenrepräsentativen Parcels (domain representative parceling).

Facettenrepräsentatives Parceling

Beim facettenrepräsentativen Parceling werden alle Items, die zu einem Subfaktor / einer Facette gehören, in das gleiche Parcel eingeordnet. Das hat den Vorteil, dass im Faktor dann nur die gemeinsame Varianz aller Items enthalten ist, also keine facettenspezifische Varianz. Man hat also eine relativ "reine" Schätzung des Oberkonstrukts. Denn bei der Faktorenanalyse (und darum handelt es sich bei den Messmodellen von CFA und SEM) enthält ein Faktor nur geteilte Varianz, nicht jedoch Varianz, die nur in einem der verwendeten Items enthalten ist. Da hier aber die facettenbezogene Varianz immer nur in einem Parcel, und damit aus Sicht des Messmodells in einem Item, enthalten ist, geht sie nicht in die Schätzung des Konstrukts ein, sondern nur diejenigen Anteile, die in mehreren Facetten enthalten sind.

Allerdings kommt dieses Verfahren nur dann in Frage, wenn es keine Beziehungen von Facetten zu anderen Faktoren / latenten Variablen Ihrer Untersuchung gibt. Daher ist dieses Verfahren zwar theoretisch wohl das bessere der beiden Parcelingverfahren für multidimensionale Konstrukte, aber in der Praxis dürfte diese Voraussetzung eher selten gegeben sein.

Domänenrepräsentatives Parceling

Beim domänenrepräsentativen Parceling werden hingegen in jedes Parcel Items aus allen Facetten eingeordnet, im Idealfall gleich viele. Jedes Parcel ist hier also repräsentativ für das gesamte Konstrukt. Allerdings hat das die praktische Konsequenz, dass im Faktor jetzt nicht nur Varianz des Oberkonstrukts enthalten ist, sondern auch Varianz der Facetten/Subfaktoren. Dieses Verfahren kommt daher zum Einsatz, wenn die Annahme des facettenrepräsentativen Parcelings (keine Beziehung zwischen Facetten und anderen Konstrukten) nicht erfüllt ist.

Im Allgemeinen kann man beim domänenrepräsentativen Parceling mit deutlich weniger Fit-Problemen rechnen - in der Praxis macht man sich also mit diesem Ansatz die Arbeit eher leichter.

6. Modell-Fit bei Parceling

Wenn man mit Parceling arbeitet, ergibt sich auch eine Änderung in der Verwendung der Fit-Indizes. In diesem Fall ist davon abzuraten, den CFI als Fit-Index heranzuziehen, da dieser durch Parceling fast immer automatisch deutlich besser wird. Stattdessen sollte man sich bei der Verwendung von Parcels eher auf die Fit-Indizes RMSEA und SRMR konzentrieren (Rhemtulla, 2016).

7. Quellen

Jorgensen, T. D., Pomprasermanit, S., Schoemann, A. M., & Rosseel, Y. (2022). Package ‘semTools’ [Version 0.5-6]. CRAN. https://cran.r-project.org/web/packages/semTools/semTools.pdf

Little, T. D., Rhemtulla, M., Gibson, K., & Schoemann, A. M. (2013). Why the items versus parcels controversy needn’t be one. Psychological Methods, 18(3), 285-300.

Rhemtulla, M. (2016). Population performance of SEM parceling strategies under measurement and structural model misspecification. Psychological Methods, 21(3), 348-368.