Voraussetzungen Regression: Skalierung der Variablen

Arndt Regorz, Dipl. Kfm. & M.Sc. Psychologie, Stand: 07.06.2022

Wenn Sie eine einfache oder multiple lineare Regression durchführen wollen, müssen Ihre Variablen geeignete Skaleneigenschaften aufweisen. Das wird im Folgenden getrennt für Kriterium und Prädiktoren betrachtet.

Inhalt

Skaleneigenschaften Kriterium
Skaleneigenschaften Prädiktoren
Ist die Likert-Skala metrisch/intervallskaliert?
Quellen

1. Skaleneigenschaften Kriterium (AV)

Für die Kriteriumsvariable (abhängige Variable) ist es relativ einfach: Bei einer linearen Regression muss diese Variable kontinuierlich und metrisch sein (mindestens intervallskaliert). Das bedeutet, dass die Abstände zwischen den einzelnen Stufen der Variable gleichen Abständen in der Realität entsprechen.

Beispiel: Wenn man ein Konstrukt auf einer 7-stufigen Skala misst, dann muss der Unterschied zwischen zwei Personen mit den Skalenwerten 2 und 3 genauso groß sein wie zwischen zwei Personen mit den Skalenwerten 6 und 7. Auf den häufigen Fall, dass man es mit einer Likert-Skala zu tun hat, wird weiter unten in einem gesonderten Abschnitt noch ausführlicher eingegangen.

Was machen Sie, wenn Sie keine Intervallskalierung für Ihre Kriteriumsvariable haben?

Bei einer binären (=dichotomen) Kriteriumsvariable können Sie die binäre logistische Regression einsetzen (siehe mein Tutorial hierarchische logistische Regression mit SPSS).
Wenn Ihre Kriteriumsvariable nominalskaliert mit mehr als zwei verschiedenen Ausprägungen ist, dann gibt es die multinomiale logistische Regression.
Für eine ordinalskalierte Kriteriumsvariable kommt die ordinale logistische Regression in Frage.

2. Skaleneigenschaften Prädiktoren (UVs)

Bei den Prädiktoren (unabhängigen Variablen) für die lineare Regression haben Sie deutlich mehr Spielraum.

Der einfachste Fall ist eine metrische Prädiktorvariable (siehe hierzu auch den Abschnitt zur Likert-Skala). Aber auch eine binäre Prädiktorvariable lässt sich ohne weiteres in der linearen Regression verwenden.

Und wenn Sie eine nominalskalierte Prädiktorvariable mit mehr als zwei Stufen haben, dann können Sie diese beispielsweise durch die Verwendung von Dummy-Variablen in mehrere binäre Prädiktorvariablen umkodieren und dann problemlos in der Regression verwenden. Wenn Sie eine nominalskalierte Variable mit k verschiedenen Ausprägungen haben, brauchen Sie k-1 Dummy-Variablen. Eine der Ausprägungen wird dabei als Referenzkategorie festgelegt.

Beispiel:
Ihre Prädiktorvariable hat die Ausprägungen 1, 2, 3, 4. Dann könnten Sie z.B. die vierte Gruppe als Referenzkategorie festlegen und folgende Dummy-Variablen codieren:

D1: Bei der ersten Gruppe 1, sonst 0
D2: Bei der zweiten Gruppe 1, sonst 0
D3: Bei dritten Gruppe 1, sonst 0

Für die vierte Gruppe brauchen Sie keine Kategorie: Denn wenn jemand auf D1, D2 und D3 eine 0 hat, dann ist diese Person weder in der ersten, zweiten oder dritten Gruppe und damit ist sie in der vierten Gruppe. Es ergibt sich also folgendes Codierungsschema:

Gruppe 1: D1 = 1, D2 = 0, D3 = 0.
Gruppe 2: D1 = 0, D2 = 1, D3 = 0.
Gruppe 3: D1 = 0, D2 = 0, D3 = 1.
Gruppe 4: D1 = 0, D2 = 0, D3 = 0.

Diese drei Dummy-Variablen D1 bis D3 schließen Sie jetzt in die Regression ein (bei einer hierarchischen Regression möglichst in einem Schritt). Die Interpretation der einzelnen Regressionsgewichte für die verschiedenen Dummy-Variablen ist immer relativ zur Referenzkategorie.

Beispiel (Fortsetzung):

Das Regressionsgewicht für D1 zeigt, wie viel höher die Kriteriumsvariable für jemanden aus der ersten Gruppe im Vergleich zu jemandem aus der vierten Gruppe (Referenzkategorie) ist.
Das Regressionsgewicht für D2 zeigt, wie viel höher die Kriteriumsvariable für jemanden aus der zweiten Gruppe im Vergleich zu jemandem aus der vierten Gruppe (Referenzkategorie) ist.
Das Regressionsgewicht für D3 zeigt, wie viel höher die Kriteriumsvariable für jemanden aus der dritten Gruppe im Vergleich zu jemandem aus der vierten Gruppe (Referenzkategorie) ist.

Für den Einschluss von ordinalen Prädiktoren finden Sie hier ein Tutorial:
Ordinale Prädiktoren/UVs in der Regression

3. Ist die Likert-Skala metrisch/intervallskaliert?

In Fragebogenstudien kommt häufig die Likert-Skalierung zum Einsatz. Das sind Items, bei denen die Antwortmöglichkeiten von z.B. starker Zustimmung bis zu starker Ablehnung reichen. Und man findet in der Literatur unterschiedliche Aussagen, ob eine solche Skala (oder auch generell Rating-Skalen) intervallskaliert oder lediglich ordinalskaliert ist. Aus den o.g. Voraussetzungen zur Skalierung bei der Regression ist klar, dass dies eine für Ihre Auswertungsstrategie äußerst wichtige Frage ist.

Ein Großteil der Diskussion über die mögliche Intervallskalierung von Likert-Skalen beruht dabei auf einem Missverständnis. Tatsächlich werden häufig zwei verschiedene Dinge zusammengenommen:

Likert-Items
Als Likert-Item soll im Folgenden ein einzelnes Item verstanden werden, dessen Antwortformat auf der Skalierung von Likert beruht.

Likert-Skalen
Als Likert-Skala soll im Folgenden eine Skala verstanden werden, die aus der Summe oder dem Mittelwert einer Anzahl von Likert-Items besteht.

Und damit löst sich der scheinbare Widerspruch in der Literatur recht schnell auf. Einzelne Likert-Items, z.B. mit fünf Antwortmöglichkeiten, werden überwiegend als ordinalskaliert angesehen. Wenn jedoch eine Anzahl von Likert-Items zu einer Likert-Skala zusammengefasst werden, kann man mit dieser Skala i.d.R. rechnen, als wenn sie intervallskaliert wäre.

Allerdings findet man mitunter in der Literatur auch Single-Items, mit denen gerechnet wird, als wenn sie intervallskaliert wären. Da wäre es für die eigene Abschlussarbeit eine mögliche Absicherung, sich beim Betreuer zu erkundigen, wie das im Lehrgebiet gehandhabt wird, und ggf. das Problem bei den Studieneinschränkungen im eigenen Diskussionsteil zu erwähnen. Insbesondere, wenn man dieses Single-Item aus einer publizierten Studie übernimmt und in dieser Studie das Item als intervallskaliert verwendet wurde (z.B. indem der Itemwert ganz normal in eine Regression eingeschlossen wurde), kann man ganz gut auf diese publizierte Studie verweisen und sollte damit auf der sicheren Seite sein.

Ein weiterer relevanter Punkt ist die Anzahl der Antwortmöglichkeiten für ein Item. Eine höhere Anzahl spricht empirisch eher dafür, dass man die Variable als kontinuierlich und intervallskaliert ansehen kann (Wu & Leung, 2017).

4. Quellen

Boone, H. N., & Boone, D. A. (2012). Analyzing likert data. Journal of extension, 50(2), 1-5.
https://www.researchgate.net/profile/Mahesh_Tengli2/post/What_statistical_analysis_should_I_use_for_Likert-Scale_data/attachment/5d09cd41cfe4a7968dac2e55/AS%3A771383042789382%401560923457797/download/JOE_v50_2tt2+likert+analysis+imp.pdf

Joshi, A., Kale, S., Chandel, S., & Pal, D. K. (2015). Likert scale: Explored and explained. Current Journal of Applied Science and Technology, 7(4), 396-403. https://doi.org/10.9734/BJAST/2015/14975

Wu, H., & Leung, S. O. (2017). Can Likert scales be treated as interval scales?—A Simulation study. Journal of Social Service Research, 43(4), 527-532. https://doi.org/10.1080/01488376.2017.1329775