Grundverständnis
Die Korrelationsanalyse hat die Aufgabe, die Art sowie die Stärke des Zusammenhanges zwischen den jeweiligen Variablen durch geeignete Maßzahlen zu charakterisieren.
Wie die Theorie zeigt, können derartige Maßzahlen, welche man als Korrelationskoeffizienten bezeichnet, sowohl für ordinal- als auch für intervall- und rationalskalierte Variable ermittelt werden.
.
- Alter vs. Gehalt: R stark positiv
.
- Alter Ehemann vs. Alter Ehefrau: R stark positiv
.
-
Seehöhe vs. Umgebungstemperatur: R stark negativ
.
- Arbeitslosenrate vs. Abstand bei der letzten Wahl: R ~ 0
Obwohl sich in Abhängigkeit vom jeweiligen Datentyp unterschiedliche Berechnungsformeln für die Korrelationskoeffizienten ergeben, ist doch allen gemeinsam, dass ihr Wertebereich zwischen -1 und +1 liegt.
Je nachdem, ob der Korrelationskoeffizient einen positiven oder negativen Wert annimmt, weist dies entweder auf ein direktes Verhältnis zwischen den beiden Merkmalen (je größer/kleiner die eine Variable, desto größer/kleiner die andere Variable) oder ein indirektes Verhältnis (je größer/kleiner die eine Variable, desto kleiner/größer die andere Variable) hin.
Während die Art des Zusammenhanges somit vom Vorzeichen des Korrelationskoeffizienten abhängt, ist die Stärke des Zusammenhanges von dessen Betrag abhängig. So ist der Zusammenhang zwischen zwei Variablen umso stärker, je näher der Betrag bei Eins liegt, und umso schwächer, je näher dieser bei Null liegt.
Wichtig! Mit Hilfe der Korrelationsanalyse lediglich überprüft werden kann, ob zwischen zwei Merkmalen ein zahlenmäßiger Zusammenhang besteht, während nicht überprüft werden kann, ob sich dahinter auch ein kausaler Zusammenhang verbirgt. Wie die Literatur zeigt, mangelt es allerdings nicht an Beispielen, in denen es zu einer derartigen Fehlinterpretation des Korrelationskoeffizienten gekommen ist.
Im Folgenden sollen lediglich die zwei bekanntesten dieser Beispiele, bei denen zudem die Verwechslung von zahlenmäßigem mit kausalem Zusammenhang offenkundig ist, besprochen werden.