Zur Bedeutung der Korrelationskoeffizienten.
Die Bedeutung des Pearsonschen Korrelationskoeffizienten für die Regressionsanalyse liegt darin, dass er wesentliche Information betreffend das Verhältnis zwischen gegebenen Daten und Regressionsgeraden enthält.
- Zum einen legt das Vorzeichen des Pearsonschen Korrelationskoeffizienten fest, ob ein direkter oder indirekter Zusammenhang zwischen zwei Variablen besteht, und ob somit die Regressionsgerade monoton wächst (sofern r > 0 ist) oder monoton fällt (sofern r < 0 ist).
- Zum anderen bringt der Betrag des Pearsonschen Korrelationskoeffizienten die Stärke des linearen Zusammenhanges zwischen zwei Merkmalen zum Ausdruck und stellt somit eine Maßzahl für die Güte der Approximation der gegebenen Datenpunkte durch die Regressionsgerade dar (siehe nachfolgende Abbildungen).
So hat man es im Falle Betrag von r = 1 mit einem „perfekten“ linearen Zusammenhang zu tun, was gleichbedeutend damit ist, dass sämtliche Datenpunkte auf der Regressionsgeraden liegen - im Rahmen praktischer Anwendungen tritt ein derart hoher Korrelationskoeffizient allerdings nie auf. Je weiter sich der Betrag von r von Eins entfernt, desto mehr streuen die Datenpunkte um die Regressionsgerade und umso ungeeigneter wird diese, um den vorliegenden Trend wiederzugeben. Als Schwellenwert, ab dem die Regressionsgerade inadäquat zur Wiedergabe des Trends erscheint, wird ein Wert von 0.6 angesehen, wobei einige Autoren aber auch einen von 0.5 oder 0.7 vorschlagen.
Je nachdem ob der Betrag von r > 0,6 oder der Betrag von r < 0,6 . ist, spricht man von einem starken respektive schwachen linearen Zusammenhang zwischen den Merkmalen, wobei letzterer für konkrete Aufgabenstellungen zu wenig aussagekräftig und somit ohne Bedeutung ist.
Sofern für den Korrelationskoeffizienten r = 0 gilt, besteht kein linearer Zusammenhang zwischen den Variablen; der Grund hierfür ist entweder darin zu suchen, dass die Datenpunkte gleichmäßig im Streuungsdiagramm verteilt sind (s. Abbildung 4-14a), oder aber darin, dass ein nichtlinearer funktionaler Zusammenhang wie z. B. ein polynomialer oder exponentieller (s. Abbildung 4-14b) vorliegt.
Abbildung 4-12: Streuungsdiagramme, in denen ein (a) „perfekter“ direkter (r = 1), (b) ein starker direkter (0.6 £ r < 1) und (c) ein schwacher direkter Zusammenhang (0 < r < 0.6) dargestellt ist.
Abbildung 4-13: Streuungsdiagramme, in denen ein (a) „perfekter“ indirekter (r = -1) , (b) ein starker indirekter (-1 < r £ -0.6) und (c) ein schwacher indirekter Zusammenhang (-0.6 < r < 0) dargestellt ist.
Abbildung 4-14: Streuungsdiagramme, in denen (a) kein linearer Zusammenhang und (b) ein starker funktionaler nichtlinearer Zusammenhang besteht