Abschnittsübersicht

    • Die Korrelationsanalyse hat die Aufgabe, die Art sowie die Stärke des Zusammenhanges zwischen den jeweiligen Variablen durch geeignete Maßzahlen zu charakterisieren.

      Wie die Theorie zeigt, können derartige Maßzahlen, welche man als Korrelationskoeffizienten bezeichnet, sowohl für ordinal- als auch für intervall- und rationalskalierte Variable ermittelt werden.

      .

      • Alter vs. Gehalt: R stark positiv

      Korrelation im Streuungsdiagramm

      .

      • Alter Ehemann vs. Alter Ehefrau: R stark positiv

      .

      • Seehöhe vs. Umgebungstemperatur: R stark negativ

      .

      • Arbeitslosenrate vs. Abstand bei der letzten Wahl: R ~ 0

    • 1.) Störche und Geburtenrate

      2.) Schuhgröße und Einkommen

    • Die Bedeutung des Pearsonschen Korrelationskoeffizienten für die Regressionsanalyse liegt darin, dass er wesentliche Information betreffend das Verhältnis zwischen gegebenen Daten und Regressionsgeraden enthält.

      • Zum einen legt das Vorzeichen des Pearsonschen Korrelationskoeffizienten fest, ob ein direkter oder indirekter Zusammenhang zwischen zwei Variablen besteht, und ob somit die Regressionsgerade monoton wächst (sofern r > 0 ist) oder monoton fällt (sofern r < 0 ist).
      • Zum anderen bringt der Betrag des Pearsonschen Korrelationskoeffizienten die Stärke des linearen Zusammenhanges zwischen zwei Merkmalen zum Ausdruck und stellt somit eine Maßzahl für die Güte der Approximation der gegebenen Datenpunkte durch die Regressionsgerade dar (siehe nachfolgende Abbildungen).
    • Zwei Korrelationskoeffizienten:

      • Pearson Correlation Coefficient (PCC, Pearson's r): Messung des Zusammenhanges zwischen intervall- bzw. rationalskalierten Variablen
      • Spearman's Rank Correlation Coefficient (Spearman's \rho /rho): Beurteilung des Zusammenhanges zwischen ordinalskalierten Merkmalen

    • Räumliche Autokorrelation

      Die "Räumliche Autokorrelation" gibt an, ob verschiedene Regionen in Bezug auf ein dargestelltes Merkmal gehäuft ("Cluster"), regelmäßig oder zufällig im geographischen Raum verteilt sind.

      Das Werkzeug "Räumliche Autokorrelation" eines GIS gibt fünf Werte zurück: Moran's I-Index (Grad der Clusterung im Gesamtdatensatz), erwarteter Index, Standardabweichung/Varianz, z-Ergebnis (Signifikanzlevel der räumlichen Verteilung) und p-Wert (Indikator für Signifikanz).

      Wenn die Aussage signifikant ist (das z-Ergebnis oder der p-Wert auf statistische Bedeutung hinweist), zeigt ein positiver Moran's I-Indexwert eine Tendenz zur Cluster-Bildung und ein negativer Moran's I-Indexwert eine Tendenz zur Streuung an.

      Bildliche Darstellung der räumlichen Verteilung von Datensätzen:

      Zufällig verteilte bis gelusterte Anordnung von Regionen

      

      Zusammenhang zwischen Standardabweichung und räumlicher Autokorrelation

      z-Transformation: Erwartungswert 0, Standardabweichung 1

      Zusammenhang Standardabweichung und räumliche Autokorrelation

      Beispiel: Local Moran's I:

      http://homepage.univie.ac.at/doris.riedl/model0910/tut_geostat/images/morans_i.jpg

      • Parameter
        • n ... Anzahl der Punkte
        • xi ... Attributwert am Punkt i
        • xj ... Attributwert am Punkt j
        • x̄ ... Mittelwert von x (aller Punkte)
        • wij ... räumlicher Gewichtungsfaktor
        • i != j

      • Normalisierung über:
        • Summe aller Gewichte
        • Summe aller quadrierten Differenzen von xi und x

      Schematisches Beispiel der Funktionalität der räumlichen Gewichte: