Definitionen
Definition 2-5:
Der Modus (Modalwert, engl. mode) ist jene Merkmalsausprägung, welche am häufigsten vorkommt.
Sofern zwei oder mehrere benachbarte Merkmalsausprägungen mit derselben Häufigkeit auftreten, sieht man das arithmetische Mittel dieser Ausprägungen als Modus[1] an; kommen hingegen zwei oder mehrere nicht benachbarte Merkmalsausprägungen mit derselben Häufigkeit vor, betrachtet man jede dieser Ausprägungen als Modus. Sofern alle Merkmalsausprägungen einer Häufigkeitsverteilung gleich oft vorkommen, besitzt die Verteilung keinen Modalwert. Bei gruppierten Daten betrachtet man die Mitte jener Klasse, welche die größte Häufigkeit besitzt, als Modus.
Beispiel:
.
Definition 2-6:
Der Median (Zentralwert, engl. median) ist jener Wert in einer der Größe nach geordneten Datenreihe x1 , x2 , ...., xn , der
- bei einer ungeraden Anzahl von xi "in der Mitte steht" bzw.
- bei geraden Anzahl von xi dem arithmetischen Mittel der beiden "mittleren" Werte entspricht,
wobei eine zahlenmäßige Kodierung der Merkmalsausprägungen vorausgesetzt wird.
Es ist evident, dass der Median, der per definitionem eine gegebene Häufigkeitsverteilung in zwei gleich große Hälften teilt, von ordinal-, intervall- und rationalskalierten, nicht aber von nominalskalierten Variablen ermittelt werden; für ordinalskalierte Merkmale ist er zudem der am besten geeignete Lageparameter, da er die in den Daten enthaltene Information zu einem wesentlich höheren Grad als der Modus in die Berechnung einfließen lässt.
Beispiel:
.
Definition 2-7:
Unter dem arithmetischen Mittel (Durchschnittswert, Mittelwert, engl. mean) einer Stichprobe x1, x2, ...., xn versteht man die Summe aller Werte dividiert durch ihr Anzahl n.
Aufgrund seiner Definition kann das arithmetische Mittel, bei welchem es sich zweifelsohne um den wichtigsten aller Lageparameter handelt, nur von intervall- und rationalskalierten, nicht aber von nominal- und ordinalskalierten Variablen berechnet werden.
Die Vorteile des arithmetischen Mittels liegen darin, dass es stets eindeutig bestimmt ist und dass es die in den Daten enthaltene Information vollständig berücksichtigt. Als Nachteile des arithmetischen Mittels sind anzuführen, dass es im Allgemeinen bei diskreten Variablen keine Entsprechung in der Wirklichkeit besitzt (z. B. durchschnittliche Kinderzahl, durchschnittliches Einkommen usw.) und dass es - im Unterschied zum Median - von extremen Werten sehr stark beeinflusst wird. Zur Charakterisierung einer Häufigkeitsverteilung eignet sich das arithmetische Mittel somit vor allem dann, wenn diese symmetrisch und eingipfelig ist.
Die Bezeichnung x mit überliegendem Querstrich ist für das arithmetische Mittel dann üblich, wenn es sich bei den Werten x1, x2, ..., xn um eine Stichprobe handelt; bilden die Werte x1, x2, ..., xn hingegen eine Population, bezeichnet man das arithmetische Mittel mit μ.
Beispiel:
Definition 2-9:
Unter dem geometrischen Mittel xG der Werte x1, x2, ..., xn versteht man die n-te Wurzel aus dem Produkt dieser n Werte.
Aufgrund seiner Definition kann das geometrische Mittel nur von rationalskalierten, nicht aber von nominal-, ordinal- und intervallskalierten Variablen berechnet werden.
Die Vorteile des geometrischen Mittels liegen darin, dass es stets eindeutig bestimmt ist, dass es die in den Daten enthaltene Information vollständig berücksichtigt und dass es extremen Merkmalswerten ein wesentlich geringeres Gewicht als das arithmetische Mittel beimisst. Als Nachteile des geometrischen Mittels sind hingegen anzuführen, dass es sich nur dann berechnen lässt, wenn sämtliche Werte größer als Null sind, dass es - ebenso wie das arithmetische Mittel - im Allgemeinen keinem tatsächlich beobachteten Wert entspricht und dass es weniger leicht als die übrigen Lageparameter zu interpretieren ist. Das geometrische Mittel findet im Speziellen bei jenen Aufgabenstellungen Anwendung, in denen relative Größenänderungen wie z. B. Wachstumsraten auftreten.
Beispiel:
[1] Dies setzt allerdings eine zumindest intervallskalierte Variable voraus.