Statistik:Zentralmaße
Inhaltsverzeichnis
Zentralmaße - statistische Kennzahlen für das Mittel
Um „das Mittel“ zu berechnen, gibt es verschiedene Möglichkeiten. Dabei hat jede Vor- und Nachteile:
Arithmetisches Mittel $\bar{x}$
Definition
Das arithmetische Mittel, auch Durchschnitt oder Mittelwert genannt, ist nur bei metrisch skalierten Merkmalen anwendbar und wird berechnet, indem man alle vorhandenen Werte addiert und die Summe dieser Werte dann durch die Gesamtanzahl der Werte dividiert.
Beachte: Es gibt Merkmale in Datenlisten, die eine Berechnung des arithmetischen Mittels unmöglich machen (z. B.: Augenfarben, Güteklassen, …). Auch bei Schulnoten, genauer zur Berechnung einer „Durchschnittsnote“, wird oftmals das arithmetische Mittel fälschlicherweise herangezogen. Schulnoten sind ausschließlich ordinal skaliert, denn die Abstände zwischen den Noten sind nicht genauer definiert.
Beispiel: Bei einem Test erzielten $5$ Teilnehmer*innen folgende Punktezahlen: $\{ 1;2;2;2;5\}$. Das arithmetische Mittel (= „Durchschnittspunktezahl“) ergibt:
$$\bar{x}=\frac{1+2+2+2+5}{5}=\frac{12}{5}=2.4$$
|
Das arithmetische Mittel $\bar{x}$ ist definiert als
$$\bar{x}=\frac{x_1+x_2+...+x_n}{n}$$ $$(\text{Summe aller Werte dividiert durch die Gesamtanzahl})$$ Formal mithilfe des Summenzeichens: $$\bar{x}=\frac{1}{n}\cdot \sum_{i=1}^{n} x_i$$ |
Idee des arithmetischen Mittels als Schwerpunkt
Übung zur Definition einer Menge |
---|
|
Falls das Applet nicht angezeigt wird, klicke hier. |
Das gewichtete arithmetische Mittel
Sind bereits die absoluten oder relativen Häufigkeiten für das arithmetische Mittel bekannt, so kann auch eine der folgenden Formeln für das „gewichtete arithmetische Mittel“ verwendet werden:
|
Formel mit der absoluten Häufigkeit
$$\bar{x}=\frac{a_1\cdot H_1+a_2\cdot H_2+...}{n}=\frac{1}{n}\cdot \sum_{i} a_i\cdot H_i$$ $$(\text{Summe aller Werte mal deren absolute Häufigkeit dividiert durch die Gesamtanzahl})$$ |
Beispiel zur Berechnung des arithmetischen Mittels mithilfe der absoluten Häufigkeiten:
Gegeben sind die folgenden Punktezahlen: $\{ 1;2;2;2;5\} $. Zuerst erstellen wir die Häufigkeitstabelle:
Punktezahl $a_i$ | $H_i$ | $h_i$ |
---|---|---|
1 | 1 | $\frac{1}{5}=20 \%$ |
2 | 3 | $\frac{3}{5}=60 \%$ |
5 | 1 | $\frac{1}{5}=20 \%$ |
$\sum$ | 5 | $\frac{5}{5}=100 \%$ |
Setzen wir in die Formel für die absolute Häufigkeit ein, so erhalten wir
$$\bar{x}=\frac{a_1\cdot H_1+a_2\cdot H_2+a_3\cdot H_3}{n}$$
$$\bar{x}=\frac{1\cdot 1+2\cdot 3+5\cdot 1}{5}=\frac{12}{5}=2.4$$
|
Formel mit der relativen Häufigkeit
$$\bar{x}=a_1\cdot h_1+a_2\cdot h_2+...=\sum_{i} a_i\cdot h_i $$ $$(\text{Summe aller Werte mal deren relative Häufigkeit})$$
|
Beispiel zur Berechnung des arithmetischen Mittels mithilfe der relativen Häufigkeiten:
Gegeben sind die Punktezahlen $\{ 1;2;2;2;5\} $. Um das arithmetische Mittel zu berechnen, lesen wir die Werte sowie die relativen Häufigkeiten aus der Häufigkeitstabelle und setzen in die Formel ein:
Punktezahl $a_i$ | $H_i$ | $h_i$ |
---|---|---|
1 | 1 | $\frac{1}{5}=20 \%$ |
2 | 3 | $\frac{3}{5}=60 \%$ |
5 | 1 | $\frac{1}{5}=20 \%$ |
$\sum$ | 5 | $\frac{5}{5}=100 \%$ |
$$\bar{x}=a_1\cdot h_1+a_2\cdot h_2+a_3\cdot h_3=1\cdot \frac{1}{5}+2\cdot \frac{3}{5}+5\cdot \frac{1}{5}$$
$$\bar{x}=\frac{12}{5}=2.4$$
Zusammenfassung
|
|
Neben dem arithmetischen Mittel gibt es nun noch einen weiteren wichtigen Zentralwert, den ...
Median $Q_2$ ($=$ mittleres oder 2. Quartil)
|
Sortiert man eine Datenliste der Größe nach, so ist der Median $Q_2$ der Wert in der Mitte der geordneten Liste.
Liegen genau zwei Werte in der Mitte (was immer dann der Fall ist, wenn die Anzahl der Werte $n$ gerade ist), so ist $Q_2$ das arithmetische Mittel dieser beiden Werte.
Formal: $\begin{align} &Q_2=x_{\frac{n+1}{2} }&& \textrm{ für ungerade $n$}\\ &Q_2=\frac{1}{2}\cdot \left(x_{\frac{n}{2} }+ x_{\frac{n}{2}+1 } \right)&& \textrm{ für gerade $n$}\\ \end{align}$ |
Beispiel für den Median
Gegeben ist die folgende Liste an Punktezahlen: $\{1;2;2;2;5\}$. Ermitteln Sie den Median $Q_2$.
Lösung: Insgesamt sind es $n=5$ Werte. Da die Liste bereits nach Größe geordnet ist, können wir den Median einfach ablesen:
durch Ablesen | $\{1;2;\color{red}{2};2;5\}$ |
rechnerisch | $Q_2=x_{\frac{5+1}{2}}=x_3=2$ |
Antwort: Der Median $Q_2$ ist der Wert an der dritten Stelle und somit $Q_2=2$.
$Aha!$ $\ $ Mithilfe dieses Applets kannst du die wichtigsten Eigenschaften des arithmetischen Mittels (Mittelwert) und des Medians noch einmal überprüfen.
Vorteil des Medians - Nachteil des arithmetischen Mittels
Vergleichen wir noch einmal das arithmetische Mittel und den Median unserer Liste $\{1; 2; 2; 2; 5\}$. $$\bar{x}=2.4 \textrm{ und } Q_2=2$$ Warum ist das arithmetische Mittel größer als der Median?
Antwort: Der Grund liegt darin, dass das arithmetische Mittel durch den „Ausreißer“ $5$ verzerrt wurde. Der Median hat sich dadurch nicht verändert.
|
Allgemein gilt:
Hinweis: Als Ausreißer gelten Zahlen, die im Vergleich zu den anderen Werten sehr klein oder sehr groß sind. |
$Aha!$ $\ $ Zur besseren Verdeutlichung kannst du dir dieses Arbeitsblatt ansehen (klicke dabei zuerst auf „Median“ und „Mittelwert“ und verändere dann die Zahlen).
Aufgaben zum Arbeitsblatt
- Setze „Zahl der Datenwerte“ auf $5$.
- Schiebe nun $4$ Werte auf „$1$“ und einen auf „$4$“. Wie verhält sich der Median, wie der Mittelwert?
- Verteile anschließend alle $5$ Werte gleichmäßig auf den Zahlengeraden.
- Nimm dann den ganz linken Wert und verschiebe ihn langsam ganz nach rechts. Beobachte dabei, wann und wie sich Median und arithmetisches Mittel verändern.
Lösungen:
1. Der Median ist der mittlere Wert aller $5$ Werte und bleibt deshalb bei $1$. Der Mittelwert liegt dagegen zwischen $1$ und $4$.
2. Der Median bleibt gleich, solange der zu verschiebende Wert nicht in der Mitte ist. Der Mittelwert ändert seinen Wert ständig.
Hinweis: Ein etwas komplexeres Arbeitsblatt findest du hier.
Modus/Modalwert
|
Der Modus (auch Modalwert genannt) ist der häufigste Wert in einer Datenreihe (d. h. jener Wert mit der größten absoluten Häufigkeit).
Dann ist der Modus gleich $2$, da $2$ mit einer absoluten Häufigkeit von $H=3$ erscheint. |
Geometrisches Mittel
Das Geometrische Mittel wird verwendet, um einen „durchschnittlichen Faktor“ zu ermitteln. So kann damit beispielsweise der durchschnittliche Wachstumsfaktor oder die durchschnittliche Verzinsung berechnet werden.
|
Sind $r_1,\ ...,\ r_5$ verschiedene Wachstumsfaktoren, dann ist
$$\bar{x}_{geo}=\sqrt[n]{r_1\cdot r_2\cdot r_3\dots r_n}$$ der durchschnittliche Wachstumsfaktor.
|
Das jährliche Wachstum eines Kapitals von $K_0=100$ Euro ist in folgender Tabelle gegeben.
Jahr | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Verzinsung | 5 % | 3 % | -4 % | 2 % | -1 % |
a) Berechnen Sie das Kapital am Ende des $5$. Jahres.
b) Ermitteln Sie um welchen Prozentsatz das Kapital durchschnittlich pro Jahr gewachsen ist.
Wiederholung: Aufzinsen heißt, mit dem Wachstumsfaktor $r$ multiplizieren. $$K_5=K_0\cdot r_1\cdot r_2\cdot r_3\cdot r_4\cdot r_5$$ $$K_5=100\cdot 1.05\cdot 1.03\cdot 0.96\cdot 1.02\cdot 0.99$$ $$K_5=104.84$$
Antwort: Das Kapital nach $5$ Jahren beträgt $€ 104.84$.
b) Ermitteln Sie um welchen Prozentsatz das Kapital durchschnittlich pro Jahr gewachsen ist.
Hier gibt es nun $2$ Möglichkeiten:
1. Möglichkeit: mithilfe des geometrischen Mittels
$$\bar{x}_{geo}=\sqrt[n]{r_1\cdot r_2\cdot r_3 \dots r_n}$$
$$\bar{x}_{geo}=\sqrt[5]{1.05\cdot 1.03\cdot 0.96\cdot 1.02\cdot 0.99}$$
$$\bar{x}_{geo} = 1.0095$$
Der durchschnittliche Zinssatz beträgt $0.95 \%$.
2. Möglichkeit: mithilfe des Anfangs- und Endkapitals und der Formel $K_n=K_0\cdot r^n$
Wir wissen: $K_0=100$ und $K_5=104.84$.
Gesucht ist nun der durchschnittliche Aufzinsungsfaktor $r$ in der Zinseszinsformel $K_n=K_0\cdot r^n$:
$$K_n=K_0\cdot r^n$$ $$104.84=100\cdot r^5$$ $$r=1.0095$$ Der durchschnittliche Zinssatz beträgt $0.95 \%$.