Beschreibende Statistik

[+/-]

Widgets

Widgets

Letzte Änderungen
Gewünschte Seiten
Wer ist online?
Aus Matura Wiki
Wechseln zu: Navigation, Suche

Einleitung

In der beschreibenden Statistik beschäftigen wir uns mit der Auswertung von Datenmengen. Die Auswertung erfolgt dabei über graphische Darstellungsformen (Diagramme) und einzelne aussagekräftige Kennzahlen (z. B. Mittelwert, Spannweite, ...), mit denen Rückschlüsse auf die Grundgesamtheit aller Daten gezogen werden können.

$Step\ by\ Step!$ $ \$ Weiterer Lernpfad zur beschreibenden Statistik] =Daten und Diagramme = == Begriffe == $n...$ Umfang der Stichprobe $x_1...$ Zahl an der 1. Stelle $x_i...$ Zahl an der $i.$ Stelle $\{ x_1;x_2;.....;x_n \} ...$ Stichprobe (z. B. $\{ 1; 2; 5; 5; 5; 10;\}$ ) $a_1...$ erster Wert, der in der Stichprobe vorkommt (im oberen Beispiel ist $a_1=1$) $a_4...$ vierter Wert, der in der Stichprobe vorkommt (im oberen Beispiel ist $a_4=10$) $a_i...$ $i.$ Wert, der in der Stichprobe vorkommt


== Arten von Merkmalen/Daten == Im Groben unterscheidet man zwischen $3$ Arten von Merkmalen: * '''Nominale Merkmale''' können nicht sinnvoll durch eine Zahl beschrieben oder in eine Reihenfolge gebracht werden. Beispiele sind „Geschlecht“ und „Haarfarbe“. * '''Ordinale Merkmale''' können in eine Reihenfolge gebracht werden, eignen sich aber nicht für Rechnungen (wie z. B. Addition). Beispiele sind „Platzierung bei einem Rennen“ und „Bildungsabschlüsse“. * '''Metrische Merkmale''' können durch Zahlen beschrieben werden, mit denen man auch rechnen kann. Beispiele sind „Gehalt“, „Alter“ und „Schuhgröße“.

== Absolute und relative Häufigkeit == {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Die '''absolute Häufigkeit $H_i$''' gibt an, wie oft das $i-$te Element in der Stichprobe auftritt. Z. B.: In der Menge $\{ 1;2;2;2;4;4;6\}$ ist die absolute Häufigkeit der Zahl $2$ genau $H=3$, da die $2$ insgesamt dreimal vorkommt. |} [[Datei:Bsp.png|left]]

Aus der absoluten Häufigkeit kann man noch nicht darauf schließen, ob ein Merkmal wirklich häufig auftritt oder nicht, da es immer auch auf die Gesamtanzahl $n$ der untersuchten Werte ankommt. So ist eine absolute Häufigkeit von $100$ für $n=150$ sehr groß, für $n=1$ Mrd. dagegen wohl eher klein. In solchen Fällen ist es hilfreich zu wissen, wie viel '''Prozent''' der Gesamtmenge $n$ dieses Merkmal besitzen. Dies wird berechnet mit ... {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Die '''relative Häufigkeit $h_i$''' gibt an, mit wie viel Prozent ein Merkmal in Bezug auf die Gesamtmenge $n$ auftritt. Es gilt: UNIQ0c4683f3b1b53c15-MathJax-4-QINU Z. B.: In der Menge $\{1;2;2;2;4;4;6\}$ ist die absolute Häufigkeit der Zahl $2$ genau $H=3$, die relative Häufigkeit ergibt sich dann mit: UNIQ0c4683f3b1b53c15-MathJax-5-QINU |} [[Datei:Bsp.png|left]]

Berechnen Sie mithilfe der Tabelle aus der Schuhgrößenumfrage (siehe oben) die relativen Häufigkeiten $h_i$. {| class="wikitable" |- ! Werte $a_i$ ! absolute Häufigkeiten $H_i$ ! relative Häufigkeiten $h_i$ |- | 36 | 3 | $\ \ \ $ |- | 37 | 4 | |- | 38 | 2 | |- | 40 | 1 | |- | 41 | 1 | |- | 42 | 3 | |- | 46 | 1 | |- | '''Summe''' | '''15''' | |}

'''Lösung''' $n=15$ { {| class="wikitable" |- ! Werte $a_i$ ! absolute Häufigkeiten $H_i$ ! relative Häufigkeiten $h_i$ |- | 36 | 3 | $\frac{3}{15}=20$% |- | 37 | 4 | $\frac{4}{15}=26.7$% |- | 38 | 2 | $\frac{2}{15}=13.3$% |- | 40 | 1 | $\frac{1}{15}=6.7$% |- | 41 | 1 | $\frac{1}{15}=6.7$% |- | 42 | 3 | $\frac{3}{15}=20$% |- | 46 | 1 | $\frac{1}{15}=6.7$% |- | '''Summe''' | '''15''' | '''$\frac{15}{15}=100$%''' |}


== Diagramme == === Säulen- und Balkendiagramm === In Säulendiagrammen gibt die $y$-Achse die absolute Häufigkeit (oder relative Häufigkeit) eines Merkmals auf der $x$-Achse an. [[Datei:Säulendiagramm-bsp1-excel.png|500px|mini|zentriert|Säulendiagramm der Schuhgrößen]] Bei Balkendiagrammen sind die Achsen vertauscht. [[Datei:Balkendiagramm-bsp1.png|500px|mini|zentriert|Balkendiagramm der Schuhgrößen]] === Histogramm === Analog zum Säulen- und Balkendiagramm können absolute Zahlen und Prozentsätze auch in einem Histogramm dargestellt werden. In beiden Fällen ist auf eine geeignete Beschriftung der Achsen zu achten. Im Unterschied zu einem Säulendiagramm entsprechen die absoluten oder relativen Häufigkeiten nun nicht mehr den Höhen der Säulen, sondern den rechteckigen Flächen der Säulen. Auf Zwischenräume bei den einzelnen Säulen kann auch verzichtet werden. Bei einem Histogramm mit Klasseneinteilung werden zuerst die Werte zu Klassen zusammengefasst, wobei möglichst gleich breite Klassen anzustreben sind. Für die Höhe der Rechtecke gilt: UNIQ0c4683f3b1b53c15-MathJax-6-QINU
Im Beispiel fassen wir die Schuhgrößen in Klassen mit der Klassenbreite $2$ zusammen und erstellen eine Häufigkeitstabelle. {| class="wikitable" |- ! Schuhgrößen ! absolute Häufigkeiten $H_i$ ! relative Häufigkeiten $h_i$ ! Rechteckshöhe |- | $[36; 38[$ | $7$ | $\frac{7}{15}=46.7 \% $ | $\frac{7}{2}=3.5$ bzw. $\frac{46.7}{2}=23.3$ |- | $[38; 40[$ | $2$ | $\frac{2}{15}=13.3 \%$ | $\frac{2}{2}=1$ bzw. $\frac{13.3}{2}=6.7$ |- | $[40; 42[$ | $2$ | $\frac{2}{15}=13.3 \%$ | $\frac{2}{2}=1$ bzw. $\frac{13.3}{2}=6.7$ |- | $[42; 44[$ | $3$ | $\frac{3}{15}=20 \%$ | $\frac{3}{2}=1.5$ bzw. $\frac{20}{2}=10$ |- | $[44; 46
$ | $1$ | $\frac{1}{15}=6.7 \%$ | $\frac{1}{2}=0.5$ bzw. $\frac{6.7}{2}=3.3$ |}
Anhand der Daten aus der Tabelle lassen sich abschließend Histogramme mit absoluten bzw. relativen Häufigkeiten erstellen.

[[Datei:Histogramm absolut.png|500px|mini|zentriert|Histogramm mit absoluten Häufigkeiten]]
[[Datei:Histogramm relativ.png|500px|mini|zentriert|Histogramm mit relativen Häufigkeiten]]

=== Kreisdiagramm === Bei Kreisdiagrammen entspricht ein Kreissegment der relativen Häufigkeit eines Merkmals. Alle Kreissegmente zusammen (d. h. alle relativen Häufigkeiten) ergeben einen ganzen Kreis (d. h. $100 \%$). [[Datei:Kreisdiagramm.png|500px|mini|zentriert|Kreisdiagramm der Schuhgrößen]] {| border ="1" cellpadding="10" | {| !| '''Merke''' |- | [[Datei:Rotes rufezeichen.png|center]] |} |[[Datei:Kreisdiagram-3d.png|300px|mini|rechts|Kreisdiagramm mit 3d-Effekt]] '''Schummeln mit Kreisdiagrammen''' Bei dreidimensionalen Kreisdiagrammen erscheinen Segmente im hinteren Bereich kleiner als Segmente im vorderen Bereich. Deshalb sollte man auf den 3d-Effekt verzichten. |} === Boxplot (Kastenschaubild) === Boxplot-Diagramme geben einen Überblick über die Verteilung der Daten, indem Sie die Datenreihe in vier $25 \%$-Bereiche teilen. Hierbei bildet der Bereich zwischen den [[Statistik:Streuungsmaße#Quartile|Quartilen]] den „Kasten“, von dem aus die Antennen zum minimalen und maximalen Wert gehen ($x_{min}$ und $x_{max}$). [[Datei:Boxplot-allgemein.png|500px|mini|zentriert|Boxplot-Diagramm]] {| border ="1" cellpadding="10" | {| !| '''Merke''' |- | [[Datei:Rotes rufezeichen.png|center]] |} |In jedem der $4$ Bereiche eines Boxplot-Diagramms liegen ca. $25 \%$ aller Werte |} [[Datei:Bsp.png|left]]

Gegeben ist das folgende Boxplot-Diagramm, das aus den Daten der Schuhgrößen erstellt wurde. [[Datei:Boxplot-bsp-schuhe-ohnebeschriftungen.png|500px|mini|zentriert|Boxplot der Daten für die Schuhgrößen]] Entscheiden Sie, ob die folgenden Aussagen richtig oder falsch sind und begründen Sie diese Entscheidung: # Die Anzahl der Werte zwischen $36$ und $37$ ist mit Sicherheit geringer als die Anzahl der Werte zwischen $42$ und $46$. # Weniger als $25 \%$ aller Werte sind kleiner oder gleich $42$.

$\ $ # Falsch! Da jeder Bereich ca. $ 25 \%$ aller Werte umfasst, liegen in beiden Bereichen ungefähr gleich viele Werte. # Falsch! Es sind mindestens $75 \%$ aller Werte kleiner oder gleich $42$ (oder weniger als $25 \%$ aller Werte sind '''größer''' als $42$).
==== Hilfreiche GeoGebra-Applets ==== *'''Boxplot (Andreas Lindner):''' https://www.geogebra.org/m/n59E5Dtm *'''Boxplot Game (Barbara Baker)''': https://www.geogebra.org/m/JRgG3xec *'''Median und arithmetischer Mittelwert (Sandi Reichenberger):''' https://www.geogebra.org/m/hK3SSww7 *'''Sammlung von Statistik-Applets (Kurt Söser):''' https://www.geogebra.org/m/R2ABEB3M

=Schummeln mit Statistik= ==Manipulieren von Liniendiagrammen==
Die folgende Tabelle bildet die Grundlage für das Einführungsbeispiel:

Anzahl der im Straßenverkehr Getöteten in Österreich: {| width="687" border=1 |- | width="48"| Jahr | width="32"| 1995 | width="32"| 1996 | width="32"| 1997 | width="32"| 1998 | width="32"| 1999 | width="32"| 2000 | width="32"| 2001 | width="32"| 2002 | width="32"| 2003 | width="32"| 2004 | width="32"| 2005 | width="32"| 2006 | width="32"| 2007 | width="32"| 2008 | width="32"| 2009 | width="32"| 2010 | width="32"| 2011 | width="32"| 2012 | width="32"| 2013 | width="32"| 2014 | width="32"| 2015 |- | width="48"| Getötete | width="32"| 1210 | width="32"| 1027 | width="32"| 1105 | width="32"| 963 | width="32"| 1079 | width="32"| 976 | width="32"| 958 | width="32"| 956 | width="32"| 931 | width="32"| 878 | width="32"| 768 | width="32"| 730 | width="32"| 691 | width="32"| 679 | width="32"| 633 | width="32"| 552 | width="32"| 521 | width="32"| 531 | width="32"| 455 | width="32"| 430 | width="32"| 475 |} Quelle: Statistik Austria

Das entsprechende Liniendiagramm sieht folgendermaßen aus:
[[Datei:Getoetete1.PNG|thumb|left|490px]]

Die an sich schon beeindruckende Statistik kann aber durchaus noch beeindruckender dargestellt werden, indem verschiedene Manipulationsmöglichkeiten angewendet werden.


==Gezielte Auswahl der Datenreihe== In den Jahren 1999 bis 2014 sind die Werte bis auf eine kleine Ausnahme immer gesunken. Diese Daten nehmen wir im folgenden Diagramm.


==Verkürzung der $y$-Achse== Um das Sinken der Werte noch deutlicher zu machen, wird die $y$-Achse erst bei $400$ gestartet.
[[Datei:Getoetete2.PNG|thumb|left|487px]]
Schon beeindruckender, nicht?


==Dehnen und Stauchen der Achsen== Eine einfache Art, die Steilheit des Graphen zu verändern, ist das Stauchen der $x$-Achse bzw. entsprechendes Dehnen der $y$-Achse.
[[Datei:Getoetete3.PNG|thumb|left|356px]]
= Interaktive Übungen = == Quiz: Beschreibende Statistik (WS 1.1-1.4) ==
[[Kategorie:Statistik]] = Zentralmaße - statistische Kennzahlen für das Mittel = Um „das Mittel“ zu berechnen, gibt es verschiedene Möglichkeiten. Dabei hat jede Vor- und Nachteile: == Arithmetisches Mittel $\bar{x}$ == ===Definition === Das arithmetische Mittel, auch Durchschnitt oder Mittelwert genannt, ist nur bei [[Statistik:Daten und Diagramme#Arten von Merkmalen/Daten|metrisch]] skalierten Merkmalen anwendbar und wird berechnet, indem man alle vorhandenen Werte addiert und die Summe dieser Werte dann durch die Gesamtanzahl der Werte dividiert. '''Beachte:''' Es gibt Merkmale in Datenlisten, die eine Berechnung des arithmetischen Mittels unmöglich machen (z. B.: Augenfarben, Güteklassen, …). Auch bei Schulnoten, genauer zur Berechnung einer „Durchschnittsnote“, wird oftmals das arithmetische Mittel fälschlicherweise herangezogen. Schulnoten sind ausschließlich [[Statistik:Daten und Diagramme#Arten von Merkmalen/Daten|ordinal]] skaliert, denn die Abstände zwischen den Noten sind nicht genauer definiert. '''Beispiel:''' Bei einem Test erzielten $5$ Teilnehmer*innen folgende Punktezahlen: $\{ 1;2;2;2;5\}$. Das arithmetische Mittel (= „Durchschnittspunktezahl“) ergibt: UNIQ0c4683f3b1b53c15-MathJax-7-QINU {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Das '''arithmetische Mittel''' $\bar{x}$ ist definiert als UNIQ0c4683f3b1b53c15-MathJax-8-QINU UNIQ0c4683f3b1b53c15-MathJax-9-QINU Formal mithilfe des [[Summe|Summenzeichens]]: UNIQ0c4683f3b1b53c15-MathJax-10-QINU |} ===Idee des arithmetischen Mittels als Schwerpunkt=== {| border="1" align="center" |- !|Übung zur Definition einer Menge |- ||
|- ||Falls das Applet nicht angezeigt wird, klicke [https://www.geogebra.org/m/Dh5sBVyz hier]. |}
=== Das gewichtete arithmetische Mittel === Sind bereits die absoluten oder relativen Häufigkeiten für das arithmetische Mittel bekannt, so kann auch eine der folgenden Formeln für das „''gewichtete arithmetische Mittel''“ verwendet werden: {| border ="1" cellpadding="10" | {| !| '''Merke''' |- | [[Datei:Rotes rufezeichen.png|center]] |} |'''Formel mit der absoluten Häufigkeit''' UNIQ0c4683f3b1b53c15-MathJax-11-QINU UNIQ0c4683f3b1b53c15-MathJax-12-QINU |} '''Beispiel zur Berechnung des arithmetischen Mittels mithilfe der absoluten Häufigkeiten:''' Gegeben sind die folgenden Punktezahlen: $\{ 1;2;2;2;5\} $. Zuerst erstellen wir die Häufigkeitstabelle:
{| class="wikitable" |- ! Punktezahl $a_i$ !! $H_i$ !! $h_i$ |- | 1 || 1 || $\frac{1}{5}=20 \%$ |- | 2 || 3 || $\frac{3}{5}=60 \%$ |- | 5 || 1 || $\frac{1}{5}=20 \%$ |- ! [[Summe|$\sum$]] !! 5 || $\frac{5}{5}=100 \%$ |}
Setzen wir in die Formel für die absolute Häufigkeit ein, so erhalten wir UNIQ0c4683f3b1b53c15-MathJax-13-QINU UNIQ0c4683f3b1b53c15-MathJax-14-QINU
{| border ="1" cellpadding="10" | {| !| '''Merke''' |- | [[Datei:Rotes rufezeichen.png|center]] |} |'''Formel mit der relativen Häufigkeit''' UNIQ0c4683f3b1b53c15-MathJax-15-QINU UNIQ0c4683f3b1b53c15-MathJax-16-QINU Wichtig: Eine fast identische Formel wird später wieder für den [[Wahrscheinlichkeit: Diskrete Zufallsvariablen und die Binomialverteilung#Erwartungswert und Standardabweichung|Erwartungswert einer diskreten Zufallsvariable]] verwendet. |} '''Beispiel zur Berechnung des arithmetischen Mittels mithilfe der relativen Häufigkeiten:''' Gegeben sind die Punktezahlen $\{ 1;2;2;2;5\} $. Um das arithmetische Mittel zu berechnen, lesen wir die Werte sowie die relativen Häufigkeiten aus der Häufigkeitstabelle und setzen in die Formel ein:
{| class="wikitable" |- ! Punktezahl $a_i$ !! $H_i$ !! $h_i$ |- | 1 || 1 || $\frac{1}{5}=20 \%$ |- | 2 || 3 || $\frac{3}{5}=60 \%$ |- | 5 || 1 || $\frac{1}{5}=20 \%$ |- ! [[Summe|$\sum$]] !! 5 || $\frac{5}{5}=100 \%$ |}
UNIQ0c4683f3b1b53c15-MathJax-17-QINU UNIQ0c4683f3b1b53c15-MathJax-18-QINU

=== Zusammenfassung ===
{| class="wikitable" cellpadding="10" | {| !| '''Welche Formel verwende''' '''ich für $\bar{x}$?''' |- | [[Datei:Rotes rufezeichen.png|center]] |} | {| border="1" cellpadding="10" ! Ist Folgendes gegeben ... !! ... verwende ich diese Formel |- | absolute Häufigkeiten $H_i$ | UNIQ0c4683f3b1b53c15-MathJax-19-QINU |- | relative Häufigkeiten $h_i$ | UNIQ0c4683f3b1b53c15-MathJax-20-QINU |- | weder $H_i$ noch $h_i$ | UNIQ0c4683f3b1b53c15-MathJax-21-QINU |} |}
Neben dem arithmetischen Mittel gibt es nun noch einen weiteren wichtigen Zentralwert, den ...

== Median $Q_2$ ($=$ mittleres oder 2. Quartil)==
{| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Sortiert man eine Datenliste der Größe nach, so ist der '''Median $Q_2$ der Wert in der Mitte der geordneten Liste'''. Liegen genau zwei Werte in der Mitte (was immer dann der Fall ist, wenn die Anzahl der Werte $n$ gerade ist), so ist $Q_2$ das arithmetische Mittel dieser beiden Werte. '''Formal''': $\begin{align} &Q_2=x_{\frac{n+1}{2} }&& \textrm{ für ungerade UNIQ0c4683f3b1b53c15-MathJax-193-QINU}\\ &Q_2=\frac{1}{2}\cdot \left(x_{\frac{n}{2} }+ x_{\frac{n}{2}+1 } \right)&& \textrm{ für gerade UNIQ0c4683f3b1b53c15-MathJax-194-QINU}\\ \end{align}$ |} === Beispiel für den Median === Gegeben ist die folgende Liste an Punktezahlen: $\{1;2;2;2;5\}$. Ermitteln Sie den Median $Q_2$. '''Lösung''': Insgesamt sind es $n=5$ Werte. Da die Liste bereits nach Größe geordnet ist, können wir den Median einfach ablesen: {| align="center" padding="2" |- | durch Ablesen || $\{1;2;\color{red}{2};2;5\}$ |- | rechnerisch || $Q_2=x_{\frac{5+1}{2}}=x_3=2$ |} '''Antwort:''' Der Median $Q_2$ ist der Wert an der dritten Stelle und somit $Q_2=2$.


[[Grün: Arbeitsblätter | $Aha!$ ]] $\ $ Mithilfe dieses [https://www.geogebra.org/m/Z33qeYzm Applets] kannst du die wichtigsten Eigenschaften des arithmetischen Mittels (Mittelwert) und des Medians noch einmal überprüfen.


== Vorteil des Medians - Nachteil des arithmetischen Mittels == Vergleichen wir noch einmal das arithmetische Mittel und den Median unserer Liste $\{1; 2; 2; 2; 5\}$. UNIQ0c4683f3b1b53c15-MathJax-22-QINU Warum ist das arithmetische Mittel größer als der Median? '''Antwort:''' Der Grund liegt darin, dass das arithmetische Mittel durch den „Ausreißer“ $5$ verzerrt wurde. Der Median hat sich dadurch nicht verändert. {| border ="1" cellpadding="10" | {| !| '''Merke''' |- | [[Datei:Rotes rufezeichen.png|center]] |} |Allgemein gilt: * Das arithmetische Mittel $\bar{x}$ kann durch einzelne Ausreißer stark beeinflusst werden. * Der Median $Q_2$ wird davon in der Regel nicht beeinflusst. Hinweis: Als Ausreißer gelten Zahlen, die im Vergleich zu den anderen Werten sehr klein oder sehr groß sind. |} [[Grün: Arbeitsblätter | $Aha!$ ]] $\ $ Zur besseren Verdeutlichung kannst du dir [http://rfdz.ph-noe.ac.at/fileadmin/Mathematik_Uploads/Medienvielfalt/Medienvielfalt3/lernpfad_statistik/index.html dieses Arbeitsblatt] ansehen (klicke dabei zuerst auf „Median“ und „Mittelwert“ und verändere dann die Zahlen).
'''Aufgaben zum Arbeitsblatt'''
UNIQ0c4683f3b1b53c15-MathJax-23-QINU # Setze „Zahl der Datenwerte“ auf $5$. #: Schiebe nun $4$ Werte auf „$1$“ und einen auf „$4$“. Wie verhält sich der Median, wie der Mittelwert? # Verteile anschließend alle $5$ Werte gleichmäßig auf den Zahlengeraden. #: Nimm dann den ganz linken Wert und verschiebe ihn langsam ganz nach rechts. Beobachte dabei, wann und wie sich Median und arithmetisches Mittel verändern. '''Lösungen:''' 1. Der Median ist der mittlere Wert aller $5$ Werte und bleibt deshalb bei $1$. Der Mittelwert liegt dagegen zwischen $1$ und $4$. 2. Der Median bleibt gleich, solange der zu verschiebende Wert nicht in der Mitte ist. Der Mittelwert ändert seinen Wert ständig. Hinweis: Ein etwas [https://www.geogebra.org/m/Z33qeYzm komplexeres Arbeitsblatt findest du hier].


== Modus/Modalwert == {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Der Modus (auch Modalwert genannt) ist der häufigste Wert in einer Datenreihe (d. h. jener Wert mit der größten absoluten Häufigkeit). '''Beispiel''': Gegeben ist die Datenreihe $\{1; 2; 2; 2; 5\}$. Dann ist der Modus gleich $2$, da $2$ mit einer absoluten Häufigkeit von $H=3$ erscheint. |} == Geometrisches Mittel == Das Geometrische Mittel wird verwendet, um einen „durchschnittlichen Faktor“ zu ermitteln. So kann damit beispielsweise der durchschnittliche [[Wachstums-_und_Zerfallsprozesse#Definition_und_Verwendung_2|Wachstumsfaktor]] oder die durchschnittliche [[Zins-_und_Zinseszinsrechnung|Verzinsung]] berechnet werden. {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Sind $r_1,\ ...,\ r_5$ verschiedene Wachstumsfaktoren, dann ist UNIQ0c4683f3b1b53c15-MathJax-24-QINU der durchschnittliche Wachstumsfaktor. '' Das Geometrische Mittel $\bar{x}_{geo}$ ist die $n$-te Wurzel aller $n$ Faktoren.'' |} {| align="center" |
|} [[Datei:Bsp.png|left]]

Das jährliche Wachstum eines Kapitals von $K_0=100$ Euro ist in folgender Tabelle gegeben. {| border="1" ! Jahr | 1 | 2 | 3 | 4 | 5 |- ! Verzinsung | 5 % | 3 % | -4 % | 2 % | -1 % |} a) Berechnen Sie das Kapital am Ende des $5$. Jahres. b) Ermitteln Sie um welchen Prozentsatz das Kapital durchschnittlich pro Jahr gewachsen ist.

a) Berechnen Sie das Kapital am Ende des $5$. Jahres. '''Wiederholung:''' Aufzinsen heißt, mit dem Wachstumsfaktor $r$ multiplizieren. UNIQ0c4683f3b1b53c15-MathJax-25-QINU UNIQ0c4683f3b1b53c15-MathJax-26-QINU UNIQ0c4683f3b1b53c15-MathJax-27-QINU '''Antwort:''' Das Kapital nach $5$ Jahren beträgt $€ 104.84$. b) Ermitteln Sie um welchen Prozentsatz das Kapital durchschnittlich pro Jahr gewachsen ist. Hier gibt es nun $2$ Möglichkeiten: '''1. Möglichkeit:''' mithilfe des geometrischen Mittels UNIQ0c4683f3b1b53c15-MathJax-28-QINU UNIQ0c4683f3b1b53c15-MathJax-29-QINU UNIQ0c4683f3b1b53c15-MathJax-30-QINU Der durchschnittliche Zinssatz beträgt $0.95 \%$. '''2. Möglichkeit:''' mithilfe des Anfangs- und Endkapitals und der Formel $K_n=K_0\cdot r^n$ Wir wissen: $K_0=100$ und $K_5=104.84$. Gesucht ist nun der durchschnittliche Aufzinsungsfaktor $r$ in der Zinseszinsformel $K_n=K_0\cdot r^n$: UNIQ0c4683f3b1b53c15-MathJax-31-QINU UNIQ0c4683f3b1b53c15-MathJax-32-QINU UNIQ0c4683f3b1b53c15-MathJax-33-QINU Der durchschnittliche Zinssatz beträgt $0.95 \%$.


= Streuungsmaße - statistische Kennzahlen für die Streuung = == Streuung von Daten == Im vorigen Kapitel haben wir gelernt, wie wir verschiedene Arten von Zentralmaßen bestimmen. Ein Zentralmaß allein sagt uns allerdings noch nicht viel über die Verteilung (= Streuung) der Werte aus. {| align="center" | [[Datei:Streuungs-bild1.png|thumb|450px|In beiden Graphiken ist das arithm. Mittel $\bar{x}=1$, ....]] | [[Datei:Streuungs-bild2.png|thumb|450px|... allerdings ist im linken Bild die Streuung der Werte eindeutig größer als im rechten Bild.]] |} Beide Datenmengen in den Abbildungen haben denselben Mittelwert, aber unterschiedliche Streuungen. Die Werte im rechten Bild liegen näher um den Mittelwert $1$ als die Werte im linken Bild. Aus diesem Grund lernen wir nun noch zusätzliche Kennzahlen für die Streuung von Werten kennen, um solche Datenmengen besser unterscheiden zu können.

== Spannweite == {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Die '''Spannweite''' ist die Differenz (Abstand) zwischen dem kleinsten und dem größten Wert der Datenmenge. UNIQ0c4683f3b1b53c15-MathJax-34-QINU |} Beispiel: Gegeben sei die Datenliste $\{1;2;2;2;5\}$. Bestimme die Spannweite. '''Lösung:''' $x_{max}=5;\ x_{min}=1$ UNIQ0c4683f3b1b53c15-MathJax-35-QINU '''Antwort:''' Die Spannweite beträgt $4$.

== Varianz und Standardabweichung == Eine andere Möglichkeit, um die Streuung anzugeben wäre folgende: Wir berechnen den '''durchschnittlichen Abstand aller Werte vom arithmetischen Mittel $\bar{x}$'''. Diesen durchschnittlichen Abstand nennen wir '''Standardabweichung''' oder kurz $\sigma$ (= sigma).
Herleitung der Standardabweichung:
Um die '''durchschnittlichen Abstände aller Werte vom arithmetischen Mittel $\bar{x}$''' (= Standardabweichung) zu erhalten, machen wir Folgendes:
UNIQ0c4683f3b1b53c15-MathJax-36-QINU # Schritt: Wir berechnen den Abstand aller Werte von $\bar{x}$: #: UNIQ0c4683f3b1b53c15-MathJax-37-QINU # Schritt: Da die Abstände mitunter negativ sind (wenn $x_i<\bar{x}$), quadrieren wir alle Abstände: #: UNIQ0c4683f3b1b53c15-MathJax-38-QINU # Schritt: Nun zählen wir die Quadrate aller Abstände zusammen und berechnen den Durchschnitt (d. h. wir dividieren durch $n$): #: UNIQ0c4683f3b1b53c15-MathJax-39-QINU # Da wir oben quadriert haben, ziehen wir nun wieder die Wurzel (Achtung: Dadurch fallen die $(\ )^2$ nicht weg!): #: UNIQ0c4683f3b1b53c15-MathJax-40-QINU Oder verkürzt angeschrieben: UNIQ0c4683f3b1b53c15-MathJax-41-QINU
{| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Die '''Standardabweichung [[sigma|$\sigma$]]''' ist ein Maß für die Abweichung aller Werte vom arithmetischen Mittel $\bar{x}$ und wird berechnet mit UNIQ0c4683f3b1b53c15-MathJax-42-QINU Verkürzt: UNIQ0c4683f3b1b53c15-MathJax-43-QINU Die Varianz $\sigma ^2$ ist das Quadrat der Standardabweichung: UNIQ0c4683f3b1b53c15-MathJax-44-QINU |} [[Datei:Bsp.png|left]]

Berechnen Sie arithmetisches Mittel und Standardabweichung der Liste $\{1;2;2;2;5\}$.

$n=5$ Werte UNIQ0c4683f3b1b53c15-MathJax-45-QINU Somit beträgt das arithmetische Mittel $\bar{x}=2.4$. Um die Standardabweichung zu berechnen, ermitteln wir zuerst die Varianz und ziehen anschließend die Wurzel (so vermeiden wir häufige Rechenfehler): UNIQ0c4683f3b1b53c15-MathJax-46-QINU UNIQ0c4683f3b1b53c15-MathJax-47-QINU UNIQ0c4683f3b1b53c15-MathJax-48-QINU UNIQ0c4683f3b1b53c15-MathJax-49-QINU UNIQ0c4683f3b1b53c15-MathJax-50-QINU Somit erhalten wir für die Standardabweichung $\sigma$: UNIQ0c4683f3b1b53c15-MathJax-51-QINU Die Standardabweichung beträgt $\sigma=1.36$.


== Quartile == {| border ="1" cellpadding="10" | {| | '''Definition''' |- | [[Datei:Grün rufezeichen.png|center]] |} |Die Quartile $Q_1,\ Q_2\,\ Q_3$ teilen die Werte der Datenmenge insgesamt in $4$ Bereiche. [[Datei:Quartile.png|thumb|300px|center|Quartile einer Datenmenge mit $5$ Werten. $Q_1$ ist zwischen dem 1. und 2. Wert, $Q_3$ zwischen dem 4. und 5.]] Berechnung: # Zuerst berechnen wir den Median $Q_2$, der die Daten in zwei Hälften teilt. $Q_2$ ist gleichzeitig das zweite Quartil $Q_2$. # Das erste Quartil $Q_1$ ist der mittlere Wert in der linken Hälfte. # Das dritte Quartil $Q_3$ ist der mittlere Wert der zweiten Hälfte. |} Die Quartile sind vor allem für die Erstellung eines [[Beschreibende Statistik#Boxplot (Kastenschaubild)|Boxplot-Diagramms]] relevant. [[Datei:Bsp.png|left]]

Gegeben ist die Datenliste $\{1;2;2;2;5\}$. Bestimme $x_{min},\ x_{max}$ sowie alle Quartile und erstelle damit ein Boxplot-Diagramm.

$\ $ * $x_{min}=1$ * $x_{max}=5$ * $\{1\underbrace{;}_{Q_1}2;\ \underbrace{2}_{Q_2 }\ ;\ 2\underbrace{;}_{Q_3} 5\}$ *: *: $Q_1=\frac{1+2}{2}=1.5$, *: $Q_2=2$ und *: $Q_3=\frac{2+5}{2}=3.5$ [[Datei:Boxplot-bsp1.png|thumb|center|400px|Boxplot-Diagramm der Liste $\{1;2;2;2;5\}$]]
{| border ="1" cellpadding="10" | {| !| '''Merke''' |- | [[Datei:Rotes rufezeichen.png|center]] |} |Der '''Quartilsabstand''' ist der Abstand zwischen den Quartilen $Q_1$ und $Q_3$. UNIQ0c4683f3b1b53c15-MathJax-52-QINU Graphisch entspricht dies der Länge der „Box“ im Boxplot-Diagramm. |} [[Datei:Bsp.png|left]]

Gegeben ist die Datenliste $\{1;2;2;2;5\}$. Bestimme den Quartilsabstand der Daten.

Aus dem obigen Beispiel wissen wir, dass $Q_1=1.5$ und $Q_3=3.5$. Somit beträgt der Quartilsabstand UNIQ0c4683f3b1b53c15-MathJax-53-QINU


[[Kategorie:Statistik]] = Matura-Aufgaben (der bisherigen Kapitel) = * [[Bifie-grün: Aufgaben des Bifie | $Bifie$ ]]: [http://aufgabenpool.srdp.at/bhs/download.php?qid=31&file=Schiunfaelle.pdf Schiunfälle] (leicht) : Siehe auch [[Wachstums- und Zerfallsprozesse]] * [[Bifie-grün: Aufgaben des Bifie | $Bifie$ ]]: [http://aufgabenpool.srdp.at/bhs/download.php?qid=159&file=Radausflug.pdf Radausflug] (mittel-mittel-mittel-leicht) : Siehe auch : * [[Wachstums- und Zerfallsprozesse]] : * [[Trigonometrie (2.12 und 3.10) | Trigonometrie]] * [[Bifie-grün: Aufgaben des Bifie | $Bifie$ ]]: [http://aufgabenpool.srdp.at/bhs/download.php?qid=73&file=Reinanken.pdf Reinanken]] (mittel-mittel-leicht) * [[Bifie-grün: Aufgaben des Bifie | $Bifie$]]: [http://aufgabenpool.srdp.at/bhs/download.php?qid=249&file=Weinbau_und_Weinkonsum.pdf Weinbau und Weinkonsum] (mittel-mittel-leicht) : Siehe auch :* [[Lineare Optimierung]] * [[Bifie-grün: Aufgaben des Bifie | $Bifie$]]: [http://aufgabenpool.srdp.at/bhs/download.php?qid=286&file=Photovoltaik_(2).pdf Photovoltaik (2)] (leicht)
: Siehe auch :* [[Finanzmathematik]] * [[Bifie-grün: Aufgaben des Bifie | $Bifie$]]: [http://aufgabenpool.srdp.at/bhs/download.php?qid=289&file=Hotelrenovierung_(3).pdf Hotelrenovierung] (mittel-leicht-mittel)
: Siehe auch :* [[Finanzmathematik]] = Berechnung der Kennzahlen mit Technologie = === GeoGebra === === Ti-8x === === Excel === = Regression =
Dieser Bereich ist nur für spezielle Schulformen (z. B. HLW und HAK) relevant.
$\rightarrow$ siehe Regression