Wahrscheinlichkeit: Normalverteilung und Stetige Zufallsvariablen
Nun beschäftigen wir uns mit Zufallsvariablen, die jeden Wert in einem bestimmten reellen Intervall annehmen können, z. B. alle Werte zwischen $2.5$ und $10$. Dies sind sogenannte stetige Zufallsvariablen. Beispiele für stetige Zufallsvariablen sind die Körpergröße oder das Gewicht eines Menschen, die Lebensdauer eines Bauteils, die Wartedauer in einer Schlange usw.
Dichtefunktion
Anstelle der Wahrscheinlichkeitsfunktion $P$ für diskrete Zufallsvariablen, definiert man für stetige Zufallsvariablen die Dichtefunktion $f$.
|
Die Dichtefunktion $f$ ist eine Funktion mit den Eigenschaften:
$$f(x)\geq 0 $$ und
$$\int_{-\infty}^{+\infty} f(x)\cdot dx=1$$ |
Der Grund, warum man nicht die Wahrscheinlichkeitsfunktion $P$ verwendet, liegt darin, dass stetige Zufallsvariablen unendlich viele (überabzählbar viele) Werte haben und die Wahrscheinlichkeit, dass ein ganz bestimmter Wert auftritt, gleich $0$ ist (Begründung siehe unten).
1. Beispiel einer Dichtefunktion | 2. Beispiel einer Dichtefunktion |
---|---|
$$f(x)\geq 0$$ und $$\int_{-\infty}^{\infty} f(x)\cdot dx=\int_{0}^{4} \frac{1}{4}=1$$ | $$f(x)\geq 0 $$ und $$\int_{-\infty}^{\infty} f(x)\cdot dx=\int_{0}^{2} \frac{1}{4}x\cdot dx + \int_{2}^{4} -\frac{1}{4}x\cdot dx=\frac{1}{2}+\frac{1}{2}=1$$ |
Verteilungsfunktion
Mithilfe der Dichtefunktion definieren wir nun (ähnlich wie bei den diskreten Zufallsvariablen) die ...
|
Verteilungsfunktion $F$
$$F(x)=P(X\leq x)= \int_{-\infty}^{x} f(t)\cdot dt$$ Sie gibt die Wahrscheinlichkeit an, dass $X$ einen Wert $\leq x$ annimmt. |
Wichtig: Die Funktionswerte der Dichtefunktion $f(x)$ geben NICHT die Wahrscheinlichkeit $P(X=x)$ an. Bei stetigen Zufallsvariablen können wir nur die Wahrscheinlichkeit dafür angeben, dass die Zufallsvariable $X$ Werte in einem bestimmten Intervall annimmt.
|
Die Wahrscheinlichkeit, dass die stetige Zufallsvariable $X$ einen Wert im Intervall $[a;b]$ annimmt, entspricht der Fläche unter der Dichtefunktion zwischen den Grenzen $a$ und $b$:
$$P(a\leq X\leq b)= \int_{a}^{b} f(x)\cdot dx = F(b)-F(a)$$ |
Hinweis:
- Die Wahrscheinlichkeit, dass $X$ einen bestimmten Wert $a$ annimmt ist $0$, da:
$$P(a\leq X\leq a)= \int_{a}^{a} f(x)\cdot dx = F(a)-F(a)=0$$
- $P(X\leq a)=P(X<a)$
- Begründung: $ P(X\leq a)=P(X<a)+P(X=a)$ und da $P(X=a)=0$ ist, folgt die Behauptung.
- $P(a\leq X\leq b)=P(X\leq b)-P(X\leq a)$, wie aus der rechten Skizze leicht zu sehen ist.
Erwartungswert und Standardabweichung
|
Für stetige Zufallsvariablen sind Erwartungswert $\mu$ und Standardabweichung $\sigma$ wie folgt definiert:
$$E(x)=\mu=\int_{-\infty}^{+\infty} x\cdot f(x)\cdot dx$$ $$\sigma =\sqrt{\int_{-\infty}^{+\infty} (x-\mu)^2 f(x)\cdot dx}$$ |
Berechnen Sie Erwartungswert und Standardabweichung der folgenden zwei Dichtefunktionen. Erklären Sie die Gemeinsamkeiten bzw. Unterschiede bei $\mu$ und $\sigma$:
1. Dichtefunktion | 2. Dichtefunktion |
---|---|
1. Dichtefunktion | 2. Dichtefunktion | |
---|---|---|
$\mu$ | $$\mu=\int_{-\infty}^{\infty} x\cdot f(x)\cdot dx=\int_{0}^{4} \frac{1}{4}x=\frac{1}{4}\cdot \frac{x^2}{2}\vert _{0}^{4}=2$$
$$\mu = 2$$ |
$$\mu=\int_{-\infty}^{\infty} f(x)\cdot dx=\int_{0}^{2} \underbrace{x \cdot \frac{1}{4}x}_{-\frac{1}{4}x^2}+\int_{2}^{4} \underbrace{x\cdot (-\frac{1}{4}x+1)}_{ -\frac{1}{4}x^2+x}=$$
$$=\frac{1}{4}\cdot\frac{x^3}{3}\vert_{0}^{2} +[-\frac{1}{4}\cdot\frac{x^3}{3}+\frac{x^2}{2}]_{2}^{4}=$$ $$=\frac{1}{4}\cdot\frac{2^3}{3}-0 +\left[-\frac{1}{4}\cdot\frac{4^3}{3}+\frac{4^2}{2}-(-\frac{1}{4}\cdot\frac{2^3}{3}+\frac{2^2}{2})\right]=$$ $$=\frac{2}{3}+\left[-\frac{16}{3}+8-(-\frac{2}{3}+2)\right]=2$$ |
$\sigma$ | $$\sigma=\sqrt{\int_{-\infty}^{\infty} (x-\mu )^2 \cdot f(x)\cdot dx}=$$
$$=\sqrt{\int_{0}^{4} \underbrace{(x-2)^2}_{x^2-4x+4}\cdot \frac{1}{4}\cdot dx }=$$ $$=\sqrt { \frac{1}{4} \left( \frac{x^3}{3} - \frac{4x^2}{2}+4x \right) \vert_{0}^{4} }=$$ $$=\sqrt{\frac{1}{4}\cdot (\frac{4^3}{3}-\frac{4^3}{2}+16)}=\frac{2}{\sqrt{3}}\approx 1.15$$ |
$$\sigma=\sqrt{\int_{-\infty}^{\infty} (x-\mu )^2 \cdot f(x)\cdot dx}$$
$$=\sqrt{\int_{0}^{2}(x-2)^2\cdot \frac{1}{4}\cdot x + \int_{2}^{4}(x-2)^2\cdot (-\frac{1}{4}\cdot x+1)}=...$$ $$\sigma=\frac{\sqrt{6}}{3}\approx 0.82$$ |
Graph |
Wichtig: Während beide Zufallsvariablen über denselben Erwartungswert verfügen ($\mu=2$), unterscheiden sie sich in ihrer Standardabweichung. Die Zufallsvariable mit der Dichtefunktion 1 weist eine höhere Streuung auf als jene Zufallsvariable mit der Dichtefunktion 2.
Eine der wichtigsten stetigen Verteilungsfunktionen ist die Normalverteilung (siehe nächste Seite).
Inhaltsverzeichnis
Einleitung
|
Eine stetige Zufallsvariable ist normalverteilt mit Erwartungswert $\mu$ und Standardabweichung $\sigma$ (kurz: $N(\mu ;\sigma)$-verteilt), wenn für die Dichtefunktion $f$ gilt:
$$ f(x)=\frac{1}{\sqrt{2\pi}\cdot \sigma}\cdot e^{\frac{1}{2}\cdot (\frac{x-\mu}{\sigma})^2}$$ |
Die Dichtefunktion der Normalverteilung wird aufgrund ihrer Form „Gaußsche Glockenkurve“ genannt.
Eigenschaften des Graphen der Dichtefunktion :
- Die Glockenkurve ist symmetrisch zum Erwartungswert $\mu$, bei dem sie auch ihren einzigen Hochpunkt hat.
- Die beiden Wendepunkte der Glockenkurve befinden sich bei $\mu -\sigma$ und $\mu +\sigma$.
- Im Intervall $[\mu -\sigma ; \mu -\sigma]$ befinden sich ca. $68 \%$ aller Werte.
- Die Glockenkurve nähert sich asymptotisch der $x$-Achse an und es gilt
$$\lim_{x\rightarrow \pm \infty} f(x) =0$$
- Die Dichtefunktion erfüllt alle wichtigen Eigenschaften einer Dichtefunktion:
- $f(x)\geq 0$ und
- $\int_{-\infty}^{+\infty} f(x)\cdot dx=1$ (d. h. die Fläche unterhalb der Dichtefunktion ist $1$).
Die Normalverteilung ist deshalb so wichtig, da es in der Natur und im Alltag sehr viele Zufallsvariablen gibt, die eine solche Verteilung aufweisen und somit eine Dichtefunktion besitzen, deren Graph glockenförmig ist.
|
Die Berechnung von Wahrscheinlichkeiten erfolgt über die Berechnung der Fläche unterhalb der Dichtefunktion.
Für die Verteilungsfunktion $F$ gilt wieder: $$F(x)=P(X\leq x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}\cdot \sigma}\cdot e^{\frac{1}{2}\cdot (\frac{t-\mu}{\sigma})^2}\cdot dt$$ Die Berechnung dieses Integrals erfolgt in der Regel mithilfe des Taschenrechners bzw. mit GeoGebra. |
Das folgende Applet von Lindner zeigt dir die wichtigsten Eigenschaften der Glockenkurve:
Verschiebung der Normalverteilung |
---|
|
Falls dieses Applet nicht funktioniert: Klicke hier |
|
$\\ $
|
Wichtige Überlegungen:
$$P(X\leq \mu)=0.5$$
$$P(X\leq b)$$
$$ P(X \geq b)=1-P(X \leq b)$$
$$ P(a\leq X\leq b)$$
Zur Wiederholung und Erheiterung ein Video vom berühmten "DorFuchs" zur Normalverteilung und seinem IQ:
$\sigma$-Umgebungen
Für jede normalverteilte Zufallsvariable $X$ gilt, dass die $\sigma$-Bereiche um den Erwartungswert $\mu$ eine konstante Fläche beinhalten.
Binomial- und Normalverteilung
Die Binomialverteilung kann durch die Normalverteilung angenähert werden. Graphisch ist dies gut erkennbar: Je symmetrischer die Wahrscheinlichkeitsfunktion der Binomialverteilung ist und umso größer der Stichprobenumfang $n$ (d. h. die Anzahl der Balken), desto ähnlicher wird die Wahrscheinlichkeitsfunktion der Binomialverteilung der Glockenkurve der Normalverteilung.
Die Graphik zeigt das Histogramm einer binomialverteilten Zufallsvariablen mit $n=20$ und $p =0.5$. Die blauen Balken visualisieren die Wahrscheinlichkeit $P(0≤X≤8)$, die rote Kurve stellt die Normalapproximation dar. Die Fläche unter der Kurve im Intervall $(-\infty, 8]$ entspricht näherungsweise der Gesamtfläche der blauen Balken.
|
Die Binomialverteilung darf näherungsweise durch die Normalverteilung ersetzt werden, wenn die Bedingung
$$n\cdot p\cdot (1-p)>9$$ erfüllt ist. |
Verteilungsfunktion einer Normalverteilung
Wir haben oben schon gelernt, dass die Wahrscheinlichkeit der Fläche unter der Dichtefunktion entspricht. Sei $f$ die Dichtefunktion einer normalverteilten Zufallsvariable $X$. Dann gilt für die Wahrscheinlichkeit $P(X\leq x)$ (d. h. die Wahrscheinlichkeit, dass die Zufallsvariable $X$ einen Wert kleiner oder gleich $x$ annimmt):$$P(X\leq x)=\int_{-\infty}^{x} f(x)\cdot dx$$
Dieses Integral können wir nun als Funktion interpretieren, die uns für jedes $x$ die Fläche unter der Glockenkurve links von $x$ angibt. D. h.: $$G(x)=\int_{-\infty}^{x} f(x)\cdot dx$$
|
Die Verteilungsfunktion $G$ mit
$$G(X)=P(X\leq x)=\int_{-\infty}^{x} f(x)\cdot dx$$ gibt die Wahrscheinlichkeit $P(X\leq x)$ für einen beliebigen Wert $x$ an. |
Das folgende Applet zeigt dir die Graphen der Dichtefunktion (links) und der Verteilungsfunktion (rechts) an.
|
$\\ $
|
Übungsbeispiele
In einer Fabrik wird Senf in Gläser zu $250 g$ verpackt. Vom Hersteller der Füllmaschine wird der Senffabrik nahegelegt, den Sollwert (Mittelwert $\mu$) auf $265 g$ einzustellen. Dabei ergibt sich eine mittlere Abweichung $\sigma=10 g$.
a) Wahrscheinlichkeit rechts von $\mu$ berechnen: Wie viele Gläser enthalten mehr als $280 g$ Senf?
Die Variable $X$ ist $N(265;10)$-verteilt und gibt die Füllmenge in Gramm (g) an.
GeoGebra / Graph | Ti-8X | Per Hand / Tabelle |
---|---|---|
Gesucht ist $P(X> 280)$ | $$P(X>280)=1-P(X\leq 280)=$$
$$=1-normcdf(-\infty,280,265,10)=$$ $$=0.06681$$ |
$$P(X>280)=1-P(X\leq 280)=$$
$$=\underbrace{P(X\leq 265 + 1.5\cdot 10)}_{P(X\leq \mu + z\cdot \sigma)}=$$ $$=1-\Phi (1.5)=$$ $$=1-0,93319=0.06681$$ |
Die Wahrscheinlichkeit $P(X> 280g)$ beträgt $6.681\%$.
b) Wahrscheinlichkeit links von $\mu$ berechnen: Berechnen Sie die Wahrscheinlichkeit, dass ein Glas weniger als $250 g$ enthält?
GeoGebra / Graph | Ti-8X | Per Hand / Tabelle |
---|---|---|
Gesucht ist $P(X< 250)$ | $$P(X<250)=$$
$$=normcdf(-\infty,250,265,10)=$$ $$=0.06681$$ |
$$P(X<250)=P(X<265-15)$$
$$=\underbrace{P(X\leq 265 - 1.5\cdot 10)}_{P(X\leq \mu - z\cdot \sigma)}=$$ $$=\Phi (-1.5)=1-\Phi (1.5)$$ $$=1-0,93319=0.06681 $$ |
Die Wahrscheinlichkeit $P(X<250g)$ beträgt ebenfalls $6.681\%$. Auf dieses Ergebnis hätten wir auch einfacher kommen können, da $280g$ und $250g$ gleich weit von $\mu=265g$ entfernt sind und aufgrund der Symmetrie der Normalverteilung erhalten wir dasselbe Ergebnis.
c) Wahrscheinlichkeit in einem bestimmten Bereich: Wie groß ist die Wahrscheinlichkeit, dass ein Glas zwischen $250 g$ und $270 g$ enthält?
GeoGebra / Graph | Ti-8X | Per Hand / Tabelle |
---|---|---|
Gesucht ist $P(250\leq X\leq 270)$ | $$P(250\leq X\leq 270)=P(X\leq 270)-P(X\leq 250)$$
$$=normcdf(-\infty,270,265,10)-normcdf(-\infty,250,265,10)=$$ $$=0.6247$$ |
$$P(250\leq X\leq 270)=P(X\leq 270)-P(X\leq 250)$$
$$=\underbrace{P(X\leq 265 + 0.5\cdot 10)}_{P(X\leq \mu + z\cdot \sigma)}-\underbrace{P(X\leq 265 - 1.5\cdot 10)}_{P(X\leq \mu + z\cdot \sigma)}=$$ $$=\Phi (0.5)-\Phi(-1.5)=$$ $$=\Phi (0.5)-(1-\Phi(1.5))$$ $$ 0.69146 -0.06681=0.6247$$ |
Die Wahrscheinlichkeit $P(250g\leq X\leq 270g)$ beträgt $62.47\%$.
d) Ermitteln eines symmetrischen Intervalls um $\mu$: In welchem symmetrischen Bereich um den Mittelwert liegen $80\%$ der Gläser?
Hier wird jetzt die Umkehrung gebraucht. Die Wahrscheinlichkeit ist bekannt und die $x$-Werte sind gesucht (vorher war es immer umgekehrt).
Gesucht ist $P(\mu -k \leq X\leq \mu + k)=0.8$ (siehe Grafik) Somit müssen zwischen $\mu$ und $\mu +k$ insgesamt $40\%$ aller Werte liegen ($40\%$ sind links und $40\%$ sind rechts von $\mu$ ). Insgesamt liegen dann $50+40=90\%$ links von $\mu+k$ (d. h. $P(X\leq \mu+k)=0.9$). Mit dieser Überlegung können wir nun $k$ bestimmen:
GeoGebra / Graph | Ti-8X | Per Hand / Tabelle |
---|---|---|
$P(X\leq \mu+k)=0.9\rightarrow \mu+k=277.82\rightarrow k=12.82$
Somit ist das gesuchte Intervall: $$[\mu -k ; \mu + k]=[252.18;277.82]$$ Alternativer CAS-Befehl: $$Normal[265, 10, 265+x]-Normal[265, 10, 265-x]=0.8$$ $$\rightarrow x=12.82$$ |
$$P(X\leq \mu+k)=0.9$$
$$\rightarrow \mu+k=invNorm(0.9,265,10)$$ $$\mu+k=277.82\rightarrow k=12.82$$ Somit ist das gesuchte Intervall: $$[\mu -k ; \mu + k]=[252.18;277.82]$$ |
$$P(\mu-z\cdot \sigma \leq X\leq \mu+z\cdot \sigma)=0.8$$
$$P(X\leq \mu+z\cdot \sigma)-P(X\leq \mu-z\cdot \sigma)=0.8$$ $$\Phi (z)-\Phi(-z)=0.8$$ $$\Phi (z)-(1-\Phi (z))=0.8$$ $$2\cdot \Phi (z)-1=0.8$$ $$\Phi (z) =\frac{1+0.8}{2}=0.9$$ $$\rightarrow z\approx 1.28$$ $\mu+z\cdot \sigma=265+1.28\dot 10=277.8$ und $\mu-z\cdot \sigma=265-1.28\dot 10=252.2$ Somit ist das gesuchte Intervall: $$[\mu -k ; \mu + k]=[252.18;277.82]$$ |
Im symmetrischen Intervall $[252.18g;277.82g]$ liegen $80\%$ der Gläser.
e) Ermitteln von $\mu$ bei bekannter Wahrscheinlichkeit: Welchen Mittelwert $\mu$ könnte die Senffirma einstellen, wenn sie $10\%$ untergewichtigen Ausschuss toleriert?
$\mu=$? und $\sigma=10$. Gesucht ist, für welches $\mu$ gilt $P(X\leq 250)=0.10$.
GeoGebra | Ti-8X | Per Hand / Tabelle |
---|---|---|
Dies berechnet man am besten mithilfe des CAS:
$$Normal[\mu, 10, 250]=0.1\rightarrow \mu=262.82$$ |
Dies berechnet man am besten mithilfe des Solve-Befehls:
$$normalcdf(-\infty,250,x, 10)=0.1$$ $$\rightarrow 0=normalcdf(-\infty,250,x, 10)-0.1$$ $$\rightarrow \mu=262.82$$ |
$$P(X\leq 250)=0.10$$
$$P(X\leq \underbrace{\mu+z\cdot 10}_{=250} )=0.10$$ $$\Phi (z)=0.1\rightarrow z\approx -1.28$$ $$ 250=\mu+(-1.29)\cdot 10 \rightarrow \mu=262.8$$ |
Der Mittelwert könnte auf $262.8g$ eingestellt werden.
Interaktive Übungen
Quiz: Normalverteilung (WS 3.4)
Maturaaufgaben
$Bifie$$HUM$ Intelligenzquotient
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik und Regression
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik
$Bifie$$HUM$ Getränkeproduktion
- Welche Inhalte werden hier noch gefragt: Lineare Optimierung
- Welche Inhalte werden hier noch gefragt: Lineare Optimierung
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik sowie Lineare Optimierung und Finanzmathematik
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik
- Welche Inhalte werden hier noch gefragt: Umkehraufgaben sowie Differenzen- und Differentialquotient und Integration
- Welche Inhalte werden hier noch gefragt: Wachstums- und Zerfallsprozesse
- Welche Inhalte werden hier noch gefragt: Binomialverteilung
$Bifie$ Freizeitparadies Schöckl
- Welche Inhalte werden hier noch gefragt: Trigonometrie, Formeln und Kurvendiskussionen
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik und Binomialverteilung
$Bifie$ Lebensdauer eines Bauteils
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik
$Bifie$ Wirksamkeit eines Medikamentes
- Welche Inhalte werden hier noch gefragt: Baumdiagramme und Binomialverteilung
$Bifie$$HUM$ Elektronikhersteller
- Welche Inhalte werden hier noch gefragt: Regression und Kosten- und Preistheorie
- Welche Inhalte werden hier noch gefragt: Gleichungssysteme und Beschreibende Statistik
- Welche Inhalte werden hier noch gefragt: Binomialverteilung
$Bifie$$HUM$ Halterung für Glasfassaden
- Welche Inhalte werden hier noch gefragt: Binomialverteilung und Kosten- und Preistheorie
- Welche Inhalte werden hier noch gefragt: Binomialverteilung und Trigonometrie
$Bifie$$HUM$ Materialzuschnitt (2)
- Welche Inhalte werden hier noch gefragt: Binomialverteilung und Rentenrechnung
- Welche Inhalte werden hier noch gefragt: Binomialverteilung und Wachstums- und Zerfallsprozesse sowie Differenzen- und Differentialquotient
- Welche Inhalte werden hier noch gefragt: Beschreibende Statistik bzw. Binomialverteilung