11. Wahrscheinlichkeitsverteilungen – Konzepte
Auf dieser Seite…
- Definitionen von zufälligen, diskreten und kontinuierlichen Variablen
- Verteilungsfunktion
- Wahrscheinlichkeiten als relative Häufigkeit
- Erwartungswert
- Varianz
- Standardabweichung
Notation
Wir verwenden Großbuchstaben (wie X und Z), um Zufallsvariablen zu bezeichnen, und Kleinbuchstaben (wie x und z), um bestimmte Werte dieser Variablen zu bezeichnen.
Konzept der Zufallsvariablen
Der Begriff „statistisches Experiment“ wird verwendet, um jeden Prozess zu beschreiben, durch den mehrere zufällige Beobachtungen erhalten werden.
Alle möglichen Ergebnisse eines Experiments umfassen eine Menge, die als Probenraum bezeichnet wird. Wir sind an einer numerischen Beschreibung des Ergebnisses interessiert.
Wenn wir beispielsweise eine Münze `3` mal werfen und uns für die Anzahl der fallenden Köpfe interessieren, wird jedem Abtastpunkt ein numerischer Wert von `0, 1, 2, 3` zugewiesen.
Die Zahlen `0`, `1`, `2`, und ‚3‘ sind Zufallszahlen, die durch das Ergebnis eines Experiments bestimmt werden.
Sie können als die Werte angesehen werden, die von einer Zufallsvariablen x angenommen werden, die in diesem Fall die Anzahl der Köpfe darstellt, wenn eine Münze 3 Mal geworfen wird.
Wir könnten also x1 = 0, x2 = 1, x3 = 2 und x4 = 3 schreiben.
Definitionen
-
Eine Zufallsvariable ist eine Variable, deren Wert durch das Ergebnis eines Zufallsexperiments bestimmt wird.
-
Eine diskrete Zufallsvariable ist eine, deren Menge angenommener Werte zählbar ist (ergibt sich aus dem Zählen).
-
Eine kontinuierliche Zufallsvariable ist eine, deren Menge angenommener Werte unzählbar ist (ergibt sich aus der Messung.).
Wir verwenden:
Ein Großbuchstaben (Großbuchstaben) X für die Zufallsvariable und
Kleinbuchstaben x1, x2, x3… für die Werte der Zufallsvariablen in einem Experiment. Diese Werte stellen dann ein Ereignis dar, das eine Teilmenge des Probenraums ist.
Die Wahrscheinlichkeiten der Ereignisse sind gegeben durch: P(x1), P(x2), P(x3), …
Wir verwenden auch die Notation ‚P(X)`. Zum Beispiel müssen wir möglicherweise einige der Wahrscheinlichkeiten finden, wenn wir einen Würfel werfen. Wir würden für die Wahrscheinlichkeit, eine „5“ zu erhalten, wenn wir einen Würfel würfeln, schreiben als:
`P(X=5)=1/6`
Beispiel 1 – Diskrete Zufallsvariable
Zwei Kugeln werden zufällig nacheinander ohne Ersatz aus einer Urne gezogen, die `4` rote Kugeln und `6` schwarze bälle.
Finden Sie die Wahrscheinlichkeiten aller möglichen Ergebnisse.
Antwort
Sei X die Anzahl der roten Kugeln im Ergebnis.
Mögliche Ergebnisse | RR | RB | BR | BB |
---|---|---|---|---|
X | 2 | 1 | 1 | 0 |
Hier ist x1 = 2, x2 = 1, x3 = 1, x4 = 0
Jetzt ist die Wahrscheinlichkeit, `2` rote Kugeln zu bekommen, wenn wir die Kugeln einzeln herausziehen,:
Wahrscheinlichkeit, dass der erste Ball rot ist `= 4/10`
Wahrscheinlichkeit, dass der zweite Ball rot ist `= 3/9` (weil noch `3` rote Kugeln in der Urne , von insgesamt `9` Kugeln links.) So:
`P(x_1)=4/ 10times3/9=2/15`
Ebenso ist für die Wahrscheinlichkeit von Rot zuerst `4/10` gefolgt von Schwarz `6/9` (weil es noch `6` schwarze Bälle in der Urne und `9` Bälle zusammen gibt). Also:
`P(x_2)=4/10times6/9= 4/15`
Ähnlich für schwarz dann rot:
`P(x_3)=6/ 10times4/9=4/15`
Schließlich für `2` schwarze Kugeln:
`P(x_4)=6/10times5/9=1/3`
Wenn wir alle Wahrscheinlichkeiten gefunden haben, sollten sie sich zu `1` addieren.
`2/15 + 4/15 + 4/15 + 1/3 = 15/15 = 1`
Also haben wir sie alle gefunden.
Beispiel 2 – Kontinuierliche Zufallsvariable
Ein Glas Kaffee wird nach dem Zufallsprinzip aus einem Füllvorgang ausgewählt, bei dem eine automatische Maschine Kaffeegläser mit jeweils `1 \ „kg“` Kaffee füllt. Aufgrund einiger Fehler im automatischen Prozess kann das Gewicht eines Glases von Glas zu Glas im Bereich von `0.9\ „kg“` bis `1.05\ „kg“` variieren, wobei letzteres ausgeschlossen ist.
X bezeichnet das Gewicht eines ausgewählten Kaffeeglases. Was ist der Bereich von X?
Antwort
Mögliche Ergebnisse: 0.9 ≤ X < 1.05
Das ist alles!
Verteilungsfunktion
Definitionen
-
Eine diskrete Wahrscheinlichkeitsverteilung ist eine Tabelle (oder eine Formel), die alle möglichen Werte auflistet, die eine diskrete Variable annehmen kann, zusammen mit den zugehörigen Wahrscheinlichkeiten.
- Die Funktion f(x) wird als Wahrscheinlichkeitsdichtefunktion für die kontinuierliche Zufallsvariable X bezeichnet, wobei die Gesamtfläche unter der durch die x-Achse begrenzten Kurve gleich `1` ist. also.
`int_(-oo)^oo f(x)dx=1`
Die Fläche unter der Kurve zwischen zwei beliebigen Ordinaten x = a und x = b ist die Wahrscheinlichkeit, dass X zwischen a und b liegt.
`int_a^bf(x)dx=P(a<=X<=b)`
Hintergrundinformationen hierzu finden Sie unter Fläche unter einer Kurve im Abschnitt Integration.
Wahrscheinlichkeiten als relative Häufigkeit
Wenn ein Experiment ausreichend oft durchgeführt wird, wird die relative Häufigkeit eines Ereignisses auf lange Sicht als Wahrscheinlichkeit des Auftretens dieses Ereignisses bezeichnet.
Beispiel 3
Siehe vorheriges Beispiel. Das Gewicht eines ausgewählten Kaffeeglases ist eine kontinuierliche Zufallsvariable. Die folgende Tabelle gibt das Gewicht in kg von `100` Gläsern an, die kürzlich von der Maschine gefüllt wurden. Es listet die beobachteten Werte der kontinuierlichen Zufallsvariablen und ihre entsprechenden Frequenzen auf.
Finden Sie die Wahrscheinlichkeiten für jede Gewichtsklasse.
Gewicht X | Anzahl der Gläser |
---|---|
`0.900 – 0.925` | `1` |
`0.925 – 0.950` | `7` |
`0,950 – 0,975` | `25` |
`0,975 – 1,000` | `32` |
`1,000 – 1,025` | `30` |
` 1.025 – 1.050` | `5` |
Total | `100` |
Antwort
Wir teilen einfach die Anzahl der Gläser in jeder Gewichtsklasse durch 100, um die Wahrscheinlichkeiten zu erhalten.
Weight X | Number of Jars |
Probability P(a ≤ X < b) |
---|---|---|
0.900 – 0.925 | 1 | 0.01 |
0.925 – 0.950 | 7 | 0.07 |
0.950 – 0.975 | 25 | 0.25 |
0.975 – 1.000 | 32 | 0.32 |
1.000 – 1.025 | 30 | 0.30 |
1.025 – 1.050 | 5 | 0.05 |
Total | 100 | 1.00 |
Erwartungswert einer Zufallsvariablen
X stelle eine diskrete Zufallsvariable mit der Wahrscheinlichkeitsverteilungsfunktion P(X) dar. Dann wird der erwartete Wert von X, der mit E(X) oder μ bezeichnet wird, definiert als:
E(X) = μ = Σ (xi × P(xi))
Um dies zu berechnen, multiplizieren wir jeden möglichen Wert der Variablen mit ihrer Wahrscheinlichkeit und addieren dann die Ergebnisse.
Σ (xi × P(xi)) = { x1 × P(x1)} + { x2 × P(x2)} + { x3 × P(x3)} + …
`E(X)` wird auch als Mittelwert der Wahrscheinlichkeitsverteilung bezeichnet.
Beispiel 4
In Beispiel 1 oben hatten wir ein Experiment, bei dem wir `2` Kugeln aus einer Urne mit `4` roten und `6` schwarzen Kugeln zeichneten. Was ist die erwartete Anzahl von roten Kugeln?
Antwort
Wir haben die Wahrscheinlichkeiten bereits vorher ausgearbeitet:
Possible Outcome | RR | RB | BR | BB |
xi | `2` | `1` | `1` | `0` |
P(xi) | `2/15` | `4/15` | `4/15` | `1/3` |
`E(X)=sum{x_i * P(x_i)}`
`=2times2/15+` `1times4/15+` `1times4/15+` `0times1/3`
`=4/5`
`=0.8`
This means that if we performed this experiment 1000 times, we would expect to get 800 red balls.
Beispiel 5
Ich werfe einen Würfel und erhalte `$ 1`, wenn `1` angezeigt wird, und `$ 2`, wenn `2` angezeigt wird, und erhalte `$ 3`, wenn `3` angezeigt wird usw. Wie viel Geld kann ich erwarten, wenn ich es 100 Mal werfe?
Antwort
Für einen Wurf ist der erwartete Wert:
`E(X)=Summe{x_i*P(x_i)}=1times1/6+` `2times1/6+3times1/6+` `4times1/6+` `5times1/6+` `6times1/6`
`=7/2`
`= 3.5`
Für 100 Würfe kann ich also 350 US-Dollar erwarten.
Example 6
The number of persons X, in a Singapore family chosen at random has the following probability distribution:
X | `1` | `2` | `3` | `4` | `5` | `6` | `7` | `8` |
---|---|---|---|---|---|---|---|---|
P(X) | `0.34` | `0.44` | `0.11` | `0.06` | `0.02` | `0.01` | `0.01` | `0.01` |
Find the average family size `E(X)`.
Antwort
`E(X)`
`=Summe{x_i*P(x_i)}`
`=1zeit0,34 +2zeit0,44` `+3zeit0,11+4zeit0,06` `+5zeit0,02+6zeit0,01` `+7zeit0,01+8zeit0,01`
`=2.1`
Die durchschnittliche Familiengröße beträgt also E(X) = μ = 2.1 Personen.
Beispiel 7
In einem Kartenspiel mit meinem Freund zahle ich jedes Mal, wenn ich verliere, einen bestimmten Geldbetrag. Ich gewinne ‚$ 4′, wenn ich einen Buben oder eine Dame ziehe, und ich gewinne `$ 5`, wenn ich einen König oder ein Ass aus einer gewöhnlichen Packung `52‘ Spielkarten ziehe. Wenn ich andere Karten ziehe, verliere ich. Was soll ich bezahlen, damit wir auch rauskommen? (Das heißt, das Spiel ist „fair“?)
Antwort
X | J, Q (`$4`) | K, A (`$5`) | verlieren (`-$x`) |
P(X) | `8/52=2/13 ` | `2/13` | `9/13` |
`E(X)=Summe{x_i * P(x_i)}`
`=4zeiten2/13+5zeiten2/13-xzeiten9/13`
` =frac{18-9x}{13}`
Jetzt sollte der erwartete Wert $ 0 sein, damit das Spiel fair ist.
Also ‚frac{18-9x}{13}=0` und das ergibt `x=2‘.
Also müsste ich `$ 2′ bezahlen, damit es ein faires Spiel ist.
Varianz einer Zufallsvariablen
X sei eine diskrete Zufallsvariable mit der Wahrscheinlichkeitsverteilungsfunktion `P(X)`. Die Varianz von X, die mit `V(X)` oder σ2 bezeichnet wird, ist definiert als:
V(X) = σ2
= Σ
Da μ = E(X), (oder der Durchschnittswert), könnten wir dies auch schreiben als:
V(X) = σ2
= Σ
Eine andere Möglichkeit, die Varianz zu berechnen, ist:
V(X) = σ2 = E(X2) − 2
Standardabweichung der Wahrscheinlichkeitsverteilung
`sigma=sqrt(V(X)` wird als Standardabweichung der Wahrscheinlichkeitsverteilung bezeichnet. Die Standardabweichung ist eine Zahl, die die Streuung der Verteilung beschreibt. Kleine Standardabweichung bedeutet kleine Streuung, große Standardabweichung bedeutet große Streuung.
In den folgenden 3 Verteilungen haben wir den gleichen Mittelwert (μ = 4), aber die Standardabweichung wird größer, was bedeutet, dass die Streuung der Scores größer ist.
Die Fläche unter jeder Kurve ist `1′.
Beispiel 8
Finde `V(X)` für die folgende Wahrscheinlichkeitsverteilung:
X | `8` | `12` | `16` | `20` | `24` |
---|---|---|---|---|---|
P(X) | `1/8` | `1/6` | `3/8` | `1/4` | `1/12` |
Antwort
Wir müssen zuerst `E(X)` finden:
`E(X)` `=8zeit1/8+12zeit1/6` `+16zeit3/8+20zeit1/4` `+24zeit1/12` `=16`
Dann:
`V(X)` `=Summe`
`=(8-16)^2 mal 1/8 + (12-16)^2 mal 1/6 ` `+ (16-16)^2 mal 3/8 + (20-16)^2 mal 1/4 ` `+ (24-16)^2 mal1/12`
`=20`
Überprüfen Sie dies mit den anderen formel:
V(X) = E(X 2) − 2
Dazu müssen wir den erwarteten Wert der Quadrate der Zufallsvariablen X berechnen.
X | `8` | `12` | `16` | `20` | `24` |
X2 | `64` | `144` | `256` | `400` | `576` |
P(X) | `1/8` | `1/6` | `3/8` | `1/4` | `1/12` |
`E(X^2)=sumX^2P(X)`
`=64times1/8+144times1/6+` `256times3/8+` `400times1/4+` `576times1/12`
`=276`
We found E(X) before: `E(X) = 16`
V(X) = E(X2) − 2 = 276 − 162 = 20, as before.