11. Sandsynlighedsfordelinger-begreber
på denne side…
- definitioner af tilfældige, diskrete og kontinuerlige variabler
- Distributionsfunktion
- sandsynligheder som relativ frekvens
- forventet værdi
- varians
- standardafvigelse
Notation
Vi bruger store bogstaver (som f.eks.
begrebet tilfældig variabel
udtrykket “statistisk eksperiment” bruges til at beskrive enhver proces, hvorved der opnås flere tilfældige observationer.
alle mulige resultater af et eksperiment omfatter et sæt, der kaldes prøveområdet. Vi er interesseret i en numerisk beskrivelse af resultatet.
for eksempel, når vi kaster en mønt `3` gange, og vi er interesserede i antallet af hoveder, der falder, tildeles en numerisk værdi på `0, 1, 2, 3` til hvert prøvepunkt.
tallene`0`, `1`, `2`, og ‘ 3 ‘ er tilfældige mængder bestemt af resultatet af et eksperiment.
de kan betragtes som de værdier, der antages af en tilfældig variabel, som i dette tilfælde repræsenterer antallet af hoveder, når en mønt kastes 3 gange.
så vi kunne skrive 1 = 0, 2 = 1, 3 = 2 og 4 = 3.
definitioner
-
en tilfældig variabel er en variabel, hvis værdi bestemmes af resultatet af et tilfældigt eksperiment.
-
en diskret tilfældig variabel er en, hvis sæt antagede værdier kan tælles (stammer fra tælling).
-
en kontinuerlig tilfældig variabel er en, hvis sæt antagede værdier er utallige (stammer fra måling.).
Vi skal bruge:
en stor (store bogstaver) for den tilfældige variabel og
små bogstaver 1, 2, 3… for værdierne af den tilfældige variabel i et eksperiment. Disse Hi repræsenterer derefter en begivenhed, der er en delmængde af prøveområdet.
sandsynlighederne for begivenhederne er givet af: P (h1), P(H2), P(H3),…
Vi bruger også notationen ‘ P (H)’. For eksempel kan vi være nødt til at finde nogle af de sandsynligheder, der er involveret, når vi kaster en matrice. Vi ville skrive for sandsynligheden for at opnå en “5”, Når vi ruller en matrice som:
`P(5)=1/6`
eksempel 1 – diskret tilfældig variabel
to bolde trækkes tilfældigt i rækkefølge uden udskiftning fra en urne, der indeholder `4` røde bolde og `6` sorte kugler.
Find sandsynlighederne for alle mulige resultater.
svar
lad os angive antallet af røde bolde i resultatet.
mulige resultater | RR | BR | BB | |
---|---|---|---|---|
2 | 1 | 1 | 0 |
Her, H1 = 2, H2 = 1 , H3 = 1 , H4 = 0
nu er sandsynligheden for at få `2` røde bolde, når vi trækker kuglerne en ad gangen:
sandsynlighed for, at den første bold er rød `= 4/10`
Sandsynlighed af anden bold er rød `= 3/9` (fordi der er `3` røde bolde tilbage i urnen, ud af i alt `9` bolde tilbage.) Så:
`P(H_1)=4/10times3/9=2/15`
ligeledes for sandsynligheden for rød først er `4/10` efterfulgt af sort er `6/9` (fordi der er `6` sorte bolde stadig i urnen og `9` bolde alle sammen). Altså:
`P(h_2)=4/10times6/9 = 4/15`
tilsvarende for sort derefter rød:
`P(h_3)=6/10times4/9=4/15`
endelig for `2` sorte bolde:
`P(h_4)=6/10times5/9=1/3`
som en check, hvis vi har fundet alle sandsynlighederne, så skal de tilføje op til `1`.
`2/15 + 4/15 + 4/15 + 1/3 = 15/15 = 1`
så vi har fundet dem alle.
eksempel 2 – kontinuerlig tilfældig variabel
en krukke kaffe plukkes tilfældigt fra en påfyldningsproces, hvor en automatisk maskine fylder kaffekande hver med `1\ “kg”` kaffe. På grund af nogle fejl i den automatiske proces kan vægten af en krukke variere fra krukke til krukke i området `0,9\ “kg”` til `1,05\ “kg”`, undtagen sidstnævnte.
lad os angive vægten af en krukke kaffe valgt. Hvad er rækkevidden af H?
svar
mulige resultater: 0.9 ch < 1.05
det er alt der er til det!
fordelingsfunktion
definitioner
-
en diskret sandsynlighedsfordeling er en tabel (eller en formel), der viser alle mulige værdier, som en diskret variabel kan påtage sig sammen med de tilknyttede sandsynligheder.
- funktionen f kaldes en sandsynlighedsdensitetsfunktion for den kontinuerlige tilfældige variabel, hvor det samlede areal under kurven afgrænset af H-aksen er lig med `1`. dvs.
`int_(-oo)^oo f (- oo)=1`
området under kurven mellem to ordinater = A og B er sandsynligheden for, at h ligger mellem a og b.
`int_a^bf=p(a<<=b)`
se område under en kurve i integrationsafsnittet for nogle baggrund om dette.
sandsynligheder som relativ frekvens
Hvis et eksperiment udføres et tilstrækkeligt antal gange, kaldes den relative frekvens af en begivenhed på lang sigt sandsynligheden for, at den begivenhed finder sted.
eksempel 3
se det foregående eksempel. Vægten af en krukke kaffe valgt er en kontinuerlig tilfældig variabel. Følgende tabel viser vægten i kg af ‘ 100 ‘ krukker, der for nylig er fyldt af maskinen. Den viser de observerede værdier for den kontinuerlige tilfældige variabel og deres tilsvarende frekvenser.
Find sandsynlighederne for hver vægtkategori.
vægt | antal af krukker |
---|---|
`0.900 – 0.925` | `1` |
`0.925 – 0.950` | `7` |
`0, 950 – 0, 975` | `25` |
`0, 975 – 1, 000` | `32` |
`1, 000 – 1, 025` | `30` |
`1.025 – 1.050` | `5` |
i alt | `100` |
svar
Vi deler simpelthen antallet af krukker i hver vægtkategori med 100 for at give sandsynlighederne.
Weight X | Number of Jars |
Probability P(a ≤ X < b) |
---|---|---|
0.900 – 0.925 | 1 | 0.01 |
0.925 – 0.950 | 7 | 0.07 |
0.950 – 0.975 | 25 | 0.25 |
0.975 – 1.000 | 32 | 0.32 |
1.000 – 1.025 | 30 | 0.30 |
1.025 – 1.050 | 5 | 0.05 |
Total | 100 | 1.00 |
forventet værdi af en tilfældig variabel
lad os repræsentere en diskret tilfældig variabel med sandsynlighedsfordelingsfunktionen P(H). For at beregne dette multiplicerer vi hver mulig værdi af variablen med dens sandsynlighed, og tilføj derefter resultaterne.dette er en af de vigtigste faktorer, der gør det muligt at beregne værdien af variablen.
= {1 p (1)} + {2 p(2)} + {3 p(3)}+…
`e(h)` kaldes også gennemsnittet af sandsynlighedsfordelingen.
eksempel 4
I eksempel 1 ovenfor havde vi et eksperiment, hvor vi tegnede `2` bolde fra en urne indeholdende `4` røde og `6` sorte bolde. Hvad er det forventede antal røde kugler?
svar
Vi har allerede udarbejdet sandsynlighederne før:
Possible Outcome | RR | RB | BR | BB |
xi | `2` | `1` | `1` | `0` |
P(xi) | `2/15` | `4/15` | `4/15` | `1/3` |
`E(X)=sum{x_i * P(x_i)}`
`=2times2/15+` `1times4/15+` `1times4/15+` `0times1/3`
`=4/5`
`=0.8`
This means that if we performed this experiment 1000 times, we would expect to get 800 red balls.
eksempel 5
Jeg kaster en matrice og får `$1`, hvis den viser `1`, og får `$2`, hvis den viser `2`, og får `$3`, hvis den viser `3` osv. Hvad er det beløb, jeg kan forvente, hvis jeg smider det `100` gange?
svar
for et kast er den forventede værdi:
`E(h)=sum{h_i*P(h_i)}=1times1/6+` `2times1/6+3times1/6+` `4times1/6+` `5times1/6+` `6times1/6`
`=7/2`
`=3.5`
så for 100 kast kan jeg forvente at få $350.
Example 6
The number of persons X, in a Singapore family chosen at random has the following probability distribution:
X | `1` | `2` | `3` | `4` | `5` | `6` | `7` | `8` |
---|---|---|---|---|---|---|---|---|
P(X) | `0.34` | `0.44` | `0.11` | `0.06` | `0.02` | `0.01` | `0.01` | `0.01` |
Find the average family size `E(X)`.
svar
`E(H)`
`=sum{h_i*P(h_i)}`
`=1times0.34+2times0.44` `+3times0.11+4times0.06` `+5times0.02+6times0.01` `+7times0.01+8times0.01`
`=2,1`
så den gennemsnitlige familiestørrelse er e(h) = l = 2,1 personer.
eksempel 7
i et kortspil med min ven betaler jeg en vis mængde penge hver gang jeg taber. Jeg vinder ‘$4`, hvis jeg trækker en jack eller en dronning, og jeg vinder` $5`, hvis jeg trækker en konge eller ess fra en almindelig pakke med` 52 ‘ spillekort. Hvis jeg trækker andre kort, taber jeg. Hvad skal jeg betale, så vi kommer ud selv? (Det vil sige, spillet er “fair”?)
svar
J, K (`$4`) | K, a (`$5`) | lose (`- $`) | ||
P(S) | `8/52=2/13` | `2/13` | `9/13` |
`e(h)=sum{h_i * p(h_i)}`
`=4times2/13+5times2/13-times9/13`
`=frac{18-9h}{13}`
nu skal den forventede værdi være $0 for at spillet skal være retfærdigt.
så ‘ frac{18-9h}{13}=0` og dette giver `H=2`.
så jeg bliver nødt til at betale `$2` for at det skal være et retfærdigt spil.
varians af en tilfældig variabel
lad os repræsentere en diskret tilfældig variabel med sandsynlighedsfordelingsfunktion `P(H)`. Variansen af X er markeret med `V(X) ” eller σ2 er defineret som:
V(X) = σ2
= Σ
Da μ = E(X), (eller den gennemsnitlige værdi), vi kan også skrive det som:
V(X) = σ2
= Σ
en Anden måde at beregne variansen er:
v(h) = lus2 = E(H2) − 2
standardafvigelse for sandsynlighedsfordelingen
`Sigma=KVRT(V(H)` kaldes standardafvigelsen for sandsynlighedsfordelingen. Standardafvigelsen er et tal, der beskriver spredningen af fordelingen. Lille standardafvigelse betyder lille spredning, stor standardafvigelse betyder stor spredning.
i de følgende 3 distributioner har vi det samme gennemsnit (kur = 4), men standardafvigelsen bliver større, hvilket betyder, at spredningen af scoringer er større.
området under hver kurve er ‘1’.
Eksempel 8
Find `V(H)` for følgende sandsynlighedsfordeling:
`8` | `12` | `16` | `20` | `24` | |
p(h) | `1/8` | `1/6` | `3/8` | `1/4` | `1/12` |
svar
Vi er nødt til at finde `e(h)` først:
`e(h)` `=8times1/8+12times1/6` `+16times3/8+20times1/4` `+24times1/12` `=16`
derefter:
`=sum`
`=(8-16)^2 gange 1/8 + (12-16)^2 gange 1/6“ + (16-16)^2 gange 3/8 + (20-16)^2 gange 1/4 ` ` + (24-16)^2 gange1/12 `
` =20`
kontrol af dette ved hjælp af den anden formel:
V (H) = E(H) 2) − 2
til dette skal vi udarbejde den forventede værdi af kvadraterne af den tilfældige variabel H.
X | `8` | `12` | `16` | `20` | `24` |
X2 | `64` | `144` | `256` | `400` | `576` |
P(X) | `1/8` | `1/6` | `3/8` | `1/4` | `1/12` |
`E(X^2)=sumX^2P(X)`
`=64times1/8+144times1/6+` `256times3/8+` `400times1/4+` `576times1/12`
`=276`
We found E(X) before: `E(X) = 16`
V(X) = E(X2) − 2 = 276 − 162 = 20, as before.