- Formel og ligninger
- Forskelle med binomialfordelingen
- eksempler
- Praktiske anvendelser
- Tilnærmelse af binomial distribution med Poisson distribution
- Løst øvelser
- Øvelse 1
- Opløsning c)
- Øvelse 2
- Løsning på)
- Referencer
The Poisson-fordelingen er en diskret sandsynlighedsfordeling, hvorved det er muligt at vide sandsynligheden for, at inden for en stor prøvestørrelse og i et bestemt interval, en begivenhed, hvis sandsynligheden er lille vil forekomme.
Ofte kan Poisson-fordelingen bruges i stedet for binomialfordelingen, så længe følgende betingelser er opfyldt: stor prøve og lille sandsynlighed.
Figur 1. Graf over Poisson-fordelingen for forskellige parametre. Kilde: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) skabte denne distribution, der bærer hans navn, meget nyttig når det kommer til uforudsigelige begivenheder. Poisson offentliggjorde sine resultater i 1837, et undersøgelsesarbejde om sandsynligheden for forekomst af fejlagtige straffedomme.
Senere tilpassede andre forskere fordelingen i andre områder, for eksempel antallet af stjerner, der kunne findes i et vist rumvolumen, eller sandsynligheden for, at en soldat ville dø af sparket fra en hest.
Formel og ligninger
Den matematiske form for Poisson-distributionen er som følger:
- μ (også undertiden betegnet som λ) er gennemsnittet eller parameteren for fordelingen
- Euler nummer: e = 2.71828
- Sandsynligheden for at opnå y = k er P
- k er antallet af succeser 0, 1,2,3…
- n er antallet af tests eller begivenheder (prøvestørrelsen)
Diskrete tilfældige variabler afhænger som tilfældet af navnet af tilfældet og tager kun diskrete værdier: 0, 1, 2, 3, 4…, k.
Gennemsnittet af fordelingen er givet ved:
Variansen σ, som måler spredningen af dataene, er en anden vigtig parameter. For Poisson-distributionen er det:
σ = μ
Poisson bestemte, at når n → ∞, og p → 0, er gennemsnittet μ - også kaldet den forventede værdi - en konstant:
-Beholdte begivenheder eller begivenheder er uafhængige af hinanden og forekommer tilfældigt.
-Sandsynligheden P for en bestemt begivenhed, der forekommer i et bestemt tidsrum, er meget lille: P → 0.
-Sandsynligheden for, at mere end en begivenhed forekommer i tidsintervallet er 0.
-Gennemsnitsværdien tilnærmelsesvis en konstant givet af: μ = np (n er prøvestørrelsen)
-For at spredningen σ er lig med μ, da den vedtager større værdier, bliver variationen også større.
-Fordele skal fordeles jævnt i det anvendte tidsinterval.
-Sættet af mulige værdier for begivenheden y er: 0,1,2,3,4….
-Summen af i-variabler, der følger en Poisson-distribution er også en anden Poisson-variabel. Dens gennemsnitlige værdi er summen af gennemsnitsværdierne for disse variabler.
Forskelle med binomialfordelingen
Poisson-fordelingen adskiller sig fra den binomiale distribution på følgende vigtige måder:
-Den binomiale fordeling påvirkes af både prøvestørrelse n og sandsynligheden P, men Poisson-fordelingen påvirkes kun af middelværdien μ.
-I en binomial fordeling er de mulige værdier for den tilfældige variabel y 0,1,2,…, N, mens der i Poisson-fordelingen ikke er nogen øvre grænse for disse værdier.
eksempler
Poisson anvendte oprindeligt sin berømte distribution til juridiske sager, men på industrielt plan var en af hans tidligste anvendelser i ølbrygning. I denne proces anvendes gærkulturer til gæring.
Gær består af levende celler, hvis befolkning varierer over tid. Ved fremstilling af øl er det nødvendigt at tilsætte den nødvendige mængde, derfor er det nødvendigt at vide, hvor meget celler der er pr. Volumenhed.
Under 2. verdenskrig blev Poisson-distributionen brugt til at finde ud af, om tyskerne faktisk sigtede mod London fra Calais, eller bare fyrede tilfældigt. Dette var vigtigt for de allierede at afgøre, hvor god den teknologi, der var til rådighed for nazisterne.
Praktiske anvendelser
Anvendelserne til Poisson-distributionen refererer altid til tællinger i tid eller tællinger i rummet. Og da sandsynligheden for forekomst er lille, er det også kendt som "loven om sjældne begivenheder."
Her er en liste over begivenheder, der falder ind i en af disse kategorier:
-Registrering af partiklerne i et radioaktivt henfald, som ligesom væksten af gærceller er en eksponentiel funktion.
-Antal besøg på et bestemt websted.
-Arrivning af mennesker til en linje for at betale eller deltage (køteori).
-Antal biler, der passerer et bestemt punkt på en vej i et givet tidsinterval.
Figur 2. Antallet af biler, der passerer gennem et punkt, følger nogenlunde en Poisson-distribution. Kilde: Pixabay.
-Mutationer led i en bestemt DNA-kæde efter at have været udsat for stråling.
- Antallet af meteoritter med en diameter på over 1 m er faldet i løbet af et år.
-Defekter pr. Kvadratmeter af et stof.
-Mængde af blodlegemer i 1 kubikcentimeter.
-Kald per minut til en telefoncentral.
-Chokoladechips til stede i 1 kg kagedej.
-Antal træer inficeret af en bestemt parasit i 1 ha skov.
Bemærk, at disse tilfældige variabler repræsenterer antallet af gange, en hændelse finder sted i en fast periode (opkald pr. Minut til telefoncentralen) eller et givet rumområde (stofdefekter pr. Kvadratmeter).
Disse begivenheder er, som allerede er etableret, uafhængige af den tid, der er gået siden den sidste begivenhed.
Tilnærmelse af binomial distribution med Poisson distribution
Poisson-distributionen er en god tilnærmelse til binomialfordelingen, så længe:
-Størrelsen af prøven er stor: n ≥ 100
-Sandsynligheden p er lille: p ≤ 0,1
- μ er i størrelsesordenen: np ≤ 10
I sådanne tilfælde er Poisson-distributionen et fremragende værktøj, da binomialfordelingen kan være vanskelig at anvende i disse tilfælde.
Løst øvelser
Øvelse 1
En seismologisk undersøgelse konstaterede, at der i løbet af de sidste 100 år var 93 store jordskælv rundt om i verden, med mindst 6,0 i Richters skala - logaritmisk -. Antag, at Poisson-distributionen er en passende model i dette tilfælde. Finde:
a) Den gennemsnitlige forekomst af store jordskælv pr. år.
b) Hvis P (y) er sandsynligheden for, at jordskælv forekommer i et tilfældigt valgt år, skal du finde følgende sandsynligheder:
Det er ganske mindre end P (2).
Resultaterne er anført nedenfor:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
For eksempel kan vi sige, at der er en sandsynlighed på 39,5% for, at der ikke vil forekomme et større jordskælv i et givet år. Eller at der er 5,29% af 3 store jordskælv, der forekommer i det år.
Opløsning c)
c) Frekvenserne analyseres, ganget med n = 100 år:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 og 0,00471.
For eksempel:
- En frekvens på 39,5 indikerer, at der forekommer 0 store jordskælv i 39,5 ud af 100 år, vi kunne sige, at det er ganske tæt på det faktiske resultat på 47 år uden noget stort jordskælv.
Lad os sammenligne et andet Poisson-resultat med de faktiske resultater:
- Den opnåede værdi på 36,7 betyder, at der i en periode på 37 år er et stort jordskælv. Det faktiske resultat er, at der i 31 år var 1 større jordskælv, hvilket var en god match med modellen.
- Der forventes 17,1 år med 2 store jordskælv, og det vides, at der i 13 år, hvilket er en tæt værdi, faktisk var 2 store jordskælv.
Derfor er Poisson-modellen acceptabel i denne sag.
Øvelse 2
Et firma estimerer, at antallet af komponenter, der mislykkes inden de når 100 driftstimer, følger en Poisson-distribution. Hvis det gennemsnitlige antal fejl er 8 på det tidspunkt, skal du finde følgende sandsynligheder:
a) At en komponent mislykkes om 25 timer.
b) Fejl på mindre end to komponenter inden for 50 timer.
c) Mindst tre komponenter mislykkes på 125 timer.
Løsning på)
a) Det vides, at gennemsnittet af fejl i 100 timer er 8, og derfor forventes der i 25 timer en fjerdedel af fejl, det vil sige 2 fejl. Dette vil være μ-parameteren.
Sandsynligheden for, at 1 komponent mislykkes, anmodes om, den tilfældige variabel er "komponenter, der mislykkes inden 25 timer", og dens værdi er y = 1. Ved at erstatte sandsynlighedsfunktionen:
Spørgsmålet er imidlertid sandsynligheden for, at færre end to komponenter mislykkes på 50 timer, ikke at nøjagtigt 2 komponenter mislykkes på 50 timer, derfor må vi tilføje sandsynlighederne for, at:
- Ingen mislykkes
- Kun fejl 1
Parameteren μ for fordelingen i dette tilfælde er:
μ = 8 + 2 = 10 fejl på 125 timer.
P (3 eller flere komponenter mislykkes) = 1- P (0) - P (1) - P (2) =
Referencer
- MathWorks. Poisson distribution. Gendannes fra: es.mathworks.com
- Mendenhall, W. 1981. Statistik for ledelse og økonomi. 3rd. udgave. Grupo Redaktion Iberoamérica.
- Stat Trek. Lær dig selv statistik. Poisson Distribution. Gendannes fra: stattrek.com,
- Triola, M. 2012. Elementær statistik. 11.. Ed. Pearson Uddannelse.
- Wikipedia. Poisson distribution. Gendannet fra: en.wikipedia.org