- Hvor kommer den empiriske regel fra?
- Tchebysjevs sætning
- Normal fordeling
- Hvordan bruges den empiriske regel?
- 1- Konstruer intervaller for reglen
- 2- Beregn antallet af studerende i hvert interval efter procentsatserne
- 3 - Aldersintervaller er forbundet med antallet af studerende og fortolker
- Hvad er tommelfingerreglen til?
- Løst øvelser
- Kaniner i reservatet
- Gennemsnitsvægt for børn i et land
- Referencer
En tommelfingerregel er resultatet af praktisk erfaring og observation i det virkelige liv. For eksempel er det muligt at vide, hvilke fuglearter der kan observeres på visse steder på hvert tidspunkt af året, og fra denne observation kan der etableres en "regel", der beskriver disse fuglers livscyklus.
I statistik refererer den empiriske regel til gruppering af observationer omkring en central værdi, middelværdien eller gennemsnittet, i enheder med standardafvigelse.
Antag, at vi har en gruppe mennesker med en gennemsnitlig højde på 1,62 meter og en standardafvigelse på 0,25 meter, så ville den empiriske regel give os mulighed for at definere, for eksempel, hvor mange mennesker ville være i et interval af middelværdien plus eller minus en standardafvigelse?
I henhold til reglen er 68% af dataene mere eller mindre en standardafvigelse fra gennemsnittet, dvs. 68% af befolkningen i gruppen har en højde mellem 1,37 (1,62-0,25) og 1,87 (1,62 + 0,25)) meter.
Hvor kommer den empiriske regel fra?
Den empiriske regel er en generalisering af Tchebyshev-sætningen og den normale distribution.
Tchebysjevs sætning
Tchebyshevs sætning siger, at: for en værdi af k> 1 er sandsynligheden for, at en tilfældig variabel ligger mellem middelværdien minus k gange standardafvigelsen, og middelværdien plus k gange, er standardafvigelsen større end eller lig med (1 - 1 / k 2).
Fordelen ved dette teorem er, at det anvendes til diskrete eller kontinuerlige tilfældige variabler med enhver sandsynlighedsfordeling, men reglen, der er defineret derfra, er ikke altid meget præcis, da det afhænger af symmetrien i fordelingen. Jo mere asymmetrisk fordelingen af den tilfældige variabel er, jo mindre justeret til reglen vil være dens opførsel.
Den empiriske regel, der er defineret ud fra dette teorem, er:
Hvis k = √2 siges det, at 50% af dataene er i intervallet:
Hvis k = 2, siges 75% af dataene at være i intervallet:
Hvis k = 3, siges 89% af dataene at være i intervallet:
Normal fordeling
Den normale fordeling, eller Gaussisk klokke, gør det muligt at etablere den empiriske regel eller regel 68 - 95 - 99.7.
Reglen er baseret på sandsynligheden for forekomst af en tilfældig variabel i intervaller mellem gennemsnittet minus et, to eller tre standardafvigelser og middelværdien plus et, to eller tre standardafvigelser.
Den empiriske regel definerer følgende intervaller:
68,27% af dataene er i intervallet:
95,45% af dataene er i intervallet:
99,73% af dataene er i intervallet:
I figuren kan du se, hvordan disse intervaller er præsenteret, og forholdet mellem dem, når du øger bredden på grafens basis.
Empirisk regel. Melikamp Standardiseringen af den tilfældige variabel, det vil sige udtrykket af den tilfældige variabel i form af z eller standard normal variabel, forenkler brugen af den empiriske regel, da variablen z har et middel lig med nul og en standardafvigelse lig med en.
Derfor definerer anvendelsen af den empiriske regel i skala af en standardnormalvariabel z de følgende intervaller:
68,27% af dataene er i intervallet:
95,45% af dataene er i intervallet:
99,73% af dataene er i intervallet:
Hvordan bruges den empiriske regel?
Den empiriske regel tillader forkortede beregninger, når man arbejder med en normal fordeling.
Antag, at en gruppe på 100 universitetsstuderende har en gennemsnitlig alder på 23 år med en standardafvigelse på 2 år. Hvilke oplysninger tillader den empiriske regel at få?
Anvendelse af den empiriske regel involverer at følge trinnene:
1- Konstruer intervaller for reglen
Da gennemsnittet er 23 og standardafvigelsen er 2, er intervallerne:
= =
= =
= =
2- Beregn antallet af studerende i hvert interval efter procentsatserne
(100) * 68,27% = 68 studerende ca.
(100) * 95,45% = 95 studerende ca.
(100) * 99,73% = 100 studerende ca.
3 - Aldersintervaller er forbundet med antallet af studerende og fortolker
Mindst 68 studerende er mellem 21 og 25 år.
Mindst 95 studerende er mellem 19 og 27 år.
Næsten 100 studerende er mellem 17 og 29 år gamle.
Hvad er tommelfingerreglen til?
Den empiriske regel er en hurtig og praktisk måde at analysere statistiske data ved at blive mere og mere pålidelige efterhånden som distributionen nærmer sig symmetri.
Dets nyttighed afhænger af det felt, hvor det bruges, og de spørgsmål, der er præsenteret. Det er meget nyttigt at vide, at forekomsten af værdier af tre standardafvigelser under eller over gennemsnittet næsten er usandsynlig, selv for ikke-normale fordelingsvariabler er mindst 88,8% af tilfældene i de tre sigma-intervaller.
I samfundsvidenskab er et generelt konkluderende resultat intervallet for det gennemsnitlige plus eller minus to sigma (95%), mens en ny effekt i partikelfysik kræver et fem sigma-interval (99.99994%) for at blive betragtet som en opdagelse.
Løst øvelser
Kaniner i reservatet
I en naturreservat anslås det, at der i gennemsnit er 16.000 kaniner med en standardafvigelse på 500 kaniner. Hvis fordelingen af variablen 'antal kaniner i reserven' ikke er kendt, er det muligt at estimere sandsynligheden for, at kaninbestanden er mellem 15.000 og 17.000 kaniner?
Intervallet kan præsenteres i disse udtryk:
15000 = 16000 - 1000 = 16000 - 2 (500) = µ - 2 s
17000 = 16000 + 1000 = 16000 + 2 (500) = µ + 2 s
Derfor: =
Anvendelse af Tchebyshevs teorem har vi en sandsynlighed for mindst 0,75 for, at kaninbestanden i naturreservatet er mellem 15.000 og 17.000 kaniner.
Gennemsnitsvægt for børn i et land
Den gennemsnitlige vægt af et år gamle børn i et land fordeles normalt med et gennemsnit på 10 kg og en standardafvigelse på cirka 1 kg.
a) estimer procentdelen af et år gamle børn i landet, der har en gennemsnitlig vægt mellem 8 og 12 kg.
8 = 10 - 2 = 10 - 2 (1) = µ - 2 s
12 = 10 + 2 = 10 + 2 (1) = µ + 2 s
Derfor: =
I henhold til den empiriske regel kan det siges, at 68,27% af et år gamle børn i landet har mellem 8 og 12 kg vægt.
b) Hvad er sandsynligheden for at finde et et år gammelt barn, der vejer 7 kg eller derunder?
7 = 10 - 3 = 10 - 3 (1) = µ - 3 s
Det er kendt, at 7 kg vægt repræsenterer værdien µ - 3s, såvel som det er kendt, at 99,73% af børnene er mellem 7 og 13 kg vægt. Det efterlader kun 0,27% af det samlede barn for ekstreme sider. Halvdelen af dem, 0,135%, er 7 kg eller derunder, og den anden halvdel, 0,135%, er 11 kg eller mere.
Så det kan konkluderes, at der er en sandsynlighed for 0,00135 for, at et barn vejer 7 kg eller mindre.
c) Hvis landets befolkning når 50 millioner indbyggere, og 1-årige børn repræsenterer 1% af landets befolkning, hvor mange et-årige børn vejer der mellem 9 og 11 kg?
9 = 10 - 1 = µ - s
11 = 10 + 1 = µ + s
Derfor: =
I henhold til den empiriske regel er 68,27% af etårige i landet i intervallet
Der er 500.000 etårige i landet (1% af 50 millioner), så 341.350 børn (68,27% af 500.000) vejer mellem 9 og 11 kg.
Referencer
- Abraira, V. (2002). Standardafvigelse og standardfejl. Semergen Magazine. Gendannes fra web.archive.org.
- Freund, R.; Wilson, W.; Mohr, D. (2010). Statistiske metoder. Tredje udgave Academic Press-Elsevier Inc.
- Alicante-server (2017). Empirisk regel (statistiske udtryk). Gendannes fra glosarios.servidor-alicante.com.
- Lind, D.; Marchal, W.; Wathen, S. (2012). Statistikker anvendt for erhvervslivet og økonomien. Femtende udgave McGraw-Hill / Interamericana de México SA
- Salinas, H. (2010). Statistik og sandsynligheder. Gendannes fra uda.cl.
- Sokal, R.; Rohlf, F. (2009). Introduktion til biostatistik. Anden udg. Dover-publikationer, Inc.
- Spiegel, M. (1976). Sandsynlighed og statistik. Schaum-serien. McGraw-Hill / Interamericana de México SA
- Spiegel, M.; Stephens, L. (2008). Statistikker. Fjerde udgave McGraw-Hill / Interamericana de México SA
- Stat119-gennemgang (2019). Løsning af empiriske spørgsmål. Gendannes fra stat119review.com.
- (2019). 68-95-99.7 regel. Gendannet fra en.wikipedia.org.