- Formler og ligninger
- Sådan beregnes prøveudtagningsfejl
- For et niveau af selvtillid
- eksempler
- - Eksempel 1
- Løsning
- - Eksempel 2
- Løsning
- - Eksempel 3
- Løsning
- - Eksempel 4
- Løsning
- - Øvelse 5
- Løsning
- Referencer
Den prøveudtagning fejl eller prøveudtagning fejl i statistikken er forskellen mellem middelværdien af en prøve, og den gennemsnitlige værdi af den samlede befolkning. For at illustrere ideen, lad os forestille os, at den samlede befolkning i en by er en million mennesker, hvoraf du vil have den gennemsnitlige skostørrelse, som der udtages en tilfældig prøve på tusind mennesker.
Den gennemsnitlige størrelse, der fremgår af prøven, falder ikke nødvendigvis sammen med størrelsen af den samlede befolkning, selvom hvis prøven ikke er partisk, skal værdien være tæt. Denne forskel mellem middelværdien af prøven og den for den samlede population er samplingfejlen.

Figur 1. Da stikprøven er en undergruppe af den samlede befolkning, har stikprøven gennemsnit en fejlmargin. Kilde: F. Zapata.
Generelt er middelværdien af den samlede population ukendt, men der er teknikker til at reducere denne fejl og formler til at estimere marginen for samplingfejl, der vil blive diskuteret i denne artikel.
Formler og ligninger
Lad os sige, at vi vil vide middelværdien af en bestemt målbar karakteristik x i en population af størrelse N, men da N er et stort antal, er det ikke muligt at gennemføre undersøgelsen af den samlede befolkning, så fortsætter vi med at tage en tilfældig prøve af størrelse n <
Middelværdien af prøven er angivet med
Antag, at der udtages m-prøver fra den samlede population N, alle af samme størrelse n med middelværdier
Disse middelværdier vil ikke være identiske med hinanden og vil alle være omkring befolkningens middelværdi μ. Samplingsfejlmargen E angiver den forventede adskillelse af middelværdierne
Standardfejlmargen ε for prøven i størrelse n er:
ε = σ / √n
hvor σ er standardafvigelsen (kvadratroten af variansen), der beregnes ved hjælp af følgende formel:
σ = √
Betydningen af standardfejlmargen ε er som følger:
Middelværdi
Sådan beregnes prøveudtagningsfejl
I det foregående afsnit blev formlen til at finde standardfejlmargen for en prøve i størrelse n givet, hvor ordstandarden angiver, at det er en fejlmargin med 68% konfidens.
Dette indikerer, at hvis mange prøver af samme størrelse n blev taget, vil 68% af dem give middelværdier
Der er en simpel regel, kaldet 68-95-99.7-reglen, der giver os mulighed for at finde samplingfejlmargen E for konfidensniveauer på 68%, 95% og 99,7% let, da denne margen er 1 ε, 2 Henholdsvis ⋅ ε og 3⋅ ε.
For et niveau af selvtillid
Hvis konfidensniveauet γ ikke er et af ovenstående, er samplingsfejlen standardafvigelsen σ ganget med faktoren Zy, som opnås ved følgende procedure:
1.- Først bestemmes signifikansniveauet α, der beregnes ud fra konfidensniveauet γ gennem følgende forhold: α = 1 - γ
2.- Derefter skal vi beregne værdien 1 - α / 2 = (1 + γ) / 2, der svarer til den akkumulerede normale frekvens mellem -∞ og Zγ, i en normal eller Gaussisk fordeling typificeret F (z), hvis definition kan ses i figur 2.
3.- Ligningen F (Zγ) = 1 - α / 2 løses ved hjælp af tabellerne for den normale (kumulative) fordeling F eller ved hjælp af en computerapplikation, der har den inverse gaussiske funktion F -1.
I sidstnævnte tilfælde har vi:
Zy = G -1 (1 - a / 2).
4.- Endelig anvendes denne formel til samplingfejlen med et pålidelighedsniveau γ:
E = Zγ ⋅ (σ / √n)

Figur 2. Tabel med normal fordeling. Kilde: Wikimedia Commons.
eksempler
- Eksempel 1
Beregn standardfejlmargenen i middelvægten af en prøve på 100 nyfødte. Beregningen af gennemsnitsvægten var
Løsning
Standard fejlmargen er ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. Dette betyder, at det med disse data kan udledes, at vægten af 68% af de nyfødte er mellem 2.950 kg og 3,25 kg.
- Eksempel 2
Bestemm margen for prøveudtagningsfejl E og vægtområdet for 100 nyfødte med et 95% konfidensniveau, hvis middelvægten er 3.100 kg med standardafvigelse σ = 1.500 kg.
Løsning
Hvis regel 68 finder anvendelse; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, vi har:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Med andre ord vil 95% af de nyfødte have vægt mellem 2.800 kg og 3.400 kg.
- Eksempel 3
Bestem rækkevidden af de nyfødte i eksempel 1 med en konfidensmargen på 99,7%.
Løsning
Prøveudtagningsfejlen med 99,7% konfidens er 3 σ / √n, hvilket for vores eksempel er E = 3 * 0,15 kg = 0,45 kg. Herfra følger det, at 99,7% af nyfødte har vægt mellem 2.650 kg og 3.550 kg.
- Eksempel 4
Bestemm faktoren Zy for et konfidensniveau på 75%. Bestem margen for samplingfejl med dette niveau af pålidelighed for det tilfælde, der er vist i eksempel 1.
Løsning
Konfidensniveauet er γ = 75% = 0,75, som er relateret til signifikansniveauet α gennem forholdet γ = (1 - α), så signifikansniveauet er α = 1 - 0,75 = 0, 25
Dette betyder, at den kumulative normale sandsynlighed mellem -∞ og Zγ er:
P (Z <Zy) = 1 - 0,125 = 0,875
Hvilket svarer til en Zy-værdi på 1.1503, som vist i figur 3.

Figur 3. Bestemmelse af Zγ-faktoren svarende til et konfidensniveau på 75%. Kilde: F. Zapata gennem Geogebra.
Med andre ord er samplingsfejlen E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Når det anvendes på dataene fra eksempel 1, giver det en fejl:
E = 1,15 * 0,15 kg = 0,17 kg
Med et tillidsniveau på 75%.
- Øvelse 5
Hvad er konfidensniveauet, hvis Z α / 2 = 2,4?
Løsning
P (Z ≤ Z α / 2) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Niveauet af betydning er:
a = 0,0164 = 1,64%
Og endelig forbliver tillidsniveauet:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Referencer
- Canavos, G. 1988. Sandsynlighed og statistik: Anvendelser og metoder. McGraw Hill.
- Devore, J. 2012. Sandsynlighed og statistik for teknik og videnskab. 8.. Edition. Cengage.
- Levin, R. 1988. Statistik for administratorer. 2nd. Edition. Prentice Hall.
- Sudman, S. 1982. Stil spørgsmål: En praktisk vejledning til design af spørgeskemaer. San Francisco. Jossey Bass.
- Walpole, R. 2007. Sandsynlighed og statistik for ingeniørvidenskab og videnskaber. Pearson.
- Wonnacott, TH og RJ Wonnacott. 1990. Indledende statistik. 5. udg. Wiley
- Wikipedia. Prøvefejl. Gendannet fra: en.wikipedia.com
- Wikipedia. Fejlmargin. Gendannet fra: en.wikipedia.com
