- Størrelsen på prøven
- Tilfælde 1: befolkningens størrelse er ukendt
- Tillidsniveauer og deres tilsvarende Z-værdier
- Tilfælde 2: befolkningens størrelse er kendt
- eksempler
- Undersøgelser og spørgeskemaer
- QA
- Fordel
- Ulemper
- Træning løst
- Løsning
- Referencer
Den tilfældige prøveudtagning er, hvordan man vælger en statistisk repræsentativ prøve fra en given population. En del af princippet om, at hvert element i prøven skal have den samme sandsynlighed for at blive valgt.
Et lodtrækning er et eksempel på tilfældig prøveudtagning, hvor hvert medlem af deltagerpopulationen tildeles et nummer. For at vælge de numre, der svarer til lodtrækningspræmierne (prøven), bruges en tilfældig teknik, for eksempel udtræk fra en postkasse de numre, der blev skrevet ned på identiske kort.
Figur 1. Ved tilfældig prøveudtagning trækkes prøven fra populationen tilfældigt ved hjælp af en teknik, der sikrer, at alle elementer har samme sandsynlighed for at blive valgt. Kilde: netquest.com.
Ved tilfældig stikprøveudtagning er det vigtigt at vælge stikprøvestørrelse korrekt, fordi en ikke-repræsentativ prøve af befolkningen kan føre til fejlagtige konklusioner på grund af statistiske udsving.
Størrelsen på prøven
Der er formler til bestemmelse af den korrekte størrelse af en prøve. Den vigtigste faktor, der skal overvejes, er, om befolkningsstørrelsen er kendt eller ej. Lad os se på formlerne for at bestemme prøvestørrelsen:
Tilfælde 1: befolkningens størrelse er ukendt
Når populationsstørrelsen N er ukendt, er det muligt at vælge en prøve med passende størrelse n til at bestemme, om en bestemt hypotese er sand eller falsk.
Til dette bruges følgende formel:
Hvor:
-p er sandsynligheden for, at hypotesen er sand.
-q er sandsynligheden for, at det ikke er, derfor er q = 1 - p.
-E er den relative fejlmargin, for eksempel har en fejl på 5% en margin på E = 0,05.
-Z har at gøre med det niveau af tillid, som undersøgelsen kræver.
I en standardiseret (eller normaliseret) normalfordeling har et konfidensniveau på 90% Z = 1.645, fordi sandsynligheden for, at resultatet er mellem -1.645σ og + 1.645σ, er 90%, hvor σ er standardafvigelsen.
Tillidsniveauer og deres tilsvarende Z-værdier
1.- 50% konfidensniveau svarer til Z = 0,675.
2.- 68,3% konfidensniveau svarer til Z = 1.
3.- 90% konfidensniveau svarer til Z = 1.645.
4.- 95% konfidensniveau svarer til Z = 1,96
5.- 95,5% konfidensniveau svarer til Z = 2.
6.- 99,7% konfidensniveau svarer til Z = 3.
Et eksempel, hvor denne formel kan anvendes, ville være i en undersøgelse for at bestemme gennemsnitsvægten af småsten på en strand.
Det er klart, at det ikke er muligt at studere og veje alle småsten på stranden, så det tilrådes at udtage en prøve så tilfældig som muligt og med det passende antal elementer.
Figur 2. For at undersøge kendetegnene for småsten på en strand er det nødvendigt at vælge en tilfældig prøve med et repræsentativt antal af dem. (Kilde: pixabay)
Tilfælde 2: befolkningens størrelse er kendt
Når antallet N af elementer, der udgør en bestemt population (eller univers), er kendt, hvis vi vil vælge en statistisk signifikant prøve af størrelse n ved simpel tilfældig sampling, er dette formlen:
Hvor:
-Z er koefficienten forbundet med konfidensniveauet.
-p er sandsynligheden for succes med hypotesen.
-q er sandsynligheden for fiasko i hypotesen, p + q = 1.
-N er størrelsen på den samlede befolkning.
-E er den relative fejl i undersøgelsesresultatet.
eksempler
Metoden til at udvinde prøverne afhænger meget af den type undersøgelse, der skal udføres. Derfor har tilfældig prøveudtagning et uendeligt antal applikationer:
Undersøgelser og spørgeskemaer
I telefonundersøgelser vælges de personer, der skal høres, f.eks. Ved hjælp af en tilfældig talgenerator, der er relevant for den undersøgte region.
Hvis du vil anvende et spørgeskema til medarbejdere i et stort firma, kan du ty til udvælgelsen af respondenterne gennem deres medarbejdernummer eller identitetskortnummer.
Nævnte nummer skal også vælges tilfældigt ved hjælp af for eksempel en tilfældig talgenerator.
Figur 3. Et spørgeskema kan anvendes ved tilfældigt at vælge deltagerne. Kilde: Pixabay.
QA
I tilfælde af at undersøgelsen drejer sig om dele, der er fremstillet af en maskine, skal dele vælges tilfældigt, men fra partier, der er fremstillet på forskellige tidspunkter af dagen, eller på forskellige dage eller uger.
Fordel
Enkel tilfældig prøveudtagning:
- Det giver mulighed for at reducere omkostningerne ved en statistisk undersøgelse, fordi det ikke er nødvendigt at studere den samlede population for at opnå statistisk pålidelige resultater med de ønskede konfidensniveauer og det fejlniveau, der kræves i undersøgelsen.
- Undgå bias: Da valget af de elementer, der skal studeres, er helt tilfældigt, afspejler undersøgelsen trofast befolkningens karakteristika, skønt kun en del af den blev undersøgt.
Ulemper
- Metoden er ikke tilstrækkelig i tilfælde, hvor du vil vide præferencerne i forskellige grupper eller befolkningslag.
I dette tilfælde foretrækkes det tidligere at bestemme de grupper eller segmenter, som undersøgelsen skal udføres på. Når lagene eller grupperne er blevet defineret, så hvis det er praktisk for hver enkelt af dem at anvende tilfældig sampling.
- Det er meget usandsynligt, at der opnås oplysninger om minoritetssektorer, som det undertiden er nødvendigt at kende deres egenskaber.
For eksempel, hvis det er et spørgsmål om kampagne for et dyre produkt, er det nødvendigt at kende præferencerne for de rigeste minoritetssektorer.
Træning løst
Vi vil undersøge befolkningens præference for en bestemt coladrink, men der er ingen tidligere undersøgelse i denne population, hvor dens størrelse er ukendt.
På den anden side skal prøven være repræsentativ med et minimums konfidensniveau på 90%, og konklusionerne skal have en procentvis fejl på 2%.
-Hvordan bestemmes størrelsen n af prøven?
-Hvad ville være prøvestørrelsen, hvis fejlmargenen gøres mere fleksibel til 5%?
Løsning
Da størrelsen på populationen er ukendt, bruges den ovenfor angivne formel til at bestemme prøvestørrelsen:
n = (Z 2 p q) / (E 2)
Vi antager, at der er en lige sandsynlighed for præference (p) for vores brand af læskedrik som for ikke-præference (q), så p = q = 0,5.
På den anden side, da resultatet af undersøgelsen skal have en procentvis fejl mindre end 2%, vil den relative fejl E være 0,02.
Endelig producerer en Z-værdi = 1.645 et konfidensniveau på 90%.
Sammenfattende har vi følgende værdier:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
Med disse data beregnes mindsteprøven:
n = (1,645 2 0,5 0,5) / (0,02 2) = 1691,3
Dette betyder, at undersøgelsen med den krævede fejlmargin og med det valgte niveau af selvtillid skal have et stik af respondenter på mindst 1692 individer, valgt ved simpel tilfældig sampling.
Hvis du går fra en fejlmargin på 2% til 5%, er den nye prøvestørrelse:
n = (1,645 2 0,5 0,5) / (0,05 2) = 271
Hvilket er et markant lavere antal individer. Afslutningsvis er prøvestørrelsen meget følsom over for den ønskede fejlmargin i undersøgelsen.
Referencer
- Berenson, M. 1985. Statistik for ledelse og økonomi, koncepter og applikationer. Redaktionel Interamericana.
- Statistikker. Tilfældig prøveudtagning. Taget fra: encyclopediaeconomica.com.
- Statistikker. Prøveudtagning. Gendannes fra: Estadistica.mat.uson.mx.
- Explorable. Tilfældig prøveudtagning. Gendannes fra: explorable.com.
- Moore, D. 2005. Anvendt grundlæggende statistik. 2nd. Edition.
- Netquest. Tilfældig prøveudtagning. Gendannes fra: netquest.com.
- Wikipedia. Statistisk prøveudtagning. Gendannet fra: en.wikipedia.org