- Typer af sandsynlighed eller tilfældig prøveudtagning
- Simpel tilfældig prøveudtagning
- Systematisk tilfældig prøveudtagning
- Stratificeret tilfældig prøveudtagning
- Tilfældig sampling af klynger
- Ikke-sandsynlighedstypeudtagning
- Prøvetagning af bekvemmelighed
- Stikprøveudtagning
- Sampling af snebold
- Diskretionær prøveudtagning
- Referencer
De typer af prøvetagning er de forskellige måder at udvinde data fra en del af den samlede, et kraftfuldt statistisk redskab, hvis funktion er at bestemme, hvilken del af befolkningen eller universet er nødvendigt at undersøge, drage slutninger og indhente oplysninger om det.
Prøveudtagning er meget vigtig, når du ikke kan eller ikke ønsker at analysere hele befolkningen. Bemærk, at udtrykket "befolkning" ikke kun henviser til en stor gruppe mennesker eller levende væsener, men generelt til det samlede antal elementer, der skal studeres i et givet problem.
Figur 1. Prøveudtagning er vigtig for at vælge en repræsentativ prøve fra et univers. Kilde: Pixabay.
I henhold til den valgte stikprøvevalg vælges den del af befolkningen, der betragtes som den mest repræsentative, altid i overensstemmelse med målene.
Når det kun er en del af datauniverset, der er taget, er det naturligvis muligt at gå glip af nogle detaljer og udelade oplysninger, hvorfor resultaterne ikke vil være så nøjagtige som de burde være. Dette er kendt som samplingsfejl.
Ideen er at forenkle datauniverset så meget som muligt ved at vælge den mest repræsentative prøve, der er i stand til at levere den maksimale information, for at sikre gyldigheden af resultaterne.
Typer af sandsynlighed eller tilfældig prøveudtagning
En sandsynlighedsprøveudtagning er baseret på sandsynligheden for, at prøverne i prøven skal vælges. På denne måde får hvert element i befolkningen en kendt chance for at blive valgt, hvilket naturligvis skal være større end 0.
Dette er ekstremt vigtigt, fordi det kan ske, at der fra et univers af data er valgt en prøve, der ikke er tilstrækkeligt repræsentativ for helheden.
I så fald vil resultaterne være partiske, da nogle dele af befolkningen vil blive mere foretrukket end andre. For at undgå bias, hvoraf der er flere kategorier, er en mulighed at lade chancen vælge prøven og dermed give hvert element en ikke-nul sandsynlighed for at blive valgt.
Simpel tilfældig prøveudtagning
Dette er en enkel måde at sikre, at chancen gør sit job. Hvis det for eksempel er et spørgsmål om at vælge nogle børn i en klasse til at deltage i en skolekunstbegivenhed, placeres alle børnenes navne på identiske foldede stemmesedler, blandet i en hat og en håndfuld tegnet tilfældigt.
Alle børnene i klassen udgør befolkningen, og den håndfulde afstemning, der blev trukket ud af hatten, er prøven.
Procedurens succes ligger i at udarbejde en komplet liste over alle børnene, så ingen udelades. I et lille kursus er dette ikke et problem; Men når du vil vælge en prøve fra en større population, skal du forfine metoden.
Enkel tilfældig prøveudtagning kan udføres med udskiftning eller udskiftning. For eksempel, hvis vi uddrager et element fra befolkningen og returnerer det efter at have valgt og undersøgt det, forbliver vores elementers univers altid det samme i hele studiet.
Hvis det valgte element tværtimod studeres, returneres ikke mere, det sampling uden udskiftning. Dette skal tages i betragtning, når der beregnes sandsynligheden for, at et element vælges.
Systematisk tilfældig prøveudtagning
For at udføre denne prøveudtagning er det også nødvendigt at liste N-elementer og også bestemme størrelsen på prøven, som vi vil kalde n. Listen kaldes en samplingsramme.
Nu er springintervallet defineret, der betegnes med bogstavet k og beregnes således:
Et tilfældigt tal vælges - tilfældigt - mellem 1 og k, kaldet ro tilfældig start. Dette er den første person på listen, der vælges, og derfra vælges følgende elementer på listen.
Et eksempel: Antag, at du har en liste med 2000 studerende fra et universitet, og at du ønsker at få et stikprøve på 100 studerende til at deltage i en kongres.
Den første ting at gøre er at finde værdien af k:
Når vi har delt det samlede antal studerende i 100 fragmenter på 20 studerende, tages et af fragmenterne, og der vælges et tilfældigt antal mellem 1 og 20, for eksempel 12. Derfor er den tolvte studerende på vores liste tilfældig start.
Den næste studerende, der vælges, skal være 12 + 20 = 22, derefter 42, derefter 62 og så videre, indtil alle 100 er afsluttet.
Som du kan se, er det en hurtig metode at anvende, og som normalt giver meget gode resultater, uden at det er nødvendigt at lægge 2000 navnene i en hat og tage 100 af dem, så længe der ikke er periodiske forhold i befolkningen, der giver anledning til partiske fordele..
Stratificeret tilfældig prøveudtagning
Figur 2. I stratificeret tilfældig stikprøve er populationen opdelt i segmenter kaldet strata. Kilde: Pixabay.
I simpel tilfældig sampling har hvert element i populationen den samme sandsynlighed for at blive valgt. Men dette er måske ikke altid sandt, især når der er flere kompleksiteter at overveje.
For at gennemføre et lagdelt tilfældigt prøveudtagningsskema skal populationen opdeles i grupper med lignende egenskaber. Dette er lagene. Lagene udtages derefter, og enkle tilfældige prøver vælges fra hver, som derefter kombineres for at danne den endelige prøve.
Lagene bestemmes inden prøveudtagning og undersøger datauniversets egenskaber.
Disse egenskaber kan være civilstand, alder, sted, hvor du bor, for eksempel by-, forstads- og landdistrikter, erhverv, uddannelsesniveau, køn og mange flere.
Under alle omstændigheder forventes det, at karakteristikaene for hvert stratum vil være meget karakteristiske, dvs. at hvert stratum er homogent.
Inden for den stratificerede prøveudtagning skelner vi to kategorier, afhængigt af om prøvestørrelsen for hvert stratum er eller ikke er proportional med dets størrelse.
Tilfældig sampling af klynger
De metoder, der er beskrevet ovenfor, vælger elementerne i prøven direkte, men i klyngsampling vælges en gruppe af elementer fra populationen, og disse vil være samplingsenheden, der kaldes en klynge.
Eksempler på klynger er afdelinger på et universitet, geografiske enheder som provinser, byer, amter eller kommuner, som alle har samme sandsynlighed for at blive valgt. I tilfælde af at man vælger en geografisk enhed, taler vi om sampling efter områder.
Når klyngerne er valgt, vælges elementerne der skal analyseres derfra. Derfor kan proceduren have flere faser.
Denne metode har nogle ligheder med den stratificerede tilfældige metode bortset fra at her er nogle klynger af det samlede antal valgt, mens i den forrige metode blev alle lag af befolkningen undersøgt.
Ikke-sandsynlighedstypeudtagning
Sandsynlighedsprøvetagning kan være meget dyr i nogle situationer, da der skal investeres tid og ressourcer for at finde prøver, der virkelig er repræsentative.
Det sker ofte, at der ikke er en komplet samplingsramme - listen - derfor er det ikke muligt at bestemme sandsynligheden for at vælge et element.
I disse tilfælde anvendes ikke-sandsynlighedstypeudtagningstyper, som man også opnår information til trods for, at der ikke er nogen garanti for præcision i resultaterne.
Når denne type prøveudtagning anvendes, skal nogle kriterier stadig følges på udvælgelsestidspunktet, idet man søger, at prøven er så passende som muligt.
Prøvetagning af bekvemmelighed
Det er en temmelig elementær prøvetagningstype, hvor elementerne i prøven vælges i henhold til deres tilgængelighed, det vil sige at vælge de personer, der er mest ved hånden. Det har fordelen ved at være en meget billig metode på grund af dens hastighed og bekvemmelighed.
Men som sagt er der ingen sikkerhed for at få pålidelige oplysninger om dine resultater. Det bruges undertiden til at lave hurtige, korte afstemninger før et valg eller til at spørge om kundepræferencer for visse produkter.
For eksempel kan en pollster gå til afkørslen fra tre af de indkøbscentre, der er tættest på hans hus og bede dem, der forlader, hvilken kandidat de vil stemme. Eller en lærer kan undersøge deres egne studerende, fordi de har øjeblikkelig adgang til dem.
Selvom det ser ud til, at resultaterne af en sådan procedure er værdiløse, forekommer det, at de kan være en god afspejling af befolkningen, så længe der er gode grunde til at antage, at skævheden ikke er særlig stor.
Det er dog ikke så simpelt, fordi eleverne til en bestemt lærer muligvis ikke udgør et repræsentativt udvalg af resten af studerende. Og for det meste har pollsters i indkøbscentre en tendens til at interviewe de mest attraktive mennesker.
Stikprøveudtagning
For at udtage stikprøver med kvoter skal man have en god forudgående viden om befolkningslagene for at få en idé om, hvilke er de mest repræsentative elementer. Men det styres ikke af tilfældighedskriteriet for lagdelt stikprøver.
I denne type prøveudtagning er det nødvendigt at indstille "kvoter", deraf navnet på metoden. Disse kvoter består af at samle et antal elementer med visse betingelser, for eksempel 15 kvinder, hvis alder er mellem 25 og 50 år, som ikke ryger og også ejer en bil.
Når kvoten er fastlagt, vælges de første personer, der opfylder de fastlagte betingelser. Kriterierne for dette sidste trin kan være efterforskerens bekvemmelighed. Her kan du se forskellen med den stratificerede samplingmetode, som er tilfældig.
Imidlertid er det en billig prismetode, der er fordelagtig, hvis, som vi sagde, den undersøgte befolkning er velkendt.
Sampling af snebold
Proceduren, der skal følges i denne samplingstil, er at vælge et par mennesker, der fører andre, og disse igen til andre, indtil prøven er den størrelse, som forskeren har brug for.
Dette er en procedure, der kan være nyttig til at karakterisere nogle populationer med ganske specifikke træk. Eksempler: indsatte i et fængsel eller personer med visse sygdomme.
Diskretionær prøveudtagning
Endelig her er det forskeren, der bestemmer kriterierne, der skal bruges til at vælge sin prøve efter hans viden. Det kan være nyttigt, når det er nødvendigt at tilføje visse individer til undersøgelsen, som, hvis de bruger en tilfældig metode, ikke kunne deltage.
Referencer
- Berenson, M. 1985. Statistik for ledelse og økonomi, koncepter og applikationer. Redaktionel Interamericana.
- Statistikker. Prøveudtagning. Gendannes fra: encyclopediaeconomica.com.
- Statistikker. Prøveudtagning. Gendannes fra: Estadistica.mat.uson.mx.
- Explorable. Cluster sampling. Gendannes fra: explorable.com.
- Moore, D. 2005. Anvendt grundlæggende statistik. 2nd. Edition.
- Netquest. Probability sampling: stratificeret sampling. Gendannes fra: netquest.com.
- Wikipedia. Prøveudtagning. Gendannet fra: es.wikipedia.org