- Grupperede data
- Eksempel
- De 3 vigtigste mål for central tendens
- 1 - Aritmetisk gennemsnit
- 2- Medium
- 3 - mode
- Referencer
De foranstaltninger af central tendens af grupperede data anvendes i statistikken til at beskrive visse former for adfærd i en gruppe af leverede data, såsom hvilken værdi de er tæt på, hvad der er gennemsnittet af de indsamlede data, blandt andre.
Når man tager en stor mængde data, er det nyttigt at gruppere dem for at få en bedre rækkefølge af dem og således være i stand til at beregne visse mål for central tendens.
Blandt de mest anvendte mål for central tendens er det aritmetiske middelværdi, medianen og tilstanden. Disse tal fortæller visse kvaliteter om de data, der er indsamlet i et bestemt eksperiment.
For at bruge disse mål skal du først vide, hvordan du grupperer et datasæt.
Grupperede data
For at gruppere data skal du først beregne intervallet for data, som opnås ved at trække den højeste værdi minus den laveste værdi af dataene.
Derefter vælges et tal "k", som er antallet af klasser, hvor vi vil gruppere dataene.
Området er divideret med "k" for at opnå amplituden af de klasser, der skal grupperes. Dette tal er C = R / k.
Endelig begynder grupperingen, for hvilket der vælges et tal mindre end den laveste værdi af de opnåede data.
Dette nummer er den nederste grænse for den første klasse. Til dette tilføjes C. Den opnåede værdi er den øvre grænse for den første klasse.
Derefter føjes C til denne værdi, og den øvre grænse for den anden klasse opnås. På denne måde fortsætter vi med at opnå den øvre grænse for den sidste klasse.
Når dataene er grupperet, kan middelværdien, medianen og tilstanden beregnes.
For at illustrere, hvordan det aritmetiske middelværdi, median og tilstand beregnes, fortsætter vi med et eksempel.
Eksempel
Derfor, når gruppering af dataene, opnås en tabel som den følgende:
De 3 vigtigste mål for central tendens
Nu fortsætter vi med at beregne det aritmetiske middelværdi, medianen og tilstanden. Eksemplet ovenfor vil blive brugt til at illustrere denne procedure.
1 - Aritmetisk gennemsnit
Det aritmetiske middelværdi består af at multiplicere hver frekvens med gennemsnittet af intervallet. Derefter tilføjes alle disse resultater, og til sidst divideres de med de samlede data.
Ved anvendelse af det foregående eksempel kan det opnås, at det aritmetiske middel er lig med:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Dette indikerer, at middelværdien af dataene i tabellen er 5.11111.
2- Medium
For at beregne medianen for et datasæt bestiller vi først alle dataene fra mindst til størst. To tilfælde kan opstå:
- Hvis antallet af data er ulige, er medianen de data, der er lige i midten.
- Hvis antallet af data er jævnt, er medianen gennemsnittet af de to data, der er i midten.
Når det kommer til grupperede data, foretages beregningen af medianen som følger:
- N / 2 beregnes, hvor N er de samlede data.
- Det første interval, hvor den akkumulerede frekvens (summen af frekvenserne) er større end N / 2, søges, og den nedre grænse for dette interval vælges, kaldet Li.
Medianen gives med følgende formel:
Mig = Li + (Ls-Li) * (N / 2 - Akkumuleret frekvens før Li) / frekvens af [Li, Ls)
Ls er den øvre grænse for det ovenfor nævnte interval.
Hvis den forrige datatabel bruges, er N / 2 = 18/2 = 9. De akkumulerede frekvenser er 4, 8, 14 og 18 (en for hver række i tabellen).
Derfor skal det tredje interval vælges, da den kumulative frekvens er større end N / 2 = 9.
Så Li = 5 og Ls = 7. Anvendelse af den ovenfor beskrevne formel skal du:
Mig = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3 - mode
Mode er værdien med den højeste frekvens blandt alle de grupperede data; det vil sige, det er den værdi, der gentages flest gange i det indledende datasæt.
Når du har en meget stor datamængde, bruges følgende formel til at beregne tilstanden for de grupperede data:
Mo = Li + (Ls-Li) * (frekvens af Li - Frekvens af L (i-1)) / ((frekvens af Li - Frekvens af L (i-1)) + (frekvens af Li - Frekvens af L (i + 1)))
Intervallet [Li, Ls) er det interval, hvor den højeste frekvens findes. For eksemplet lavet i denne artikel er tilstanden givet af:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
En anden formel, der bruges til at opnå en omtrentlig værdi til tilstanden er følgende:
Mo = Li + (Ls-Li) * (frekvens L (i + 1)) / (frekvens L (i-1) + frekvens L (i + 1)).
Med denne formel er kontiene som følger:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referencer
- Bellhouse, DR (2011). Abraham De Moivre: Indstilling af scenen for klassisk sandsynlighed og dens anvendelser. CRC Press.
- Cifuentes, JF (2002). Introduktion til sandsynlighedsteorien. National University of Colombia.
- Daston, L. (1995). Klassisk sandsynlighed i oplysningstiden. Princeton University Press.
- Larson, HJ (1978). Introduktion til sandsynlighedsteori og statistisk inferens. Redaktionel Limusa.
- Martel, PJ, & Vegas, FJ (1996). Sandsynlighed og matematisk statistik: anvendelser i klinisk praksis og sundhedsstyring. Díaz de Santos udgaver.
- Vázquez, AL, & Ortiz, FJ (2005). Statistiske metoder til måling, beskrivelse og kontrol af variation. Ed. University of Cantabria.
- Vázquez, SG (2009). Manual for matematik for adgang til universitetet. Redaktionel Centro de Estudios Ramon Areces SA.