- Fordele og ulemper
- Ulemper ved rækkevidde som et mål for spredning
- Interkvartil rækkevidde, kvartiler og bearbejdet eksempel
- - Beregning af kvartiler
- Første kvartil
- Anden kvartil eller median
- Tredje kvartil
- Arbejdet eksempel
- Løsning på
- Løsning b
- Opløsning c
- Referencer
Den rækkevidde, rækkevidde eller amplitude, i statistik, er forskellen (subtraktion) mellem den maksimale værdi og værdien af et sæt data fra en prøve eller en population minimum. Hvis intervallet er repræsenteret med bogstavet R, og dataene er repræsenteret med x, er formlen for området simpelthen:
R = x max - x min
Hvor x max er den maksimale værdi af dataene og x min er minimum.
Figur 1. Dataområde, der svarer til befolkningen i Cádiz i de sidste to århundreder. Kilde: Wikimedia Commons.
Konceptet er meget nyttigt som et simpelt mål for spredning for hurtigt at værdsætte variationen i dataene, da det indikerer forlængelsen eller længden af det interval, hvor disse findes.
Antag f.eks., At højden af en gruppe på 25 mandlige førsteårs ingeniørstuderende på et universitet måles. Den højeste studerende i gruppen er 1,93 m og den korteste 1,67 m. Dette er de ekstreme værdier for eksempeldataene, derfor er deres sti:
R = 1,93 - 1,67 m = 0,26 m eller 26 cm.
Højden på de studerende i denne gruppe er fordelt på dette interval.
Fordele og ulemper
Område er, som vi sagde før, et mål for, hvor spredt dataene er. Et lille interval angiver, at dataene er mere eller mindre tæt, og spredningen er lav. På den anden side er et større interval indikativt for, at dataene er mere spredt.
Fordelene ved at beregne rækkevidden er indlysende: det er meget let og hurtigt at finde, da det er en simpel forskel.
Det har også de samme enheder som de data, som det fungerer, og konceptet er meget let at fortolke for enhver observatør.
I eksemplet med højden på ingeniørstuderende, hvis rækkevidden havde været 5 cm, vil vi sige, at de studerende alle har omtrent samme størrelse. Men med en rækkevidde på 26 cm antager vi straks, at der er studerende i alle mellemhøjder i prøven. Er denne antagelse altid korrekt?
Ulemper ved rækkevidde som et mål for spredning
Hvis vi ser nøje, kan det være, at kun en af dem i vores prøve på 25 ingeniørstuderende måler 1,93, og de resterende 24 har højder tæt på 1,67 m.
Og alligevel forbliver rækkevidden den samme, selvom det modsatte er fuldstændigt muligt: at størstedelen af højden er omkring 1,90 m og kun den ene er 1,67 m.
I begge tilfælde er fordelingen af dataene ganske forskellige.
Ulemperne ved rækkevidde som et mål for spredning er fordi det kun bruger ekstreme værdier og ignorerer alle andre. Da de fleste af oplysningerne går tabt, har du ingen idé om, hvordan eksempeldataene distribueres.
En anden vigtig egenskab er, at prøven ikke reduceres. Hvis vi tilføjer flere oplysninger, det vil sige, vi overvejer flere data, intervallet øges eller forbliver det samme.
Og under alle omstændigheder er det kun nyttigt, når man arbejder med små prøver, det anbefales ikke at anvende det som et mål for spredning i store prøver.
Hvad der skal gøres, er at supplere den med beregningen af andre spredningstiltag, der tager højde for de oplysninger, der leveres af de samlede data: interkvartilt interval, varians, standardafvigelse og variationskoefficient.
Interkvartil rækkevidde, kvartiler og bearbejdet eksempel
Vi har indset, at svagheden ved rækkevidden som et mål for spredning er, at det kun bruger de ekstreme værdier i datafordelingen og udelader de andre.
For at undgå denne ulempe bruges kvartiler: tre værdier kendt som positionsmålinger.
De distribuerer de ugrupperede data i fire dele (andre vidt anvendte positionsmålinger er deciler og percentiler). Disse er dens egenskaber:
-Det første kvartil Q 1 er værdien af dataene, således at 25% af dem alle er mindre end Q 1.
-Det andet kvartil Q 2 er medianen for fordelingen, hvilket betyder, at halvdelen (50%) af dataene er mindre end denne værdi.
- Endelig indikerer det tredje kvartil Q 3, at 75% af dataene er mindre end Q 3.
Derefter defineres interkvartilområdet eller interkvartilområdet som forskellen mellem den tredje kvartil Q 3 og den første kvartil Q 1 af dataene:
Interkvartilt interval = R Q = Q 3 - Q 1
På denne måde påvirkes værdien af området R Q ikke så ekstreme værdier. Af denne grund tilrådes det at bruge det, når man beskæftiger sig med skæve distributioner, såsom dem for meget høje eller meget korte studerende beskrevet ovenfor.
- Beregning af kvartiler
Der er flere måder at beregne dem på, her vil vi foreslå en, men under alle omstændigheder er det nødvendigt at kende ordrenummeret "N o ", som er det sted, som den respektive kvartil optager i distributionen.
Det vil sige, hvis for eksempel det udtryk, der svarer til Q 1, er det andet, det tredje eller det fjerde og så videre for distributionen.
Første kvartil
N eller (Q 1) = (N + 1) / 4
Anden kvartil eller median
N eller (Q 2) = (N + 1) / 2
Tredje kvartil
N eller (Q 3) = 3 (N + 1) / 4
Hvor N er antallet af data.
Medianen er den værdi, der er lige midt i fordelingen. Hvis antallet af data er underligt, er der ikke noget problem med at finde dem, men hvis de er jævn, beregnes de to centrale værdier i gennemsnit for at blive en.
Når ordrenummeret er beregnet, følges en af disse tre regler:
-Hvis der ikke er nogen decimaler, søges de data, der er angivet i distributionen, og dette vil være det søgte kvartil.
-Når ordrenummeret er halvvejs mellem to, gennemsættes de data, der er angivet med heltaldelen, med følgende data, og resultatet er den tilsvarende kvartil.
-I ethvert andet tilfælde afrundes det til det nærmeste heltal, og det vil være placeringen af kvartilen.
Arbejdet eksempel
På en skala fra 0 til 20 opnåede en gruppe på 16 matematik I-studerende følgende karakterer (point) på en midtvejseksamen:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Finde:
a) Dataets rækkevidde eller rækkevidde.
b) Værdierne for kvartilerne Q 1 og Q 3
c) Interkvartilområdet.
Figur 2. Har resultaterne på denne matematikprøve så meget variation? Kilde: Pixabay.
Løsning på
Den første ting at gøre for at finde ruten er at bestille dataene i stigende eller faldende rækkefølge. For eksempel i stigende rækkefølge har du:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Brug af formlen givet i begyndelsen: R = x max - x min
R = 20 - 1 point = 19 point.
Ifølge resultatet har disse ratings en stor spredning.
Løsning b
N = 16
N eller (Q 1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Det er et tal med decimaler, hvis heltal er 4. Så går vi til distributionen, vi ser efter de data, der indtager fjerde plads, og dens værdi er gennemsnitligt med den i femte position. Da begge er 9, er gennemsnittet også 9, og så:
Q 1 = 9
Nu gentager vi proceduren for at finde Q 3:
N eller (Q 3) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Igen er det en decimal, men da det ikke er halvvejs, afrundes det til 13. Det søgte kvartil besætter den trettende position og er:
Q 3 = 16
Opløsning c
R Q = Q 3 - Q 1 = 16 - 9 = 7 point.
Som, som vi kan se, er meget mindre end det interval af data, der er beregnet i afsnit a), fordi minimumsresultatet var 1 point, en værdi meget længere fra resten.
Referencer
- Berenson, M. 1985. Statistik for ledelse og økonomi. Interamericana SA
- Canavos, G. 1988. Sandsynlighed og statistik: Anvendelser og metoder. McGraw Hill.
- Devore, J. 2012. Sandsynlighed og statistik for teknik og videnskab. 8.. Edition. Cengage.
- Eksempler på kvartiler. Gendannet fra: matematicas10.net.
- Levin, R. 1988. Statistik for administratorer. 2nd. Edition. Prentice Hall.
- Walpole, R. 2007. Sandsynlighed og statistik for ingeniørvidenskab og videnskaber. Pearson.