- Definition
- Formler og ligninger
- - Kurtosis i henhold til præsentationen af dataene
- Data ikke grupperet eller grupperet i frekvenser
- Data grupperet i intervaller
- Overskydende kurtose
- Hvad er kurtose til?
- Løn for 3 afdelinger
- Resultaterne af en eksamen
- Arbejdet eksempel på kurtose
- Løsning
- Trin 1
- Trin 2
- Trin 3
- Referencer
Den kurtosis eller kurtosis er en statistisk parameter, der anvendes til at karakterisere sandsynlighedsfordelingen for en stokastisk variabel, der angiver graden af koncentrationen af værdier omkring den centrale foranstaltning. Dette er også kendt som "peak grade."
Udtrykket kommer fra det græske "kurtos", som betyder buet, derfor angiver kurtosen graden af peger eller udflatning af fordelingen, som det ses i følgende figur:

Figur 1. Forskellige typer kurtose. Kilde: F. Zapata.
Næsten alle værdier for en tilfældig variabel har en tendens til at klynge sig omkring en central værdi som middelværdien. Men i nogle fordelinger er værdierne mere spredt end i andre, hvilket resulterer i fladere eller slankere kurver.
Definition
Kurtosen er en numerisk værdi, der er typisk for hver frekvensfordeling, som i henhold til koncentrationen af værdierne omkring middelværdien er klassificeret i tre grupper:
- Leptokurtisk: hvor værdierne er meget samlet omkring middelværdien, så fordelingen er ret spids og slank (figur 1 til venstre).
- Mesocúrtic: det har en moderat koncentration af værdier omkring middelværdien (figur 1 i midten).
- Platicúrtica: denne fordeling har en bredere form, da værdierne har en tendens til at være mere spredt (figur 1 til højre).
Formler og ligninger
Kurtosen kan have enhver værdi uden begrænsninger. Beregningen udføres afhængigt af, hvordan dataene leveres. Notationen, der anvendes i begge tilfælde, er følgende:
-Koefficient for kurtose: g 2
-Arithmetisk middel: X eller x med bjælke
-En i-th værdi: x i
-Standardafvigelse: σ
- Antallet af data: N
-Frekvensen af i-th-værdien: f i
-Klassemærke: mx i
Med denne notation præsenterer vi nogle af de mest anvendte formler til at finde kurtose:
- Kurtosis i henhold til præsentationen af dataene
Data ikke grupperet eller grupperet i frekvenser

Data grupperet i intervaller

Overskydende kurtose
Også kaldet Fishers målretningskoefficient eller Fishers mål, bruges det til at sammenligne den undersøgte distribution med den normale distribution.
Når overskydende kurtose er 0, er vi i nærværelse af en normal fordeling eller Gaussisk klokke. På denne måde, når vi beregner overskydende kurtose af en fordeling, sammenligner vi faktisk den med den normale fordeling.
For både de ugrupperede og de samlede data er Fishers pegekoefficient, betegnet med K,:
K = g 2 - 3
Nu kan det vises, at kurtosen i den normale fordeling er 3, hvis Fisher-pegekoefficienten er 0 eller tæt på 0, og der er en mesokruktisk fordeling. Hvis K> 0 er fordelingen leptokurtisk, og hvis K <0 er den platicúrtisk.
Hvad er kurtose til?
Kurtosis er et mål på variabilitet, der bruges til at karakterisere morfologien i en distribution. På denne måde kan symmetriske fordelinger med samme gennemsnit og den samme spredning (givet ved standardafvigelsen) sammenlignes.
At have målinger af variabilitet sikrer, at gennemsnittet er pålidelige og hjælper med at kontrollere variationer i distributionen. Lad os som et eksempel se på disse to situationer.
Løn for 3 afdelinger
Antag, at følgende graf viser lønfordelingen for 3 afdelinger i samme virksomhed:

Figur 2. Tre fordelinger med forskellige kurtosis illustrerer praktiske situationer. (Udarbejdet af Fanny Zapata)
Kurve A er den slankeste af alle, og fra dens form kan det udledes, at de fleste af afdelingsens lønninger er meget tæt på gennemsnittet, derfor får de fleste af de ansatte en lignende kompensation.
På den anden side i afdeling B følger lønnskurven en normal fordeling, da kurven er mesokúrtisk, hvor vi antager, at lønningerne blev fordelt tilfældigt.
Og endelig har vi kurve C, som er meget flad, et tegn på, at lønområdet i denne afdeling er meget bredere end i de andre.
Resultaterne af en eksamen
Antag nu, at de tre kurver i figur 2 repræsenterer resultaterne af en eksamen anvendt til tre grupper af studerende af det samme emne.
Gruppen, hvis ratings er repræsenteret af A leptokurtisk kurve er ret homogen, de fleste opnåede en gennemsnitlig eller tæt vurdering.
Det er også muligt, at resultatet skyldtes, at testspørgsmålene havde mere eller mindre den samme vanskelighedsgrad.
På den anden side indikerer resultaterne af gruppe C en større heterogenitet i gruppen, der sandsynligvis indeholder gennemsnitlige studerende, nogle mere avancerede studerende og helt sikkert den samme mindre opmærksomme.
Eller det kunne betyde, at testspørgsmålene havde meget forskellige sværhedsgrader.
Kurve B er mesokutisk, hvilket indikerer, at testresultaterne fulgte en normal fordeling. Dette er normalt det hyppigste tilfælde.
Arbejdet eksempel på kurtose
Find Fishers scorekoefficient for følgende karakterer, der er opnået i en fysikeksamen til en gruppe studerende med en skala fra 1 til 10:
Løsning
Følgende udtryk vil blive brugt til ikke-grupperede data givet i de foregående afsnit:

K = g 2 - 3
Denne værdi giver dig mulighed for at kende distributionstypen.
At beregne g 2 det er praktisk at gøre det på en ordentlig måde, skridt for skridt, da flere aritmetiske operationer skal løses.
Trin 1
Først beregnes gennemsnittet af karaktererne. Der er N = 11 data.
Trin 2
Standardafvigelsen findes, som denne ligning bruges til:

σ = 1,992
Eller du kan også opbygge en tabel, som også er påkrævet til det næste trin, og hvor hver periode i de sammenlægninger, der er behov, skrives, startende med (x i - X), derefter (x i - X) 2 og derefter (x i - X) 4:

Trin 3
Udfør summen angivet i tælleren med formlen for g 2. Til dette bruges resultatet af højre kolonne i den forrige tabel:
∑ (x i - X) 4 = 290,15
Dermed:
g 2 = (1/11) x 290,15 /1.992 4 = 1,675
Fishers pegekoefficient er:
K = g 2 - 3 = 1.675 - 3 = -1.325
Det, der er af interesse, er resultatet af resultatet, der, når det er negativt, svarer til en platicúrtisk fordeling, som kan fortolkes, som det blev gjort i det foregående eksempel: muligvis er det et heterogent kursus med studerende i forskellige grader af interesse, eller eksamensspørgsmålene var af forskellige sværhedsniveauer.
Brug af et regneark som Excel letter i høj grad løsningen af disse typer problemer og tilbyder også muligheden for at tegne grafen for distributionen.
Referencer
- Levin, R. 1988. Statistik for administratorer. 2nd. Edition. Prentice Hall.
- Marco, F. Curtosis. Gendannes fra: economipedia.com.
- Oliva, J. Asymmetri og kurtose. Gendannes fra: statististicaucv.files.wordpress.com.
- Spurr, W. 1982. Beslutningstagning i ledelse. Limusa.
- Wikipedia. Kurtosis. Gendannet fra: en.wikipedia.org.
