Den Tukey testen er en metode, har til formål at sammenligne de enkelte midler fra en varians analyse af flere prøver underkastet forskellige behandlinger.
Testen, der blev præsenteret i 1949 af John.W. Tukey, giver os mulighed for at skelne mellem, om de opnåede resultater er markant forskellige eller ej. Det er også kendt som Tukeys ærligt signifikante forskelstest (Tukey's HSD-test).
Figur 1. Tukey-test giver os mulighed for at skelne mellem, om forskellene i resultater mellem tre eller flere forskellige behandlinger anvendt på tre eller flere grupper med de samme egenskaber har signifikant og ærligt forskellige middelværdier.
I eksperimenter, hvor tre eller flere forskellige behandlinger anvendt til det samme antal prøver sammenlignes, er det nødvendigt at skelne, om resultaterne er signifikant forskellige eller ikke.
Et eksperiment siges at være afbalanceret, når størrelsen på alle statistiske prøver er den samme for hver behandling. Når størrelsen på prøverne er forskellige for hver behandling, foretages der et ubalanceret eksperiment.
Nogle gange er det ikke nok med en variansanalyse (ANOVA) at vide, om de i sammenligningen af forskellige behandlinger (eller eksperimenter) anvendt på flere prøver opfylder nulhypotesen (Ho: "alle behandlinger er ens") eller tværtimod, opfylder den alternative hypotese (Ha: "mindst en af behandlingerne er anderledes").
Tukey's test er ikke unik, der er mange flere test til sammenligning af prøvemidler, men dette er en af de bedst kendte og anvendte.
Tukey-komparator og tabel
Ved anvendelsen af denne test beregnes en værdi w kaldet Tukey-komparator, hvis definition er som følger:
w = q √ (MSE / r)
Hvor faktoren q opnås fra en tabel (Tukey's Table), der består af rækker med q-værdier til forskellige antal behandlinger eller eksperimenter. Søjlerne angiver værdien af faktor q for forskellige frihedsgrader. Normalt har de tilgængelige tabeller en relativ betydning på 0,05 og 0,01.
I denne formel vises MSE-faktoren (middelkvadrat af fejl) divideret med r inden i kvadratroten divideret med r, som angiver antallet af gentagelser. MSE er et tal, der normalt opnås fra en analyse af afvigelser (ANOVA).
Når forskellen mellem to middelværdier overstiger værdien w (Tukey-komparator), konkluderes det, at de er forskellige gennemsnit, men hvis forskellen er mindre end Tukey-tallet, er det to prøver med statistisk identisk middelværdi.
Nummeret w er også kendt som HSD-nummeret (ærligt betydningsfuld forskel).
Dette enkelt sammenlignende antal kan anvendes, hvis antallet af prøver, der er anvendt til testen for hver behandling, er det samme i hver af dem.
Ubalancerede eksperimenter
Når størrelsen af prøverne af en eller anden grund er forskellig i hver behandling, der skal sammenlignes, adskiller proceduren ovenfor sig lidt og kaldes Tukey-Kramer-testen.
Nu opnås et komparatornummer w for hvert par af behandlinger i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
I denne formel opnås faktoren q fra Tukey's tabel. Denne faktor q afhænger af antallet af behandlinger og graden af frihed for fejlen. r i er antallet af gentagelser i behandling i, mens r j er antallet af gentagelser i behandling j.
Eksempel
En kaninopdrætter ønsker at foretage en pålidelig statistisk undersøgelse, der fortæller ham, hvilket af de fire mærker af fede fødevarer, der er den mest effektive. Til undersøgelsen dannede han fire grupper med seks en og en halv måned gamle kaniner, der indtil da havde de samme fodringsbetingelser.
Årsagerne var, at der i gruppe A1 og A4 døde dødsfald på grund af årsager, der ikke kan tilskrives mad, da en af kaninerne blev bidt af et insekt, og i det andet tilfælde var døden helt sikkert årsagen til en medfødt defekt. Så grupperne er ubalancerede, og så er det nødvendigt at anvende Tukey-Kramer-testen.
Træning løst
For ikke at forlænge beregningerne for længe, vil en afbalanceret eksperimentstilfælde blive taget som en løst øvelse. Følgende vil blive taget som data:
I dette tilfælde er der fire grupper svarende til fire forskellige behandlinger. Vi bemærker imidlertid, at alle grupper har det samme antal data, så det er en afbalanceret sag.
Til at udføre ANOVA-analysen er det værktøj, der er inkorporeret i Libreoffice-regnearket, blevet brugt. Andre regneark såsom Excel har dette værktøj inkorporeret til dataanalyse. Nedenfor er en oversigtstabel, der er resultatet efter analyse af varians (ANOVA) er udført:
Fra variansanalysen har vi også P-værdien, som for eksemplet er 2.24E-6, godt under 0,05-niveauet, som direkte fører til afvisning af nulhypotesen: Alle behandlinger er ens.
Det er blandt behandlingerne, at nogle har forskellige middelværdier, men det er nødvendigt at vide, hvilke der er de signifikant og ærligt forskellige (HSD) fra det statistiske synspunkt ved hjælp af Tukey-testen.
For at finde antallet wo, som HSD-nummeret også er kendt, er vi nødt til at finde middelkvadratet for fejlen MSE. Fra ANOVA-analysen opnås det, at summen af firkanter inden for grupperne er SS = 0,2; og antallet af frihedsgrader inden for grupperne er df = 16 med disse data kan vi finde MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Det kræves også at finde Tukey's faktor q ved hjælp af tabellen. I søjle 4 søges de 4 grupper eller behandlinger, der skal sammenlignes og række 16, da ANOVA-analysen gav 16 frihedsgrader inden for grupperne. Dette fører os til en værdi på q lig med: q = 4,33 svarende til 0,05 af betydning eller 95% af pålideligheden. Endelig findes værdien for den "ærligt betydelige forskel":
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
For at vide, hvilke er de ærligt forskellige grupper eller behandlinger, skal du kende gennemsnitsværdierne for hver behandling:
Det er også nødvendigt at kende forskellene mellem middelværdierne for par af behandlinger, som er vist i følgende tabel:
Det konkluderes, at de bedste behandlinger med hensyn til at maksimere resultatet er T1 eller T3, som er ligeglade ud fra et statistisk synspunkt. For at vælge mellem T1 og T3, må man kigge efter andre faktorer uden for analysen præsenteret her. For eksempel pris, tilgængelighed osv.
Referencer
- Cochran William og Cox Gertrude. 1974. Eksperimentelle design. Tærsket. Mexico. Tredje genoptryk. 661p.
- Snedecor, GW og Cochran, WG 1980. Statistiske metoder. Syvende udgave Iowa, The Iowa State University Press. 507p.
- Steel, RGD og Torrie, JH 1980. Principper og procedurer for statistik: En biometrisk tilgang (2. udg.). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Sammenligning af individuelle midler i analysen af varians. Biometri, 5: 99-114.
- Wikipedia. Tukey's test. Gendannet fra: en.wikipedia.com