Innhold
Statistikeren og evolusjonsbiologen Ronald Fisher utviklet ANOVA, eller variansanalyse, for å være et middel til slutt. Det kan hjelpe deg med å finne ut om resultatene fra et eksperiment, undersøkelse eller studie kan støtte hypotesen. Ved å bruke ANOVA kan du raskt bestemme om en hypotese er sann eller usann.
Hva er ANOVA?
Brukt for å evaluere avvikene mellom gruppemidlene i en prøve, er ANOVA en samling av statistiske modeller og tilhørende estimeringsprosedyrer. Det er i utgangspunktet variasjonen mellom to kjente datagrupper. Den tilbyr en statistisk test av om populasjonsmidlene til flere datasett faktisk er like. Den generaliserer deretter t-testen, eller en analyse av to populasjonsmidler gjennom statistisk undersøkelse, til mer enn to grupper. En t-test viser om det er en betydelig forskjell mellom befolkningsgjennomsnittet og en antatt verdi. Størrelsen på forskjellen i forhold til variasjonen i eksempeldata er t-verdien.
Envei eller toveis?
Antallet uavhengige variabler i variansanalysen du bruker, avgjør om ANOVA er den ene eller den andre. Enveis test har en enkelt uavhengig variabel med to nivåer. En toveis analyse av variansetest har to uavhengige variabler. En toveis test kan ha et mangfold av nivåer. Et eksempel på en enveis ville være å sammenligne to merker av gelé. En toveis vil sammenligne merker av gelé så vel som kalorier, fett, sukker eller karbohydratnivå.
Nivåene inkluderer de forskjellige gruppene som alle er i samme uavhengige variabel. Replikering er når du gjentar testene med flere grupper. En toveis analyse av varians med replikering bruker to grupper og individer som er i den gruppen som gjør flere ting. To-veis ANOVA-tester kan fullføres med eller uten replikering.
Hvordan gjøre ANOVA for hånd
Statistisk programvare er tilgjengelig som raskt og enkelt kan beregne ANOVA, men det er en fordel å beregne ANOVA for hånd. Det lar deg forstå de individuelle trinnene som er involvert, samt hvordan de hver for seg bidrar til å vise forskjellene mellom de flere gruppene.
Samle den grunnleggende sammendragsstatistikken for dataene du har samlet. Sammendragsstatistikken inkluderer de individuelle datapunktene for den første gruppen, merket "x", og antall datapunkter for den andre individuelle varianten, "y." Antallet datapunkter for hver gruppe er merket "n."
Legg til poengene for den første gruppen, merket "SX." Den andre gruppen data som samles inn er "SY."
For å beregne gjennomsnittet, bruk formelen, C = (SX + SY) ^ 2 / (2n).
Beregn summen av kvadratet mellom gruppene, SSB = - C.
Når du har kvadratet alle datapunktene, oppsummer de dem i en endelig sum av "D."
Deretter beregner du summen av kvadratene totalt, SST = D - C.
Bruk formelen SST - SSB for å finne SSW, eller summen av kvadrater i grupper.
Finn grader av frihet for gruppene "dfb" og i gruppene "dfw."
Formelen for gruppene er dfb = 1 og for gruppene innenfor er den dfw = 2n-2.
Beregn middelkvadratet for gruppene innenfor, MSW = SSW / dfw.
Til slutt, beregne den endelige statistikken, eller "F," F = MSB / MSW