Innhold
I statistikk er variansanalysen (ANOVA) en måte å analysere forskjellige datagrupper sammen for å se om de er relatert eller lignende. En viktig test i ANOVA er root mean square error (MSE). Denne mengden er en måte å estimere forskjellen mellom verdiene forutsagt av en statistisk modell og de målte verdiene fra det faktiske systemet. Beregning av rot MSE kan gjøres i noen få enkle trinn.
Summen av firkantede feil (SSE)
Beregn det totale gjennomsnittet for hver gruppe datasett. Si for eksempel at det er to datagrupper, sett A og sett B, der sett A inneholder tallene 1, 2 og 3 og sett B inneholder tallene 4, 5 og 6. Gjennomsnittet for sett A er 2 (funnet av å legge til 1, 2 og 3 sammen og dele med 3) og gjennomsnittet av sett B er 5 (funnet ved å legge til 4, 5 og 6 sammen og dele med 3).
Trekk gjennomsnittet av dataene fra de individuelle datapunktene og kvadrat den påfølgende verdien. I datasettet A gir for eksempel subtraksjon 1 med gjennomsnittet 2 en verdi på -1. Å kvadre dette tallet (det vil si å multiplisere det med seg selv) gir 1. Gjenta denne prosessen for resten av dataene fra sett A gir 0, og 1, og for sett B er tallene 1, 0 og 1 også .
Oppsummer alle de kvadratiske verdiene. Fra forrige eksempel gir summen av alle firkantede tall tallet 4.
Beregne rot MSE i ANOVA
Finn frihetsgrader for feil ved å trekke fra det totale antall datapunkter med graden av behandlingsfrihet (antall datasett). I vårt eksempel er det seks totale datapunkter og to forskjellige datasett, noe som gir 4 som frihetsgrader.
Del summen av kvadrater feil med graden av frihet for feil. Hvis du fortsetter eksemplet, deler 4 med 4 gir 1. Dette er den gjennomsnittlige kvadratfeilen (MSE).
Ta kvadratroten til MSE. Avslutter eksemplet, kvadratroten av 1 er 1. Derfor er roten MSE for ANOVA 1 i dette eksemplet.