Innhold
I matematiske termer er et "middel" et gjennomsnitt. Gjennomsnitt beregnes for å representere et datasett meningsfullt. For eksempel kan en meteorolog fortelle deg at gjennomsnittstemperaturen for 22. januar i Chicago er 25 grader F basert på tidligere data. Dette tallet kan ikke forutsi den nøyaktige temperaturen neste 22 januar i Chicago, men det forteller deg nok å vite at du bør pakke en jakke hvis du skal til Chicago på den datoen. To ofte brukte midler er det aritmetiske gjennomsnittet og det geometriske middelverdien. Å vite hvilken du skal bruke til dataene dine betyr å forstå forskjellene deres.
Formler for beregning
Den mest åpenbare forskjellen mellom det aritmetiske gjennomsnittet og det geometriske gjennomsnittet for et datasett er hvordan de blir beregnet. Det aritmetiske gjennomsnittet beregnes ved å legge sammen alle tallene i et datasett og dele resultatet med det totale antall datapunkter.
Eksempel: Aritmetisk gjennomsnitt på 11, 13, 17 og 1 000 = (11 + 13 + 17 + 1 000) / 4 = 260,25
Det geometriske gjennomsnittet av et datasett beregnes ved å multiplisere tallene i datasettet, og ta den nede roten til resultatet, der "n" er det totale antallet datapunkter i settet.
Eksempel: Geometrisk middelverdi på 11, 13, 17 og 1000 = fjerde rot av (11 x 13 x 17 x 1 000) = 39,5
Effekten av outliers
Når du ser på resultatene fra aritmetiske middelverdier og geometriske middelberegninger, merker du at effekten av utliggere er kraftig dempet i det geometriske middelverdien. Hva betyr dette? I datasettet 11, 13, 17 og 1000 kalles tallet 1000 en "outlier" fordi verdien er mye høyere enn alle de andre. Når det aritmetiske gjennomsnittet er beregnet, er resultatet 260,25. Legg merke til at ingen tall i datasettet er enda nær 260,25, så det aritmetiske gjennomsnittet er ikke representativt i dette tilfellet. Outliers-effekten er overdrevet. Det geometriske gjennomsnittet, ved 39,5, gjør en bedre jobb med å vise at de fleste tallene fra datasettet er innenfor området 0 til 50.
Bruker
Statistikere bruker aritmetiske midler for å representere data uten nevneverdige utskyttere. Denne typen middel er bra for å representere gjennomsnittstemperaturer, fordi alle temperaturene for 22. januar i Chicago vil være mellom -50 og 50 grader F. En temperatur på 10.000 grader F er bare ikke til å skje. Ting som batting gjennomsnitt og gjennomsnittlig racerbilhastighet er også representert godt ved bruk av aritmetiske midler.
Geometriske virkemidler brukes i tilfeller der forskjellene mellom datapunkter er logaritmiske eller varierer med multipler av 10. Biologer bruker geometriske midler for å beskrive størrelsene på bakteriepopulasjoner, som kan være 20 organismer en dag og 20 000 den neste. Økonomer kan bruke geometriske midler for å beskrive inntektsfordelinger. Du og de fleste av naboene dine kan tjene rundt 65 000 dollar per år, men hva om fyren oppe på bakken tjener $ 65 millioner per år? Det aritmetiske gjennomsnittet av inntekten i nabolaget ditt vil være misvisende her, så et geometrisk middel ville være mer passende.