Innhold
- TL; DR (for lang; ikke lest)
- Standardavvik vs. prøve standardavvik
- Finne prøven standardavvik
- Gjennomsnittlig avvik kontra standardavvik
Statistiske tester som t-Testen er avhengig av begrepet standardavvik. Enhver student i statistikk eller naturfag vil bruke standardavvik regelmessig og trenger å forstå hva det betyr og hvordan finne det fra et sett med data. Heldigvis er det eneste du trenger originale data, og selv om beregningene kan være slitsomme når du har mye data, bør du i disse tilfellene bruke funksjoner eller regnearkdata for å gjøre det automatisk. Alt du trenger å gjøre for å forstå nøkkelbegrepet er imidlertid å se et grunnleggende eksempel du enkelt kan trene for hånd. I kjernen måler prøvestandardavviket hvor mye mengden du har valgt, varierer i hele populasjonen basert på prøven.
TL; DR (for lang; ikke lest)
Ved hjelp av n å bety prøve størrelse, μ for gjennomsnittet av dataene, xJeg for hvert enkelt datapunkt (fra Jeg = 1 til Jeg = n), og Σ som et summeringstegn, variansen av prøven (s2) er:
s2 = (Σ xJeg – μ)2 / (n − 1)
Og standardavviket er:
s = √s2
Standardavvik vs. prøve standardavvik
Statistikk dreier seg om å lage estimater for hele populasjoner basert på mindre utvalg fra befolkningen, og å gjøre rede for eventuell usikkerhet i estimatet i prosessen. Standardavvik kvantifiserer mengden variasjon i befolkningen du studerer. Hvis du prøver å finne gjennomsnittshøyden, vil du få en klynge av resultater rundt middelverdien (gjennomsnittet), og standardavviket beskriver bredden på klyngen og fordelingen av høyder over hele befolkningen.
"Utvalget" standardavvik estimerer det sanne standardavviket for hele befolkningen basert på et lite utvalg fra befolkningen. Det meste av tiden vil du ikke kunne ta utvalg av hele den aktuelle befolkningen, så utvalgets standardavvik er ofte den riktige versjonen å bruke.
Finne prøven standardavvik
Du trenger resultatene og antallet (n) av personer i prøven din. Beregn først gjennomsnittet av resultatene (μ) ved å legge sammen alle de individuelle resultatene og deretter dele dette med antall målinger.
Som et eksempel er hjertefrekvensen (i slag per minutt) for fem menn og fem kvinner:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
Noe som fører til et middel av:
μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
= 702 ÷ 10 = 70.2
Neste trinn er å trekke middelet fra hver enkelt måling og deretter kvadratere resultatet. For eksempel for det første datapunktet:
(71 – 70.2)2 = 0.82 = 0.64
Og for det andre:
(83 – 70.2)2 = 12.82 = 163.84
Du fortsetter på denne måten gjennom dataene, og deretter legge til disse resultatene. Så for eksempeldata er summen av disse verdiene:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
Neste trinn skiller mellom prøven standardavvik og populasjonsstandardavviket. For prøveavviket deler du dette resultatet med prøvestørrelse minus ett (n -1). I vårt eksempel n = 10, altså n – 1 = 9.
Dette resultatet gir utvalget varians, betegnet med s2, som for eksempel er:
s2 = 353.6 ÷ 9 = 39.289
Utvalgets standardavvik (s) er bare den positive kvadratroten til dette tallet:
s = √39.289 = 6.268
Hvis du beregnet populasjonsstandardavviket (σ) den eneste forskjellen er at du deler deg etter n heller enn n −1.
Hele formelen for standardstandardavvik kan uttrykkes ved bruk av summeringssymbolet Σ, med summen over hele prøven, og xJeg som representerer i_th resultat ut av _n. Utvalget varians er:
s2 = (Σ xJeg – μ)2 / (n − 1)
Og standardavviket til prøven er ganske enkelt:
s = √s2
Gjennomsnittlig avvik kontra standardavvik
Gjennomsnittavviket skiller seg litt fra standardavviket. I stedet for å kvadratere forskjellene mellom middelverdien og hver verdi, tar du i stedet bare den absolutte forskjellen (ignorerer eventuelle minustegn), og finner deretter gjennomsnittet av disse. For eksempelet i forrige seksjon gir de første og andre datapunktene (71 og 83):
x1 – μ = 71 – 70.2 = 0.8
x2 – μ = 83 – 70.2 = 12.8
Det tredje datapunktet gir et negativt resultat
x3 – μ = 63 – 70.2 = −7.2
Men du fjerner bare minustegnet og tar dette som 7.2.
Summen av alle disse gir delt på n gir middelavviket. I eksemplet:
(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64
Dette skiller seg vesentlig fra standardavviket beregnet før, fordi det ikke involverer kvadrater og røtter.