Innhold
Forenkle sammenligninger av sett med antall, spesielt store sett med antall, ved å beregne sentrumsverdiene ved å bruke middel, modus og median. Bruk områdene og standardavvikene til settene for å undersøke variabiliteten i data.
Beregningsgjennomsnitt
Gjennomsnittet identifiserer gjennomsnittsverdien til settet med tall. Tenk for eksempel datasettet som inneholder verdiene 20, 24, 25, 36, 25, 22, 23.
For å finne middelverdien, bruk formelen: Gjennomsnitt tilsvarer summen av tallene i datasettet delt på antall verdier i datasettet. I matematiske termer: Gjennomsnitt = (summen av alle termer) ÷ (hvor mange termer eller verdier i settet).
Legg til tallene i eksempelet datasett: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Del med antall datapunkter i settet. Dette settet har syv verdier, så del med 7.
Sett inn verdiene i formelen for å beregne middelverdien. Gjennomsnittet tilsvarer summen av verdiene (175) dividert med antall datapunkter (7). Siden 175 ÷ 7 = 25, er gjennomsnittet av dette datasettet lik 25. Ikke alle middelverdiene vil være like et helt tall.
Beregner median
Median identifiserer midtpunktet eller middelverdien til et sett med tall.
Sett tallene i rekkefølge fra minste til største. Bruk eksempelet verdisett: 20, 24, 25, 36, 25, 22, 23. Plassert i rekkefølge blir settet: 20, 22, 23, 24, 25, 25, 36.
Siden dette settet med tall har syv verdier, er medianen eller verdien i sentrum 24.
Hvis settet med tall har et jevnt antall verdier, beregner du gjennomsnittet av de to sentrumsverdiene. Anta for eksempel at settet med tall inneholder verdiene 22, 23, 25, 26. Midten ligger mellom 23 og 25. Å legge til 23 og 25 gir 48. Å dele 48 med to gir en medianverdi på 24.
Beregningsmodus
Modusen identifiserer den vanligste verdien eller verdiene i datasettet. Avhengig av dataene, kan det være en eller flere modus, eller ingen modus i det hele tatt.
Bestill datasettet fra det minste til det største som å finne medianen. I eksempelsettet blir de bestilte verdiene: 20, 22, 23, 24, 25, 25, 36.
En modus oppstår når verdiene gjentas. I eksempelsettet forekommer verdien 25 to ganger. Ingen andre tall gjentas. Derfor er modus verdien 25.
I noen datasett forekommer mer enn én modus. Datasettet 22, 23, 23, 24, 27, 27, 29 inneholder to moduser, ett hver på 23 og 27. Andre datasett kan ha mer enn to modi, kan ha modi med mer enn to tall (som 23, 23 , 24, 24, 24, 28, 29: modus er lik 24) eller har kanskje ikke noen modus i det hele tatt (som 21, 23, 24, 25, 26, 27, 29). Modusen kan forekomme hvor som helst i datasettet, ikke bare i midten.
Beregningsområde
Område viser den matematiske avstanden mellom de laveste og høyeste verdiene i datasettet. Range måler variabiliteten til datasettet. Et bredt spekter indikerer større variabilitet i dataene, eller kanskje en enkelt outlier langt fra resten av dataene. Outliers kan skje, eller forskyve middelverdien nok til å påvirke dataanalyse.
I utvalgsgruppen er den laveste verdien 20 og den høyeste verdien 36.
For å beregne rekkevidde, trekker du den laveste verdien fra den høyeste verdien. Siden 36-20 = 16 tilsvarer rekkevidden 16.
I prøvesettet overstiger den høye dataverdien på 36 den forrige verdien, 25, med 11. Denne verdien virker ekstrem, gitt de andre verdiene i settet. Verdien av 36 kan være et tidligere datapunkt.
Beregning av standardavvik
Standardavvik måler variabelen til datasettet. Som rekkevidde indikerer et mindre standardavvik mindre variasjon.
Å finne standardavvik krever summing av kvadratforskjellen mellom hvert datapunkt og middelverdien, legge til alle rutene, dele den summen med en mindre enn antall verdier (N-1) og til slutt beregne kvadratroten til utbyttet. Begynn matematisk, begynn med å beregne middelverdien.
Beregn gjennomsnittet ved å legge til alle datapunktverdiene, og deretter dele med antall datapunkter. I prøvedatasettet er 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Del summen, 175, med antall datapunkter, 7 eller 175 ÷ 7 = 25. Gjennomsnittet tilsvarer 25.
Trekk deretter gjennomsnittet fra hvert datapunkt, og kvadrat deretter hver forskjell. Formelen ser slik ut: ∑ (x-µ)2, hvor ∑ betyr sum, x representerer hvert datasettverdi og µ representerer middelverdien. Fortsetter vi med eksemplet, blir verdiene: 20-25 = -5 og -52= 25; 24-25 = -1 og -12= 1; 25-25 = 0 og 02= 0; 36-25 = 11 og 112= 121; 25-25 = 0 og 02= 0; 22-25 = -3 og -32= 9; og 23-25 = -2 og -22=4.
Å legge til de kvadratiske forskjellene gir: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Del summen av de kvadratiske forskjellene med ett mindre enn antall datapunkter. Eksempelet datasett har 7 verdier, så N-1 tilsvarer 7-1 = 6. Summen av de kvadratiske forskjellene, 160, delt med 6 tilsvarer omtrent 26.6667.
Beregn standardavviket ved å finne kvadratroten til divisjonen med N-1. I eksemplet tilsvarer kvadratroten på 26.6667 omtrent 5.164. Derfor tilsvarer standardavviket omtrent 5.164.
Standardavvik hjelper til med å evaluere data. Tall i datasettet som faller innenfor ett standardavvik for middelverdien, er en del av datasettet. Tall som faller utenfor to standardavvik, er ekstreme verdier eller outliers. I eksempelsettet ligger verdien 36 mer enn to standardavvik fra gjennomsnittet, så 36 er en outlier. Outliers kan representere feil data eller kan antyde uforutsette omstendigheter og bør vurderes nøye når du tolker data.