Hvordan beregne interkvartilområdet

November 2024

Forfatter: Monica Porter

Opprettelsesdato: 22 Mars 2021

Oppdater Dato: 22 November 2024

Hvordan beregne interkvartilområdet - Vitenskap

Innhold

TL; DR (for lang; ikke lest)
Bestill datapoeng
Bestem første kvartilstilling
Bestem tredje kvartilstilling
Beregn interkvartil rekkevidde
Fordeler og ulemper ved IQR

Det interkvartile området, ofte forkortet som IQR, representerer området fra den 25te persentilen til den 75. persentilen, eller den midtre 50 prosent, av et gitt datasett. Det interkvartile området kan brukes til å bestemme hva det gjennomsnittlige ytelsesområdet for en test vil være: du kan bruke det til å se hvor flest folk scorer på et bestemt testfall, eller bestemme hvor mye penger den gjennomsnittlige ansatte i et selskap tjener hver måned . Interkvartilområdet kan være et mer effektivt verktøy for dataanalyse enn middelverdien eller medianen til et datasett, fordi det lar deg identifisere spredningsområdet i stedet for bare et enkelt tall.

TL; DR (for lang; ikke lest)

Interkvartilområdet (IQR) representerer de midterste 50 prosent av et datasett. For å beregne det, bestiller du datapunktene dine fra minst til størst, bestem deretter dine første og tredje kvartilposisjoner ved å bruke formlene (N + 1) / 4 og 3 * (N + 1) / 4, hvor N er tallet av punkter i datasettet. Til slutt, trekke fra den første kvartilen fra den tredje kvartilen for å bestemme interkvartilområdet for datasettet.

Bestill datapoeng

Beregning av interkvartil rekkevidde er en enkel oppgave, men før du beregner, må du ordne de forskjellige punktene i datasettet. For å gjøre dette, begynn med å bestille datapunktene dine fra minst til størst. Hvis datapunktene dine for eksempel var 10, 19, 8, 4, 9, 12, 15, 11 og 20, vil du omorganisere dem slik: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når dine datapunkter er bestilt slik, kan du gå videre til neste trinn.

Bestem første kvartilstilling

Deretter bestemmer du plasseringen av den første kvartilen ved å bruke følgende formel: (N + 1) / 4, der N er antall punkter i datasettet. Hvis den første kvartilen faller mellom to tall, tar du gjennomsnittet av de to tallene som din første kvartil. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, og deretter dele med 4 for å få 2,5. Siden den første kvartilen faller mellom den andre og den tredje verdien, vil du ta gjennomsnittet 8 og 9 for å få en første kvartilstilling på 8,5.

Bestem tredje kvartilstilling

Når du har bestemt din første kvartil, må du bestemme plasseringen til den tredje kvartilen ved å bruke følgende formel: 3 * (N + 1) / 4 der N igjen er antall poeng i datasettet. På samme måte, hvis den tredje kvartilen faller mellom to tall, tar du bare gjennomsnittet som du ville gjort når du beregner den første kvartiltscore. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, multiplisere med 3 for å få 30 og deretter dele med 4 for å få 7,5. Siden den første kvartilen faller mellom den syvende og åttende verdien, ville du ta gjennomsnittet 15 og 19 for å få en tredje kvartiltscore på 17.

Beregn interkvartil rekkevidde

Når du har bestemt din første og tredje kvartil, må du beregne interkvartilområdet ved å trekke verdien av den første kvartilen fra verdien av den tredje kvartilen. For å fullføre eksemplet som ble brukt i løpet av denne artikkelen, ville du trekke 8.5 fra 17 for å finne at interkvarteringsområdet for datasettet tilsvarer 8.5.

Fordeler og ulemper ved IQR

Det interkvartile området har en fordel ved å være i stand til å identifisere og eliminere utliggere i begge ender av et datasett. IQR er også et godt mål på variasjon i tilfeller av skjev datadistribusjon, og denne metoden for å beregne IQR kan fungere for grupperte datasett, så lenge du bruker en kumulativ frekvensfordeling for å organisere datapunktene dine. Interkvartilområdeformelen for grupperte data er den samme som for ikke-grupperte data, der IQR er lik verdien av den første kvartilen trukket fra verdien av den tredje kvartilen. Imidlertid har det flere ulemper sammenlignet med standardavvik: mindre følsomhet for noen få ekstreme score og en prøvetakingsstabilitet som ikke er så sterk som standardavvik.