Innhold
- TL; DR (for lang; ikke lest)
- Bestill datapoeng
- Bestem første kvartilstilling
- Bestem tredje kvartilstilling
- Beregn interkvartil rekkevidde
- Fordeler og ulemper ved IQR
Det interkvartile området, ofte forkortet som IQR, representerer området fra den 25te persentilen til den 75. persentilen, eller den midtre 50 prosent, av et gitt datasett. Det interkvartile området kan brukes til å bestemme hva det gjennomsnittlige ytelsesområdet for en test vil være: du kan bruke det til å se hvor flest folk scorer på et bestemt testfall, eller bestemme hvor mye penger den gjennomsnittlige ansatte i et selskap tjener hver måned . Interkvartilområdet kan være et mer effektivt verktøy for dataanalyse enn middelverdien eller medianen til et datasett, fordi det lar deg identifisere spredningsområdet i stedet for bare et enkelt tall.
TL; DR (for lang; ikke lest)
Interkvartilområdet (IQR) representerer de midterste 50 prosent av et datasett. For å beregne det, bestiller du datapunktene dine fra minst til størst, bestem deretter dine første og tredje kvartilposisjoner ved å bruke formlene (N + 1) / 4 og 3 * (N + 1) / 4, hvor N er tallet av punkter i datasettet. Til slutt, trekke fra den første kvartilen fra den tredje kvartilen for å bestemme interkvartilområdet for datasettet.
Bestill datapoeng
Beregning av interkvartil rekkevidde er en enkel oppgave, men før du beregner, må du ordne de forskjellige punktene i datasettet. For å gjøre dette, begynn med å bestille datapunktene dine fra minst til størst. Hvis datapunktene dine for eksempel var 10, 19, 8, 4, 9, 12, 15, 11 og 20, vil du omorganisere dem slik: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når dine datapunkter er bestilt slik, kan du gå videre til neste trinn.
Bestem første kvartilstilling
Deretter bestemmer du plasseringen av den første kvartilen ved å bruke følgende formel: (N + 1) / 4, der N er antall punkter i datasettet. Hvis den første kvartilen faller mellom to tall, tar du gjennomsnittet av de to tallene som din første kvartil. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, og deretter dele med 4 for å få 2,5. Siden den første kvartilen faller mellom den andre og den tredje verdien, vil du ta gjennomsnittet 8 og 9 for å få en første kvartilstilling på 8,5.
Bestem tredje kvartilstilling
Når du har bestemt din første kvartil, må du bestemme plasseringen til den tredje kvartilen ved å bruke følgende formel: 3 * (N + 1) / 4 der N igjen er antall poeng i datasettet. På samme måte, hvis den tredje kvartilen faller mellom to tall, tar du bare gjennomsnittet som du ville gjort når du beregner den første kvartiltscore. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, multiplisere med 3 for å få 30 og deretter dele med 4 for å få 7,5. Siden den første kvartilen faller mellom den syvende og åttende verdien, ville du ta gjennomsnittet 15 og 19 for å få en tredje kvartiltscore på 17.
Beregn interkvartil rekkevidde
Når du har bestemt din første og tredje kvartil, må du beregne interkvartilområdet ved å trekke verdien av den første kvartilen fra verdien av den tredje kvartilen. For å fullføre eksemplet som ble brukt i løpet av denne artikkelen, ville du trekke 8.5 fra 17 for å finne at interkvarteringsområdet for datasettet tilsvarer 8.5.
Fordeler og ulemper ved IQR
Det interkvartile området har en fordel ved å være i stand til å identifisere og eliminere utliggere i begge ender av et datasett. IQR er også et godt mål på variasjon i tilfeller av skjev datadistribusjon, og denne metoden for å beregne IQR kan fungere for grupperte datasett, så lenge du bruker en kumulativ frekvensfordeling for å organisere datapunktene dine. Interkvartilområdeformelen for grupperte data er den samme som for ikke-grupperte data, der IQR er lik verdien av den første kvartilen trukket fra verdien av den tredje kvartilen. Imidlertid har det flere ulemper sammenlignet med standardavvik: mindre følsomhet for noen få ekstreme score og en prøvetakingsstabilitet som ikke er så sterk som standardavvik.