Innhold
Eksperimenter tester spådommer. Disse spådommene er ofte numeriske, noe som betyr at når forskere samler inn data, forventer de at tallene brytes sammen på en viss måte. Virkelige data samsvarer sjelden med nøyaktig de spådommene forskere gjør, så forskere trenger en test for å fortelle dem om forskjellen mellom observerte og forventede tall er på grunn av tilfeldig sjanse, eller på grunn av en uforutsett faktor som vil tvinge forskeren til å justere den underliggende teorien . En chi-square test er et statistisk verktøy som forskere bruker til dette formålet.
Type data som kreves
Du trenger kategoriske data for å bruke en chi-square test. Et eksempel på kategoriske data er antall personer som svarte på et spørsmål "ja" i forhold til antall personer som svarte på spørsmålet "nei" (to kategorier), eller antall frosker i en populasjon som er grønn, gul eller grå ( tre kategorier). Du kan ikke bruke en chi-kvadrat-test på kontinuerlige data, som for eksempel kan bli samlet inn fra en undersøkelse der du spør folk hvor høye de er. Fra en slik undersøkelse ville du få et bredt spekter av høyder. Imidlertid, hvis du delte høydene i kategorier som "under 6 fot høye" og "6 fot høye og over", kan du bruke en chi-square test på dataene.
Test av godhet
En godkjennelsestest er en vanlig, og kanskje den enkleste testen som utføres ved hjelp av chi-square-statistikken. I en test av godhet, passer forskeren en spesifikk spådom om tallene hun forventer å se i hver kategori av dataene sine. Deretter samler hun data fra den virkelige verden - kalt observerte data - og bruker chi-square-testen for å se om de observerte dataene samsvarer med forventningene hennes.
Tenk deg for eksempel at en biolog studerer arvemønstrene i en froskeart. Blant 100 avkom til et sett froskeforeldre fører biologens genetiske modell til at hun forventer 25 gule avkom, 50 grønne avkom og 25 grå avkom. Det hun faktisk observerer er 20 gule avkom, 52 grønne avkom og 28 grå avkom. Støttes prediksjonen hennes, eller er hennes genetiske modell feil? Hun kan bruke en chi-square test for å finne ut av det.
Beregning av Chi-Square-statistikken
Begynn å beregne chi-square-statistikken ved å trekke fra hver forventet verdi fra den tilsvarende observerte verdien og kvadrere hvert resultat. Beregningen for eksempelet til froskeavkom vil se slik ut:
gul = (20 - 25) ^ 2 = 25 grønn = (52 - 50) ^ 2 = 4 grå = (28 - 25) ^ 2 = 9
Del nå hvert resultat med tilsvarende forventet verdi.
gul = 25 ÷ 25 = 1 grønn = 4 ÷ 50 = 0,08 grå = 9 ÷ 25 = 0,36
Til slutt legger du sammen svarene fra forrige trinn.
Chi-kvadrat = 1 + 0,08 + 0,36 = 1,44
Tolke Chi-Square-statistikken
Chi-square-statistikken forteller deg hvor forskjellige de observerte verdiene dine var fra de forutsagte verdiene. Jo høyere tall, desto større er forskjellen. Du kan bestemme om chi-kvadratverdien din er for høy eller lav nok til å støtte din prediksjon ved å se om den er under en viss kritisk verdi på et chi-square distribusjonsbord. Denne tabellen samsvarer med chi-kvadratverdier med sannsynligheter, kalt p-verdiene. Spesielt forteller tabellen deg sannsynligheten for at forskjellene mellom dine observerte og forventede verdier ganske enkelt skyldes tilfeldig sjanse eller om en annen faktor er til stede. For en test av godhet, hvis p-verdien er 0,05 eller mindre, må du avvise prediksjonen din.
Du må bestemme grader av frihet (df) i dataene dine før du kan slå opp den kritiske chi-kvadratverdien i en distribusjonstabell. Grad av frihet beregnes ved å trekke fra 1 fra antall kategorier i dine data. Det er tre kategorier i dette eksemplet, så det er 2 frihetsgrader. Et blikk på denne chi-square distribusjonstabellen forteller deg at den kritiske verdien for en 0,05 sannsynlighet for 2 grader av frihet er 5,99. Dette betyr at så lenge den beregnede chi-kvadratverdien er mindre enn 5,99, er dine forventede verdier, og dermed den underliggende teorien, gyldige og støttet. Siden chi-square-statistikken for froskeavkomdataene var 1,44, kan biologen godta hennes genetiske modell.