Hvordan beregne korrelasjonen mellom to variabler

Posted on
Forfatter: John Stephens
Opprettelsesdato: 25 Januar 2021
Oppdater Dato: 21 November 2024
Anonim
11A Samvariasjon mellom to kategoriske variabler
Video: 11A Samvariasjon mellom to kategoriske variabler

Korrelasjonen mellom to variabler beskriver sannsynligheten for at en endring i en variabel vil forårsake en proporsjonal endring i den andre variabelen. En høy korrelasjon mellom to variabler antyder at de deler en vanlig årsak, eller at en endring i en av variablene er direkte ansvarlig for en endring i den andre variabelen. Pearsons r-verdi brukes til å kvantifisere sammenhengen mellom to diskrete variabler.

    Merk variabelen du tror forårsaker endringen til den andre variabelen som x (den uavhengige variabelen) og den andre variabelen y (den avhengige variabelen).

    Konstruer en tabell med fem kolonner og så mange rader som det er datapunkter for x og y. Merk kolonnene A til E fra venstre mot høyre.

    Fyll ut hver rad med følgende verdier for hvert (x, y) datapunkt i den første kolonnen - verdien av x i kolonne A, verdien av x kvadrat i kolonne B, verdien av y i kolonne C, verdien av y kvadrat i kolonne D og verdien x ganger y i kolonne E.

    Lag en siste rad helt nederst i tabellen og legg summen av alle verdiene til hver kolonne i den tilhørende cellen.

    Beregn produktet av sluttcellene i kolonne A og C.

    Multipliser den siste cellen i kolonne E med antall datapunkter.

    Trekk verdien oppnådd i trinn 5 fra verdien oppnådd i trinn 6 og understrek svaret.

    Multipliser den siste cellen i kolonne B med antall datapunkter. Trekk fra denne verdien kvadratet til verdien av den endelige cellen i kolonne A.

    Multipliser den endelige cellen i kolonne D med antall datapunkter og trekk kvadratet med verdien til den endelige cellen i kolonne C.

    Multipliser verdiene som er funnet i trinn 8 og 9 sammen, og ta deretter kvadratroten av resultatet.

    Del verdien oppnådd i trinn 7 (den skal understrekes) med verdien oppnådd i trinn 10. Dette er Pearsons r, også kjent som korrelasjonskoeffisienten. Hvis r er nær 1, er det en sterk positiv korrelasjon. Hvis r er nær -1, er det en sterk negativ korrelasjon. Hvis r er nær 0, er det en svak korrelasjon.