Korrelasjonen mellom to variabler beskriver sannsynligheten for at en endring i en variabel vil forårsake en proporsjonal endring i den andre variabelen. En høy korrelasjon mellom to variabler antyder at de deler en vanlig årsak, eller at en endring i en av variablene er direkte ansvarlig for en endring i den andre variabelen. Pearsons r-verdi brukes til å kvantifisere sammenhengen mellom to diskrete variabler.
Merk variabelen du tror forårsaker endringen til den andre variabelen som x (den uavhengige variabelen) og den andre variabelen y (den avhengige variabelen).
Konstruer en tabell med fem kolonner og så mange rader som det er datapunkter for x og y. Merk kolonnene A til E fra venstre mot høyre.
Fyll ut hver rad med følgende verdier for hvert (x, y) datapunkt i den første kolonnen - verdien av x i kolonne A, verdien av x kvadrat i kolonne B, verdien av y i kolonne C, verdien av y kvadrat i kolonne D og verdien x ganger y i kolonne E.
Lag en siste rad helt nederst i tabellen og legg summen av alle verdiene til hver kolonne i den tilhørende cellen.
Beregn produktet av sluttcellene i kolonne A og C.
Multipliser den siste cellen i kolonne E med antall datapunkter.
Trekk verdien oppnådd i trinn 5 fra verdien oppnådd i trinn 6 og understrek svaret.
Multipliser den siste cellen i kolonne B med antall datapunkter. Trekk fra denne verdien kvadratet til verdien av den endelige cellen i kolonne A.
Multipliser den endelige cellen i kolonne D med antall datapunkter og trekk kvadratet med verdien til den endelige cellen i kolonne C.
Multipliser verdiene som er funnet i trinn 8 og 9 sammen, og ta deretter kvadratroten av resultatet.
Del verdien oppnådd i trinn 7 (den skal understrekes) med verdien oppnådd i trinn 10. Dette er Pearsons r, også kjent som korrelasjonskoeffisienten. Hvis r er nær 1, er det en sterk positiv korrelasjon. Hvis r er nær -1, er det en sterk negativ korrelasjon. Hvis r er nær 0, er det en svak korrelasjon.