Hvordan finne korrelasjonskoeffisienten for 'R' i en spredningsdiagram

November 2024

Forfatter: Laura McKinney

Opprettelsesdato: 9 April 2021

Oppdater Dato: 17 November 2024

Hvordan finne korrelasjonskoeffisienten for 'R' i en spredningsdiagram - Vitenskap

Innhold

TL; DR (for lang; ikke lest)

Å finne styrken i forbindelsen mellom to variabler er en viktig ferdighet for forskere av alle typer. Hvis to variabler er korrelert med hverandre, viser det at det er en kobling mellom dem. En positiv korrelasjon betyr at når den ene variabelen øker, den andre gjør det også, og en negativ korrelasjon betyr at når den ene variabelen øker, reduseres den andre. Korrelasjoner beviser ikke årsakssammenheng, selv om det er mulig at ytterligere tester vil bevise en årsakssammenheng mellom variablene. Korrelasjonskoeffisienten R viser styrken i forholdet mellom de to variablene, og om det er en positiv eller negativ korrelasjon.

TL; DR (for lang; ikke lest)

Ring en variabel x og en variabel y. Beregn verdien av R ved å bruke formelen:

R = ÷ √ {}

Hvor n er din prøve størrelse.

Lag en tabell over dataene dine. Dette bør inneholde en kolonne for deltakernummeret, en kolonne for den første variabelen (merket x) og en kolonne for den andre variabelen (merket y). For eksempel, hvis du ønsker å se om det er en sammenheng mellom høyde og skostørrelse, vil en kolonne identifisere hver person du måler, en kolonne viser hver persons høyde og en annen viser skoens størrelse. Lag ytterligere tre kolonner, en til xy, en for x² og en for y².

Bruk dataene dine til å fylle ut de tre ekstra kolonnene. Tenk deg for eksempel at din første person måler 75 tommer høy og har størrelse 12 fot. De x (høyde) kolonne vil vise 75, og y (skostørrelse) kolonnen viser 12. Du må finne xy, x² og y². Så bruker du dette eksemplet:

xy = 75 × 12 = 900

x² = 75² = 5,625

y² = 12² = 144

Fullfør disse beregningene for hver person du har data for.

Lag en ny rad nederst på tabellen for summen av hver kolonne. Legg sammen alt x verdier, alle y verdier, alle xy verdier, alle x² verdier og alle y² verdier, og legg deretter resultatene nederst i den tilsvarende kolonnen i den nye raden. Du kan merke den nye raden “sum” eller bruke et sigma-symbol (Σ).

Du finner R fra dataene dine ved å bruke formelen:

R = ÷ √ {}

Dette ser litt skremmende ut, så du kan dele det i to deler, som vi vil kalle s og t.

s = n (Σxy) - (Σx) (Σy)

t = √ {}

I disse likningene, n er antall deltakere du har (prøvestørrelsen). Resten av delene av ligningen er summene du beregnet i siste trinn. Så for s, multipliser størrelsen på prøven med summen av xy kolonnen, og trekk deretter summen av x kolonne multiplisert med summen av y kolonne fra dette.

Til t, er det fire hovedtrinn. Beregn først n multiplisert med summen av din x² kolonnen, og trekk deretter summen av din x kolonne kvadrat (multiplisert med seg selv) fra denne verdien. For det andre, gjør nøyaktig samme ting, men med summen av y² kolonne og summen av y søylen kvadratert i stedet for x deler (dvs. n × Σy² -). For det tredje multipliserer du disse to resultatene (for xs og ys) sammen. For det fjerde, ta kvadratroten av dette svaret.

Hvis du har jobbet i deler, kan du beregne R så enkelt R = s ÷ t. Du vil få et svar mellom −1 og 1. Et positivt svar viser en positiv korrelasjon, der alt over 0,7 generelt anses som et sterkt forhold. Et negativt svar viser en negativ korrelasjon, med alt over -0,7 som et sterkt negativt forhold. Tilsvarende anses ± 0,5 som et moderat forhold og ± 0,3 regnes som et svakt forhold. Alt i nærheten av 0 viser mangel på korrelasjon.