Hvordan finne korrelasjonskoeffisienten for 'R' i en spredningsdiagram

Posted on
Forfatter: Laura McKinney
Opprettelsesdato: 9 April 2021
Oppdater Dato: 14 Kan 2024
Anonim
Hvordan finne korrelasjonskoeffisienten for 'R' i en spredningsdiagram - Vitenskap
Hvordan finne korrelasjonskoeffisienten for 'R' i en spredningsdiagram - Vitenskap

Innhold

Å finne styrken i forbindelsen mellom to variabler er en viktig ferdighet for forskere av alle typer. Hvis to variabler er korrelert med hverandre, viser det at det er en kobling mellom dem. En positiv korrelasjon betyr at når den ene variabelen øker, den andre gjør det også, og en negativ korrelasjon betyr at når den ene variabelen øker, reduseres den andre. Korrelasjoner beviser ikke årsakssammenheng, selv om det er mulig at ytterligere tester vil bevise en årsakssammenheng mellom variablene. Korrelasjonskoeffisienten R viser styrken i forholdet mellom de to variablene, og om det er en positiv eller negativ korrelasjon.

TL; DR (for lang; ikke lest)

Ring en variabel x og en variabel y. Beregn verdien av R ved å bruke formelen:

R = ÷ √ {}

Hvor n er din prøve størrelse.

    Lag en tabell over dataene dine. Dette bør inneholde en kolonne for deltakernummeret, en kolonne for den første variabelen (merket x) og en kolonne for den andre variabelen (merket y). For eksempel, hvis du ønsker å se om det er en sammenheng mellom høyde og skostørrelse, vil en kolonne identifisere hver person du måler, en kolonne viser hver persons høyde og en annen viser skoens størrelse. Lag ytterligere tre kolonner, en til xy, en for x2 og en for y2.

    Bruk dataene dine til å fylle ut de tre ekstra kolonnene. Tenk deg for eksempel at din første person måler 75 tommer høy og har størrelse 12 fot. De x (høyde) kolonne vil vise 75, og y (skostørrelse) kolonnen viser 12. Du må finne xy, x2 og y2. Så bruker du dette eksemplet:

    xy = 75 × 12 = 900

    x2 = 752 = 5,625

    y2 = 122 = 144

    Fullfør disse beregningene for hver person du har data for.

    Lag en ny rad nederst på tabellen for summen av hver kolonne. Legg sammen alt x verdier, alle y verdier, alle xy verdier, alle x2 verdier og alle y2 verdier, og legg deretter resultatene nederst i den tilsvarende kolonnen i den nye raden. Du kan merke den nye raden “sum” eller bruke et sigma-symbol (Σ).

    Du finner R fra dataene dine ved å bruke formelen:

    R = ÷ √ {}

    Dette ser litt skremmende ut, så du kan dele det i to deler, som vi vil kalle s og t.

    s = n (Σxy) - (Σx) (Σy)

    t = √ {}

    I disse likningene, n er antall deltakere du har (prøvestørrelsen). Resten av delene av ligningen er summene du beregnet i siste trinn. Så for s, multipliser størrelsen på prøven med summen av xy kolonnen, og trekk deretter summen av x kolonne multiplisert med summen av y kolonne fra dette.

    Til t, er det fire hovedtrinn. Beregn først n multiplisert med summen av din x2 kolonnen, og trekk deretter summen av din x kolonne kvadrat (multiplisert med seg selv) fra denne verdien. For det andre, gjør nøyaktig samme ting, men med summen av y2 kolonne og summen av y søylen kvadratert i stedet for x deler (dvs. n × Σy2 -). For det tredje multipliserer du disse to resultatene (for xs og ys) sammen. For det fjerde, ta kvadratroten av dette svaret.

    Hvis du har jobbet i deler, kan du beregne R så enkelt R = s ÷ t. Du vil få et svar mellom −1 og 1. Et positivt svar viser en positiv korrelasjon, der alt over 0,7 generelt anses som et sterkt forhold. Et negativt svar viser en negativ korrelasjon, med alt over -0,7 som et sterkt negativt forhold. Tilsvarende anses ± 0,5 som et moderat forhold og ± 0,3 regnes som et svakt forhold. Alt i nærheten av 0 viser mangel på korrelasjon.