Innhold
Et spredningsdiagram er en graf som viser forholdet mellom to datasett. Noen ganger er det nyttig å bruke dataene som finnes i et spredningsdiagram for å få et matematisk forhold mellom to variabler. Ligningen av et spredningsdiagram kan oppnås for hånd ved å bruke en av to hovedmåter: en grafisk teknikk eller en teknikk som kalles lineær regresjon.
Lage en spredningsdiagram
Bruk grafikkpapir for å lage et spredningsdiagram. Tegn x- og y-aksene, sørg for at de krysser og merker opprinnelsen. Forsikre deg om at x- og y-aksene også har riktige titler. Plasser deretter hvert datapunkt i grafen. Eventuelle trender mellom de plottede datasettene skulle nå være tydelige.
Line of Best Fit
Når et scatter-plot er blitt opprettet, forutsatt at det er en lineær sammenheng mellom to datasett, kan vi bruke en grafisk metode for å oppnå ligningen. Ta en linjal og tegne en linje så nær som mulig til alle punktene. Forsøk å sikre at det er like mange punkter over linjen som det er under linjen. Når linjen er tegnet, bruk standardmetoder for å finne ligningen på den rette linjen
Ligning av rett linje
Når en linje med best passform er plassert på en spredningsgraf, er det enkelt å finne ligningen. Den generelle ligningen for en rett linje er:
y = mx + c
Hvor m er skråningen (gradienten) for linjen og c er y-avskjæringen. For å få gradienten, finn to punkter på linjen. For dette eksempelets skyld kan vi anta at de to punktene er (1,3) og (0,1). Gradienten kan beregnes ved å ta forskjellen i y-koordinatene og dele med forskjellen i x-koordinatene:
m = (3 - 1) / (1 - 0) = 2/1 = 2
Gradienten i dette tilfellet er lik 2. Så langt er ligningen på den rette linjen
y = 2x + c
Verdien for c kan oppnås ved å erstatte verdiene med et kjent punkt. Etter eksemplet er et av de kjente punktene (1,3). Plugg dette inn i ligningen og ordne om for c:
3 = (2 * 1) + c
c = 3 - 2 = 1
Den endelige ligningen i dette tilfellet er:
y = 2x + 1
Lineær regresjon
Lineær regresjon er en matematisk metode som kan brukes til å oppnå en rettlinjelig ligning av et spredningsdiagram. Begynn med å plassere dataene i en tabell. For dette eksempelet, la oss anta at vi har følgende data:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Beregn summen av x-verdiene:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Deretter beregner du summen av y-verdiene:
y_sum = 2,2 + 4,4 + 10,4 = 17
Nå summer produktene fra hvert datapunksett:
xy_sum = (4,1 * 2,2) + (6,5 * 4,4) + (12,6 * 10,4) = 168,66
Deretter beregner du summen av kvadratene med x-verdiene og kvadratene med y-verdiene:
x_square_sum = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y_square_sum = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Telle til slutt antall datapunkter du har. I dette tilfellet har vi tre datapunkter (N = 3). Forløpet for linjen som passer best kan fås fra:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168.66) - (23.2 * 17) / (3 * 217.82) - (23.2 * 23.2) = 0,968
Avskjæringen for den best tilpassede linjen kan fås fra:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
Den endelige ligningen er derfor:
y = 0,968x - 1,82