Innhold
Flere regresjoner brukes til å undersøke forholdet mellom flere uavhengige variabler og en avhengig variabel. Mens flere regresjonsmodeller lar deg analysere den relative påvirkningen av disse uavhengige, eller prediktoren, variablene på den avhengige variabelen eller kriteriet, kan disse ofte komplekse datasettene føre til falske konklusjoner hvis de ikke analyseres riktig.
Eksempler på multippel regresjon
En eiendomsmegler kunne bruke flere regresjoner for å analysere verdien av hus. Hun kunne for eksempel bruke som uavhengige variabler størrelsen på husene, deres aldre, antall soverom, den gjennomsnittlige boligprisen i nabolaget og nærheten til skoler. Plotting av disse i en multippel regresjonsmodell, og hun kunne deretter bruke disse faktorene for å se deres forhold til prisene på hjemmene som kriterievariabel.
Et annet eksempel på bruk av en multippel regresjonsmodell kan være noen i menneskelige ressurser som bestemmer lønnen til lederstillinger - kriterievariabelen. Prediktorvariablene kan være hver leders ansiennitet, gjennomsnittlig antall arbeidstimer, antall personer som blir administrert og lederavdelingsbudsjettet.
Fordeler med flere regresjoner
Det er to hovedfordeler med å analysere data ved å bruke en multippel regresjonsmodell. Den første er evnen til å bestemme den relative påvirkningen av en eller flere prediktorvariabler til kriterieverdien. Eiendomsmegleren kunne oppleve at størrelsen på boligene og antall soverom har en sterk sammenheng med prisen på et hjem, mens nærheten til skoler ikke har noen sammenheng i det hele tatt, eller til og med en negativ korrelasjon hvis det først og fremst er pensjonisttilværelse samfunnet.
Den andre fordelen er muligheten til å identifisere utliggere eller avvik. Mens vi for eksempel gjennomgikk dataene relatert til ledelseslønn, kunne personalansvarlig finne at antall arbeidstimer, avdelingsstørrelse og budsjett alt hadde en sterk sammenheng med lønn, mens ansiennitet ikke gjorde det. Alternativt kan det være at alle de listede prediktorverdiene var korrelert til hver av lønningene som ble undersøkt, bortsett fra en leder som ble for mye betalt sammenlignet med de andre.
Ulemper ved flere regresjoner
Enhver ulempe ved å bruke en multippel regresjonsmodell kommer vanligvis ned på dataene som brukes. To eksempler på dette bruker ufullstendige data og konkluderer falskt med at en korrelasjon er en årsakssammenheng.
Når vi for eksempel vurderte prisen på hjem, antar at eiendomsmegleren bare så på 10 hjem, hvorav syv ble kjøpt av små foreldre. I dette tilfellet kan forholdet mellom nærhet til skoler føre til at hun tror at dette hadde innvirkning på salgsprisen for alle hjem som ble solgt i samfunnet. Dette illustrerer fallgruvene med ufullstendige data. Hadde hun brukt en større prøve, kunne hun ha funnet at av 100 solgte hjem, bare ti prosent av hjemmeverdiene var relatert til en nærhet til skolen. Hvis hun hadde brukt kjøperens aldre som en prediktorverdi, kunne hun ha funnet ut at yngre kjøpere var villige til å betale mer for boliger i samfunnet enn eldre kjøpere.
I eksempelet med lederlønninger, antar at det var en utenforstående som hadde et mindre budsjett, mindre ansiennitet og med færre personell å administrere, men tjente mer enn noen andre. HR-sjefen kunne se på dataene og konkludere med at denne personen blir for mye betalt. Imidlertid vil denne konklusjonen være feilaktig hvis han ikke tok høyde for at denne manageren hadde ansvaret for selskapets nettsted og hadde et meget ettertraktet ferdighetssett i nettverkssikkerhet.