Innhold
Skjevhet er feilen i estimater på grunn av systematiske feil som fører til gjennomgående høye eller lave resultater sammenlignet med de faktiske verdiene. Den individuelle skjevheten i et estimat som er kjent for å være partisk, er forskjellen mellom de estimerte og faktiske verdiene. Hvis estimatet ikke er kjent for å være partisk, kan forskjellen også skyldes tilfeldig feil eller andre unøyaktigheter. I motsetning til skjevhet, som alltid fungerer i en retning, kan disse feilene være positive eller negative.
For å beregne skjevheten til en metode som er brukt for mange estimater, finner du feilene ved å trekke hvert estimat fra den faktiske eller observerte verdien. Legg opp alle feilene, og del med antall estimater for å få skjevheten. Hvis feilene legger opp til null, var estimatene objektive, og metoden gir objektive resultater. Hvis estimatene er partiske, kan det være mulig å finne kilden til skjevheten, og eliminere den for å forbedre metoden.
TL; DR (for lang; ikke lest)
Beregn skjevhet ved å finne forskjellen mellom et estimat og den faktiske verdien. For å finne skjevheten til en metode, utfør mange estimater og legge opp feilene i hvert estimat sammenlignet med den reelle verdien. Ved å dele på antall estimater gir skjevheten til metoden. I statistikk kan det være mange estimater for å finne en enkelt verdi. Skjevhet er forskjellen mellom gjennomsnittet av disse estimatene og den faktiske verdien.
Hvordan skjevhet fungerer
Når estimater er partiske, tar de konsekvent feil i en retning på grunn av feil i systemet som brukes for estimatene. For eksempel kan en værmelding konsekvent forutsi temperaturer som er høyere enn faktisk observert. Prognosen er partisk, og et sted i systemet er det en feil som gir et for høyt estimat. Hvis prognosemetoden er objektiv, kan det fremdeles forutsi temperaturer som ikke er riktige, men de uriktige temperaturene vil noen ganger være høyere og noen ganger lavere enn observerte temperaturer.
Statistisk skjevhet fungerer på samme måte, men er vanligvis basert på et stort antall estimater, undersøkelser eller prognoser. Disse resultatene kan være grafisk representert i en distribusjonskurve, og skjevheten er forskjellen mellom gjennomsnittet av fordelingen og den faktiske verdien. Hvis det er skjevhet, vil det alltid være en forskjell selv om noen individuelle estimater kan falle på begge sider av den faktiske verdien.
Skjevhet i undersøkelser
Et eksempel på skjevhet er et undersøkelsesselskap som kjører meningsmålinger under valgkamp, men valgresultatene deres overvurderer konsekvent resultatene for ett politisk parti sammenlignet med de faktiske valgresultatene. Skjevheten kan beregnes for hvert valg ved å trekke fra det faktiske resultatet fra avstemningen prediksjon. Gjennomsnittlig skjevhet av avstemmingsmetoden som brukes kan beregnes ved å finne gjennomsnittet av de individuelle feilene. Hvis skjevheten er stor og konsekvent, kan valglederiet prøve å finne ut hvorfor metoden deres er partisk.
Skjevhet kan komme fra to hovedkilder. Enten er valg av deltakere til avstemningen partisk, eller skjevheten skyldes tolkningen av informasjonen som er mottatt fra deltakerne. For eksempel er meningsmålinger iboende partisk fordi meningsmålingsdeltakerne som fyller ut internettskjemaene ikke er representative for hele befolkningen. Dette er en valgskjevhet.
Avstemmingsbedrifter er klar over denne utvelgelsesskjevheten og kompenserer ved å justere tallene. Hvis resultatene fortsatt er partiske, er det en informasjonsskjevhet fordi selskapene ikke tolket informasjonen riktig. I alle disse tilfellene viser en skjevhetsberegning i hvilken grad de estimerte verdiene er nyttige og når metodene trenger justering.