Innhold
Statistiske tester brukes for å bestemme om et hypotetisk forhold mellom variabler har statistisk betydning. Typisk vil testen måle i hvilken grad variablene enten korrelerer eller avviker. Parametriske tester er de som er avhengige av variabelenes sentrale tendenser og antar en normalfordeling. Ikke-parametriske tester gjør ikke antagelser om befolkningsfordelingene.
T-test
T-testen er en parametrisk test som sammenligner middelene til prøvene og populasjonene som er involvert. Det er flere varianter av t-tester. En t-test med én prøve sammenligner gjennomsnittet av en prøve med et antatt middel. En uavhengig t-test for prøver ser på om middelet til to forskjellige prøver har lignende verdier. En sammenkoblet t-test brukes når det er to observasjoner å sammenligne for hvert individ i prøven. T-testen er designet for numeriske data som har normal fordeling.
Ordinære data
Vanlige data er avledede data som beskriver de relative verdiene til hver enhet i prøven. For eksempel vil ordinære data på høyden til 10 elever i et klasserom ganske enkelt være tallene 1 til 10, der 1 kan representere den korteste studenten og 10 kan representere den høyeste studenten. Ingen elever ville ha samme verdi med mindre de hadde nøyaktig samme høyde. Målinger av sentral tendens er meningsløse med ordinære data.
Utilstrekkelighet av T-test
T-tester er ikke passende å bruke med ordinære data. Fordi ordinære data ikke har noen sentral tendens, har de heller ingen normalfordeling. Verdiene av ordinære data er jevnt fordelt, ikke gruppert rundt et midtpunkt. På grunn av dette ville en t-test av ordinære data ikke ha noen statistisk betydning.
Andre passende tester
Det er tre tester av statistisk betydning som er passende å bruke med ordinære data. Spearmans rangordningskorrelasjon er passende å bruke når det bare er to variabler involvert, og forholdet deres er monotonisk, men ikke nødvendigvis lineært. Når den første variabelen øker i monotoniske forhold, er det ingen endring i retning av den andre variabelen. Kruskal-Wallis-testen er designet for tilfeller der det er mer enn to prøver, og dataene blir normalt ikke distribuert. Det ligner en enveis variansanalyse. Friedman-analysen av varians etter rang kan brukes når det er tre eller flere observasjoner av en enkelt variabel i en enkelt gruppe.