I statistikk fører tilfeldig prøvetaking av data fra en populasjon ofte til produksjon av en klokkeformet kurve med middelet sentrert på bjellens topp. Dette er kjent som en normalfordeling. Den sentrale grense-teoremet sier at når antall prøver øker, har det målte gjennomsnittet en tendens til å være normalfordelt rundt populasjonsgjennomsnittet og standardavviket blir smalere. Den sentrale grense-teoremet kan brukes til å estimere sannsynligheten for å finne en bestemt verdi i en populasjon.
Samle prøver og bestem deretter gjennomsnittet. Anta for eksempel at du vil beregne sannsynligheten for at en mann i USA har et kolesterolnivå på 230 milligram per desiliter eller over. Vi ville begynne med å samle prøver fra 25 individer og måle kolesterolnivået deres. Etter å ha samlet dataene, beregne gjennomsnittet av prøven. Gjennomsnittet oppnås ved å summere hver målte verdi og dele med det totale antall prøver. I dette eksemplet antar du at gjennomsnittet er 211 milligram per desiliter.
Beregn standardavviket, som er et mål på dataene "spredning". Dette kan gjøres i noen få enkle trinn:
I dette eksemplet antar du at standardavviket er 46 milligram per desiliter.
Beregn standardfeilen ved å dele standardavviket med kvadratroten av det totale prøvenummer:
Standardfeil = 46 / sqrt25 = 9.2
Tegn en skisse av normalfordeling og skygge med passende sannsynlighet. Etter eksemplet, vil du vite sannsynligheten for at en hann har et kolesterolnivå på 230 milligram per desiliter eller over. For å finne sannsynligheten, finn ut hvor mange standardfeil fra gjennomsnittet 230 milligram per desiliter er (Z-verdi):
Z = 230 - 211 / 9,2 = 2,07
Slå opp sannsynligheten for å få en verdi på 2,07 standardfeil over gjennomsnittet. Hvis du trenger å finne sannsynligheten for å finne en verdi innenfor 2,07 standardavvik fra gjennomsnittet, er z positivt. Hvis du trenger å finne sannsynligheten for å finne en verdi utover 2,07 standardavvik for gjennomsnittet, er z negativ.
Slå opp z-verdien på en standard normal sannsynlighetstabell. Den første kolonnen på venstre side viser hele tallet og første desimalplass for z-verdien. Raden øverst viser den tredje desimalen til z-verdien. Etter eksemplet, siden z-verdien vår er -2,07, må du først finne -2,0 i venstre kolonne, og deretter skanne den øverste raden etter 0,07-oppføringen. Det punktet hvor disse kolonnene og radene krysser hverandre, er sannsynligheten. I dette tilfellet er verdien av tabellen 0,0192 og dermed er sannsynligheten for å finne en hann som har et kolesterolnivå på 230 milligram per desiliter eller over 1,92 prosent.