Wordt standaarddeviatie kleiner?

Vraag van een student

Wordt de standaarddeviatie per se kleiner als je meer mensen aan je steekproef toevoegt?

Antwoord

Als je een voorbeeld vindt dat het tegenovergestelde bewijst, dan weet je dat die ‘regel’ niet opgaat.

Stel je voor dat je van vijf mensen hebt gevraagd wat hun leeftijd is: 23, 24, 25, 26, 27. Gemiddelde is 25 jaar, de standaarddeviate = 1,6. Stel dat je nu je steekproef vergroot met nog eens vijf mensen uit de populatie en die hebben de leeftijden: 55, 101, 12, 98, 15. Dan is het gemiddelde 40,6 jaar met standaarddeviatie 33,1.

Dus, nee. De standaarddeviatie wordt niet perse kleiner als je meer mensen aan je steekproef toevoegt.

Kerstbalongeluk

Vraag van student: “In mijn leven heb ik tot op heden twee kerstballen laten vallen, ik ben nu 20 jaar. Hoe groot is de kans dat ik vier keer een kerstbal laat vallen?

Photo by freestocks.org on Unsplash

Antwoord

Voor dergelijke kansverdelingen is er de Poisson-verdeling. Een verdeling voor zeldzame gebeurtenissen. De formule voor de kansverdeling:

We veronderstellen in dit voorbeeld van de student dat die twee keer een goede verwachting is van het aantal keer dat zij een kerstbal laat vallen. Dan wordt:

De kans dat deze student de bal bijvoorbeeld vier keer laat vallen is dan:

Oftewel ongeveer 1 op de 250.000.

Voor verdere informatie zie bijvoorbeeld:

  • Rijken van Olst, H. (1974). Algemene statistiek. Een moderne inleiding tot de statistische theorie. Assen: Van Gorcum & Comp. B.V.
  • https://en.wikipedia.org/wiki/Poisson_distribution

Mediaan & spreiding

De boxplot visualiseert de relatie tussen de mediaan en de spreiding.

De spreiding is weergegeven via kwartielen, minimum en maximum.

Figuur 2.7. Statistiek voor de beroepspraktijk, paragraaf 2.4.2.

Scheve verdeling is normaal

Maar daar bedoelen we niet mee dat een scheve verdeling ook een ‘normale verdeling’ is!

Het Hikkende Heksje

HRM-afdelingen houden bij hoe vaak een werknemer ziek is. Het is normaal dat men niet ziek is, nou ja, soms een verkoudheid of zo. Dus elke werknemer heeft meestal minder dan vijf ziektedagen.

Dus hier een scheve verdeling met de staart naar rechts.

De verdeling is scheef, want een paar werknemers trekken het gemiddelde omhoog. Daarom is het bij scheve verdelingen vaak beter de mediaan te hanteren.

Valentine’s Day

How are the hearts distributed?

Photo by Element5 Digital on Unsplash

Spreiding is de basis van statistiek

Photo by Doug Linstedt on Unsplash

Bedenk dat spreiding het centrale begrip in de statistiek is: alles draait om spreiding. Hoe het gespreid is, hoe de waarnemingen (of getallen, of gegevens) verdeeld zijn rondom een midden.