Tagoror  

Encyclopedie




Standaarddeviatie

De standaardafwijking of standaarddeviatie (zie statistiek) is de wortel uit de variantie van de metingen. De variantie is het gemiddelde van de kwadraten van de afwijking van de metingen ten opzichte van het gemiddelde van de gegevensset. De standaardafwijking wordt gebruikt om de spreiding van een meting rond het gemiddelde te kunnen meten. Een verschil tussen standaardafwijking en variantie is dat de standaardafwijking in dezelfde eenheid wordt uitgedrukt als het gemiddelde, waardoor het zinnig wordt te spreken over het gemiddelde plus of min een aantal malen de standaardafwijking.

De standaardaafwijking kan worden gebruikt voor normale verdelingen, waarvan 68% van de metingen tussen de gemiddelde waarde minus standaardafwijking en de gemiddelde waarde plus standaardafwijking valt. Dankzij de centrale limietstelling weten we verder dat het bij voldoende veel metingen veilig is aan te nemen dat de verdeling van de som van een groot aantal steekproeven van een onbekende verdeling de vorm van een normale verdeling heeft.

Statistici verrichten vaak meerdere metingen van dezelfde soort, dus met in dezelfde verwachte uitkomst, om te voorkomen dat hun uitkomsten te sterk beïnvloed worden door zaken als menselijk gedrag, de stand van de maan, quantumeffecten en andere vormen van onvoorspelbare en onafhankelijke ruis. Als ze alleen het gemiddelde zouden vermelden zou je niet weten in hoeverre zulke ongrijpbare factoren zijn onderdrukt. Het aantal metingen meldt dat ook niet.

Denk je eens in dat je als volgt zou handelen. Om uitspraken te doen zoals "geval A levert lagere meetwaarden op dan geval B", zou je er voor kunnen kiezen om van de metingen van beide gevallen het minimum en maximum te bepalen. Als dan het maximum van A onder het minimum van B zit dan is je meetwaarde aangetoond (mits je meting representatief is natuurlijk). Maar als er maar één uitschieter tussen zit dan gaat dat niet meer op, en verzand je wederom in vaagheden als "dit geval komt vrijwel nooit voor" of "het meeste clustert rond het gemiddelde".Juist dat soort vaagheden kun je de kop indrukken met statistiek.

Zoals genoemd kennen we een centrale limietstelling die aantoont dat je bij voldoende metingen mag aannemen dat de som (of equivalent het gemiddelde) van de meetgegevens een normale verdeling volgt. Voor natuurlijke fenomenen die alleen door ruis worden beïnvloed is dat toch al vaak zo, maar voor metingen die door psychologische factoren worden beïnvloed is dat minder vaststaand, maar biedt die stelling dus een elegante oplossing.

Als je twee metingen samenvat als een normale verdeling rond een bepaald gemiddelde, en met een bepaalde standaarddeviatie, dan is uit te rekenen in hoeverre de hypothese "geval A levert lagere meetwaarden op dan geval B" van toepassing is. Je bepaalt dus eigenlijk de significantie van zo'n uitspraak. Zie statistische toetsen voor meer informatie.




Tagoror Networks: Spain  |  Philippines  |  Mexico

Los documentos de esta enciclopedia on line se publican bajo la Licencia de Documentación Libre GNU

De tekst is beschikbaar onder de licentie Creative Commons Naamsvermelding/Gelijk delen, er kunnen aanvullende voorwaarden van toepassing zijn.