Rekenen met getallen: Decimale getallen
Extra: foutenleer in vogelvlucht
In natuurwetenschappelijke experimenten worden toevallige meetfouten gemaakt; dit komt al tot uiting wanneer metingen herhaald worden en er niet steeds precies dezelfde meetuitkomst wordt verkregen. Dit fenomeen heet spreiding. In deze theoriepagina overstijgen we het precalculus gebied met de toegift van een summiere behandeling van op statistiek gebaseerde foutenleer. Onderstaande foutenbeschouwing is het echte werk, maar de eerder beschreven methode van significante cijfers kent een paar eenvoudige spelregels waarmee snel een verantwoord resultaat kan verkregen worden.
Een meting van dezelfde massa van een metalen blokje op 3 verschillende balansen, vlak na elkaar gemeten, kan bijvoorbeeld leiden tot drie verschillende uitkomsten: \(34.7251\), \(34.7256\) en \(34.7193\) (gram). De reden kan zijn dat de meting door verschillende personen is uitgevoerd, dat de balansen van verschillend type zijn of verschillend zijn afgesteld (bijvoorbeeld van het nulpunt), tussentijdse verontreiniging het meetobject, enzovoort. Het lijkt er op dat de cijfers \(34.7\) als "zeker" beschouwd kunnen worden, maar dat de volgende decimalen onzeker zijn. De tweede decimaal is een 2, maar misschien ook wel een 1 of 3. De meetuitkomst schommelt dus rondom \(34.72\) met een spreiding van \(0.01\). Dit wordt vaak genoteerd als \(34.72\pm 0.01\) en de uitkomst kan dus alleen zinvol in 4 significante cijfers opgeschreven worden. Schrijft men enkel het getal \(34.72\) met 4 decimalen op als meetuitkomst, dan wordt meestal verondersteld dat het laatste cijfer onzeker is en er evengoed een 1 bij opgeteld of afgetrokken kan worden.
Om aan de spreiding een getalswaarde te koppelen kunnen verschillende spreidingsmaten gehanteerd worden. In het voorbeeld hierboven hebben we naar de meetgegevens gekeken en op basis hiervan een keuze gemaakt. Maar we hadden ook naar de spreidingsbreedte, d.w.z. het verschil tussen de grootste en kleinste waarde, kunnen kijken. In dit voorbeeld is dat \(34.7256-34.7193=0.0063\) en daaruit zou je ook een kleinere spreiding van \(0.004\) rondom de gemiddelde waarde van \(34.723\) (afgerond op 3 decimalen). Op deze manier hanteren we een nauwkeurigere meetuitkomst van \(34.723\pm 0.004\).
Een statistische maat voor spreiding van meetuitkomsten Uitgaande van op toeval berustende meetfouten heeft een op statistiek gebaseerde aanpak met begrippen als variante en standaarddeviatie de voorkeur. Men berekent dan voor een grootheid \(X\) eerst het gemiddelde \(\overline{X}\) van \(n\) uitkomsten via de formule \[\overline{X}=\frac{1}{n}\sum_{i=1}^n X_i\] Daarna berekent men zogenaamde variantie \(S^2\) via de formule \[S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\overline(X))^2\] Vervolgens neemt men de wortel eruit en krijgt de standaarddeviatie \(S\), ook wel standaardafwijking of absolute fout genoemd, als statistische maat voor de spreiding van de meetuitkomsten.
Zonder ook maar in details te treden vermelden we de rekenregels voor het berekenen van de standaarddeviatie bij optellen, aftrekken, vermenigvuldigen en delen van de uitkomsten van twee of meer gemeten grootheden.
Rekenregels voor statistische spreiding bij een lineaire combinatie Als een grootheid \(U\) een willekeurige lineaire combinatie is van direct gemeten onafhankelijke grootheden, zeg \[U=aX+bY+cZ+\ldots\] met coëfficiënten \(a\), \(b\), \(c\) en grootheden \(X\), \(Y\), \(Z\), dan is de variantie van \(U\), genoteerd als \(S_{U}^2\), gegeven door de volgende formule in termen van variantie van \(X\), \(Y\), \(Z\), enzovoort (genoteerd als \(S_{X}^2\), \(S_{Y}^2\), \(S_{Z}^2\)): \[S_{U}^2=a^2S_{X}^2+b^2S_{Y}^2+c^2S_{Z}^2+\cdots\] Men zegt wel: "kwadratisch optellen van absolute fouten". Deze formule is vooral handig bij een som of verschil als de coëfficiënten \(\pm1\) zijn.
Rekenregels voor statistische spreiding bij product en quotiënt met exponenten Voor een grootheid \(U=kX^aY^bZ^c\cdots\) met een willekeurige coëfficiënt \(k\), exponenten \(a\), \(b\), \(c\), en grootheden \(X\), \(Y\), \(Z\), is de variantie van \(U\), genoteerd als \(S_{U}^2\), gegeven door de volgende formule in termen van gemiddelde van \(X\), \(Y\), \(Z\), enzovoort (genoteerd als \(\overline{X}\), \(\overline{Y}\), \(\overline{Z}\)) en variantie van \(X\), \(Y\), \(Z\), enzovoort (genoteerd als \(S_{X}^2\), \(S_{X}^2\), \(S_{X}^2\)): \[\frac{S_{U}^2}{\overline{U}^2}=a^2\frac{S_{X}^2}{\overline{X}^2}+b^2\frac{S_{Y}^2}{\overline{Y}^2}+c^2\frac{S_{Z}^2}{\overline{Z}^2}+\ldots\] Deze formule kan ook als volgt opgeschreven worden: \[\left(\frac{S_{U}}{\overline{U}}\right)^2 =a^2\left(\frac{S_{X}}{\overline{X}}\right)^2+b^2\left(\frac{S_{Y}}{\overline{Y}}\right)^2+c^2\left(\frac{S_{Z}}{\overline{Z}}\right)^2+\cdots\] Men spreekt wel van: "kwadratisch optellen van relatieve fouten". Deze formule is vooral handig bij een product of verschil als de exponenten \(\pm1\) zijn.
Stel dat je bij een titratie met een klasse A-buret een beginwaarde \(12.34\pm0.05\) en een eindwaarde \(5.67\pm0.05\) (mL) afleest. Het verbruik is het verschil tussen deze meetwaarden. Je bent geneigd hier te denken dat de fout \(0.05 +0.05=0.1\) zou zijn omdat dit de grootst mogelijke fout is; je hebt dan de zogenaamde variatiemethode toegepast. Maar omdat toevallige fouten elkaar kunnen opheffen kun je beter de rekenregel voor statistische spreiding bij een verschil gebruiken: je moet de absolute fouten kwadratisch optellen en krijgt dan de standaarddeviatie \[S=\sqrt{(0.05)^2+(0.05)^2}\approx 0.07\qquad\text{afgerond op 2 decimalen.}\] De statistische spreiding is hiermee kleiner dan de grootst mogelijke fout. De uitkomst wordt dus \(6.67\pm 0.07\,\).