Inhoudsopgave
De handleiding legt de essentie uit van de standaardafwijking en de standaardfout van het gemiddelde, alsmede welke formule het best kan worden gebruikt voor de berekening van de standaardafwijking in Excel.
In de beschrijvende statistiek zijn het rekenkundig gemiddelde (ook wel het gemiddelde genoemd) en de standaardafwijking twee nauw verwante begrippen. Maar terwijl het eerste door de meesten goed wordt begrepen, wordt het tweede door weinigen begrepen. Het doel van deze handleiding is licht te werpen op wat de standaardafwijking eigenlijk is en hoe deze in Excel kan worden berekend.
Wat is standaarddeviatie?
De standaardafwijking is een maat die aangeeft hoeveel de waarden van de gegevensreeks afwijken (uitspreiden) van het gemiddelde. Anders gezegd, de standaardafwijking laat zien of uw gegevens dicht bij het gemiddelde liggen of veel fluctueren.
Het doel van de standaardafwijking is u te helpen begrijpen of het gemiddelde werkelijk een "typisch" gegeven is. Hoe dichter de standaardafwijking bij nul ligt, hoe lager de variabiliteit van de gegevens en hoe betrouwbaarder het gemiddelde is. Een standaardafwijking gelijk aan 0 betekent dat elke waarde in de dataset precies gelijk is aan het gemiddelde. Hoe hoger de standaardafwijking, hoe meer variatie er is in degegevens en hoe minder nauwkeurig het gemiddelde is.
Om een beter idee te krijgen van hoe dit werkt, kunt u de volgende gegevens bekijken:
Voor Biologie is de standaardafwijking 5 (afgerond op een geheel getal), wat ons vertelt dat de meeste scores niet meer dan 5 punten van het gemiddelde afwijken. Is dat goed? Ja, het geeft aan dat de scores voor Biologie van de leerlingen behoorlijk consistent zijn.
Voor wiskunde is de standaardafwijking 23. Hieruit blijkt dat er een enorme spreiding (spreiding) is in de scores, wat betekent dat sommige leerlingen veel beter en/of sommige veel slechter presteerden dan het gemiddelde.
In de praktijk wordt de standaardafwijking door bedrijfsanalisten vaak gebruikt als maatstaf voor het beleggingsrisico - hoe hoger de standaardafwijking, hoe hoger de volatiliteit van het rendement.
Standaardafwijking steekproef vs. standaardafwijking populatie
In verband met de standaardafwijking hoort u vaak de termen "steekproef" en "populatie", die verwijzen naar de volledigheid van de gegevens waarmee u werkt. Het belangrijkste verschil is het volgende:
- Bevolking omvat alle elementen van een gegevensverzameling.
- Voorbeeld is een deelverzameling van gegevens die een of meer elementen uit de populatie omvat.
Onderzoekers en analisten werken in verschillende situaties met de standaardafwijking van een steekproef en een populatie. Bijvoorbeeld, wanneer een leraar de examenscores van een klas leerlingen samenvat, zal hij de standaardafwijking van de populatie gebruiken. Statistici die de nationale SAT-gemiddelde score berekenen, zouden een standaardafwijking van de steekproef gebruiken omdat zij alleen de gegevens van een steekproef te zien krijgen, nietvan de hele bevolking.
De standaardafwijkingsformule begrijpen
De aard van de gegevens is van belang omdat de standaarddeviatie van de populatie en de standaarddeviatie van de steekproef met enigszins verschillende formules worden berekend:
Standaardafwijking van het monster | Standaardafwijking van de bevolking |
Waar:
- x i zijn individuele waarden in de gegevensverzameling
- x is het gemiddelde van alle x waarden
- n is het totale aantal x waarden in de gegevensverzameling
Heb je moeite met het begrijpen van de formules? Ze in eenvoudige stappen opdelen kan helpen. Maar eerst hebben we wat voorbeeldgegevens om mee te werken:
1. Bereken het gemiddelde
Eerst vindt u het gemiddelde van alle waarden in de gegevensverzameling ( x Als je met de hand rekent, tel je de getallen op en deel je de som door het aantal getallen, zoals dit:
(1+2+4+5+6+8+9)/7=5
Om het gemiddelde in Excel te vinden, gebruikt u de functie GEMIDDELDE, bijvoorbeeld =GEMIDDELDE(A2:G2)
2. Trek van elk getal het gemiddelde af en kwadrateer het resultaat.
Dit is het deel van de standaardafwijkingsformule dat zegt: ( x i - x )2
Om te visualiseren wat er eigenlijk aan de hand is, kunt u de volgende afbeeldingen bekijken.
In dit voorbeeld is het gemiddelde 5, dus berekenen we het verschil tussen elk gegevenspunt en 5.
Dan kwadrateer je de verschillen, zodat ze allemaal positieve getallen worden:
3. Tel de verschillen in het kwadraat op
Om in de wiskunde te zeggen "dingen optellen", gebruik je sigma Σ. Dus wat we nu doen is de gekwadrateerde verschillen optellen om dit deel van de formule te voltooien: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. Deel de totale gekwadrateerde verschillen door het aantal waarden.
Tot nu toe waren de formules voor de standaardafwijking van de steekproef en de standaardafwijking van de populatie identiek. Nu zijn ze verschillend.
Voor de standaardafwijking van het monster krijg je de steekproefvariantie door de totale gekwadrateerde verschillen te delen door de steekproefomvang min 1:
52 / (7-1) = 8.67
Voor de standaarddeviatie van de bevolking vindt u de gemiddelde van de gekwadrateerde verschillen door de totale gekwadrateerde verschillen te delen door hun aantal:
52 / 7 = 7.43
Waarom dit verschil in de formules? Omdat je in de formule voor de standaardafwijking van de steekproef de vertekening in de schatting van een steekproefgemiddelde in plaats van het werkelijke populatiegemiddelde moet corrigeren. En dat doe je door gebruik te maken van n - 1 in plaats van n die de correctie van Bessel wordt genoemd.
5. Neem de vierkantswortel
Neem tenslotte de vierkantswortel van de bovenstaande getallen, en u krijgt uw standaardafwijking (in de onderstaande vergelijkingen afgerond op 2 decimalen):
Standaardafwijking van het monster | Standaardafwijking van de bevolking |
√ 8.67 = 2.94 | √ 7.43 = 2.73 |
In Microsoft Excel wordt de standaardafwijking op dezelfde manier berekend, maar alle bovenstaande berekeningen worden achter de schermen uitgevoerd. Het belangrijkste voor u is om een goede standaardafwijkingsfunctie te kiezen, waarover het volgende hoofdstuk u enkele aanwijzingen zal geven.
Hoe standaardafwijking berekenen in Excel
In totaal zijn er zes verschillende functies om de standaardafwijking in Excel te vinden. Welke u moet gebruiken hangt vooral af van de aard van de gegevens waarmee u werkt - of het de gehele populatie is of een steekproef.
Functies om de standaardafwijking van een steekproef te berekenen in Excel
Om de standaardafwijking op basis van een steekproef te berekenen, gebruikt u een van de volgende formules (ze zijn allemaal gebaseerd op de hierboven beschreven "n-1"-methode).
Excel STDEV-functie
STDEV(nummer1,[nummer2],...)
is de oudste Excel-functie voor het schatten van de standaardafwijking op basis van een steekproef, en is beschikbaar in alle versies van Excel 2003 tot 2019.
In Excel 2007 en later kan STDEV maximaal 255 argumenten accepteren die kunnen worden weergegeven door getallen, arrays, benoemde bereiken of verwijzingen naar cellen die getallen bevatten. In Excel 2003 kan de functie slechts maximaal 30 argumenten accepteren.
Logische waarden en tekstvoorstellingen van getallen die rechtstreeks in de lijst met argumenten worden ingevoerd, worden geteld. In arrays en verwijzingen worden alleen getallen geteld; lege cellen, logische waarden TRUE en FALSE, tekst en foutwaarden worden genegeerd.
Opmerking: Excel STDEV is een verouderde functie, die in de nieuwere versies van Excel alleen wordt gehandhaafd voor achterwaartse compatibiliteit. Microsoft doet echter geen beloftes met betrekking tot de toekomstige versies. In Excel 2010 en later wordt daarom aanbevolen om STDEV.S te gebruiken in plaats van STDEV.
Excel STDEV.S functie
STDEV.S(nummer1,[nummer2],...)
is een verbeterde versie van STDEV, geïntroduceerd in Excel 2010.
Net als STDEV berekent de functie STDEV.S de standaardafwijking van een reeks waarden op basis van de klassieke formule voor standaardafwijking die in het vorige hoofdstuk is besproken.
Excel STDEVA functie
STDEVA(waarde1, [waarde2], ...)
is een andere functie om de standaardafwijking van een steekproef in Excel te berekenen. Deze verschilt alleen van de twee voorgaande in de manier waarop deze functie omgaat met logische en tekstwaarden:
- Alle logische waarden worden geteld, ongeacht of ze zijn opgenomen in arrays of verwijzingen, of rechtstreeks in de lijst van argumenten zijn ingevoerd (TRUE evalueert als 1, FALSE evalueert als 0).
- Tekstwaarden binnen arrays of referentieargumenten worden geteld als 0, inclusief lege tekenreeksen (""), tekstweergaven van getallen en alle andere tekst. Tekstweergaven van getallen die rechtstreeks in de lijst van argumenten worden gegeven, worden geteld als de getallen die ze voorstellen (hier is een voorbeeld van een formule).
- Lege cellen worden genegeerd.
Opmerking: Om een standaardafwijkingsformule correct te laten werken, moeten de opgegeven argumenten ten minste twee numerieke waarden bevatten, anders wordt de foutmelding #DIV/0! teruggestuurd.
Functies om de standaarddeviatie van een populatie te berekenen in Excel
Als u te maken hebt met de gehele populatie, gebruik dan een van de volgende functies om de standaardafwijking in Excel te doen. Deze functies zijn gebaseerd op de "n"-methode.
Excel STDEVP-functie
STDEVP(nummer1,[nummer2],...)
is de oude Excel-functie om de standaardafwijking van een populatie te vinden.
In de nieuwe versies van Excel 2010, 2013, 2016 en 2019 is deze functie vervangen door de verbeterde STDEV.P-functie, maar ze wordt nog steeds bewaard voor achterwaartse compatibiliteit.
Excel STDEV.P functie
STDEV.P(nummer1,[nummer2],...)
is de moderne versie van de STDEVP-functie die een verbeterde nauwkeurigheid biedt. Hij is beschikbaar in Excel 2010 en latere versies.
Net als hun tegenhangers voor de standaardafwijking van steekproeven tellen de functies STDEVP en STDEV.P binnen arrays of referentieargumenten alleen getallen. In de lijst van argumenten tellen ze ook logische waarden en tekstrepresentaties van getallen.
Excel STDEVPA functie
STDEVPA(waarde1, [waarde2], ...)
berekent de standaardafwijking van een populatie, inclusief tekst en logische waarden. Met betrekking tot niet-numerieke waarden werkt STDEVPA precies zoals de functie STDEVA.
Opmerking. Welke Excel-standaardafwijkingsformule u ook gebruikt, deze geeft een foutmelding indien een of meer argumenten een foutwaarde bevatten die door een andere functie is teruggegeven of tekst die niet als een getal kan worden geïnterpreteerd.
Welke Excel standaardafwijkingsfunctie moet ik gebruiken?
Een verscheidenheid aan standaardafwijkingsfuncties in Excel kan zeker een puinhoop veroorzaken, vooral voor onervaren gebruikers. Om de juiste standaardafwijkingsformule voor een bepaalde taak te kiezen, hoeft u alleen maar de volgende 3 vragen te beantwoorden:
- Bereken je de standaardafwijking van een steekproef of een populatie?
- Welke Excel versie gebruikt u?
- Bevat uw gegevensverzameling alleen getallen of ook logische waarden en tekst?
Om de standaardafwijking te berekenen op basis van een numerieke voorbeeld Gebruik de functie STDEV.S in Excel 2010 en later; STDEV in Excel 2007 en eerder.
Om de standaardafwijking van een bevolking Gebruik de functie STDEV.P in Excel 2010 en later; STDEVP in Excel 2007 en eerder.
Als u wilt logisch of tekst waarden op te nemen in de berekening, gebruik dan STDEVA (standaardafwijking van de steekproef) of STDEVPA (standaardafwijking van de populatie). Hoewel ik geen scenario kan bedenken waarin beide functies op zichzelf nuttig kunnen zijn, kunnen ze van pas komen in grotere formules, waarbij een of meer argumenten door andere functies worden teruggegeven als logische waarden of tekstvoorstellingen van getallen.
Om u te helpen beslissen welke van de Excel-standaardafwijkingsfuncties het meest geschikt is voor uw behoeften, kunt u de volgende tabel bekijken, waarin de informatie die u reeds hebt geleerd, wordt samengevat.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Excel versie | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Voorbeeld | ✓ | ✓ | ✓ | |||
Bevolking | ✓ | ✓ | ✓ | |||
Logische waarden in arrays of referenties | Genegeerd | Geëvalueerd (WAAR=1, ONWAAR=0) | ||||
Tekst in arrays of referenties | Genegeerd | Geëvalueerd als nul | ||||
Logische waarden en "tekst-nummers" in de lijst van argumenten | Geëvalueerd (WAAR=1, ONWAAR=0) | |||||
Lege cellen | Genegeerd |
Excel standaardafwijkingsformule voorbeelden
Zodra u de functie hebt gekozen die overeenstemt met uw gegevenstype, zou het schrijven van de formule geen problemen mogen opleveren - de syntaxis is zo duidelijk en transparant dat er geen ruimte is voor fouten :) De volgende voorbeelden tonen een paar Excel-formules voor standaardafwijkingen in actie.
Berekening van de standaardafwijking van een steekproef en een populatie
Afhankelijk van de aard van uw gegevens gebruikt u een van de volgende formules:
- Om de standaardafwijking te berekenen op basis van de gehele bevolking , d.w.z. de volledige lijst van waarden (B2:B50 in dit voorbeeld), gebruik de functie STDEV.P:
=STDEV.P(B2:B50)
- Om de standaardafwijking te vinden op basis van een voorbeeld die een deel, of subgroep, van de populatie vormt (B2:B10 in dit voorbeeld), gebruik je de functie STDEV.S:
=STDEV.S(B2:B10)
Zoals u in de onderstaande schermafbeelding kunt zien, leveren de formules enigszins verschillende getallen op (hoe kleiner de steekproef, hoe groter het verschil):
In Excel 2007 en lager gebruikt u in plaats daarvan de functies STDEVP en STDEV:
- Om de standaardafwijking van de populatie te krijgen:
=STDEVP(B2:B50)
- Om de standaardafwijking van de steekproef te berekenen:
=STDEV(B2:B10)
Berekening van de standaardafwijking voor tekstvoorstellingen van getallen
Bij de bespreking van verschillende functies om de standaardafwijking in Excel te berekenen, hadden we het soms over "tekstrepresentaties van getallen" en misschien bent u benieuwd wat dat eigenlijk betekent.
In deze context zijn "tekstrepresentaties van getallen" gewoon getallen die als tekst zijn opgemaakt. Hoe kunnen zulke getallen in uw werkbladen verschijnen? Meestal worden ze geëxporteerd uit externe bronnen. Of ze worden teruggestuurd door zogenaamde tekstfuncties die bedoeld zijn om tekststrings te manipuleren, bv. TEKST, MIDDEN, RECHTS, LINKS, enz. Sommige van die functies kunnen ook met getallen werken, maar hun uitvoer is altijd tekst, zelfsals het veel op een nummer lijkt.
Om het punt beter te illustreren, kunt u het volgende voorbeeld bekijken. Stel dat u een kolom hebt met productcodes zoals "Jeans-105", waarbij de cijfers na een streepje de hoeveelheid aangeven. Uw doel is de hoeveelheid van elk artikel te extraheren en vervolgens de standaardafwijking van de geëxtraheerde getallen te vinden.
Het verplaatsen van de hoeveelheid naar een andere kolom is geen probleem:
=RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))
Het probleem is dat het gebruik van een Excel-standaardafwijkingsformule op de geëxtraheerde getallen ofwel #DIV/0! of 0 oplevert, zoals in de onderstaande schermafbeelding:
Waarom zulke vreemde resultaten? Zoals hierboven vermeld, is de uitvoer van de functie RECHTS altijd een tekststring. Maar noch STDEV.S, noch STDEVA kan omgaan met getallen die als tekst zijn opgemaakt in verwijzingen (de eerste negeert ze gewoon, terwijl de tweede ze telt als nullen). Om de standaardafwijking van zulke "tekst-nummers" te krijgen, moet je ze rechtstreeks aan de lijst met argumenten toevoegen, wat kan door alleRECHTS functies in uw STDEV.S of STDEVA formule:
=STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))
De formules zijn een beetje omslachtig, maar voor een kleine steekproef zou dat een werkende oplossing kunnen zijn. Voor een grotere steekproef, om nog maar te zwijgen van de hele populatie, is het zeker geen optie. In dit geval zou een elegantere oplossing zijn dat de VALUE-functie "tekst-nummers" omzet in getallen die elke standaardafwijkingsformule kan begrijpen (let op de rechts uitgelijnde getallen in de schermafbeeldinghieronder in tegenstelling tot de links uitgelijnde tekststrings op de schermafbeelding hierboven):
Hoe bereken ik de standaardfout van het gemiddelde in Excel
In de statistiek is er nog een maat voor het schatten van de variabiliteit in gegevens - standaardafwijking van het gemiddelde De standaardafwijking en de standaardafwijking van het gemiddelde zijn twee nauw verwante begrippen, maar niet hetzelfde.
Terwijl de standaardafwijking de variabiliteit van een gegevensreeks ten opzichte van het gemiddelde meet, schat de standaardafwijking van het gemiddelde (SEM) hoe ver het steekproefgemiddelde waarschijnlijk van het werkelijke populatiegemiddelde afwijkt. Anders gezegd - als u meerdere steekproeven uit dezelfde populatie zou nemen, zou de standaardafwijking van het gemiddelde de spreiding tussen die steekproefgemiddelden weergeven. Omdat we gewoonlijk slechts eengemiddelde voor een reeks gegevens, niet meerdere gemiddelden, wordt de standaardafwijking van het gemiddelde geschat in plaats van gemeten.
In de wiskunde wordt de standaardfout van het gemiddelde berekend met deze formule:
Waar SD is de standaardafwijking, en n is de steekproefomvang (het aantal waarden in de steekproef).
In uw Excel-werkbladen kunt u de functie COUNT gebruiken om het aantal waarden in een steekproef te verkrijgen, SQRT om de vierkantswortel van dat aantal te nemen, en STDEV.S om de standaardafwijking van een steekproef te berekenen.
Als je dit alles bij elkaar optelt, krijg je de standaardfout van het gemiddelde in Excel:
STDEV.S( reeks )/SQRT(COUNT( reeks ))Aangenomen dat de steekproefgegevens in B2:B10 staan, gaat onze SEM-formule als volgt:
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
En het resultaat zou hier op kunnen lijken:
Hoe standaardafwijkingsbalken toevoegen in Excel
Om een marge van de standaardafwijking visueel weer te geven, kunt u standaardafwijkingsbalken toevoegen aan uw Excel-grafiek. Zo gaat u te werk:
- Maak een grafiek op de gebruikelijke manier ( Plaats tab> Grafieken groep).
- Klik ergens op de grafiek om deze te selecteren en klik dan op de knop Grafiekelementen knop.
- Klik op het pijltje naast Foutbalken en kies Standaardafwijking .
Hierdoor worden dezelfde standaardafwijkingsbalken voor alle gegevenspunten ingevoegd.
Dit is hoe je standaardafwijking doet in Excel. Ik hoop dat je deze informatie nuttig vindt. In ieder geval dank ik je voor het lezen en ik hoop je volgende week op onze blog te zien.