Inhoudsopgave
Bij het analyseren van numerieke gegevens bent u vaak op zoek naar een manier om de "typische" waarde te krijgen. Voor dit doel kunt u de zgn. maten van centrale tendens die een enkele waarde vertegenwoordigen die de centrale positie binnen een gegevensverzameling aangeeft of, technischer, het midden of centrum in een statistische verdeling. Soms worden ze ook geclassificeerd als samenvattende statistieken.
De drie belangrijkste maten van centrale tendens zijn Gemiddelde , Mediaan en Modus Het zijn allemaal geldige maatstaven voor de centrale ligging, maar elk geeft een andere indicatie van een typische waarde, en onder verschillende omstandigheden zijn sommige maatstaven geschikter om te gebruiken dan andere.
Hoe het gemiddelde berekenen in Excel
Rekenkundig gemiddelde ook wel aangeduid als gemiddelde Het gemiddelde wordt berekend door een groep getallen op te tellen en de som te delen door het aantal getallen.
Om bijvoorbeeld het gemiddelde van de getallen {1, 2, 2, 3, 4, 6} te berekenen, tel je ze bij elkaar op, en deel je de som door 6, wat 3 oplevert: (1+2+2+3+4+6)/6=3.
In Microsoft Excel kan het gemiddelde worden berekend met een van de volgende functies:
- AVERAGE- geeft een gemiddelde van getallen.
- AVERAGEA - geeft een gemiddelde van cellen met willekeurige gegevens (getallen, Booleaanse en tekstwaarden).
- AVERAGEIF - vindt een gemiddelde van getallen op basis van een enkel criterium.
- AVERAGEIFS - vindt een gemiddelde van getallen op basis van meerdere criteria.
Volg voor de uitgebreide tutorials de bovenstaande links. Om een idee te krijgen van hoe deze functies werken, kunt u het volgende voorbeeld bekijken.
Stel dat u in een verkooprapport (zie de schermafbeelding hieronder) het gemiddelde wilt krijgen van de waarden in de cellen C2:C8. Gebruik daarvoor deze eenvoudige formule:
=GEMIDDELDE(C2:C8)
Om het gemiddelde te krijgen van alleen de "Bananen"-verkopen, gebruikt u een AVERAGEIF-formule:
=AVERAGEIF(A2:A8, "Banaan", C2:C8)
Om het gemiddelde te berekenen op basis van 2 voorwaarden, bijvoorbeeld het gemiddelde van "Bananen"-verkopen met de status "Geleverd", gebruikt u AVERAGEIFS:
=AVERAGEIFS(C2:C8,A2:A8, "Banaan", B2:B8, "Geleverd")
U kunt uw voorwaarden ook in afzonderlijke cellen invoeren, en naar die cellen verwijzen in uw formules, zoals dit:
Hoe de mediaan te vinden in Excel
Mediaan is de middelste waarde in een groep getallen, die in oplopende of aflopende volgorde zijn gerangschikt, d.w.z. de helft van de getallen is groter dan de mediaan en de helft van de getallen is kleiner dan de mediaan. Bijvoorbeeld, de mediaan van de gegevensverzameling {1, 2, 2, 3, 4, 6, 9} is 3.
Dit werkt prima als er een oneven aantal waarden in de groep zijn. Maar wat als u een zelfs aantal waarden? In dit geval is de mediaan het rekenkundig gemiddelde van de twee middelste waarden. Bijvoorbeeld, de mediaan van {1, 2, 2, 3, 4, 6} is 2,5. Om dit te berekenen, neem je de 3e en 4e waarde in de datareeks en neem je het gemiddelde om een mediaan van 2,5 te krijgen.
In Microsoft Excel wordt een mediaan berekend met behulp van de functie MEDIAAN. Om bijvoorbeeld de mediaan te krijgen van alle bedragen in ons verkooprapport, gebruiken we deze formule:
=MEDIAAN(C2:C8)
Om het voorbeeld illustratiever te maken, heb ik de getallen in kolom C oplopend gesorteerd (hoewel dat eigenlijk niet nodig is om de Excel Median-formule te laten werken):
In tegenstelling tot het gemiddelde biedt Microsoft Excel geen speciale functie om de mediaan te berekenen met een of meer voorwaarden. U kunt echter de functionaliteit van MEDIANIF en MEDIANIFS "emuleren" door een combinatie van twee of meer functies te gebruiken zoals in deze voorbeelden:
- MEDIAAN IF-formule (met één voorwaarde)
- MEDIAAN IFS-formule (met meerdere criteria)
Hoe de modus berekenen in Excel
Modus is de meest voorkomende waarde in de dataset. Terwijl het gemiddelde en de mediaan enkele berekeningen vereisen, kan een moduswaarde eenvoudig worden gevonden door het aantal keren dat elke waarde voorkomt te tellen.
Bijvoorbeeld, de modus van de verzameling waarden {1, 2, 2, 3, 4, 6} is 2. In Microsoft Excel kunt u een modus berekenen met behulp van de gelijknamige functie, de MODE-functie. Voor onze voorbeeldgegevensverzameling gaat de formule als volgt:
=MODE(C2:C8)
In situaties waarin er twee of meer modi in uw gegevensverzameling zijn, geeft de Excel MODE-functie de laagste modus .
Gemiddelde vs. mediaan: wat is beter?
In het algemeen is er geen "beste" maatstaf voor de centrale tendens. Welke maatstaf u moet gebruiken, hangt meestal af van het soort gegevens waarmee u werkt en van uw inzicht in de "typische waarde" die u probeert te schatten.
Voor een symmetrische verdeling (waarin waarden met regelmatige frequentie voorkomen) zijn het gemiddelde, de mediaan en de modus hetzelfde. Voor een scheef distributie (met een klein aantal extreem hoge of lage waarden) kunnen de drie maten van centrale tendens verschillend zijn.
Aangezien het gemiddelde sterk wordt beïnvloed door scheve gegevens en uitschieters (niet-typische waarden die significant verschillen van de rest van de gegevens), mediaan is de voorkeursmaatstaf voor de centrale tendens voor een asymmetrische verdeling .
Zo wordt algemeen aanvaard dat de mediaan beter is dan het gemiddelde voor de berekening van een typisch salaris Waarom? De beste manier om dit te begrijpen is aan de hand van een voorbeeld. Kijk eens naar een paar voorbeeldsalarissen voor gewone banen:
- Elektricien - $20/uur
- Verpleegster - $26/uur
- Politieagent - $47/uur
- Verkoopmanager - $54/uur
- Productie ingenieur - $63/uur
Laten we nu het gemiddelde berekenen: tel de bovenstaande cijfers op en deel ze door 5: (20+26+47+54+63)/5=42. Het gemiddelde loon is dus $42/uur. De mediaan is $47/uur, en het is de politieagent die dat verdient (1/2 loon is lager, en 1/2 hoger). Welnu, in dit specifieke geval geven het gemiddelde en de mediaan vergelijkbare cijfers.
Maar laten we eens kijken wat er gebeurt als we de lijst van lonen uitbreiden met een beroemdheid die bijvoorbeeld ongeveer 30 miljoen dollar per jaar verdient, dat is ongeveer 14.500 dollar per uur. Nu wordt het gemiddelde loon 2.451,67 dollar per uur, een loon dat niemand verdient! De mediaan daarentegen wordt niet wezenlijk veranderd door deze ene uitschieter, die is 50,50 dollar per uur.
Mee eens, de mediaan geeft een beter idee van wat mensen gewoonlijk verdienen omdat deze niet zo sterk wordt beïnvloed door abnormale salarissen.
Zo bereken je het gemiddelde, de mediaan en de modus in Excel. Ik dank u voor het lezen en hoop u volgende week op onze blog te zien!