Inhoudsopgave
In deze handleiding leert u hoe u in Excel een scatterplot maakt om een grafische voorstelling te maken van twee gecorreleerde gegevensreeksen.
Wanneer u naar twee kolommen met kwantitatieve gegevens in uw Excel-spreadsheet kijkt, wat ziet u dan? Gewoon twee reeksen getallen. Wilt u zien hoe de twee reeksen aan elkaar gerelateerd zijn? De scatter plot is daarvoor de ideale grafiekkeuze.
Scatterplot in Excel
A spreidingsdiagram (ook wel een XY-grafiek of spreidingsdiagram ) is een tweedimensionale grafiek die het verband tussen twee variabelen weergeeft.
In een spreidingsdiagram zijn zowel de horizontale als de verticale assen waarde-assen die numerieke gegevens plotten. Typisch staat de onafhankelijke variabele op de x-as, en de afhankelijke variabele op de y-as. De grafiek toont waarden op het snijpunt van een x- en y-as, gecombineerd tot enkele gegevenspunten.
Het belangrijkste doel van een spreidingsdiagram is aan te tonen hoe sterk het verband, of de correlatie, tussen de twee variabelen is. Hoe strakker de gegevenspunten langs een rechte lijn vallen, hoe hoger de correlatie.
Hoe gegevens ordenen voor een staafdiagram
Met een verscheidenheid aan ingebouwde grafieksjablonen van Excel wordt het maken van een spreidingsdiagram een kwestie van een paar klikken. Maar eerst moet u uw brongegevens goed rangschikken.
Zoals reeds vermeld, geeft een spreidingsdiagram twee onderling verbonden kwantitatieve variabelen weer. U voert dus twee reeksen numerieke gegevens in twee afzonderlijke kolommen in.
Voor het gebruiksgemak is de onafhankelijk variabele moet in de links kolom als deze kolom zal worden uitgezet op de x-as. De afhankelijk variabele (degene die beïnvloed wordt door de onafhankelijke variabele) moet in de rechts kolom, en het wordt uitgezet op de y-as.
Tip: Als de afhankelijke kolom vóór de onafhankelijke kolom komt en u dit op geen enkele manier in een werkblad kunt veranderen, kunt u de x- en y-assen rechtstreeks in een grafiek verwisselen.
In ons voorbeeld gaan we het verband visualiseren tussen het reclamebudget voor een bepaalde maand (onafhankelijke variabele) en het aantal verkochte artikelen (afhankelijke variabele), dus ordenen we de gegevens dienovereenkomstig:
Een spreidingsdiagram maken in Excel
Als de brongegevens correct zijn georganiseerd, kan in Excel in twee snelle stappen een spreidingsdiagram worden gemaakt:
- Selecteer twee kolommen met numerieke gegevens, inclusief de kolomkoppen. In ons geval is dat het bereik C1:D13. Selecteer geen andere kolommen om verwarring in Excel te voorkomen.
- Ga naar de Inzet tab> Chats groep, klik op de Strooi grafiekpictogram, en selecteer de gewenste sjabloon. Om een klassieke strooigrafiek in te voegen, klikt u op de eerste miniatuur:
Het spreidingsdiagram wordt onmiddellijk ingevoegd in uw werkblad:
In principe kun je het werk als gedaan beschouwen. Of je kunt enkele elementen van je grafiek aanpassen om hem er mooier uit te laten zien en de correlatie tussen de twee variabelen duidelijker over te brengen.
Typen spreidingsdiagrammen
Naast de klassieke spreidingsplot in het bovenstaande voorbeeld zijn er nog een paar sjablonen beschikbaar:
- Strooien met vloeiende lijnen en stiften
- Strooien met vloeiende lijnen
- Strooien met rechte lijnen en markers
- Strooien met rechte lijnen
Strooien met lijnen kan het best worden gebruikt wanneer u weinig gegevenspunten hebt. Hier ziet u bijvoorbeeld hoe u de gegevens voor de eerste vier maanden kunt weergeven met behulp van de spreidingsgrafiek met vloeiende lijnen en markeringen:
De Excel XY-plotsjablonen kunnen ook het volgende tekenen elke variabele afzonderlijk Hiervoor moet u 3 kolommen met gegevens selecteren - de meest linkse kolom met tekstwaarden (labels), en de twee kolommen met getallen.
In ons voorbeeld stellen de blauwe punten de advertentiekosten voor, en de oranje punten de verkochte artikelen:
Om alle beschikbare scattertypes op één plaats te bekijken, selecteert u uw gegevens, klikt u op de knop Verspreiding (X, Y) pictogram op het lint, en klik dan op Meer spreidingsdiagrammen... Dit opent de Inlegkaart dialoogvenster met de XY (Scatter) type geselecteerd, en u schakelt tussen de verschillende sjablonen bovenaan om te zien welke de beste grafische weergave van uw gegevens biedt:
3D-plot
In tegenstelling tot een klassieke XY-strooitabel is een 3D-plot toont datapunten op drie assen (x, y en z) om het verband tussen drie variabelen weer te geven. Daarom wordt het vaak een XYZ-plot .
Helaas is er geen manier om een 3D-strooiagram te maken in Excel, zelfs niet in de nieuwe versie van Excel 2019. Als u dit grafiektype hard nodig hebt voor uw gegevensanalyse, overweeg dan het gebruik van een tool van derden, zoals plot.ly. De onderstaande schermafbeelding laat zien wat voor soort 3D-strooiagram deze tool kan tekenen:
Scatter grafiek en correlatie
Om de scatterplot correct te interpreteren, moet je begrijpen hoe de variabelen met elkaar in verband kunnen staan. Globaal bestaan er drie soorten correlatie:
Positieve correlatie - Naarmate de x-variabele toeneemt, neemt ook de y-variabele toe. Een voorbeeld van een sterke positieve correlatie is de hoeveelheid tijd die studenten besteden aan hun studie en hun cijfers.
Negatieve correlatie - naarmate de x-variabele toeneemt, neemt de y-variabele af. Spijbelen en cijfers zijn negatief gecorreleerd - naarmate het aantal absenties toeneemt, dalen de examencijfers.
Geen correlatie - er is geen duidelijk verband tussen de twee variabelen; de punten liggen verspreid over het hele grafiekgebied. Bijvoorbeeld, de lengte van de leerlingen en de cijfers lijken geen verband te hebben, aangezien de lengte van de leerlingen geen enkele invloed heeft op de cijfers van de leerlingen.
XY-scatterplot aanpassen in Excel
Net als bij andere grafiektypen is bijna elk element van een spreidingsgrafiek in Excel aanpasbaar. U kunt gemakkelijk de grafiektitel wijzigen, assentitels toevoegen, de rasterlijnen verbergen, uw eigen grafiekkleuren kiezen, en nog veel meer.
Hieronder zullen we ons concentreren op enkele aanpassingen die specifiek zijn voor een scatterplot.
Pas de asschaal aan (verminder de witruimte)
Als uw datapunten boven, onder, rechts of links in de grafiek zijn gegroepeerd, kunt u de extra witruimte opruimen.
Voer de volgende stappen uit om de ruimte tussen het eerste gegevenspunt en de verticale as en/of tussen het laatste gegevenspunt en de rechterrand van de grafiek te verkleinen:
- Rechtsklik op de x-as en klik op Formaat As...
- Op de Formaat As deelvenster, stel de gewenste Minimum en Maximum grenzen waar nodig.
- Bovendien kunt u de Grote eenheden die de afstand tussen de rasterlijnen bepalen.
Het onderstaande screenshot toont mijn instellingen:
Om de ruimte tussen de gegevenspunten en de boven- en onderrand van het plotgebied te verwijderen, maakt u de verticale y-as op soortgelijke wijze op.
Labels toevoegen aan punten van scatterplots
Wanneer u een strooigrafiek maakt met een relatief klein aantal datapunten, kunt u de punten een naam geven om de visualisatie begrijpelijker te maken. Hier ziet u hoe u dat kunt doen:
- Selecteer het perceel en klik op de Grafiekelementen knop.
- Vink de Gegevenslabels vakje, klik op het kleine zwarte pijltje ernaast, en dan op Meer opties...
- Op de Gegevenslabels opmaken deelvenster, schakel naar de Etiketopties tab (de laatste), en configureer zo uw gegevenslabels:
- Selecteer de Waarde Van Cellen en selecteer vervolgens het bereik waaruit u de gegevenslabels wilt halen (B2:B6 in ons geval).
- Als u alleen de namen wilt weergeven, wis dan de X Waarde en/of Y Waarde om de numerieke waarden uit de labels te verwijderen.
- Specificeer de positie van de etiketten, Boven datapunten in ons voorbeeld.
Dat is het! Alle gegevenspunten in onze Excel-grafiek hebben nu een naam:
Tip: Overlappende etiketten oplossen
Wanneer twee of meer datapunten zeer dicht bij elkaar liggen, kunnen hun labels elkaar overlappen, zoals het geval is met de Jan en Mar Om dit op te lossen klikt u op de labels, en vervolgens op het overlappende label, zodat alleen dat label geselecteerd wordt. Richt uw muiscursor op het geselecteerde label totdat de cursor verandert in de vierzijdige pijl, en sleep het label dan naar de gewenste positie.
Het resultaat is een mooie Excel-scatterplot met perfect leesbare labels:
Voeg een trendlijn en een vergelijking toe
Om het verband tussen de twee variabelen beter te visualiseren, kunt u een trendlijn tekenen in uw Excel-strooiagram, ook wel een best passende lijn .
Om dit te laten doen, klikt u met de rechtermuisknop op een gegevenspunt en kiest u Trendline toevoegen... uit het contextmenu.
Excel trekt een lijn zo dicht mogelijk bij alle gegevenspunten, zodat er evenveel punten boven als onder de lijn liggen.
Bovendien kunt u de vergelijking voor de trendlijn die de relatie tussen de twee variabelen wiskundig beschrijft. Controleer hiervoor de Vergelijking op grafiek weergeven vakje op de Formaat Trendline paneel dat moet verschijnen in het rechterdeel van uw Excel-venster onmiddellijk nadat u een trendlijn hebt toegevoegd. Het resultaat van deze manipulaties ziet er ongeveer zo uit:
Wat u in de bovenstaande schermafbeelding ziet, wordt vaak de lineaire regressie grafiek en de gedetailleerde richtlijnen voor het maken ervan vindt u hier: Hoe maak ik een lineaire regressiegrafiek in Excel?
Hoe de X- en Y-assen in een staafdiagram verwisselen
Zoals reeds vermeld, toont een scatter plot gewoonlijk de onafhankelijke variabele op de horizontale as en de afhankelijke variabele op de verticale as. Als uw grafiek anders is uitgezet, is de eenvoudigste oplossing de bronkolommen in uw werkblad te verwisselen, en vervolgens de grafiek opnieuw te tekenen.
Als het herschikken van de kolommen om een of andere reden niet mogelijk is, kunt u de X- en Y-gegevensreeksen rechtstreeks in een grafiek verwisselen. Hier ziet u hoe:
- Rechtsklik op een willekeurige as en klik op Selecteer gegevens... in het contextmenu.
- In de Selecteer gegevensbron dialoogvenster, klik op de Bewerk knop.
- Kopie Serie X waarden aan de Serie Y waarden doos en vice versa.
Tip. Om de inhoud van de Serie vakken, zet de muisaanwijzer in het vak en druk op F2 .
- Klik op OK twee keer om beide ramen te sluiten.
Het resultaat is dat uw Excel-scatterplot deze transformatie ondergaat:
Tip. Als u een specifiek gegevenspunt in een grafiek moet vinden, leert deze handleiding u hoe u een gegevenspunt in een scatterplot kunt vinden, markeren en labelen.
Zo maak je een scatter plot in Excel. In onze volgende tutorial gaan we verder met dit onderwerp en laten we zien hoe je snel een bepaald gegevenspunt kunt vinden en markeren in een scatter grafiek. Blijf kijken!