Indholdsfortegnelse
I denne vejledning lærer du, hvordan du laver et scatter plot i Excel for at skabe en grafisk repræsentation af to korrelerede datasæt.
Når du ser på to kolonner med kvantitative data i dit Excel-regneark, hvad ser du så? Bare to sæt tal. Hvis du vil se, hvordan de to sæt er relateret til hinanden, er spredningsdiagrammet det ideelle valg af graf til dette formål.
Spredningsdiagram i Excel
A spredningsdiagram (også kaldet en XY-diagram , eller spredningsdiagram ) er et todimensionelt diagram, der viser forholdet mellem to variabler.
I et spredningsdiagram er både den vandrette og den lodrette akse værdiakser, som viser numeriske data. Typisk er den uafhængige variabel på x-aksen og den afhængige variabel på y-aksen. Diagrammet viser værdier i skæringspunktet mellem x- og y-aksen, kombineret til enkelte datapunkter.
Hovedformålet med et spredningsdiagram er at vise, hvor stærk sammenhængen, eller korrelationen, mellem de to variabler er. Jo tættere datapunkterne falder langs en lige linje, jo højere er korrelationen.
Sådan arrangerer du data til et spredningsdiagram
Med en række indbyggede diagramskabeloner i Excel er det nemt at lave et spredningsdiagram med et par klik. Men først skal du arrangere dine kildedata korrekt.
Som allerede nævnt viser et spredningsdiagram to indbyrdes forbundne kvantitative variabler. Du indtaster altså to sæt numeriske data i to separate kolonner.
For at gøre det lettere at bruge uafhængig variabel skal være i venstre kolonne, da denne kolonne skal plottes på x-aksen. afhængig variabel (den, der påvirkes af den uafhængige variabel) skal være i den højre kolonnen, og den vil blive plottet på y-aksen.
Tip. Hvis din afhængige kolonne kommer før den uafhængige kolonne, og du ikke kan ændre dette i et regneark, kan du bytte x- og y-akse direkte i et diagram.
I vores eksempel skal vi visualisere forholdet mellem reklamebudgettet for en bestemt måned (uafhængig variabel) og antallet af solgte varer (afhængig variabel), så vi arrangerer dataene i overensstemmelse hermed:
Sådan oprettes et spredningsdiagram i Excel
Når kildedataene er organiseret korrekt, kan du lave et spredningsdiagram i Excel med disse to hurtige trin:
- Vælg to kolonner med numeriske data, herunder kolonneoverskrifterne. I vores tilfælde er det området C1:D13. Vælg ikke andre kolonner for at undgå at forvirre Excel.
- Gå til Indsat faneblad> Chats gruppe, skal du klikke på Spredning diagramikonet, og vælg den ønskede skabelon. Hvis du vil indsætte et klassisk spredningsdiagram, skal du klikke på det første miniaturebillede:
Spredningsdiagrammet vil straks blive indsat i dit regneark:
Du kan også tilpasse nogle elementer i din graf for at få den til at se smukkere ud og for at gøre sammenhængen mellem de to variabler tydeligere.
Typer af spredningsdiagrammer
Ud over det klassiske spredningsdiagram, der er vist i ovenstående eksempel, er der flere skabeloner til rådighed:
- Spredning med glatte linjer og markører
- Spredning med glatte linjer
- Spredning med lige linjer og markører
- Spredning med lige linjer
Spredning med linjer er bedst at bruge, når du har få datapunkter. Sådan kan du f.eks. repræsentere dataene for de første fire måneder ved at bruge et spredningsdiagram med glatte linjer og markører:
Excel XY-plot-skabelonerne kan også tegne hver variabel for sig Hertil skal du vælge 3 kolonner med data - den venstre kolonne med tekstværdier (etiketter) og de to kolonner med tal.
I vores eksempel repræsenterer de blå prikker reklameomkostninger, og de orange prikker repræsenterer de solgte varer:
Hvis du vil se alle tilgængelige spredningstyper på ét sted, skal du vælge dine data, klikke på Spredning (X, Y) ikonet på båndet, og klik derefter på Flere spredningsdiagrammer... Dette vil åbne Indsat diagram dialogboks med XY (spredning) type, og du skifter mellem de forskellige skabeloner øverst for at se, hvilken skabelon der giver den bedste grafiske repræsentation af dine data:
3D-spredningsdiagram
I modsætning til et klassisk XY-spredningsdiagram er et 3D-spredningsdiagram viser datapunkter på tre akser (x, y og z) for at vise sammenhængen mellem tre variabler. Derfor kaldes det ofte en XYZ-plot .
Desværre er der ingen måde at oprette et 3D-spredningsdiagram i Excel på, selv ikke i den nye version af Excel 2019. Hvis du har stærkt brug for denne diagramtype til din dataanalyse, kan du overveje at bruge et tredjepartsværktøj som plot.ly. Skærmbilledet nedenfor viser, hvilken slags 3D-spredningsdiagram dette værktøj kan tegne:
Spredningsdiagram og korrelation
For at kunne fortolke et spredningsdiagram korrekt skal du forstå, hvordan variablerne kan være forbundet med hinanden. Overordnet set findes der tre typer korrelation:
Positiv korrelation - Når x-variablen stiger, stiger y-variablen også. Et eksempel på en stærk positiv korrelation er den tid, som de studerende bruger på at studere, og deres karakterer.
Negativ korrelation - når x-variablen stiger, falder y-variablen. Der er en negativ sammenhæng mellem pjække og karakterer - når antallet af fravær stiger, falder eksamenskaraktererne.
Ingen sammenhæng - Der er ingen tydelig sammenhæng mellem de to variabler; prikkerne er spredt ud over hele diagramområdet. F.eks. synes elevernes højde og karakterer ikke at have nogen sammenhæng, da førstnævnte ikke påvirker sidstnævnte på nogen måde.
Tilpasning af XY-spredningsdiagram i Excel
Som med andre diagramtyper kan næsten alle elementer i et spredningsdiagram i Excel tilpasses. Du kan nemt ændre diagramtitlen, tilføje aksetitler, skjule gitterlinjerne, vælge dine egne diagramfarver og meget mere.
Nedenfor vil vi fokusere på nogle få tilpasninger, der er specifikke for et spredningsdiagram.
Juster akseskalaen (reducer hvidt mellemrum)
Hvis dine datapunkter er samlet i toppen, bunden, højre eller venstre side af grafen, kan du måske rydde op i den ekstra hvide plads.
Hvis du vil reducere afstanden mellem det første datapunkt og den lodrette akse og/eller mellem det sidste datapunkt og grafens højre kant, skal du udføre følgende trin:
- Højreklik på x-aksen, og klik på Format Axis...
- På den Format-akse ruden, indstiller du den ønskede Minimum og Maksimum grænser, hvor det er relevant.
- Derudover kan du ændre den Større enheder, der styrer afstanden mellem gitterlinjerne.
Nedenstående skærmbillede viser mine indstillinger:
Hvis du vil fjerne mellemrummet mellem datapunkterne og plotområdets øverste/nedre kant, skal du formatere den lodrette y-akse på samme måde.
Tilføj etiketter til datapunkterne i et spredningsdiagram
Når du opretter et spredningsdiagram med et relativt lille antal datapunkter, kan du måske ønske at mærke punkterne med navn for at gøre dit billede mere forståeligt. Her er hvordan du kan gøre dette:
- Vælg plottet, og klik på Diagramelementer knap.
- Afkryds de Datamærker feltet, klik på den lille sorte pil ved siden af, og klik derefter på Flere muligheder...
- På den Formater dataetiketter skal du skifte til ruden Indstillinger for etiketter fanen (den sidste), og konfigurer dine dataetiketter på denne måde:
- Vælg den Værdi fra celler feltet, og vælg derefter det område, hvorfra du vil trække dataetiketter (B2:B6 i vores tilfælde).
- Hvis du kun vil vise navnene, skal du fjerne markeringen X-værdi og/eller Y-værdi feltet for at fjerne de numeriske værdier fra etiketterne.
- Angiv etikettens position, Over datapunkter i vores eksempel.
Det var det! Alle datapunkter i vores Excel-spredningsdiagram er nu mærket med navn:
Tip: Sådan retter du overlappende etiketter
Når to eller flere datapunkter ligger meget tæt på hinanden, kan deres etiketter overlappe hinanden, som det er tilfældet med Jan og Mar For at løse dette skal du klikke på etiketterne og derefter klikke på den overlappende etiket, så kun denne etiket bliver valgt. Peg musemarkøren på den valgte etiket, indtil markøren ændres til en firesidet pil, og træk derefter etiketten til den ønskede position.
Resultatet er et flot Excel-spredningsdiagram med perfekt læselige etiketter:
Tilføj en tendenslinje og en ligning
For bedre at visualisere forholdet mellem de to variabler kan du tegne en tendenslinje i dit Excel-spredningsdiagram, også kaldet en linje af bedste tilpasning .
For at få det gjort skal du højreklikke på et datapunkt og vælge Tilføj Trendline... fra kontekstmenuen.
Excel tegner en linje så tæt som muligt på alle datapunkterne, så der er lige så mange punkter over som under linjen.
Derudover kan du vise den ligning for trendlinjen der matematisk beskriver forholdet mellem de to variabler. Kontroller i den forbindelse Visning af ligning på diagrammet feltet på den Format Trendline ruden, der skal vises i højre del af dit Excel-vindue, umiddelbart efter at du har tilføjet en trendlinje. Resultatet af disse manipulationer vil se ud som følger:
Det, du ser på skærmbilledet ovenfor, kaldes ofte for graf for lineær regression , og du kan finde de detaljerede retningslinjer for, hvordan du laver den her: Sådan laver du en lineær regressionsgraf i Excel.
Sådan skifter du X- og Y-akse i et spredningsdiagram
Som allerede nævnt viser et spredningsdiagram normalt den uafhængige variabel på den horisontale akse og den afhængige variabel på den vertikale akse. Hvis din graf er plottet anderledes, er det letteste at ændre det ved at bytte om på kildekolonnerne i dit regneark og derefter tegne diagrammet på ny.
Hvis det af en eller anden grund ikke er muligt at omarrangere kolonnerne, kan du skifte X- og Y-dataserie direkte på et diagram. Sådan gør du:
- Højreklik på en hvilken som helst akse, og klik på Vælg Data... i kontekstmenuen.
- I den Vælg datakilde dialogvinduet, skal du klikke på Rediger knap.
- Kopier Værdier i serie X til den Y-værdier i serien boks og omvendt.
Tip. Hvis du vil redigere indholdet af Serie felter, placer musemarkøren i feltet, og tryk på F2 .
- Klik på OK to gange for at lukke begge vinduer.
Som følge heraf vil dit Excel-spredningsdiagram gennemgå denne transformation:
Tip. Hvis du har brug for at finde et bestemt datapunkt i en graf, lærer du i denne vejledning, hvordan du finder, fremhæver og mærker et datapunkt i et spredningsdiagram.
Sådan opretter du et spredningsdiagram i Excel. I vores næste vejledning fortsætter vi med dette emne og viser, hvordan du hurtigt kan finde og fremhæve et bestemt datapunkt i et spredningsdiagram. Bliv på skærmen!