Innholdsfortegnelse
I denne opplæringen lærer du hvordan du lager et spredningsplott i Excel for å lage en grafisk representasjon av to korrelerte datasett.
Når du ser på to kolonner med kvantitative data i Excel-regnearket ditt, hva ser du? Bare to sett med tall. Vil du se hvordan de to settene er relatert til hverandre? Spredningsplottet er det ideelle grafvalget for dette.
Spredningsplott i Excel
Et spredningsplott (også kalt en XY graf , eller spredningsdiagram ) er et todimensjonalt diagram som viser forholdet mellom to variabler.
I en spredningsgraf er både horisontale og vertikale akser verdiakser som plotter numeriske data. Vanligvis er den uavhengige variabelen på x-aksen, og den avhengige variabelen på y-aksen. Diagrammet viser verdier i skjæringspunktet mellom en x- og y-akse, kombinert til enkeltdatapunkter.
Hovedformålet med et spredningsplott er å vise hvor sterk relasjonen, eller korrelasjonen, mellom de to variablene er. Jo tettere datapunktene faller langs en rett linje, jo høyere er korrelasjonen.
Hvordan ordne data for et punktdiagram
Med en rekke innebygde diagrammaler levert av Excel, blir det å lage et punktdiagram til en jobb med et par klikk. Men først må du ordne kildedataene dine riktig.
Som allerede nevnt, viser en spredningsgraf to innbyrdes relaterte kvantitativevariabler. Så du legger inn to sett med numeriske data i to separate kolonner.
For enkel bruk bør den uavhengige -variabelen være i venstre -kolonnen ettersom denne kolonnen er skal plottes på x-aksen. Den avhengige -variabelen (den som påvirkes av den uavhengige variabelen) skal være i høyre -kolonnen, og den vil bli plottet på y-aksen.
Tips. Hvis den avhengige kolonnen din kommer før den uavhengige kolonnen og det ikke er mulig å endre dette i et regneark, kan du bytte x- og y-aksene direkte på et diagram.
I vårt eksempel skal vi visualisere forholdet mellom annonsebudsjettet for en bestemt måned (uavhengig variabel) og antall solgte varer (avhengig variabel), så vi ordner dataene deretter:
Hvordan lage et spredningsplott i Excel
Med kildedataene riktig organisert tar det å lage et spredningsplott i Excel disse to raske trinnene:
- Velg to kolonner med numeriske data, inkludert kolonneoverskriftene. I vårt tilfelle er det området C1:D13. Ikke velg noen andre kolonner for å unngå å forvirre Excel.
- Gå til Innsetting -fanen > Chatter -gruppen, klikk på Scatter -diagramikonet , og velg ønsket mal. For å sette inn en klassisk spredningsgraf, klikk på det første miniatyrbildet:
Spredningsdiagrammet vil umiddelbart settes inn i regnearket ditt:
I utgangspunktet kan duvurdere arbeidet som er utført. Eller du kan tilpasse noen elementer i grafen din for å få den til å se vakrere ut og for å formidle sammenhengen mellom de to variablene klarere.
Spredningsdiagramtyper
I tillegg til det klassiske spredningsplottet vist i eksempelet ovenfor er noen flere maler tilgjengelige:
- Spredning med jevne linjer og markører
- Spredning med glatte linjer
- Spredning med rette linjer og markører
- Spredning med rette linjer
Spredning med linjer er best å bruke når du har få datapunkter. For eksempel, her er hvordan du kan representere dataene for de første fire månedene ved å bruke spredningsgrafen med jevne linjer og markører:
Excel XY-plottmalene kan også tegne hver variabel separat , presentere de samme relasjonene på en annen måte. For dette bør du velge 3 kolonner med data - kolonnen lengst til venstre med tekstverdier (etiketter), og de to kolonnene med tall.
I vårt eksempel representerer de blå prikkene annonseringskostnaden, og oransje prikker representerer solgte varer:
For å se alle tilgjengelige scatter-typer på ett sted, velg dataene dine, klikk på Scatter (X, Y) -ikonet på båndet, og klikk deretter More Scatter Diagrammer... Dette åpner dialogboksen Innsatt diagram med XY (Scatter) -typen valgt, og du bytter mellom de forskjellige malene øverst for å se hvilken som gir bestegrafisk representasjon av dataene dine:
3D-spredningsplott
I motsetning til et klassisk XY-spredningsdiagram, viser et 3D-spredningsplott datapunkter på tre akser (x, y og z) for å vise sammenhengen mellom tre variabler. Derfor kalles det ofte et XYZ-plott .
Dessverre er det ingen måte å lage et 3D-spredningsplott i Excel, selv i den nye versjonen av Excel 2019. Hvis du har sterkt behov for denne diagramtypen for dataanalysen din, bør du vurdere å bruke et tredjepartsverktøy, som plot.ly. Skjermbildet nedenfor viser hva slags 3D-spredningsgraf dette verktøyet kan tegne:
Spredningsgraf og korrelasjon
For å tolke spredningsplottet riktig, må du forstå hvordan variablene kan relateres til hver annen. Totalt sett finnes det tre typer korrelasjon:
Positiv korrelasjon - når x-variabelen øker, øker også y-variabelen. Et eksempel på en sterk positiv korrelasjon er hvor lang tid elevene bruker på å studere og karakterene deres.
Negativ korrelasjon - når x-variabelen øker, reduseres y-variabelen. Grøfteklasser og karakterer er negativt korrelert - ettersom antall fravær øker, reduseres eksamensskårene.
Ingen korrelasjon - det er ingen åpenbar sammenheng mellom de to variablene; prikkene er spredt rundt hele kartområdet. For eksempel ser det ut til at elevenes høyde og karakterer ikke har noen sammenhengda førstnevnte ikke påvirker sistnevnte på noen måte.
Tilpasse XY-spredningsplott i Excel
Som med andre diagramtyper, kan nesten hvert element i en spredningsgraf i Excel tilpasses. Du kan enkelt endre karttittelen, legge til aksetitler, skjule rutenettet, velge dine egne diagramfarger og mer.
Nedenfor vil vi fokusere på noen få tilpasninger som er spesifikke for et spredningsplott.
Juster akseskalaen (reduser mellomrom)
Hvis datapunktene dine er gruppert i toppen, bunnen, høyre eller venstre side av grafen, kan det være lurt å rydde opp i det ekstra hvite rommet.
For å redusere avstanden mellom det første datapunktet og den vertikale aksen og/eller mellom det siste datapunktet og høyre kant av grafen, utfør disse trinnene:
- Høyreklikk x-aksen, og klikk Formater akse...
- I ruten Formater akse angir du ønsket Minimum og Maksimum grenser etter behov.
- I tillegg kan du endre Major -enhetene som kontrollerer avstanden mellom rutenettene.
Skjermbildet nedenfor viser innstillingene mine:
For å fjerne mellomrom mellom datapunktene og topp-/nederkanten av plottområdet, formater den vertikale y-aksen i n på lignende måte.
Legg til etiketter for spredningsplottdatapunkter
Når du lager en spredningsgraf med et relativt lite antall datapunkter, kan det være lurt å merke punktene etter navn for å gjørevisuell bedre forståelig. Slik gjør du dette:
- Velg plottet og klikk på Kartelementer -knappen.
- Kryss av Dataetiketter -boksen , klikk på den lille svarte pilen ved siden av den, og klikk deretter Flere alternativer...
- I ruten Format dataetiketter bytter du til Etikettalternativer -kategorien (den siste), og konfigurer dataetikettene på denne måten:
- Velg boksen Verdi fra celler , og velg deretter område som du vil trekke dataetiketter fra (B2:B6 i vårt tilfelle).
- Hvis du bare vil vise navnene, fjerner du X-verdien og/eller Y-verdi -boksen for å fjerne de numeriske verdiene fra etikettene.
- Spesifiser etikettposisjonen, Over datapunkter i vårt eksempel.
Det var det! Alle datapunkter i Excel-spredningsplottet er nå merket med navn:
Tips: Slik fikser du overlappende etiketter
Når to eller flere datapunkter er svært nær hverandre, kan etikettene deres overlappe hverandre , som tilfellet er med Jan og Mar -etikettene i spredningsdiagrammet vårt. For å fikse dette, klikk på etikettene, og klikk deretter på den overlappende slik at bare den etiketten blir valgt. Pek med musepekeren på den valgte etiketten til markøren endres til den firesidige pilen, og dra deretter etiketten til ønsket posisjon.
Som et resultat vil du få et fint Excel-spredningsplott med perfekt lesbaretiketter:
Legg til en trendlinje og ligning
For bedre å visualisere forholdet mellom de to variablene, kan du tegne en trendlinje i Excel-spredningsgrafen, også kalt en linje av best passform .
For å få det gjort, høyreklikk på et datapunkt og velg Legg til trendlinje... fra hurtigmenyen.
Excel vil tegne en linje så nær alle datapunkter som mulig slik at det er så mange punkter over linjen som nedenfor.
I tillegg kan du vise ligningen for trendlinje som matematisk beskriver forholdet mellom de to variablene. For dette, merk av for Vis ligning på diagram i ruten Format trendlinje som skal vises i høyre del av Excel-vinduet umiddelbart etter at du har lagt til en trendlinje. Resultatet av disse manipulasjonene vil ligne dette:
Det du ser i skjermbildet ovenfor kalles ofte lineær regresjonsgrafen , og du kan finne de detaljerte retningslinjene for hvordan du oppretter den her: Hvordan lage en lineær regresjonsgraf i Excel.
Hvordan bytte X- og Y-akser i et spredningsdiagram
Som allerede nevnt, viser et spredningsplott vanligvis den uavhengige variabelen horisontalt aksen og den avhengige variabelen på den vertikale aksen. Hvis grafen din er plottet annerledes, er den enkleste løsningen å bytte kildekolonnene i regnearket og deretter tegne diagrammet på nytt.
Hvisav en eller annen grunn er det ikke mulig å omorganisere kolonnene, du kan bytte X- og Y-dataserier direkte på et diagram. Slik gjør du:
- Høyreklikk på hvilken som helst akse og klikk Velg data... i kontekstmenyen.
- I dialogvinduet Velg datakilde klikker du på Rediger -knappen.
- Kopier Serie X-verdier til Serie Y-verdier -boksen og omvendt.
Tips. For trygt å redigere innholdet i Serie boksene, plasser musepekeren i boksen og trykk F2 .
- Klikk OK to ganger for å lukke begge vinduene.
Som et resultat vil Excel-spredningsplottet gjennomgå denne transformasjonen:
Tips. Hvis du trenger å finne et spesifikt datapunkt i en graf, vil denne opplæringen lære deg hvordan du finner, markerer og merker et datapunkt i et spredningsplott.
Det er slik du lager et spredningsplott i Excel. I vår neste opplæring vil vi fortsette med dette emnet og vise hvordan du raskt finner og fremhever et bestemt datapunkt i en spredningsgraf. Følg med!