Hvordan beregne varians i Excel – eksempel & populasjonsvariansformel

  • Dele Denne
Michael Brown

I denne opplæringen vil vi se på hvordan du gjør variansanalyse i Excel og hvilke formler du skal bruke for å finne variansen til et utvalg og en populasjon.

Varians er en av de mest nyttige verktøy innen sannsynlighetsteori og statistikk. I vitenskapen beskriver det hvor langt hvert tall i datasettet er fra gjennomsnittet. I praksis viser det ofte hvor mye noe forandrer seg. For eksempel har temperatur nær ekvator mindre variasjon enn i andre klimasoner. I denne artikkelen vil vi analysere ulike metoder for å beregne varians i Excel.

    Hva er varians?

    Varians er målet for variabilitet av et datasett som angir hvor langt ulike verdier er spredt. Matematisk er det definert som gjennomsnittet av kvadrerte forskjeller fra gjennomsnittet.

    For bedre å forstå hva du faktisk beregner med variansen, bør du vurdere dette enkle eksemplet.

    Anta at det er 5 tigre i din lokale dyrehage som er 14, 10, 8, 6 og 2 år gamle.

    For å finne varians, følg disse enkle trinnene:

    1. Beregn gjennomsnittet (enkelt gjennomsnitt) av de fem tallene:

    2. Fra hvert tall trekker du gjennomsnittet for å finne forskjellene. For å visualisere dette, la oss plotte forskjellene på diagrammet:

    3. Kvadrater hver forskjell.
    4. Treg ut gjennomsnittet av kvadratiske forskjeller.

    Så, variansen er 16. Men hva betyr dette talletegentlig mener?

    I sannhet gir varians deg bare en veldig generell idé om spredningen av datasettet. En verdi på 0 betyr at det ikke er noen variasjon, det vil si at alle tallene i datasettet er like. Jo større tall, jo mer spredt er dataene.

    Dette eksemplet er for populasjonsvarians (dvs. 5 tigre er hele gruppen du er interessert i). Hvis dataene dine er et utvalg fra en større populasjon, må du beregne utvalgets varians ved å bruke en litt annen formel.

    Hvordan beregne variansen i Excel

    Det er 6 innebygde funksjoner å gjøre varians i Excel: VAR, VAR.S, VARP, VAR.P, VARA og VARPA.

    Ditt valg av variansformelen bestemmes av følgende faktorer:

    • Versjonen av Excel du bruker.
    • Enten du beregner utvalgs- eller populasjonsvarians.
    • Om du vil evaluere eller ignorere tekst og logiske verdier.

    Excel-avviksfunksjoner

    Tabellen nedenfor gir en oversikt over variantfunksjonene som er tilgjengelige i Excel for å hjelpe deg med å velge formelen som passer best for dine behov.

    Navn Excel-versjon Datatype Tekst og logikk
    VAR 2000 - 2019 Eksempel Ignorert
    VAR.S 2010 - 2019 Eksempel Ignorert
    VARA 2000 -2019 Utvalg Evaluert
    VARP 2000 - 2019 Befolkning Ignorert
    VAR.P 2010 - 2019 Befolkning Ignorert
    VARPA 2000 - 2019 Befolkning Evaluert

    VAR.S vs. VARA og VAR.P vs. VARPA

    VARA og VARPA skiller seg fra andre variansfunksjoner bare i måten de håndterer logiske verdier og tekstverdier i referanser. Følgende tabell gir et sammendrag av hvordan tekstrepresentasjoner av tall og logiske verdier evalueres.

    Argumenttype VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Logiske verdier i matriser og referanser Ignorert Evaluert

    (TRUE=1, FALSE=0)

    Tekstrepresentasjoner av tall i matriser og referanser Ignorert Evaluert som null
    Logisk verdier og tekstrepresentasjoner av tall skrevet direkte inn i argumenter Evaluert

    (TRUE=1, FALSE=0)

    Tomme celler Ignorert

    Hvordan beregne prøvevarians i Excel

    Et utvalg er et sett med data hentet fra hele populasjonen. Og variansen beregnet fra en prøve kalles sample varians .

    For eksempel, hvis du vil vite hvordan folks høyder varierer, ville det være teknisk umulig for deg å måle hver person på jord.Løsningen er å ta et utvalg av befolkningen, for eksempel 1000 personer, og estimere høyden til hele befolkningen basert på det utvalget.

    Utvalgsvariasjonen beregnes med denne formelen:

    Hvor:

    • x̄ er gjennomsnittet (enkelt gjennomsnitt) av prøveverdiene.
    • n er prøvestørrelsen, dvs. antall verdier i sample.

    Det er 3 funksjoner for å finne prøvevarians i Excel: VAR, VAR.S og VARA.

    VAR-funksjon i Excel

    Det er den eldste Excel-funksjon for å estimere varians basert på et utvalg. VAR-funksjonen er tilgjengelig i alle versjoner av Excel 2000 til 2019.

    VAR(nummer1, [nummer2], …)

    Merk. I Excel 2010 ble VAR-funksjonen erstattet med VAR.S som gir forbedret nøyaktighet. Selv om VAR fortsatt er tilgjengelig for bakoverkompatibilitet, anbefales det å bruke VAR.S i gjeldende versjoner av Excel.

    VAR.S-funksjonen i Excel

    Det er det moderne motstykket til Excel. VAR funksjon. Bruk VAR.S-funksjonen for å finne eksempelvarians i Excel 2010 og senere.

    VAR.S(nummer1, [tall2], …)

    VARA-funksjon i Excel

    Excel VARA-funksjonen returnerer en eksempelvarians basert på et sett med tall, tekst og logiske verdier som vist i denne tabellen.

    VARA(verdi1, [verdi2], …)

    Eksempelvariansformel i Excel

    Når du arbeider med et numerisk sett med data du kan bruke hvilken som helst av funksjonene ovenfor for å beregne prøvevariansi Excel.

    Som et eksempel, la oss finne variansen til en prøve som består av 6 elementer (B2:B7). For dette kan du bruke en av formlene nedenfor:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Som vist på skjermbildet, returnerer alle formlene samme resultat (avrundet til 2 desimaler):

    For å sjekke resultatet, la oss gjøre var-beregning manuelt:

    1. Finn gjennomsnittet ved å bruke AVERAGE-funksjonen:

      =AVERAGE(B2:B7)

      Gjennomsnittet går til en hvilken som helst tom celle, for eksempel B8.

    2. Strek gjennomsnittet fra hvert tall i utvalget:

      =B2-$B$8

      Forskjellene går til kolonne C, som begynner på C2.

    3. Kvadrar hver forskjell og legg resultatene til kolonne D, som begynner med D2:

      =C2^2

    4. Sett opp de kvadratiske forskjellene og del resultatet på antall elementer i prøven minus 1:

      =SUM(D2:D7)/(6-1)

    Som du kan se, er resultatet av vår manuelle var-beregning nøyaktig det samme som tallet returnert av Excels innebygde funksjoner:

    Hvis datasettet ditt inneholder boolske - og/eller tekst -verdier, vil VARA-funksjonen returnere et annet resultat. Årsaken er at VAR og VAR.S ignorerer andre verdier enn tall i referanser, mens VARA evaluerer tekstverdier som null, TRUE som 1 og FALSE som 0. Så vennligst velg variansfunksjonen for beregningene dine, avhengig av om du ønsker å behandle eller ignorere tekst og logikk.

    Hvordanberegne populasjonsvarians i Excel

    Befolkning er alle medlemmer av en gitt gruppe, dvs. alle observasjoner i studiefeltet. Befolkningsvarians beskriver hvordan data peker i hele populasjonen er spredt.

    Befolkningsvariasjonen kan finnes med denne formelen:

    Hvor:

    • x̄ er gjennomsnitt av populasjonen.
    • n er populasjonsstørrelsen, dvs. det totale antallet verdier i populasjonen.

    Det er 3 funksjoner for å beregne populasjonsvarians i Excel: VARP, VAR .P og VARPA.

    VARP-funksjon i Excel

    Excel-VARP-funksjonen returnerer variansen til en populasjon basert på hele settet med tall. Den er tilgjengelig i alle versjoner av Excel 2000 til 2019.

    VARP(nummer1, [nummer2], …)

    Merk. I Excel 2010 ble VARP erstattet med VAR.P, men beholdes fortsatt for bakoverkompatibilitet. Det anbefales å bruke VAR.P i gjeldende versjoner av Excel fordi det ikke er noen garanti for at VARP-funksjonen vil være tilgjengelig i fremtidige versjoner av Excel.

    VAR.P-funksjon i Excel

    Det er en forbedret versjon av VARP-funksjonen tilgjengelig i Excel 2010 og senere.

    VAR.P(nummer1, [nummer2], …)

    VARPA-funksjonen i Excel

    VARPA-funksjonen beregner variansen av en populasjon basert på hele settet med tall, tekst og logiske verdier. Den er tilgjengelig i alle versjoner av Excel 2000 til og med 2019.

    VARA(verdi1,[verdi2], …)

    Befolkningsavviksformel i Excel

    I beregningseksemplet med prøvevariasjon fant vi en varians på 5 eksamenspoeng, forutsatt at disse skårene var et utvalg fra en større gruppe studenter. Hvis du samler inn data om alle studentene i gruppen, vil disse dataene representere hele populasjonen, og du vil beregne en populasjonsvariasjon ved å bruke funksjonene ovenfor.

    La oss si at vi har eksamensresultatene til en gruppe av 10 elever (B2:B11). Poengsummene utgjør hele populasjonen, så vi vil gjøre varians med disse formlene:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    Og alle formlene vil returnere identisk resultat:

    For å sikre at Excel har gjort variansen riktig, kan du sjekke den med den manuelle var-beregningsformelen vist i skjermbildet nedenfor:

    Hvis noen av studentene ikke tok eksamen og har N/A i stedet for et poengnummer, vil VARPA-funksjonen returnere et annet resultat. Årsaken er at VARPA evaluerer tekstverdier som nuller mens VARP og VAR.P ignorerer tekst og logiske verdier i referanser. Vennligst se VAR.P vs. VARPA for fullstendige detaljer.

    Variansformel i Excel - bruksnotater

    For å gjøre variansanalyse i Excel riktig, følg disse enkle reglene:

    • Oppgi argumenter som verdier, matriser eller cellereferanser.
    • I Excel 2007 og nyere kan du oppgi opptil 255 argumenter som tilsvarer enutvalg eller populasjon; i Excel 2003 og eldre - opptil 30 argumenter.
    • For å evaluere bare tall i referanser, ignorere tomme celler, tekst og de logiske verdiene, bruk VAR- eller VAR.S-funksjonen for å beregn utvalgsvarians og VARP eller VAR.P for å finne populasjonsvarians.
    • For å evaluere logiske - og tekst -verdier i referanser, bruk VARA- eller VARPA-funksjonen.
    • Gi minst to numeriske verdier til en prøvevariansformel og minst én numerisk verdi til en populasjonsvariansformel i Excel, ellers en #DIV/0! feil oppstår.
    • Argumenter som inneholder tekst som ikke kan tolkes som tall forårsaker #VERDI! feil.

    Varians vs. standardavvik i Excel

    Varians er utvilsomt et nyttig konsept i vitenskapen, men det gir svært lite praktisk informasjon. For eksempel fant vi alderen på bestanden av tigere i en lokal dyrehage og beregnet variansen, som tilsvarer 16. Spørsmålet er - hvordan kan vi faktisk bruke dette tallet?

    Du kan bruke variansen for å regne ut standardavvik, som er et mye bedre mål på mengden variasjon i et datasett.

    Standardavvik beregnes som kvadratroten av variansen. Så vi tar kvadratroten av 16 og får standardavviket på 4.

    I kombinasjon med gjennomsnittet kan standardavviket fortelle deg hvor gamle de fleste tigrene er. For eksempel hvisgjennomsnittet er 8 og standardavviket er 4, flertallet av tigrene i dyrehagen er mellom 4 år (8 - 4) og 12 år (8 + 4).

    Microsoft Excel har spesielle funksjoner for å beregne standardavvik for et utvalg og en populasjon. Den detaljerte forklaringen av alle funksjonene finner du i denne opplæringen: Slik beregner du standardavvik i Excel.

    Slik gjør du varians i Excel. For å se nærmere på formlene som er diskutert i denne opplæringen, er du velkommen til å laste ned prøvearbeidsboken vår på slutten av dette innlegget. Jeg takker for at du leser og håper å se deg på bloggen vår neste uke!

    Øvningsarbeidsbok

    Beregn varians i Excel - eksempler (.xlsx-fil)

    Michael Brown er en dedikert teknologientusiast med en lidenskap for å forenkle komplekse prosesser ved hjelp av programvareverktøy. Med mer enn ti års erfaring i teknologibransjen, har han forbedret ferdighetene sine i Microsoft Excel og Outlook, samt Google Sheets og Docs. Michaels blogg er dedikert til å dele sin kunnskap og ekspertise med andre, og gir enkle å følge tips og veiledninger for å forbedre produktivitet og effektivitet. Enten du er en erfaren profesjonell eller nybegynner, tilbyr Michaels blogg verdifull innsikt og praktiske råd for å få mest mulig ut av disse viktige programvareverktøyene.