Varianssin laskeminen Excelissä - otos & populaatiovarianssin kaava

  • Jaa Tämä
Michael Brown

Tässä opetusohjelmassa tarkastelemme, miten Excelissä tehdään varianssianalyysi ja mitä kaavoja käytetään otoksen ja populaation varianssin määrittämiseen.

Varianssi on yksi todennäköisyysteorian ja tilastotieteen hyödyllisimmistä työkaluista. Tieteessä se kuvaa, kuinka kaukana kukin luku aineistossa on keskiarvosta. Käytännössä se usein osoittaa, kuinka paljon jokin asia muuttuu. Esimerkiksi lämpötilalla päiväntasaajan läheisyydessä on vähemmän varianssia kuin muilla ilmastovyöhykkeillä. Tässä artikkelissa analysoimme erilaisia menetelmiä varianssin laskemiseen Excelissä.

    Mitä on varianssi?

    Poikkeama on tietokokonaisuuden vaihtelun mitta, joka osoittaa, kuinka paljon eri arvot ovat hajallaan. Matemaattisesti se määritellään keskiarvosta poikkeavien neliöerojen keskiarvona.

    Jotta ymmärtäisit paremmin, mitä varianssilla oikeastaan lasketaan, katso tätä yksinkertaista esimerkkiä.

    Oletetaan, että paikallisessa eläintarhassasi on viisi tiikeriä, jotka ovat 14, 10, 8, 6 ja 2-vuotiaita.

    Löydät varianssin noudattamalla seuraavia yksinkertaisia ohjeita:

    1. Laske viiden luvun keskiarvo (yksinkertainen keskiarvo):

    2. Vähennä jokaisesta luvusta keskiarvo, jotta saat erot selville. Havainnollistetaan tämä piirtämällä erot kaavioon:

    3. Neliöi jokainen ero.
    4. Laske neliöerojen keskiarvo.

    Poikkeama on siis 16. Mutta mitä tämä luku oikeastaan tarkoittaa?

    Todellisuudessa varianssi antaa vain hyvin yleisen käsityksen aineiston hajonnasta. Arvo 0 tarkoittaa, että vaihtelua ei ole, eli kaikki aineiston luvut ovat samanlaisia. Mitä suurempi luku on, sitä enemmän aineisto on hajallaan.

    Tämä esimerkki koskee populaatiovarianssia (eli 5 tiikeriä on koko ryhmä, josta olet kiinnostunut). Jos aineistosi on valinta suuremmasta populaatiosta, sinun on laskettava otosvarianssi hieman eri kaavalla.

    Miten lasketaan varianssi Excelissä

    Excelissä on kuusi sisäänrakennettua funktiota varianssin määrittämiseen: VAR, VAR.S, VARP, VAR.P, VARA ja VARPA.

    Varianssikaavan valinta riippuu seuraavista tekijöistä:

    • Käyttämäsi Excel-versio.
    • Lasketaanko otoksen vai populaation varianssi.
    • Haluatko arvioida vai jättää huomiotta teksti- ja loogiset arvot.

    Excelin varianssitoiminnot

    Alla olevassa taulukossa on yleiskatsaus Excelissä käytettävissä olevista muunnosfunktioista, jotta voit valita tarpeisiisi parhaiten sopivan kaavan.

    Nimi Excel-versio Tietotyyppi Teksti ja logiikat
    VAR 2000 - 2019 Näyte Ei huomioitu
    VAR.S 2010 - 2019 Näyte Ei huomioitu
    VARA 2000 - 2019 Näyte Arvioitu
    VARP 2000 - 2019 Väestö Ei huomioitu
    VAR.P 2010 - 2019 Väestö Ei huomioitu
    VARPA 2000 - 2019 Väestö Arvioitu

    VAR.S vs. VARA ja VAR.P vs. VARPA

    VARA ja VARPA eroavat muista varianssitoiminnoista vain siinä, miten ne käsittelevät loogisia ja tekstiarvoja viitteissä. Seuraavassa taulukossa on yhteenveto siitä, miten numeroiden ja loogisten arvojen tekstiedustukset arvioidaan.

    Argumentin tyyppi VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Loogiset arvot matriisien ja viittausten sisällä Ei huomioitu Arvioitu

    (TRUE=1, FALSE=0)

    Numeroiden tekstimuotoiset esitykset matriiseissa ja viittauksissa Ei huomioitu Arvioidaan nollaksi
    Loogiset arvot ja numeroiden tekstimuotoiset esitykset, jotka on kirjoitettu suoraan argumentteihin. Arvioitu

    (TRUE=1, FALSE=0)

    Tyhjät solut Ei huomioitu

    Otoksen varianssin laskeminen Excelissä

    A näyte on koko perusjoukosta poimittu aineistojoukko. Ja otoksesta laskettua varianssia sanotaan näytteen varianssi .

    Jos esimerkiksi halutaan tietää, miten ihmisten pituudet vaihtelevat, olisi teknisesti mahdotonta mitata kaikkia maapallon ihmisiä. Ratkaisu on ottaa otos väestöstä, esimerkiksi 1000 ihmistä, ja arvioida koko väestön pituudet otoksen perusteella.

    Otoksen varianssi lasketaan tällä kaavalla:

    Missä:

    • x̄ on otosarvojen keskiarvo (yksinkertainen keskiarvo).
    • n on otoskoko eli otoksen sisältämien arvojen lukumäärä.

    Excelissä on kolme funktiota otosvarianssin löytämiseksi: VAR, VAR.S ja VARA.

    VAR-toiminto Excelissä

    Se on vanhin Excel-funktio, jolla estimoidaan varianssia otokseen perustuen. VAR-funktio on käytettävissä kaikissa Excelin versioissa 2000-2019.

    VAR(numero1, [numero2], ...)

    Huomautus: Excel 2010:ssä VAR-funktio korvattiin VAR.S-toiminnolla, joka tarjoaa paremman tarkkuuden. Vaikka VAR on edelleen käytettävissä taaksepäin yhteensopivuuden vuoksi, on suositeltavaa käyttää VAR.S-toimintoa nykyisissä Excel-versioissa.

    VAR.S-toiminto Excelissä

    Se on nykyaikainen vastine Excelin VAR-funktiolle. Käytä VAR.S-funktiota otantavarianssin määrittämiseen Excel 2010:ssä ja uudemmissa ohjelmissa.

    VAR.S(numero1, [numero2], ...)

    VARA-toiminto Excelissä

    Excelin VARA-funktio palauttaa näytteen varianssista, joka perustuu numeroiden, tekstin ja loogisten arvojen joukkoon, kuten tässä taulukossa on esitetty.

    VARA(arvo1, [arvo2], ...)

    Esimerkki varianssikaavasta Excelissä

    Kun työskentelet numeeristen tietojen kanssa, voit käyttää mitä tahansa edellä mainittuja funktioita otantavarianssin laskemiseen Excelissä.

    Esimerkkinä on, että etsitään 6 kappaleesta (B2:B7) koostuvan otoksen varianssi. Tähän voit käyttää jotakin alla olevista kaavoista:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Kuten kuvakaappauksessa näkyy, kaikki kaavat antavat saman tuloksen (pyöristettynä kahteen desimaaliin):

    Tarkistetaan tulos tekemällä var-laskenta manuaalisesti:

    1. Etsi keskiarvo käyttämällä AVERAGE-funktiota:

      =KESKIARVO(B2:B7)

      Keskiarvo siirtyy mihin tahansa tyhjään soluun, esimerkiksi B8:aan.

    2. Vähennä keskiarvo jokaisesta otoksen luvusta:

      =B2-$B$8

      Erot siirretään sarakkeeseen C, alkaen sarakkeesta C2.

    3. Neliöi jokainen erotus ja siirrä tulokset sarakkeeseen D, alkaen D2:sta:

      =C2^2

    4. Laske yhteen neliöerot ja jaa tulos otoksen kohteiden lukumäärällä miinus 1:

      =SUMMA(D2:D7)/(6-1)

    Kuten näet, manuaalisen var-laskennan tulos on täsmälleen sama kuin Excelin sisäänrakennettujen funktioiden palauttama luku:

    Jos aineistosi sisältää Boolean ja/tai teksti arvot, VARA-funktio palauttaa eri tuloksen. Syynä on se, että VAR ja VAR.S eivät huomioi muita arvoja kuin numeroita viittauksissa, kun taas VARA arvioi tekstiarvot nollina, TRUE arvona 1 ja FALSE arvona 0. Valitse siis varianssifunktio laskelmissasi huolellisesti sen mukaan, haluatko käsitellä vai jättää huomiotta tekstiä ja loogisia arvoja.

    Kuinka laskea populaation varianssi Excelissä

    Väestö on kaikki tietyn ryhmän jäsenet, eli kaikki havainnot tutkimusalueella. Väestön varianssi kuvaa, miten koko populaation datapisteet jakautuvat.

    Populaation varianssi voidaan määrittää tällä kaavalla:

    Missä:

    • x̄ on populaation keskiarvo.
    • n on populaation koko eli populaatiossa olevien arvojen kokonaismäärä.

    Excelissä on kolme funktiota populaatiovarianssin laskemiseen: VARP, VAR.P ja VARPA.

    VARP-toiminto Excelissä

    Excelin VARP-funktio palauttaa perusjoukon varianssin koko lukujoukon perusteella. Se on käytettävissä kaikissa Excelin versioissa 2000-2019.

    VARP(numero1, [numero2], ...)

    Huomautus: Excel 2010:ssä VARP korvattiin VAR.P:llä, mutta se säilytetään edelleen taaksepäin yhteensopivuuden vuoksi. On suositeltavaa käyttää VAR.P:tä nykyisissä Excel-versioissa, koska ei ole mitään takeita siitä, että VARP-toiminto on käytettävissä tulevissa Excel-versioissa.

    VAR.P-toiminto Excelissä

    Se on parannettu versio Excel 2010:ssä ja sitä uudemmissa versioissa käytettävissä olevasta VARP-toiminnosta.

    VAR.P(numero1, [numero2], ...)

    VARPA-toiminto Excelissä

    VARPA-funktio laskee perusjoukon varianssin, joka perustuu numeroiden, tekstin ja loogisten arvojen kokonaisuuteen. Se on käytettävissä kaikissa Excel 2000-2019 -versioissa.

    VARA(arvo1, [arvo2], ...)

    Väestön varianssin kaava Excelissä

    Esimerkin varianssilaskentaesimerkissä löysimme viiden koepistemäärän varianssin olettaen, että kyseiset pisteet olivat valinta suuremmasta opiskelijaryhmästä. Jos keräät tietoja kaikista ryhmän opiskelijoista, nämä tiedot edustavat koko perusjoukkoa, ja voit laskea perusjoukon varianssin käyttämällä edellä mainittuja funktioita.

    Oletetaan, että meillä on 10 opiskelijan ryhmän (B2:B11) tenttipisteet. Pisteet muodostavat koko perusjoukon, joten teemme varianssin näillä kaavoilla:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    Ja kaikki kaavat palauttavat identtisen tuloksen:

    Jos haluat varmistaa, että Excel on tehnyt varianssin oikein, voit tarkistaa sen alla olevassa kuvakaappauksessa näkyvän manuaalisen varianssin laskentakaavan avulla:

    Jos osa opiskelijoista ei osallistunut kokeeseen ja heillä on pistenumeron sijasta N/A, VARPA-funktio palauttaa erilaisen tuloksen. Syynä on se, että VARPA arvioi tekstiarvot nollina, kun taas VARP ja VAR.P eivät huomioi teksti- ja loogisia arvoja viitteissä. Katso lisätietoja kohdasta VAR.P vs. VARPA.

    Varianssin kaava Excelissä - käyttöohjeet

    Jos haluat tehdä varianssianalyysin Excelissä oikein, noudata näitä yksinkertaisia sääntöjä:

    • Anna argumentit arvoina, malleina tai soluviittauksina.
    • Excel 2007:ssä ja sitä uudemmissa versioissa voit antaa enintään 255 argumenttia, jotka vastaavat otosta tai populaatiota; Excel 2003:ssa ja sitä vanhemmissa versioissa - enintään 30 argumenttia.
    • Arvioida vain numerot käyttämällä VAR- tai VAR.S-funktiota otosvarianssin laskemiseen ja VARP- tai VAR.P-funktiota populaatiovarianssin määrittämiseen, kun viitteissä ei oteta huomioon tyhjiä soluja, tekstiä ja loogisia arvoja.
    • Arvioida looginen ja teksti arvot viitteissä, käytä VARA- tai VARPA-funktiota.
    • Tarjota vähintään kaksi numeerista arvoa otoksen varianssikaavaan ja vähintään yksi numeerinen arvo Excelissä olevaan populaatiovarianssin kaavaan, muuten tulee virhe #DIV/0!.
    • Argumentit, jotka sisältävät tekstiä, jota ei voida tulkita numeroiksi, aiheuttavat #VALUE! -virheitä.

    Varianssi vs. keskihajonta Excelissä

    Varianssi on epäilemättä hyödyllinen käsite luonnontieteissä, mutta se antaa hyvin vähän käytännön tietoa. Löysimme esimerkiksi paikallisen eläintarhan tiikeripopulaation iät ja laskimme varianssin, joka on 16. Kysymys kuuluu: miten voimme käyttää tätä lukua?

    Voit käyttää varianssia keskihajonnan laskemiseen, joka on paljon parempi mittari vaihtelun määrän mittaamiseen tietosarjassa.

    Keskihajonta lasketaan varianssin neliöjuurena. Otetaan siis neliöjuuri 16:sta ja saadaan keskihajonnaksi 4.

    Yhdessä keskiarvon kanssa keskihajonta voi kertoa, kuinka vanhoja suurin osa tiikereistä on. Jos keskiarvo on esimerkiksi 8 ja keskihajonta 4, suurin osa eläintarhan tiikereistä on iältään 4-vuotiaita (8 - 4) ja 12-vuotiaita (8 + 4).

    Microsoft Excelissä on erityisiä funktioita otoksen ja perusjoukon keskihajonnan laskemiseen. Kaikkien funktioiden yksityiskohtainen selitys on tässä opetusohjelmassa: Keskihajonnan laskeminen Excelissä.

    Näin varianssi tehdään Excelissä. Jos haluat tutustua tarkemmin tässä ohjeessa käsiteltyihin kaavoihin, voit ladata esimerkkityökirjan tämän viestin lopussa. Kiitos lukemisesta ja toivottavasti tapaamme blogissamme ensi viikolla!

    Harjoitustyökirja

    Varianssin laskeminen Excelissä - esimerkkejä (.xlsx-tiedosto)

    Michael Brown on omistautunut teknologian harrastaja, jolla on intohimo yksinkertaistaa monimutkaisia ​​prosesseja ohjelmistotyökalujen avulla. Yli vuosikymmenen kokemuksella teknologia-alalta hän on hionut taitojaan Microsoft Excelissä ja Outlookissa sekä Google Sheetsissä ja Docsissa. Michaelin blogi on omistettu jakamaan tietojaan ja asiantuntemustaan ​​muiden kanssa, ja se tarjoaa helposti seurattavia vinkkejä ja opetusohjelmia tuottavuuden ja tehokkuuden parantamiseksi. Olitpa kokenut ammattilainen tai aloittelija, Michaelin blogi tarjoaa arvokkaita oivalluksia ja käytännön neuvoja, joiden avulla saat kaiken irti näistä tärkeistä ohjelmistotyökaluista.