Kako izračunati varijancu u Excelu – uzorak & formula varijance populacije

  • Podijeli Ovo
Michael Brown

U ovom vodiču ćemo pogledati kako napraviti analizu varijance u Excelu i koje formule koristiti za pronalaženje varijance uzorka i populacije.

Varijanca je jedan od najkorisnijih alati u teoriji vjerojatnosti i statistici. U znanosti opisuje koliko je svaki broj u skupu podataka udaljen od srednje vrijednosti. U praksi se često vidi koliko se nešto mijenja. Na primjer, temperatura u blizini ekvatora ima manju varijaciju nego u drugim klimatskim zonama. U ovom ćemo članku analizirati različite metode izračuna varijance u Excelu.

    Što je varijanca?

    Varijanca je mjera varijabilnosti skup podataka koji pokazuje koliko su različite vrijednosti raširene. Matematički se definira kao prosjek kvadrata razlika u odnosu na srednju vrijednost.

    Da biste bolje razumjeli što zapravo računate s varijancom, razmotrite ovaj jednostavan primjer.

    Pretpostavimo da postoji 5 tigrova u vašem lokalnom zoološkom vrtu koji su stari 14, 10, 8, 6 i 2 godine.

    Da biste pronašli varijancu, slijedite ove jednostavne korake:

    1. Izračunajte srednju vrijednost (jednostavni prosjek) od pet brojeva:

    2. Od svakog broja oduzmite srednju vrijednost da biste pronašli razlike. Da bismo to vizualizirali, iscrtajmo razlike na grafikonu:

    3. Svaku razliku kvadrirajte.
    4. Izračunajte prosjek kvadrata razlika.

    Dakle, varijanca je 16. Ali što znači ovaj brojzapravo znači?

    U stvari, varijanca vam samo daje vrlo općenitu ideju disperzije skupa podataka. Vrijednost 0 znači da nema varijabilnosti, tj. da su svi brojevi u skupu podataka isti. Što je veći broj, to su podaci više raspoređeni.

    Ovaj primjer je za varijancu populacije (tj. 5 tigrova je cijela grupa koja vas zanima). Ako su vaši podaci odabir iz veće populacije, tada trebate izračunati varijancu uzorka pomoću malo drugačije formule.

    Kako izračunati varijancu u Excelu

    Postoji 6 ugrađenih funkcija za izradu varijance u Excelu: VAR, VAR.S, VARP, VAR.P, VARA i VARPA.

    Vaš izbor formule varijance određen je sljedećim faktorima:

    • Verzija programa Excel koju koristite.
    • Izračunavate li varijancu uzorka ili populacije.
    • Želite li procijeniti ili zanemariti tekst i logičke vrijednosti.

    Funkcije varijance programa Excel

    Tablica u nastavku pruža pregled funkcija varijacije dostupnih u programu Excel kako bi vam pomogla da odaberete formulu koja najbolje odgovara vašim potrebama.

    Naziv Excel verzija Vrsta podataka Tekst i logika
    VAR 2000 - 2019 Uzorak Zanemaren
    VAR.S 2010. - 2019 Uzorak Zanemaren
    VARA 2000 -2019 Uzorak Procijenjeno
    VARP 2000 - 2019 Stanovništvo Zanemareno
    VAR.P 2010. - 2019 Stanovništvo Zanemareno
    VARPA 2000 - 2019 Stanovništvo Procijenjeno

    VAR.S u odnosu na VARA i VAR.P u odnosu na VARPA

    VARA i VARPA razlikuju se od drugih funkcija varijance samo u načinu na koji obrađuju logičke i tekstualne vrijednosti u referencama. Sljedeća tablica daje sažetak načina na koji se procjenjuju tekstualne reprezentacije brojeva i logičkih vrijednosti.

    Vrsta argumenta VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Logičke vrijednosti unutar nizova i referenci Zanemareno Procijenjeno

    (TRUE=1, FALSE=0)

    Tekstualne reprezentacije brojeva unutar nizova i referenci Zanemareno Procijenjeno kao nula
    Logično vrijednosti i tekstualni prikazi brojeva upisani izravno u argumente Procijenjeno

    (TRUE=1, FALSE=0)

    Prazne ćelije Zanemareno

    Kako izračunati varijancu uzorka u Excelu

    Uzorak je skup podataka izdvojenih iz cijele populacije. A varijanca izračunata iz uzorka naziva se varijanca uzorka .

    Na primjer, ako želite znati kako visine ljudi variraju, bilo bi tehnički neizvedivo da izmjerite svaku osobu na Zemlja.Rješenje je uzeti uzorak populacije, recimo 1000 ljudi, i procijeniti visinu cijele populacije na temelju tog uzorka.

    Varijanca uzorka izračunava se ovom formulom:

    Gdje je:

    • x̄ srednja vrijednost (jednostavni prosjek) vrijednosti uzorka.
    • n je veličina uzorka, tj. broj vrijednosti u uzorak.

    Postoje 3 funkcije za pronalaženje varijance uzorka u Excelu: VAR, VAR.S i VARA.

    VAR funkcija u Excelu

    Ona je najstarija Excel funkcija za procjenu varijance na temelju uzorka. Funkcija VAR dostupna je u svim verzijama programa Excel 2000 do 2019.

    VAR(broj1, [broj2], …)

    Napomena. U programu Excel 2010 funkcija VAR zamijenjena je funkcijom VAR.S koja pruža poboljšanu točnost. Iako je VAR još uvijek dostupan za kompatibilnost sa starijim verzijama, preporučuje se korištenje VAR.S u trenutnim verzijama Excela.

    Funkcija VAR.S u Excelu

    To je moderni pandan Excelu VAR funkcija. Koristite funkciju VAR.S za pronalaženje varijance uzorka u programu Excel 2010 i novijim verzijama.

    VAR.S(broj1, [broj2], …)

    Funkcija VARA u programu Excel

    Funkcija VARA programa Excel vraća uzorak varijance na temelju skupa brojeva, teksta i logičkih vrijednosti kao što je prikazano u ovoj tablici.

    VARA(vrijednost1, [vrijednost2], …)

    Uzorak formule varijance u Excelu

    Kada radite s numerički skup podataka možete koristiti bilo koju od gornjih funkcija za izračun varijance uzorkau Excelu.

    Kao primjer, pronađimo varijancu uzorka koji se sastoji od 6 stavki (B2:B7). Za ovo možete upotrijebiti jednu od sljedećih formula:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Kao što je prikazano na snimci zaslona, ​​sve formule vraćaju isti rezultat (zaokruženo na 2 decimalna mjesta):

    Da provjerimo rezultat, izvršimo izračun var ručno:

    1. Pronađite srednju vrijednost pomoću funkcija AVERAGE:

      =AVERAGE(B2:B7)

      Prosjek ide u bilo koju praznu ćeliju, recimo B8.

    2. Oduzmite prosjek od svakog broja u uzorku:

      =B2-$B$8

      Razlike idu u stupac C, počevši od C2.

    3. Kvadrirajte svaku razliku i stavite rezultate u stupac D, počevši od D2:

      =C2^2

    4. Zbrojite kvadrate razlika i podijelite rezultat s brojem stavke u uzorku minus 1:

      =SUM(D2:D7)/(6-1)

    Kao što vidite, rezultat našeg ručnog izračuna varijable potpuno je isti kao broj koji vraćaju ugrađene funkcije programa Excel:

    Ako vaš skup podataka sadrži Booleove i/ili tekstualne vrijednosti, funkcija VARA vratit će drugačiji rezultat. Razlog je taj što VAR i VAR.S ignoriraju sve vrijednosti osim brojeva u referencama, dok VARA procjenjuje tekstualne vrijednosti kao nule, TRUE kao 1, a FALSE kao 0. Dakle, pažljivo odaberite funkciju varijance za svoje izračune ovisno o tome jeste li želite obraditi ili zanemariti tekst i logike.

    Kakoizračunajte varijancu populacije u Excelu

    Stanovništvo su svi članovi dane grupe, tj. sva opažanja u području proučavanja. Varijanca populacije opisuje kako podaci pokazuju u cijeloj populacija je raširena.

    Varijanca populacije može se pronaći ovom formulom:

    Gdje je:

    • x̄ srednja vrijednost populacije.
    • n je veličina populacije, tj. ukupan broj vrijednosti u populaciji.

    Postoje 3 funkcije za izračunavanje varijance populacije u Excelu: VARP, VAR .P i VARPA.

    VARP funkcija u programu Excel

    Excel VARP funkcija vraća varijancu populacije na temelju cijelog skupa brojeva. Dostupan je u svim verzijama programa Excel 2000 do 2019.

    VARP(broj1, [broj2], …)

    Napomena. U Excelu 2010, VARP je zamijenjen s VAR.P, ali je i dalje zadržan radi kompatibilnosti sa starijim verzijama. Preporuča se korištenje VAR.P u trenutnim verzijama Excela jer nema jamstva da će funkcija VARP biti dostupna u budućim verzijama Excela.

    Funkcija VAR.P u Excelu

    To je poboljšana verzija funkcije VARP dostupna u programu Excel 2010 i novijim.

    VAR.P(broj1, [broj2], …)

    Funkcija VARPA u programu Excel

    Funkcija VARPA izračunava varijancu populacije na temelju cjelokupnog skupa brojeva, teksta i logičkih vrijednosti. Dostupan je u svim verzijama programa Excel 2000 do 2019.

    VARA(vrijednost1,[vrijednost2], …)

    Formula varijance populacije u Excelu

    U primjeru izračuna varijance uzorka pronašli smo varijancu od 5 ispitnih rezultata pod pretpostavkom da su ti rezultati bili izbor veće grupe studenata. Ako prikupite podatke o svim studentima u grupi, ti će podaci predstavljati cjelokupnu populaciju, a vi ćete izračunati varijancu populacije pomoću gornjih funkcija.

    Recimo, imamo rezultate ispita grupe od 10 studenata (B2:B11). Rezultati sačinjavaju cjelokupnu populaciju, tako da ćemo napraviti varijaciju ovim formulama:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    I sve formule će vratiti identičan rezultat:

    Kako biste bili sigurni da je Excel ispravno izvršio varijancu, možete to provjeriti pomoću formule za ručni izračun varijance prikazane na snimci zaslona u nastavku:

    Ako neki od studenata nije izašao na ispit i umjesto broja bodova ima N/A, funkcija VARPA vratit će drugačiji rezultat. Razlog je taj što VARPA procjenjuje tekstualne vrijednosti kao nule, dok VARP i VAR.P ignoriraju tekstualne i logičke vrijednosti u referencama. Molimo pogledajte VAR.P naspram VARPA za sve detalje.

    Formula varijance u Excelu - napomene o korištenju

    Da biste ispravno napravili analizu varijance u Excelu, molimo slijedite ova jednostavna pravila:

    • Navedite argumente kao vrijednosti, nizove ili reference ćelija.
    • U programu Excel 2007 i novijim verzijama možete unijeti do 255 argumenata koji odgovarajuuzorak ili populacija; u programu Excel 2003 i starijim - do 30 argumenata.
    • Za procjenu samo brojeva u referencama, zanemarujući prazne ćelije, tekst i logičke vrijednosti, koristite funkciju VAR ili VAR.S za izračunajte varijancu uzorka i VARP ili VAR.P za pronalaženje varijance populacije.
    • Za procjenu logičkih i tekstualnih vrijednosti u referencama koristite funkciju VARA ili VARPA.
    • Navedite najmanje dvije numeričke vrijednosti formuli varijance uzorka i najmanje jednu numeričku vrijednost formuli varijance populacije u Excelu, inače #DIV/0! dolazi do pogreške.
    • Argumenti koji sadrže tekst koji se ne može protumačiti kao brojevi uzrokuju #VALUE! pogreške.

    Varijanca u odnosu na standardnu ​​devijaciju u Excelu

    Varijanca je nedvojbeno koristan koncept u znanosti, ali daje vrlo malo praktičnih informacija. Na primjer, pronašli smo starost populacije tigrova u lokalnom zoološkom vrtu i izračunali varijancu, koja je jednaka 16. Pitanje je - kako zapravo možemo upotrijebiti ovaj broj?

    Možete upotrijebiti varijancu da biste izračunali standardna devijacija, što je mnogo bolja mjera količine varijacije u skupu podataka.

    Standardna devijacija izračunava se kao kvadratni korijen varijance. Dakle, uzimamo kvadratni korijen od 16 i dobivamo standardnu ​​devijaciju od 4.

    U kombinaciji sa srednjom, standardna devijacija vam može reći koliko je većina tigrova stara. Na primjer, akosrednja vrijednost je 8, a standardna devijacija je 4, većina tigrova u zoološkom vrtu je između 4 godine (8 - 4) i 12 godina (8 + 4).

    Microsoft Excel ima posebne funkcije za određivanje standardne devijacije uzorka i populacije. Detaljno objašnjenje svih funkcija može se pronaći u ovom vodiču: Kako izračunati standardnu ​​devijaciju u Excelu.

    Tako se radi varijanca u Excelu. Kako biste pobliže pogledali formule o kojima se govori u ovom vodiču, slobodno možete preuzeti naš primjer radne knjige na kraju ovog posta. Zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeći tjedan!

    Radna bilježnica

    Izračunaj varijancu u Excelu - primjeri (.xlsx datoteka)

    Michael Brown predani je tehnološki entuzijast sa strašću za pojednostavljivanjem složenih procesa pomoću softverskih alata. S više od desetljeća iskustva u tehnološkoj industriji, usavršio je svoje vještine u Microsoft Excelu i Outlooku, kao i Google tablicama i dokumentima. Michaelov blog posvećen je dijeljenju znanja i stručnosti s drugima, pružajući savjete i upute koje je lako slijediti za poboljšanje produktivnosti i učinkovitosti. Bez obzira jeste li iskusni profesionalac ili početnik, Michaelov blog nudi vrijedne uvide i praktične savjete za izvlačenje maksimuma iz ovih osnovnih softverskih alata.