Sadržaj
U ovom vodiču ćemo pogledati kako napraviti analizu varijance u Excelu i koje formule koristiti za pronalaženje varijance uzorka i populacije.
Varijanca je jedan od najkorisnijih alati u teoriji vjerojatnosti i statistici. U znanosti opisuje koliko je svaki broj u skupu podataka udaljen od srednje vrijednosti. U praksi se često vidi koliko se nešto mijenja. Na primjer, temperatura u blizini ekvatora ima manju varijaciju nego u drugim klimatskim zonama. U ovom ćemo članku analizirati različite metode izračuna varijance u Excelu.
Što je varijanca?
Varijanca je mjera varijabilnosti skup podataka koji pokazuje koliko su različite vrijednosti raširene. Matematički se definira kao prosjek kvadrata razlika u odnosu na srednju vrijednost.
Da biste bolje razumjeli što zapravo računate s varijancom, razmotrite ovaj jednostavan primjer.
Pretpostavimo da postoji 5 tigrova u vašem lokalnom zoološkom vrtu koji su stari 14, 10, 8, 6 i 2 godine.
Da biste pronašli varijancu, slijedite ove jednostavne korake:
- Izračunajte srednju vrijednost (jednostavni prosjek) od pet brojeva:
- Od svakog broja oduzmite srednju vrijednost da biste pronašli razlike. Da bismo to vizualizirali, iscrtajmo razlike na grafikonu:
- Svaku razliku kvadrirajte.
- Izračunajte prosjek kvadrata razlika.
Dakle, varijanca je 16. Ali što znači ovaj brojzapravo znači?
U stvari, varijanca vam samo daje vrlo općenitu ideju disperzije skupa podataka. Vrijednost 0 znači da nema varijabilnosti, tj. da su svi brojevi u skupu podataka isti. Što je veći broj, to su podaci više raspoređeni.
Ovaj primjer je za varijancu populacije (tj. 5 tigrova je cijela grupa koja vas zanima). Ako su vaši podaci odabir iz veće populacije, tada trebate izračunati varijancu uzorka pomoću malo drugačije formule.
Kako izračunati varijancu u Excelu
Postoji 6 ugrađenih funkcija za izradu varijance u Excelu: VAR, VAR.S, VARP, VAR.P, VARA i VARPA.
Vaš izbor formule varijance određen je sljedećim faktorima:
- Verzija programa Excel koju koristite.
- Izračunavate li varijancu uzorka ili populacije.
- Želite li procijeniti ili zanemariti tekst i logičke vrijednosti.
Funkcije varijance programa Excel
Tablica u nastavku pruža pregled funkcija varijacije dostupnih u programu Excel kako bi vam pomogla da odaberete formulu koja najbolje odgovara vašim potrebama.
Naziv | Excel verzija | Vrsta podataka | Tekst i logika |
VAR | 2000 - 2019 | Uzorak | Zanemaren |
VAR.S | 2010. - 2019 | Uzorak | Zanemaren |
VARA | 2000 -2019 | Uzorak | Procijenjeno |
VARP | 2000 - 2019 | Stanovništvo | Zanemareno |
VAR.P | 2010. - 2019 | Stanovništvo | Zanemareno |
VARPA | 2000 - 2019 | Stanovništvo | Procijenjeno |
VAR.S u odnosu na VARA i VAR.P u odnosu na VARPA
VARA i VARPA razlikuju se od drugih funkcija varijance samo u načinu na koji obrađuju logičke i tekstualne vrijednosti u referencama. Sljedeća tablica daje sažetak načina na koji se procjenjuju tekstualne reprezentacije brojeva i logičkih vrijednosti.
Vrsta argumenta | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Logičke vrijednosti unutar nizova i referenci | Zanemareno | Procijenjeno (TRUE=1, FALSE=0) |
Tekstualne reprezentacije brojeva unutar nizova i referenci | Zanemareno | Procijenjeno kao nula |
Logično vrijednosti i tekstualni prikazi brojeva upisani izravno u argumente | Procijenjeno (TRUE=1, FALSE=0) | |
Prazne ćelije | Zanemareno |
Kako izračunati varijancu uzorka u Excelu
Uzorak je skup podataka izdvojenih iz cijele populacije. A varijanca izračunata iz uzorka naziva se varijanca uzorka .
Na primjer, ako želite znati kako visine ljudi variraju, bilo bi tehnički neizvedivo da izmjerite svaku osobu na Zemlja.Rješenje je uzeti uzorak populacije, recimo 1000 ljudi, i procijeniti visinu cijele populacije na temelju tog uzorka.
Varijanca uzorka izračunava se ovom formulom:
Gdje je:
- x̄ srednja vrijednost (jednostavni prosjek) vrijednosti uzorka.
- n je veličina uzorka, tj. broj vrijednosti u uzorak.
Postoje 3 funkcije za pronalaženje varijance uzorka u Excelu: VAR, VAR.S i VARA.
VAR funkcija u Excelu
Ona je najstarija Excel funkcija za procjenu varijance na temelju uzorka. Funkcija VAR dostupna je u svim verzijama programa Excel 2000 do 2019.
VAR(broj1, [broj2], …)Napomena. U programu Excel 2010 funkcija VAR zamijenjena je funkcijom VAR.S koja pruža poboljšanu točnost. Iako je VAR još uvijek dostupan za kompatibilnost sa starijim verzijama, preporučuje se korištenje VAR.S u trenutnim verzijama Excela.
Funkcija VAR.S u Excelu
To je moderni pandan Excelu VAR funkcija. Koristite funkciju VAR.S za pronalaženje varijance uzorka u programu Excel 2010 i novijim verzijama.
VAR.S(broj1, [broj2], …)Funkcija VARA u programu Excel
Funkcija VARA programa Excel vraća uzorak varijance na temelju skupa brojeva, teksta i logičkih vrijednosti kao što je prikazano u ovoj tablici.
VARA(vrijednost1, [vrijednost2], …)Uzorak formule varijance u Excelu
Kada radite s numerički skup podataka možete koristiti bilo koju od gornjih funkcija za izračun varijance uzorkau Excelu.
Kao primjer, pronađimo varijancu uzorka koji se sastoji od 6 stavki (B2:B7). Za ovo možete upotrijebiti jednu od sljedećih formula:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Kao što je prikazano na snimci zaslona, sve formule vraćaju isti rezultat (zaokruženo na 2 decimalna mjesta):
Da provjerimo rezultat, izvršimo izračun var ručno:
- Pronađite srednju vrijednost pomoću funkcija AVERAGE:
=AVERAGE(B2:B7)
Prosjek ide u bilo koju praznu ćeliju, recimo B8.
- Oduzmite prosjek od svakog broja u uzorku:
=B2-$B$8
Razlike idu u stupac C, počevši od C2.
- Kvadrirajte svaku razliku i stavite rezultate u stupac D, počevši od D2:
=C2^2
- Zbrojite kvadrate razlika i podijelite rezultat s brojem stavke u uzorku minus 1:
=SUM(D2:D7)/(6-1)
Kao što vidite, rezultat našeg ručnog izračuna varijable potpuno je isti kao broj koji vraćaju ugrađene funkcije programa Excel:
Ako vaš skup podataka sadrži Booleove i/ili tekstualne vrijednosti, funkcija VARA vratit će drugačiji rezultat. Razlog je taj što VAR i VAR.S ignoriraju sve vrijednosti osim brojeva u referencama, dok VARA procjenjuje tekstualne vrijednosti kao nule, TRUE kao 1, a FALSE kao 0. Dakle, pažljivo odaberite funkciju varijance za svoje izračune ovisno o tome jeste li želite obraditi ili zanemariti tekst i logike.
Kakoizračunajte varijancu populacije u Excelu
Stanovništvo su svi članovi dane grupe, tj. sva opažanja u području proučavanja. Varijanca populacije opisuje kako podaci pokazuju u cijeloj populacija je raširena.
Varijanca populacije može se pronaći ovom formulom:
Gdje je:
- x̄ srednja vrijednost populacije.
- n je veličina populacije, tj. ukupan broj vrijednosti u populaciji.
Postoje 3 funkcije za izračunavanje varijance populacije u Excelu: VARP, VAR .P i VARPA.
VARP funkcija u programu Excel
Excel VARP funkcija vraća varijancu populacije na temelju cijelog skupa brojeva. Dostupan je u svim verzijama programa Excel 2000 do 2019.
VARP(broj1, [broj2], …)Napomena. U Excelu 2010, VARP je zamijenjen s VAR.P, ali je i dalje zadržan radi kompatibilnosti sa starijim verzijama. Preporuča se korištenje VAR.P u trenutnim verzijama Excela jer nema jamstva da će funkcija VARP biti dostupna u budućim verzijama Excela.
Funkcija VAR.P u Excelu
To je poboljšana verzija funkcije VARP dostupna u programu Excel 2010 i novijim.
VAR.P(broj1, [broj2], …)Funkcija VARPA u programu Excel
Funkcija VARPA izračunava varijancu populacije na temelju cjelokupnog skupa brojeva, teksta i logičkih vrijednosti. Dostupan je u svim verzijama programa Excel 2000 do 2019.
VARA(vrijednost1,[vrijednost2], …)Formula varijance populacije u Excelu
U primjeru izračuna varijance uzorka pronašli smo varijancu od 5 ispitnih rezultata pod pretpostavkom da su ti rezultati bili izbor veće grupe studenata. Ako prikupite podatke o svim studentima u grupi, ti će podaci predstavljati cjelokupnu populaciju, a vi ćete izračunati varijancu populacije pomoću gornjih funkcija.
Recimo, imamo rezultate ispita grupe od 10 studenata (B2:B11). Rezultati sačinjavaju cjelokupnu populaciju, tako da ćemo napraviti varijaciju ovim formulama:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
I sve formule će vratiti identičan rezultat:
Kako biste bili sigurni da je Excel ispravno izvršio varijancu, možete to provjeriti pomoću formule za ručni izračun varijance prikazane na snimci zaslona u nastavku:
Ako neki od studenata nije izašao na ispit i umjesto broja bodova ima N/A, funkcija VARPA vratit će drugačiji rezultat. Razlog je taj što VARPA procjenjuje tekstualne vrijednosti kao nule, dok VARP i VAR.P ignoriraju tekstualne i logičke vrijednosti u referencama. Molimo pogledajte VAR.P naspram VARPA za sve detalje.
Formula varijance u Excelu - napomene o korištenju
Da biste ispravno napravili analizu varijance u Excelu, molimo slijedite ova jednostavna pravila:
- Navedite argumente kao vrijednosti, nizove ili reference ćelija.
- U programu Excel 2007 i novijim verzijama možete unijeti do 255 argumenata koji odgovarajuuzorak ili populacija; u programu Excel 2003 i starijim - do 30 argumenata.
- Za procjenu samo brojeva u referencama, zanemarujući prazne ćelije, tekst i logičke vrijednosti, koristite funkciju VAR ili VAR.S za izračunajte varijancu uzorka i VARP ili VAR.P za pronalaženje varijance populacije.
- Za procjenu logičkih i tekstualnih vrijednosti u referencama koristite funkciju VARA ili VARPA.
- Navedite najmanje dvije numeričke vrijednosti formuli varijance uzorka i najmanje jednu numeričku vrijednost formuli varijance populacije u Excelu, inače #DIV/0! dolazi do pogreške.
- Argumenti koji sadrže tekst koji se ne može protumačiti kao brojevi uzrokuju #VALUE! pogreške.
Varijanca u odnosu na standardnu devijaciju u Excelu
Varijanca je nedvojbeno koristan koncept u znanosti, ali daje vrlo malo praktičnih informacija. Na primjer, pronašli smo starost populacije tigrova u lokalnom zoološkom vrtu i izračunali varijancu, koja je jednaka 16. Pitanje je - kako zapravo možemo upotrijebiti ovaj broj?
Možete upotrijebiti varijancu da biste izračunali standardna devijacija, što je mnogo bolja mjera količine varijacije u skupu podataka.
Standardna devijacija izračunava se kao kvadratni korijen varijance. Dakle, uzimamo kvadratni korijen od 16 i dobivamo standardnu devijaciju od 4.
U kombinaciji sa srednjom, standardna devijacija vam može reći koliko je većina tigrova stara. Na primjer, akosrednja vrijednost je 8, a standardna devijacija je 4, većina tigrova u zoološkom vrtu je između 4 godine (8 - 4) i 12 godina (8 + 4).
Microsoft Excel ima posebne funkcije za određivanje standardne devijacije uzorka i populacije. Detaljno objašnjenje svih funkcija može se pronaći u ovom vodiču: Kako izračunati standardnu devijaciju u Excelu.
Tako se radi varijanca u Excelu. Kako biste pobliže pogledali formule o kojima se govori u ovom vodiču, slobodno možete preuzeti naš primjer radne knjige na kraju ovog posta. Zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeći tjedan!
Radna bilježnica
Izračunaj varijancu u Excelu - primjeri (.xlsx datoteka)