Sadržaj
U ovom vodiču ćemo pogledati kako napraviti analizu varijanse u Excelu i koje formule koristiti za pronalaženje varijanse uzorka i populacije.
Varijanca je jedna od najkorisnijih alati u teoriji vjerovatnoće i statistici. U nauci, on opisuje koliko je svaki broj u skupu podataka udaljen od srednje vrijednosti. U praksi se često pokazuje koliko se nešto mijenja. Na primjer, temperatura u blizini ekvatora ima manje varijacije nego u drugim klimatskim zonama. U ovom članku ćemo analizirati različite metode izračunavanja varijanse u Excel-u.
Šta je varijansa?
Varijanca je mjera varijabilnosti skup podataka koji pokazuje koliko su različite vrijednosti raširene. Matematički se definiše kao prosjek kvadratnih razlika od srednje vrijednosti.
Da biste bolje razumjeli šta zapravo izračunavate s varijansom, razmotrite ovaj jednostavan primjer.
Pretpostavimo da postoji 5 tigrovi u vašem lokalnom zoološkom vrtu koji su stari 14, 10, 8, 6 i 2 godine.
Da biste pronašli varijansu, slijedite ove jednostavne korake:
- Izračunajte srednju vrijednost (jednostavan prosjek) od pet brojeva:
- Od svakog broja oduzmite srednju vrijednost da biste pronašli razlike. Da bismo to vizualizirali, nacrtajmo razlike na grafikonu:
- Postavite svaku razliku na kvadrat.
- Razradite prosjek kvadratnih razlika.
Dakle, varijansa je 16. Ali šta znači ovaj brojzapravo znači?
U stvari, varijansa vam daje vrlo opštu ideju o disperziji skupa podataka. Vrijednost 0 znači da nema varijabilnosti, tj. da su svi brojevi u skupu podataka isti. Što je broj veći, podaci su rašireniji.
Ovaj primjer je za varijansu populacije (tj. 5 tigrova je cijela grupa koja vas zanima). Ako su vaši podaci izbor iz veće populacije, tada morate izračunati varijansu uzorka koristeći malo drugačiju formulu.
Kako izračunati varijansu u Excelu
Postoji 6 ugrađenih funkcija da napravite varijansu u Excelu: VAR, VAR.S, VARP, VAR.P, VARA i VARPA.
Vaš izbor formule varijance određen je sljedećim faktorima:
- Verzija Excel-a koju koristite.
- Bilo da izračunate varijansu uzorka ili populacije.
- Bilo da želite procijeniti ili zanemariti tekst i logičke vrijednosti.
Excel funkcije varijanse
Tabela u nastavku pruža pregled funkcija varijacije dostupnih u Excelu kako bi vam pomogla da odaberete formulu koja najbolje odgovara vašim potrebama.
Naziv | Excel verzija | Tip podataka | Tekst i logički |
VAR | 2000 - 2019 | Uzorak | Ignorirano |
VAR.S | 2010 - 2019 | Uzorak | Ignorirano |
VARA | 2000 -2019 | Uzorak | Procijenjeno |
VARP | 2000 - 2019 | Stanovništvo | Ignorirano |
VAR.P | 2010 - 2019 | Stanovništvo | Ignorirano |
VARPA | 2000 - 2019 | Stanovništvo | Procijenjeno |
VAR.S vs. VARA i VAR.P naspram VARPA
VARA i VARPA razlikuju se od drugih funkcija varijanse samo po načinu na koji rukuju logičkim i tekstualnim vrijednostima u referencama. Sljedeća tabela daje sažetak načina na koji se procjenjuju tekstualne reprezentacije brojeva i logičkih vrijednosti.
Tip argumenta | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Logičke vrijednosti unutar nizova i referenci | Ignorirano | Procijenjeno (TRUE=1, FALSE=0) Vidi_takođe: Excel DESNA funkcija s primjerima formule |
Tekstualni prikazi brojeva unutar nizova i referenci | Ignorirano | Ocijenjeno kao nula |
Logički vrijednosti i tekstualni prikazi brojeva ukucanih direktno u argumente | Procijenjeno (TRUE=1, FALSE=0) | |
Prazne ćelije | Ignorirano |
Kako izračunati varijansu uzorka u Excelu
A uzorak je skup podataka ekstrahiranih iz cijele populacije. A varijansa izračunata iz uzorka naziva se varijansa uzorka .
Na primjer, ako želite znati kako visina ljudi varira, bilo bi tehnički neizvodljivo da izmjerite svaku osobu na zemlja.Rješenje je uzeti uzorak populacije, recimo 1000 ljudi, i procijeniti visinu cijele populacije na osnovu tog uzorka.
Varijanca uzorka se izračunava po ovoj formuli:
Gdje je:
- x̄ srednja vrijednost (jednostavan prosjek) vrijednosti uzorka.
- n je veličina uzorka, tj. broj vrijednosti u sample.
Postoje 3 funkcije za pronalaženje varijance uzorka u Excelu: VAR, VAR.S i VARA.
VAR funkcija u Excelu
Ona je najstarija Excel funkcija za procjenu varijanse na osnovu uzorka. Funkcija VAR dostupna je u svim verzijama programa Excel 2000 do 2019.
VAR(broj1, [broj2], …)Napomena. U programu Excel 2010, funkcija VAR je zamijenjena sa VAR.S koja pruža poboljšanu preciznost. Iako je VAR još uvijek dostupan za kompatibilnost unatrag, preporučuje se korištenje VAR.S u trenutnim verzijama Excela.
VAR.S funkcija u Excelu
To je moderni pandan Excelu VAR funkcija. Koristite funkciju VAR.S da biste pronašli uzorak varijance u programu Excel 2010 i novijim.
VAR.S(broj1, [broj2], …)VARA funkcija u Excelu
Excel funkcija VARA vraća uzorak varijanse zasnovan na skupu brojeva, teksta i logičkih vrijednosti kao što je prikazano u ovoj tabeli.
VARA(value1, [value2], …)Primjer formule varijance u Excelu
Kada radite sa numerički skup podataka koji možete koristiti bilo koju od gore navedenih funkcija za izračunavanje varijanse uzorkau Excel-u.
Kao primjer, pronađimo varijansu uzorka koji se sastoji od 6 stavki (B2:B7). Za ovo možete koristiti jednu od sljedećih formula:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Kao što je prikazano na snimku ekrana, sve formule vraćaju isti rezultat (zaokružen na 2 decimale):
Da provjerimo rezultat, izvršimo ručno izračunavanje var:
- Pronađi srednju vrijednost koristeći funkcija AVERAGE:
=AVERAGE(B2:B7)
Prosjek ide u bilo koju praznu ćeliju, recimo B8.
- Oduzmite prosjek od svakog broja u uzorku:
=B2-$B$8
Razlike idu u kolonu C, počevši od C2.
- Kvadrirajte svaku razliku i stavite rezultate u kolonu D, počevši od D2:
=C2^2
- Zbrojite kvadratne razlike i podijelite rezultat s brojem stavke u uzorku minus 1:
=SUM(D2:D7)/(6-1)
Kao što vidite, rezultat našeg ručnog izračuna var je potpuno isti kao i broj koji vraćaju ugrađene funkcije Excela:
Ako vaš skup podataka sadrži vrijednosti Boolean i/ili text , funkcija VARA će vratiti drugačiji rezultat. Razlog je taj što VAR i VAR.S zanemaruju sve vrijednosti osim brojeva u referencama, dok VARA procjenjuje tekstualne vrijednosti kao nule, TRUE kao 1, a FALSE kao 0. Stoga, molimo pažljivo odaberite funkciju varijanse za svoje proračune u zavisnosti od toga da li želite obraditi ili zanemariti tekst i logičke elemente.
Kakoizračunaj varijansu populacije u Excelu
Populacija su svi članovi date grupe, tj. sva zapažanja u polju proučavanja. Varijanca stanovništva opisuje kako podaci ukazuju na cijeli populacija je raspoređena.
Varijanca populacije se može naći sa ovom formulom:
Gdje je:
- x̄ srednja vrijednost populacije.
- n je veličina populacije, tj. ukupan broj vrijednosti u populaciji.
Postoje 3 funkcije za izračunavanje varijanse populacije u Excelu: VARP, VAR .P i VARPA.
VARP funkcija u Excelu
Excel VARP funkcija vraća varijansu populacije na osnovu cijelog skupa brojeva. Dostupan je u svim verzijama Excela 2000 do 2019.
VARP(broj1, [broj2], …)Napomena. U Excelu 2010, VARP je zamijenjen sa VAR.P, ali se i dalje čuva radi kompatibilnosti unatrag. Preporučuje se korištenje VAR.P u trenutnim verzijama Excela jer nema garancije da će VARP funkcija biti dostupna u budućim verzijama Excela.
VAR.P funkcija u Excelu
To je poboljšana verzija VARP funkcije dostupna u programu Excel 2010 i novijim.
VAR.P(broj1, [broj2], …)VARPA funkcija u Excelu
Funkcija VARPA izračunava varijansu populacije na osnovu čitavog skupa brojeva, teksta i logičkih vrijednosti. Dostupan je u svim verzijama Excela 2000 do 2019.
VARA(value1,[value2], …)Formula varijance populacije u Excel-u
U primjeru izračunavanja uzorka var, pronašli smo varijansu od 5 rezultata ispita pod pretpostavkom da su ti rezultati bili izbor iz veće grupe studenata. Ako prikupite podatke o svim studentima u grupi, ti podaci će predstavljati cijelu populaciju, a vi ćete izračunati varijansu populacije koristeći gore navedene funkcije.
Recimo, imamo ispitne rezultate grupe od 10 učenika (B2:B11). Rezultati čine cijelu populaciju, tako da ćemo napraviti varijaciju sa ovim formulama:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
I sve formule će vratiti identičan rezultat:
Da biste bili sigurni da je Excel ispravno izvršio odstupanje, možete to provjeriti pomoću formule za ručno izračunavanje var prikazane na slici ispod:
Ako neki od studenata nisu polagali ispit i imaju N/A umjesto broja bodova, VARPA funkcija će vratiti drugačiji rezultat. Razlog je taj što VARPA procjenjuje tekstualne vrijednosti kao nule, dok VARP i VAR.P zanemaruju tekst i logičke vrijednosti u referencama. Molimo pogledajte VAR.P vs. VARPA za sve detalje.
Formula varijance u Excelu - napomene o upotrebi
Da biste ispravno uradili analizu varijanse u Excelu, slijedite ova jednostavna pravila:
- Navedite argumente kao vrijednosti, nizove ili reference na ćelije.
- U programu Excel 2007 i novijim, možete dostaviti do 255 argumenata koji odgovarajuuzorak ili populaciju; u Excelu 2003 i starijim - do 30 argumenata.
- Da biste procijenili samo brojeve u referencama, zanemarujući prazne ćelije, tekst i logičke vrijednosti, koristite funkciju VAR ili VAR.S za izračunajte varijansu uzorka i VARP ili VAR.P da biste pronašli varijansu populacije.
- Da biste procijenili logičke i tekstualne vrijednosti u referencama, koristite funkciju VARA ili VARPA.
- Navedite najmanje dvije numeričke vrijednosti za formulu uzorka varijance i najmanje jednu brojčanu vrijednost u formulu varijance populacije u Excelu, inače #DIV/0! javlja se greška.
- Argumenti koji sadrže tekst koji se ne može protumačiti kao brojevi uzrokuju #VRIJEDNOST! greške.
Varijanca naspram standardne devijacije u Excelu
Varijanca je nesumnjivo koristan koncept u nauci, ali daje vrlo malo praktičnih informacija. Na primjer, pronašli smo starost populacije tigrova u lokalnom zoološkom vrtu i izračunali varijansu, koja je jednaka 16. Pitanje je - kako zapravo možemo koristiti ovaj broj?
Možete koristiti varijansu za izračunavanje standardna devijacija, koja je mnogo bolja mjera količine varijacije u skupu podataka.
Standardna devijacija se izračunava kao kvadratni korijen varijanse. Dakle, uzimamo kvadratni korijen od 16 i dobivamo standardnu devijaciju od 4.
U kombinaciji sa srednjom vrijednosti, standardna devijacija vam može reći koliko je godina većina tigrova. Na primjer, akosrednja vrijednost je 8, a standardna devijacija je 4, većina tigrova u zoološkom vrtu je između 4 godine (8 - 4) i 12 godina (8 + 4).
Microsoft Excel ima posebne funkcije za određivanje standardne devijacije uzorka i populacije. Detaljno objašnjenje svih funkcija može se naći u ovom vodiču: Kako izračunati standardnu devijaciju u Excelu.
Tako se radi varijansa u Excelu. Da biste bliže pogledali formule o kojima se govori u ovom vodiču, možete preuzeti našu radnu svesku na kraju ovog posta. Zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeće sedmice!
Vježbanje
Izračunajte varijansu u Excelu - primjeri (.xlsx datoteka)