Sadržaj
Uputstvo objašnjava suštinu standardne devijacije i standardne greške srednje vrijednosti kao i koju formulu je najbolje koristiti za izračunavanje standardne devijacije u Excelu.
U deskriptivnoj statistici , aritmetička sredina (naziva se i prosek) i standardna devijacija i dva su blisko povezana koncepta. Ali dok većina dobro razumije ovo prvo, malo tko drugi razumije. Cilj ovog vodiča je baciti malo svjetla na to što je zapravo standardna devijacija i kako je izračunati u Excelu.
Šta je standardna devijacija?
standardna devijacija je mjera koja pokazuje koliko vrijednosti skupa podataka odstupaju (šire se) od srednje vrijednosti. Drugačije rečeno, standardna devijacija pokazuje da li su vaši podaci blizu srednje vrijednosti ili jako fluktuiraju.
Svrha standardne devijacije je da vam pomogne da shvatite da li srednja vrijednost zaista vraća "tipične" podatke. Što je standardna devijacija bliža nuli, to je manja varijabilnost podataka i pouzdanija je srednja vrijednost. Standardna devijacija jednaka 0 označava da je svaka vrijednost u skupu podataka tačno jednaka srednjoj vrijednosti. Što je veća standardna devijacija, to je više varijacija u podacima i manje je tačna srednja vrijednost.
Da biste dobili bolju predstavu o tome kako ovo funkcionira, pogledajte sljedeće podatke:
Za biologiju, standardna devijacijaodstupanje uzorka i populacije
U zavisnosti od prirode vaših podataka, koristite jednu od sljedećih formula:
- Da biste izračunali standardnu devijaciju na osnovu cijele populacije , tj. punu listu vrijednosti (B2:B50 u ovom primjeru), koristite funkciju STDEV.P:
=STDEV.P(B2:B50)
- Da biste pronašli standardnu devijaciju na osnovu uzorka koji čini dio ili podskup populacije (B2:B10 u ovom primjeru), koristite funkciju STDEV.S:
=STDEV.S(B2:B10)
Kao što možete vidjeti u snimku ekrana ispod, formule vraćaju malo drugačije brojeve (što je manji uzorak, veća je razlika):
U Excelu 2007 i nižim, koristili biste STDEVP i STDEV funkcije umjesto:
- Da biste dobili standardnu devijaciju populacije:
=STDEVP(B2:B50)
- Za izračunavanje standardne devijacije uzorka:
=STDEV(B2:B10)
Izračunavanje standardne devijacije za tekstualne reprezentacije brojeva
Kada smo raspravljali o različitim funkcijama za izračunavanje standardne devijacije u Excelu, ponekad smo spomenuli "tekst r prikazi brojeva" i možda ćete biti znatiželjni da saznate šta to zapravo znači.
U ovom kontekstu, "tekstualni prikazi brojeva" su jednostavno brojevi formatirani kao tekst. Kako se takvi brojevi mogu pojaviti u vašim radnim listovima? Najčešće se izvoze iz eksternih izvora. Ili, koje vraćaju takozvane funkcije teksta koje su dizajnirane da manipulišu tekstualnim nizovima, npr. TEKST, SREDINA, DESNO, LIJEVO,itd. Neke od tih funkcija mogu raditi i sa brojevima, ali njihov izlaz je uvijek tekst, čak i ako izgleda kao broj.
Da biste bolje ilustrirali poentu, razmotrite sljedeći primjer. Pretpostavimo da imate kolonu kodova proizvoda poput "Jeans-105" gdje cifre iza crtice označavaju količinu. Vaš cilj je da izvučete količinu svake stavke, a zatim pronađete standardnu devijaciju izdvojenih brojeva.
Povlačenje količine u drugu kolonu nije problem:
=RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))
Problem je u tome što korištenje formule za standardnu devijaciju Excela na ekstrahiranim brojevima vraća ili #DIV/0! ili 0 like prikazanih na slici ispod:
Zašto tako čudni rezultati? Kao što je gore spomenuto, izlaz funkcije DESNO je uvijek tekstualni niz. Ali ni STDEV.S ni STDEVA ne mogu rukovati brojevima formatiranim kao tekst u referencama (prvi ih jednostavno ignoriše dok se drugi računaju kao nule). Da biste dobili standardnu devijaciju takvih "brojeva teksta", morate ih dostaviti direktno na listu argumenata, što se može učiniti ugrađivanjem svih DESNIH funkcija u vašu STDEV.S ili STDEVA formulu:
=STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
Formule su malo glomazne, ali to bi moglo biti radno rješenje za mali uzorak. Za veće, a da ne govorimo o cijeloj populaciji, to definitivno nije opcija. U ovom slučaju, elegantnije rješenje bi bilo imatiFunkcija VALUE pretvara "brojeve teksta" u brojeve koje svaka formula standardne devijacije može razumjeti (obratite pažnju na desno poravnate brojeve na snimku ekrana ispod, za razliku od lijevo poravnatih tekstualnih nizova na snimku ekrana iznad):
Kako izračunati standardnu grešku srednje vrijednosti u Excelu
U statistici postoji još jedna mjera za procjenu varijabilnosti podataka - standardna greška srednje vrijednosti , koji se ponekad skraćuje (iako, netačno) na samo "standardna greška". Standardna devijacija i standardna greška srednje vrijednosti su dva blisko povezana koncepta, ali nisu isti.
Dok standardna devijacija mjeri varijabilnost skupa podataka od srednje vrijednosti, standardna greška srednje vrijednosti (SEM) procjenjuje koliko je vjerovatno da će srednja vrijednost uzorka biti udaljena od prave srednje vrijednosti populacije. Rečeno na drugi način - ako uzmete više uzoraka iz iste populacije, standardna greška srednje vrijednosti bi pokazala disperziju između tih srednjih vrijednosti uzorka. Budući da obično izračunavamo samo jednu srednju vrijednost za skup podataka, a ne više srednjih vrijednosti, standardna greška srednje vrijednosti se procjenjuje, a ne mjeri.
U matematici se standardna greška srednje vrijednosti izračunava ovom formulom:
Gdje je SD standardna devijacija, a n je veličina uzorka (broj vrijednosti u uzorku).
U vašim Excel radnim listovima, možete koristiti funkciju COUNT da biste dobili brojvrijednosti u uzorku, SQRT da uzme kvadratni korijen tog broja i STDEV.S da izračuna standardnu devijaciju uzorka.
Stavljajući sve ovo zajedno, dobijate standardnu grešku formule srednje vrijednosti u Excelu :
STDEV.S( opseg )/SQRT(COUNT( opseg ))Pod pretpostavkom da su podaci uzorka u B2:B10, naša SEM formula bi išla kako slijedi :
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
I rezultat bi mogao biti sličan ovome:
Kako dodati trake standardne devijacije u Excel
Da biste vizuelno prikazali marginu standardne devijacije, možete dodati trake standardne devijacije u svoj Excel grafikon. Evo kako:
- Kreirajte grafikon na uobičajen način ( Insert kartica > Grafikoni grupa).
- Kliknite bilo gdje na graf da biste ga odabrali, a zatim kliknite na dugme Elementi grafikona .
- Kliknite na strelicu pored Trake grešaka i odaberite Standardno odstupanje .
Ovo će umetnuti iste trake standardne devijacije za sve tačke podataka.
Ovo je način na koji se standardno odstupanje radi u Excelu. Nadam se da će vam ove informacije biti od pomoći. U svakom slučaju, zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeće sedmice.
je 5 (zaokruženo na cijeli broj), što nam govori da većina rezultata nije udaljena više od 5 bodova od srednje vrijednosti. Jeli to dobro? Pa, da, to ukazuje da su rezultati iz biologije učenika prilično konzistentni.Za matematiku, standardna devijacija je 23. To pokazuje da postoji ogromna disperzija (širenje) u rezultatima, što znači da neki studenti su imali mnogo bolje rezultate i/ili neki daleko lošije od prosjeka.
U praksi, standardnu devijaciju često koriste poslovni analitičari kao mjeru rizika ulaganja – što je veća standardna devijacija, veća je volatilnost povrata.
Standardna devijacija uzorka naspram standardne devijacije populacije
U vezi sa standardnom devijacijom, često možete čuti izraze "uzorak" i "populacija", koji se odnose na potpunost podatke sa kojima radite. Glavna razlika je sljedeća:
- Populacija uključuje sve elemente iz skupa podataka.
- Uzorak je podskup podaci koji uključuju jedan ili više elemenata iz populacije.
Istraživači i analitičari rade na standardnoj devijaciji uzorka i populacije u različitim situacijama. Na primjer, kada sumira ispitne rezultate razreda učenika, nastavnik će koristiti standardnu devijaciju populacije. Statističari koji izračunavaju nacionalni SAT prosječni rezultat koristili bi standardnu devijaciju uzorka jeroni su predstavljeni samo podacima iz uzorka, a ne iz cijele populacije.
Razumijevanje formule standardne devijacije
Razlog zašto je priroda podataka bitna je zato što standardna devijacija populacije i uzorak standardna devijacija se izračunava po malo drugačijim formulama:
Standardna devijacija uzorka | Standardna devijacija stanovništva |
Gdje:
- x i su pojedinačne vrijednosti u skupu podataka
- x je srednja vrijednost svih x vrijednosti
- n je ukupan broj x vrijednosti u skupu podataka
Imate poteškoća s razumijevanjem formula? Razbijanje na jednostavne korake moglo bi pomoći. Ali prvo, dajte nam neke uzorke podataka na kojima ćemo raditi:
1. Izračunajte srednju vrijednost (prosjek)
Prvo, naći ćete srednju vrijednost svih vrijednosti u skupu podataka ( x u gornjim formulama). Kada računate ručno, zbrojite brojeve, a zatim podijelite zbir sa brojem tih brojeva, ovako:
(1+2+4+5+6+8+9)/7=5
Da biste pronašli srednju vrijednost u Excelu, koristite funkciju AVERAGE, npr. =PROSJEK(A2:G2)
2. Za svaki broj oduzmite srednju vrijednost i kvadratirajte rezultat
Ovo je dio formule standardne devijacije koji kaže: ( x i - x )2
Da biste vizualizirali šta se zapravo događa, pogledajtesljedeće slike.
U ovom primjeru, srednja vrijednost je 5, pa izračunavamo razliku između svake tačke podataka i 5.
Onda kvadrirate razlike, pretvarajući ih sve u pozitivne brojeve:
3. Zbrojite kvadratne razlike
Da biste rekli "sumiraj stvari" u matematici, koristite sigmu Σ. Dakle, ono što sada radimo je da saberemo kvadratne razlike da završimo ovaj dio formule: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. Podijelite ukupne kvadratne razlike brojem vrijednosti
Do sada su formule standardne devijacije uzorka i standardne devijacije populacije bile identične. U ovom trenutku, one su različite.
Za standardnu devijaciju uzorka , dobijate varijansu uzorka dijeljenjem ukupnih kvadrata razlika s veličinom uzorka minus 1:
52 / (7-1) = 8,67
Za standardnu devijaciju stanovništva , naći ćete srednju vrijednost kvadrata razlika dijeljenjem ukupnog kvadrat razlike po njihovom broju:
52 / 7 = 7,43
Zašto ova razlika u formulama? Zato što u formuli standardne devijacije uzorka, morate ispraviti pristrasnost u procjeni srednje vrijednosti uzorka umjesto prave srednje vrijednosti populacije. I to radite koristeći n - 1 umjesto n , što se zove Besselova korekcija.
5. Uzmi kvadratni korijen
Konačno, uzmi kvadratni korijen od gore navedenogbrojeve, i dobićete svoju standardnu devijaciju (u donjim jednačinama, zaokruženu na 2 decimale):
Standardna devijacija uzorka | Standardna devijacija stanovništva |
√ 8,67 = 2,94 | √ 7,43 = 2,73 |
U Microsoft Excelu, standardna devijacija se izračunava u na isti način, ali se svi gore navedeni proračuni izvode iza scene. Ključna stvar za vas je da odaberete odgovarajuću funkciju standardne devijacije, o čemu će vam sljedeći odjeljak dati neke naznake.
Kako izračunati standardnu devijaciju u Excelu
Sve u svemu, postoji šest različitih funkcije za pronalaženje standardne devijacije u Excelu. Koju ćete koristiti ovisi prvenstveno o prirodi podataka s kojima radite - da li se radi o cijeloj populaciji ili uzorku.
Funkcije za izračunavanje standardne devijacije uzorka u Excelu
Za izračunavanje standarda odstupanje na osnovu uzorka, koristite jednu od sljedećih formula (sve su bazirane na "n-1" metodi opisanoj gore).
Excel STDEV funkcija
STDEV(number1,[number2],…)
je najstariji Excel funkcija za procjenu standardne devijacije na osnovu uzorka, a dostupna je u svim verzijama Excela 2003 do 2019.
U Excelu 2007 i novijim, STDEV može prihvatiti do 255 argumenata koji se mogu predstaviti brojevima, nizovima , imenovani rasponi ili reference na ćelije koje sadrže brojeve. U programu Excel 2003, funkcija može prihvatiti samo do30 argumenata.
Logičke vrijednosti i tekstualni prikazi brojeva koji su dostavljeni direktno u listu argumenata se računaju. U nizovima i referencama broje se samo brojevi; prazne ćelije, logičke vrijednosti TRUE i FALSE, tekst i vrijednosti greške se zanemaruju.
Napomena. Excel STDEV je zastarjela funkcija, koja se čuva u novijim verzijama Excela samo radi kompatibilnosti unatrag. Međutim, Microsoft ne daje obećanja u vezi sa budućim verzijama. Dakle, u programu Excel 2010 i novijim, preporučuje se korištenje STDEV.S umjesto STDEV.
Excel STDEV.S funkcija
STDEV.S(number1,[number2],…)
je poboljšana verzija STDEV-a, uvedena u Excel 2010.
Kao STDEV, funkcija STDEV.S izračunava standardnu devijaciju uzorka skupa vrijednosti na osnovu klasične formule standardne devijacije uzorka o kojoj se raspravljalo u prethodnom odjeljku.
Excel STDEVA funkcija
STDEVA(value1, [value2], …)
je još jedna funkcija za izračunavanje standardne devijacije uzorka u Excelu. Razlikuje se od gornja dva samo po načinu na koji obrađuje logičke i tekstualne vrijednosti:
- Sve logičke vrijednosti se broje, bez obzira da li su sadržane u nizovima ili referencama, ili su direktno upisane u listu argumenata (TRUE se procjenjuje kao 1, FALSE se procjenjuje kao 0).
- Tekstualne vrijednosti unutar nizova ili referentnih argumenata se računaju kao 0, uključujući prazne nizove (""), tekst prikaze brojeva i bilo koji drugi tekst. Tekstualni prikazibrojevi navedeni direktno u listi argumenata računaju se kao brojevi koje predstavljaju (ovdje je primjer formule).
- Prazne ćelije se zanemaruju.
Napomena. Da bi uzorak formule standardne devijacije ispravno radio, dostavljeni argumenti moraju sadržavati najmanje dvije numeričke vrijednosti, inače #DIV/0! greška je vraćena.
Funkcije za izračunavanje standardne devijacije populacije u Excelu
Ako imate posla s cijelom populacijom, koristite jednu od sljedećih funkcija da napravite standardnu devijaciju u Excelu. Ove funkcije su zasnovane na "n" metodi.
Excel STDEVP funkcija
STDEVP(number1,[number2],…)
je stara Excel funkcija za pronalaženje standardne devijacije populacije.
U novim verzijama Excela 2010, 2013, 2016 i 2019, zamijenjena je poboljšanom STDEV.P funkcijom, ali se i dalje čuva radi kompatibilnosti unatrag.
Excel STDEV.P funkcija
STDEV.P(number1,[number2],…)
je moderna verzija STDEVP funkcije koja pruža poboljšanu preciznost. Dostupan je u Excelu 2010 i novijim verzijama.
Kao i njihovi uzorci standardne devijacije, unutar nizova ili referentnih argumenata, funkcije STDEVP i STDEV.P broje samo brojeve. U listi argumenata oni također broje logičke vrijednosti i tekstualne reprezentacije brojeva.
Excel STDEVPA funkcija
STDEVPA(value1, [value2], …)
izračunava standardnu devijaciju populacije, uključujući tekst i logičke vrijednosti. Što se tiče nenumeričkihvrijednosti, STDEVPA radi točno kao funkcija STDEVA.
Napomena. Koju god formulu za standardnu devijaciju programa Excel koristite, vratit će grešku ako jedan ili više argumenata sadrže vrijednost greške koju vraća druga funkcija ili tekst koji se ne može protumačiti kao broj.
Koju Excel funkciju standardne devijacije koristiti?
Različite funkcije standardnog odstupanja u Excelu definitivno mogu izazvati nered, posebno neiskusnim korisnicima. Da biste odabrali ispravnu formulu standardne devijacije za određeni zadatak, samo odgovorite na sljedeća 3 pitanja:
- Izračunavate li standardnu devijaciju uzorka ili populacije?
- Koju verziju Excela koristite koristiti?
- Da li vaš skup podataka uključuje samo brojeve ili logičke vrijednosti i tekst?
Da biste izračunali standardnu devijaciju na osnovu numeričkog uzorka , koristite STDEV.S funkcija u programu Excel 2010 i novijim verzijama; STDEV u programu Excel 2007 i starijim verzijama.
Da biste pronašli standardnu devijaciju populacije , koristite funkciju STDEV.P u programu Excel 2010 i novijim verzijama; STDEVP u programu Excel 2007 i starijim verzijama.
Ako želite da logičke ili tekstualne vrijednosti budu uključene u izračun, koristite ili STDEVA (uzorak standardne devijacije) ili STDEVPA ( standardna devijacija populacije). Iako se ne mogu sjetiti nijednog scenarija u kojem bilo koja funkcija može biti korisna sama po sebi, one mogu biti korisne u većim formulama, gdje se jedan ili više argumenata vraća pomoćudruge funkcije kao logičke vrijednosti ili tekstualni prikazi brojeva.
Da bi vam pomogli da odlučite koja od funkcija standardne devijacije programa Excel je najprikladnija za vaše potrebe, pogledajte sljedeću tabelu koja rezimira informacije koje ste već naučili.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Excel verzija | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Uzorak | ✓ | ✓ | ✓ | |||
Stanovništvo | ✓ | ✓ | ✓ | |||
Logičke vrijednosti u nizovima ili reference | Ignorirano | Procijenjeno (TRUE=1, FALSE=0) | ||||
Tekst u nizovima ili referencama | Ignorirano | Procijenjeno kao nula | ||||
Logičke vrijednosti i "brojevi teksta" na listi argumenata | Procijenjeno (TRUE =1, FALSE=0) | |||||
Prazne ćelije | <3 4>Ignorirano
Primjeri formule za standardnu devijaciju Excel
Kada odaberete funkciju koja odgovara vašem tipu podataka, ne bi trebalo biti poteškoća u pisanju formula - sintaksa je toliko jasna i transparentna da ne ostavlja prostora za greške :) Sljedeći primjeri pokazuju nekoliko Excelovih formula standardne devijacije u akciji.