Sadržaj
Udžbenik objašnjava suštinu standardne devijacije i standardne pogreške srednje vrijednosti, kao i koju je formulu najbolje koristiti za izračunavanje standardne devijacije u Excelu.
U deskriptivnoj statistici , aritmetička sredina (koja se naziva i prosjek) i standardna devijacija i dva su blisko povezana koncepta. No dok ovo prvo većina dobro razumije, ovo drugo shvaća malo tko. Cilj ovog vodiča je rasvijetliti što je zapravo standardna devijacija i kako je izračunati u Excelu.
Što je standardna devijacija?
standardna devijacija je mjera koja pokazuje koliko vrijednosti skupa podataka odstupaju (rasprostranjeno) od srednje vrijednosti. Drugim riječima, standardna devijacija pokazuje jesu li vaši podaci blizu srednje vrijednosti ili jako fluktuiraju.
Svrha standardne devijacije je pomoći vam da shvatite vraća li srednja vrijednost stvarno "tipične" podatke. Što je standardna devijacija bliža nuli, manja je varijabilnost podataka i pouzdanija je srednja vrijednost. Standardna devijacija jednaka 0 označava da je svaka vrijednost u skupu podataka točno jednaka srednjoj vrijednosti. Što je veća standardna devijacija, to je više varijacija u podacima i to je srednja vrijednost manje točna.
Da biste dobili bolju predodžbu o tome kako ovo funkcionira, pogledajte sljedeće podatke:
Za biologiju, standardna devijacijaodstupanje uzorka i populacije
Ovisno o prirodi vaših podataka, upotrijebite jednu od sljedećih formula:
- Za izračun standardne devijacije na temelju cijele populacije , tj. cijeli popis vrijednosti (B2:B50 u ovom primjeru), upotrijebite funkciju STDEV.P:
=STDEV.P(B2:B50)
- Da biste pronašli standardnu devijaciju na temelju uzorka koja čini dio ili podskup populacije (B2:B10 u ovom primjeru), koristite funkciju STDEV.S:
=STDEV.S(B2:B10)
Kao što možete vidjeti u na slici ispod, formule vraćaju nešto drugačije brojeve (što je manji uzorak, to je veća razlika):
U programu Excel 2007 i starijim verzijama koristili biste funkcije STDEVP i STDEV umjesto toga:
- Da biste dobili standardnu devijaciju populacije:
=STDEVP(B2:B50)
- Da biste izračunali standardnu devijaciju uzorka:
=STDEV(B2:B10)
Izračunavanje standardne devijacije za tekstualne prikaze brojeva
Kad smo razgovarali o različitim funkcijama za izračunavanje standardne devijacije u Excelu, ponekad smo spomenuli "tekst r eprezentacije brojeva" i možda ćete biti znatiželjni znati što to zapravo znači.
U ovom kontekstu, "tekstualne reprezentacije brojeva" su jednostavno brojevi formatirani kao tekst. Kako se takvi brojevi mogu pojaviti u vašim radnim listovima? Najčešće se izvoze iz vanjskih izvora. Ili, vraćaju takozvane tekstualne funkcije koje su dizajnirane za manipuliranje tekstualnim nizovima, npr. TEKST, SREDINA, DESNO, LIJEVO,itd. Neke od tih funkcija mogu raditi i s brojevima, ali njihov je izlaz uvijek tekst, čak i ako izgleda kao broj.
Da biste bolje ilustrirali poantu, razmotrite sljedeći primjer. Pretpostavimo da imate stupac kodova proizvoda kao što je "Jeans-105" gdje znamenke nakon crtice označavaju količinu. Vaš cilj je izdvojiti količinu svake stavke, a zatim pronaći standardnu devijaciju izdvojenih brojeva.
Povlačenje količine u drugi stupac nije problem:
=RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))
Problem je u tome što uporaba Excelove formule standardne devijacije na izdvojenim brojevima vraća #DIV/0! ili 0 kao što je prikazano na slici ispod:
Zašto tako čudni rezultati? Kao što je gore spomenuto, izlaz funkcije RIGHT uvijek je tekstualni niz. Ali ni STDEV.S ni STDEVA ne mogu rukovati brojevima formatiranim kao tekst u referencama (prvi ih jednostavno ignorira dok se drugi računa kao nule). Da biste dobili standardnu devijaciju takvih "tekstualnih brojeva", morate ih unijeti izravno u popis argumenata, što se može učiniti ugradnjom svih RIGHT funkcija u vašu formulu STDEV.S ili STDEVA:
=STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
Formule su malo glomazne, ali to bi moglo biti radno rješenje za mali uzorak. Za neku veću, da ne kažem cijelu populaciju, to definitivno nije opcija. U ovom slučaju, elegantnije rješenje bilo bi imatiFunkcija VRIJEDNOST pretvara "tekstualne brojeve" u brojeve koje svaka formula standardne devijacije može razumjeti (obratite pozornost na desno poravnate brojeve na snimci zaslona u nastavku za razliku od lijevo poravnatih tekstualnih nizova na gornjoj snimci zaslona):
Kako izračunati standardnu pogrešku srednje vrijednosti u Excelu
U statistici, postoji još jedna mjera za procjenu varijabilnosti u podacima - standardna pogreška srednje vrijednosti , što se ponekad skraćuje (iako, netočno) samo na "standardnu pogrešku". Standardna devijacija i standardna pogreška srednje vrijednosti dva su blisko povezana pojma, ali nisu ista.
Dok standardna devijacija mjeri varijabilnost skupa podataka u odnosu na srednju vrijednost, standardna pogreška srednje vrijednosti (SEM) procjenjuje koliko će srednja vrijednost uzorka vjerojatno biti daleko od prave srednje vrijednosti populacije. Drugim riječima - ako ste uzeli više uzoraka iz iste populacije, standardna pogreška srednje vrijednosti pokazala bi disperziju između tih srednjih vrijednosti uzorka. Budući da obično izračunavamo samo jednu srednju vrijednost za skup podataka, a ne višestruke srednje vrijednosti, standardna pogreška srednje vrijednosti se procjenjuje, a ne mjeri.
U matematici, standardna pogreška srednje vrijednosti izračunava se ovom formulom:
Gdje je SD standardna devijacija, a n veličina uzorka (broj vrijednosti u uzorku).
U svojim Excel radnim listovima možete koristiti funkciju COUNT da dobijete brojvrijednosti u uzorku, SQRT za vađenje kvadratnog korijena tog broja i STDEV.S za izračunavanje standardne devijacije uzorka.
Stavljajući sve ovo zajedno, dobivate standardnu pogrešku formule srednje vrijednosti u Excelu :
STDEV.S( raspon )/SQRT(COUNT( raspon ))Pod pretpostavkom da su uzorci podataka u B2:B10, naša SEM formula bi išla kako slijedi :
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
A rezultat bi mogao biti sličan ovome:
Kako dodati stupce standardne devijacije u Excel
Da biste vizualno prikazali marginu standardne devijacije, možete dodati stupce standardne devijacije na vaš Excel grafikon. Evo kako:
- Stvorite grafikon na uobičajeni način (kartica Umetni > Grafikoni grupa).
- Kliknite bilo gdje na graf da biste ga odabrali, a zatim kliknite gumb Elementi grafikona .
- Kliknite strelicu pokraj Trake pogrešaka i odaberite Standardno odstupanje .
Ovo će umetnuti iste stupce standardne devijacije za sve podatkovne točke.
Ovako se radi standardna devijacija u Excelu. Nadam se da će vam ove informacije pomoći. U svakom slučaju, zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeći tjedan.
je 5 (zaokruženo na cijeli broj), što nam govori da većina rezultata nije udaljena više od 5 bodova od srednje vrijednosti. Je li to dobro? Pa, da, to pokazuje da su rezultati učenika iz biologije prilično dosljedni.Za matematiku, standardna devijacija je 23. To pokazuje da postoji velika disperzija (rasprostranjenost) u rezultatima, što znači da neki studenti su imali mnogo bolje rezultate i/ili neki su imali daleko lošije rezultate od prosjeka.
U praksi poslovni analitičari često koriste standardnu devijaciju kao mjeru rizika ulaganja - što je veća standardna devijacija, to je veća volatilnost povrata.
Standardna devijacija uzorka u odnosu na standardnu devijaciju populacije
U odnosu na standardnu devijaciju, često možete čuti izraze "uzorak" i "populacija", koji se odnose na potpunost podatke s kojima radite. Glavna razlika je sljedeća:
- Populacija uključuje sve elemente iz skupa podataka.
- Uzorak je podskup podaci koji uključuju jedan ili više elemenata iz populacije.
Istraživači i analitičari rade na standardnoj devijaciji uzorka i populacije u različitim situacijama. Na primjer, kada sažima rezultate ispita razreda učenika, nastavnik će koristiti standardnu devijaciju populacije. Statističari koji izračunavaju nacionalni prosječni rezultat SAT koristili bi standardnu devijaciju uzorka jerprikazani su s podacima samo iz uzorka, a ne iz cijele populacije.
Razumijevanje formule standardne devijacije
Razlog zašto je priroda podataka bitna je taj što standardna devijacija populacije i uzorak standardna devijacija se izračunava malo drugačijim formulama:
Standardna devijacija uzorka | Standardna devijacija populacije |
Gdje:
- x i su pojedinačne vrijednosti u skupu podataka
- x je srednja vrijednost svih x vrijednosti
- n je ukupan broj x vrijednosti u skupu podataka
Imate poteškoća s razumijevanjem formula? Moglo bi pomoći ako ih raščlanite na jednostavne korake. No, prvo ćemo imati neke ogledne podatke na kojima ćemo raditi:
1. Izračunajte srednju vrijednost (prosjek)
Prvo ćete pronaći srednju vrijednost svih vrijednosti u skupu podataka ( x u gornjim formulama). Kada računate ručno, zbrajate brojeve i zatim dijelite zbroj s brojem tih brojeva, ovako:
(1+2+4+5+6+8+9)/7=5
Da biste pronašli srednju vrijednost u Excelu, koristite funkciju AVERAGE, npr. =PROSJEK(A2:G2)
2. Za svaki broj oduzmite srednju vrijednost i kvadrirajte rezultat
Ovo je dio formule standardne devijacije koji kaže: ( x i - x )2
Da biste vizualizirali što se zapravo događa, pogledajtesljedeće slike.
U ovom primjeru, srednja vrijednost je 5, tako da izračunavamo razliku između svake podatkovne točke i 5.
Zatim kvadrirate razlike, pretvarajući ih sve u pozitivne brojeve:
3. Zbrojite razlike na kvadrat
Da biste rekli "zbroj stvari" u matematici, koristite sigmu Σ. Dakle, ono što sada radimo je zbrajanje kvadrata razlika kako bismo dovršili ovaj dio formule: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. Podijelite ukupne kvadrate razlika s brojem vrijednosti
Do sada su formule standardne devijacije uzorka i standardne devijacije populacije bile identične. U ovom trenutku one su različite.
Za standardnu devijaciju uzorka dobivate varijancu uzorka dijeljenjem ukupnih kvadrata razlika s veličinom uzorka minus 1:
52 / (7-1) = 8,67
Za standardnu devijaciju populacije , pronaći ćete srednju vrijednost kvadrata razlika dijeljenjem ukupnog kvadrat razlike njihovim brojem:
52 / 7 = 7,43
Zašto ova razlika u formulama? Zato što u formuli standardne devijacije uzorka trebate ispraviti pristranost u procjeni uzorka srednje vrijednosti umjesto stvarne srednje vrijednosti populacije. A to radite korištenjem n - 1 umjesto n , što se naziva Besselova korekcija.
5. Izvadite kvadratni korijen
Na kraju, izvucite kvadratni korijen od gore navedenogbrojeve i dobit ćete svoju standardnu devijaciju (u donjim jednadžbama, zaokruženu na 2 decimalna mjesta):
Standardna devijacija uzorka | Standardna devijacija populacije |
√ 8,67 = 2,94 | √ 7,43 = 2,73 |
U programu Microsoft Excel, standardna devijacija se izračunava u na isti način, ali se svi gornji izračuni izvode iza scene. Ključna stvar za vas je odabrati odgovarajuću funkciju standardne devijacije, o čemu će vam sljedeći odjeljak dati neke natuknice.
Kako izračunati standardnu devijaciju u Excelu
Sve u svemu, postoji šest različitih funkcije za pronalaženje standardne devijacije u Excelu. Koju ćete koristiti prvenstveno ovisi o prirodi podataka s kojima radite - radi li se o cijeloj populaciji ili uzorku.
Funkcije za izračunavanje standardne devijacije uzorka u programu Excel
Za izračunavanje standarda odstupanje na temelju uzorka, upotrijebite jednu od sljedećih formula (sve se temelje na gore opisanoj metodi "n-1").
Funkcija Excel STDEV
STDEV(number1,[number2],…)
je najstariji Excel funkcija za procjenu standardne devijacije na temelju uzorka, a dostupna je u svim verzijama programa Excel 2003 do 2019.
U programu Excel 2007 i novijim, STDEV može prihvatiti do 255 argumenata koji mogu biti predstavljeni brojevima, nizovima , imenovani rasponi ili reference na ćelije koje sadrže brojeve. U programu Excel 2003 funkcija može prihvatiti samo do30 argumenata.
Broju se logičke vrijednosti i tekstualni prikazi brojeva koji su navedeni izravno na popisu argumenata. U nizovima i referencama broje se samo brojevi; prazne ćelije, logičke vrijednosti TRUE i FALSE, tekst i vrijednosti pogreške se zanemaruju.
Napomena. Excel STDEV je zastarjela funkcija koja se čuva u novijim verzijama Excela samo radi kompatibilnosti s prethodnim verzijama. Međutim, Microsoft ne daje obećanja u vezi s budućim verzijama. Dakle, u programu Excel 2010 i novijim, preporučuje se korištenje STDEV.S umjesto STDEV.
Funkcija Excel STDEV.S
STDEV.S(number1,[number2],…)
je poboljšana verzija STDEV, uvedena u Excel 2010.
Kao i STDEV, funkcija STDEV.S izračunava standardnu devijaciju uzorka skupa vrijednosti na temelju klasične formule standardne devijacije uzorka o kojoj je bilo riječi u prethodnom odjeljku.
Funkcija Excel STDEVA
STDEVA(value1, [value2], …)
je još jedna funkcija za izračunavanje standardne devijacije uzorka u Excelu. Razlikuje se od gornje dvije samo u načinu na koji rukuje logičkim i tekstualnim vrijednostima:
- Broju se sve logičke vrijednosti , bilo da su sadržane u nizovima ili referencama, ili su izravno upisane u popis argumenata (TRUE daje vrijednost 1, FALSE vrijednost kao 0).
- Tekstualne vrijednosti unutar nizova ili referentnih argumenata broje se kao 0, uključujući prazne nizove (""), tekst prikazi brojeva i bilo koji drugi tekst. Tekstualni prikazibrojevi navedeni izravno na popisu argumenata računaju se kao brojevi koje predstavljaju (ovdje je primjer formule).
- Prazne ćelije se zanemaruju.
Napomena. Da bi uzorak standardne devijacije formule ispravno funkcionirao, dostavljeni argumenti moraju sadržavati najmanje dvije numeričke vrijednosti, inače #DIV/0! vraća se pogreška.
Funkcije za izračunavanje standardne devijacije populacije u Excelu
Ako radite s cijelom populacijom, upotrijebite jednu od sljedećih funkcija za izračunavanje standardne devijacije u Excelu. Ove se funkcije temelje na "n" metodi.
Excel STDEVP funkcija
STDEVP(number1,[number2],…)
je stara Excel funkcija za pronalaženje standardne devijacije populacije.
U novim verzijama Excela 2010, 2013, 2016 i 2019, zamijenjena je poboljšanom STDEV.P funkcijom, ali je i dalje zadržana radi kompatibilnosti sa starijim verzijama.
Excel STDEV.P funkcija
STDEV.P(number1,[number2],…)
je moderna verzija funkcije STDEVP koja pruža poboljšanu točnost. Dostupna je u Excelu 2010 i novijim verzijama.
Kao i njihovi uzorci standardne devijacije, unutar nizova ili referentnih argumenata, funkcije STDEVP i STDEV.P broje samo brojeve. Na popisu argumenata također broje logičke vrijednosti i tekstualne prikaze brojeva.
Excel STDEVPA funkcija
STDEVPA(value1, [value2], …)
izračunava standardnu devijaciju populacije, uključujući tekstualne i logičke vrijednosti. S obzirom na nenumeričkevrijednosti, STDEVPA radi točno kao funkcija STDEVA.
Napomena. Koju god formulu standardnog odstupanja u programu Excel koristite, vratit će pogrešku ako jedan ili više argumenata sadrži vrijednost pogreške koju je vratila druga funkcija ili tekst koji se ne može protumačiti kao broj.
Koju funkciju standardnog odstupanja u programu Excel koristiti?
Različite funkcije standardne devijacije u Excelu definitivno mogu izazvati nered, posebno neiskusnim korisnicima. Da biste odabrali ispravnu formulu standardne devijacije za određeni zadatak, samo odgovorite na sljedeća 3 pitanja:
- Izračunavate li standardnu devijaciju uzorka ili populacije?
- Koju verziju programa Excel koristite koristiti?
- Uključuje li vaš skup podataka samo brojeve ili logičke vrijednosti i tekst?
Da biste izračunali standardnu devijaciju na temelju numeričkog uzorka , koristite STDEV.S funkcija u programu Excel 2010 i novijim; STDEV u programu Excel 2007 i ranijim verzijama.
Da biste pronašli standardnu devijaciju populacije , koristite funkciju STDEV.P u programu Excel 2010 i novijim verzijama; STDEVP u programu Excel 2007 i ranijim verzijama.
Ako želite da logičke ili tekstualne vrijednosti budu uključene u izračun, koristite ili STDEVA (uzorak standardne devijacije) ili STDEVPA ( standardna devijacija populacije). Iako se ne mogu sjetiti nijednog scenarija u kojem bilo koja funkcija može biti korisna sama za sebe, one bi mogle biti korisne u većim formulama, gdje jedan ili više argumenata vraćadruge funkcije kao što su logičke vrijednosti ili tekstualni prikazi brojeva.
Da biste lakše odlučili koja je funkcija standardne devijacije programa Excel najprikladnija za vaše potrebe, pregledajte sljedeću tablicu koja sažima informacije koje ste već naučili.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Excel verzija | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Uzorak | ✓ | ✓ | ✓ | |||
Stanovništvo | ✓ | ✓ | ✓ | |||
Logičke vrijednosti u nizovima ili reference | Zanemareno | Procijenjeno (TRUE=1, FALSE=0) | ||||
Tekst u nizovima ili referencama | Zanemareno | Procijenjeno kao nula | ||||
Logičke vrijednosti i "brojevi teksta" na popisu argumenata | Procijenjeno (TRUE =1, FALSE=0) | |||||
Prazne ćelije | <3 4>Zanemareno
Primjeri formula standardne devijacije programa Excel
Nakon što odaberete funkciju koja odgovara vašoj vrsti podataka, ne bi trebalo biti poteškoća u pisanju formula - sintaksa je toliko jasna i transparentna da ne ostavlja mjesta za pogreške :) Sljedeći primjeri pokazuju nekoliko Excel formula standardne devijacije na djelu.