Štandardná odchýlka v programe Excel: príklady funkcií a vzorcov

  • Zdieľajte To
Michael Brown

V učebnici sa vysvetľuje podstata štandardnej odchýlky a štandardnej chyby priemeru, ako aj to, ktorý vzorec je najlepšie použiť na výpočet štandardnej odchýlky v programe Excel.

V popisnej štatistike sú aritmetický priemer (nazývaný aj priemer) a smerodajná odchýlka a dva úzko súvisiace pojmy. Ale zatiaľ čo prvému z nich väčšina dobre rozumie, druhému rozumie len málokto. Cieľom tohto návodu je objasniť, čo to vlastne smerodajná odchýlka je a ako ju vypočítať v programe Excel.

    Čo je to štandardná odchýlka?

    Stránka štandardná odchýlka je miera, ktorá udáva, ako veľmi sa hodnoty súboru údajov odchyľujú (rozptyľujú) od priemeru. Inak povedané, štandardná odchýlka ukazuje, či sú vaše údaje blízko priemeru alebo veľmi kolíšu.

    Účelom štandardnej odchýlky je pomôcť pochopiť, či priemer naozaj vracia "typické" údaje. Čím bližšie je štandardná odchýlka k nule, tým nižšia je variabilita údajov a tým spoľahlivejší je priemer. Štandardná odchýlka rovná 0 znamená, že každá hodnota v súbore údajov sa presne rovná priemeru. Čím vyššia je štandardná odchýlka, tým väčšia je variabilita vúdajov a tým menej presný je priemer.

    Ak chcete získať lepšiu predstavu o tom, ako to funguje, pozrite si nasledujúce údaje:

    V prípade biológie je štandardná odchýlka 5 (zaokrúhlené na celé číslo), čo nám hovorí, že väčšina výsledkov nie je od priemeru vzdialená viac ako 5 bodov. Je to dobré? Áno, znamená to, že výsledky žiakov v biológii sú pomerne vyrovnané.

    V prípade matematiky je štandardná odchýlka 23. Ukazuje to, že výsledky sú veľmi rozptýlené, čo znamená, že niektorí žiaci dosiahli oveľa lepšie výsledky a/alebo niektorí dosiahli oveľa horšie výsledky ako priemer.

    V praxi sa štandardná odchýlka často používa ako meradlo investičného rizika - čím vyššia je štandardná odchýlka, tým vyššia je volatilita výnosov.

    Štandardná odchýlka vzorky vs. štandardná odchýlka populácie

    V súvislosti so smerodajnou odchýlkou môžete často počuť pojmy "vzorka" a "populácia", ktoré sa vzťahujú na úplnosť údajov, s ktorými pracujete. Hlavný rozdiel je nasledovný:

    • Obyvateľstvo obsahuje všetky prvky zo súboru údajov.
    • Vzorka je podmnožina údajov, ktorá obsahuje jeden alebo viac prvkov z populácie.

    Výskumníci a analytici pracujú so smerodajnou odchýlkou vzorky a populácie v rôznych situáciách. Napríklad pri sumarizácii výsledkov skúšok triedy žiakov použije učiteľ smerodajnú odchýlku populácie. Štatistici, ktorí počítajú národný priemerný výsledok maturitnej skúšky, použijú smerodajnú odchýlku vzorky, pretože majú k dispozícii len údaje zo vzorky, niez celej populácie.

    Pochopenie vzorca pre štandardnú odchýlku

    Dôvodom, prečo je povaha údajov dôležitá, je skutočnosť, že štandardná odchýlka populácie a štandardná odchýlka vzorky sa vypočítavajú pomocou mierne odlišných vzorcov:

    Štandardná odchýlka vzorky

    Štandardná odchýlka populácie

    Kde:

    • x i sú jednotlivé hodnoty v súbore údajov
    • x je priemer všetkých x hodnoty
    • n je celkový počet x hodnoty v súbore údajov

    Máte problémy s pochopením vzorcov? Pomôcť by vám mohlo ich rozdelenie do jednoduchých krokov. Najprv si však pripravme niekoľko vzorových údajov, s ktorými budeme pracovať:

    1. Vypočítajte priemer (priemer)

    Najprv zistíte priemer všetkých hodnôt v súbore údajov ( x Pri ručnom výpočte sa čísla sčítajú a potom sa súčet vydelí počtom týchto čísel takto:

    (1+2+4+5+6+8+9)/7=5

    Ak chcete v programe Excel zistiť priemer, použite funkciu AVERAGE, napr. =AVERAGE(A2:G2)

    2. Od každého čísla odpočítajte priemer a výsledok odmocnite

    Toto je časť vzorca pre štandardnú odchýlku, ktorá hovorí: ( x i - x )2

    Ak si chcete predstaviť, čo sa vlastne deje, pozrite si nasledujúce obrázky.

    V tomto príklade je priemer 5, takže vypočítame rozdiel medzi každým dátovým bodom a hodnotou 5.

    Potom rozdiely odmocníte, čím ich všetky premeníte na kladné čísla:

    3. Súčet štvorcových rozdielov

    Ak chcete v matematike povedať "zhrnúť veci", použite sigma Σ. Takže teraz sčítame štvorcové rozdiely, aby sme doplnili túto časť vzorca: Σ( x i - x )2

    16 + 9 + 1 + 1 + 9 + 16 = 52

    4. Vydelte celkový počet štvorcových rozdielov počtom hodnôt

    Doteraz boli vzorce pre výberovú štandardnú odchýlku a populačnú štandardnú odchýlku totožné. V tomto bode sa líšia.

    Pre štandardná odchýlka vzorky , dostanete rozptyl vzorky vydelením celkových štvorcových rozdielov veľkosťou vzorky mínus 1:

    52 / (7-1) = 8.67

    Pre štandardná odchýlka populácie , nájdete priemer štvorcových rozdielov vydelením celkových štvorcových rozdielov ich počtom:

    52 / 7 = 7.43

    Prečo je tento rozdiel vo vzorcoch? Pretože vo vzorci pre výberovú štandardnú odchýlku musíte opraviť skreslenie odhadu výberového priemeru namiesto skutočného populačného priemeru. n - 1 namiesto n , ktorá sa nazýva Besselova korekcia.

    5. Vezmite druhú odmocninu

    Nakoniec z uvedených čísel vyrátajte druhú odmocninu a dostanete štandardnú odchýlku (v nižšie uvedených rovniciach zaokrúhlenú na 2 desatinné miesta):

    Štandardná odchýlka vzorky Štandardná odchýlka populácie
    √ 8.67 = 2.94 √ 7.43 = 2.73

    V programe Microsoft Excel sa štandardná odchýlka počíta rovnakým spôsobom, ale všetky vyššie uvedené výpočty sa vykonávajú v pozadí. Kľúčové pre vás je vybrať si správnu funkciu štandardnej odchýlky, o ktorej vám napovie nasledujúca časť.

    Ako vypočítať štandardnú odchýlku v programe Excel

    Celkovo existuje šesť rôznych funkcií na zistenie štandardnej odchýlky v programe Excel. Ktorú z nich použijete, závisí predovšetkým od povahy údajov, s ktorými pracujete - či ide o celú populáciu alebo vzorku.

    Funkcie na výpočet štandardnej odchýlky vzorky v programe Excel

    Ak chcete vypočítať štandardnú odchýlku na základe vzorky, použite jeden z nasledujúcich vzorcov (všetky sú založené na vyššie opísanej metóde "n-1").

    Funkcia Excel STDEV

    STDEV(číslo1,[číslo2],...) je najstaršia funkcia programu Excel na odhad štandardnej odchýlky na základe vzorky a je k dispozícii vo všetkých verziách programu Excel 2003 až 2019.

    V programe Excel 2007 a novších verziách môže funkcia STDEV prijať až 255 argumentov, ktoré môžu byť reprezentované číslami, poliami, pomenovanými rozsahmi alebo odkazmi na bunky obsahujúce čísla. V programe Excel 2003 môže funkcia prijať len 30 argumentov.

    Počítajú sa logické hodnoty a textové reprezentácie čísel zadaných priamo v zozname argumentov. V poliach a odkazoch sa počítajú len čísla; prázdne bunky, logické hodnoty TRUE a FALSE, text a chybové hodnoty sa ignorujú.

    Poznámka: Excel STDEV je zastaraná funkcia, ktorá je v novších verziách programu Excel zachovaná len kvôli spätnej kompatibilite. Spoločnosť Microsoft však nedáva žiadne prísľuby týkajúce sa budúcich verzií. V programe Excel 2010 a novších sa preto odporúča používať STDEV.S namiesto STDEV.

    Funkcia Excel STDEV.S

    STDEV.S(číslo1,[číslo2],...) je vylepšená verzia STDEV, ktorá bola zavedená v programe Excel 2010.

    Podobne ako funkcia STDEV, aj funkcia STDEV.S vypočíta výberovú štandardnú odchýlku súboru hodnôt na základe klasického vzorca výberovej štandardnej odchýlky, o ktorom sa hovorí v predchádzajúcej časti.

    Funkcia Excel STDEVA

    STDEVA(hodnota1, [hodnota2], ...) je ďalšia funkcia na výpočet štandardnej odchýlky vzorky v programe Excel. Od predchádzajúcich dvoch sa líši len spôsobom, akým pracuje s logickými a textovými hodnotami:

    • Všetky logické hodnoty sa započítavajú, či už sú obsiahnuté v poliach alebo odkazoch, alebo sú zapísané priamo v zozname argumentov (TRUE sa vyhodnotí ako 1, FALSE ako 0).
    • Hodnoty textu v rámci polí alebo referenčných argumentov sa počítajú ako 0, vrátane prázdnych reťazcov (""), textových reprezentácií čísel a akéhokoľvek iného textu. Textové reprezentácie čísel zadaných priamo v zozname argumentov sa počítajú ako čísla, ktoré reprezentujú (tu je príklad vzorca).
    • Prázdne bunky sa ignorujú.

    Poznámka: Aby vzorec pre výberovú štandardnú odchýlku fungoval správne, musia zadané argumenty obsahovať aspoň dve číselné hodnoty, inak sa vráti chyba #DIV/0!.

    Funkcie na výpočet štandardnej odchýlky populácie v programe Excel

    Ak pracujete s celou populáciou, použite na štandardnú odchýlku v programe Excel jednu z nasledujúcich funkcií. Tieto funkcie sú založené na metóde "n".

    Funkcia Excel STDEVP

    STDEVP(číslo1,[číslo2],...) je stará excelovská funkcia na zistenie štandardnej odchýlky populácie.

    V nových verziách programu Excel 2010, 2013, 2016 a 2019 je nahradená vylepšenou funkciou STDEV.P, ale stále je zachovaná kvôli spätnej kompatibilite.

    Funkcia Excel STDEV.P

    STDEV.P(číslo1,[číslo2],...) je moderná verzia funkcie STDEVP, ktorá poskytuje vyššiu presnosť. Je k dispozícii v programe Excel 2010 a novších verziách.

    Podobne ako ich vzorové náprotivky štandardnej odchýlky, v rámci polí alebo referenčných argumentov funkcie STDEVP a STDEV.P počítajú iba čísla. V zozname argumentov počítajú aj logické hodnoty a textové reprezentácie čísel.

    Funkcia Excel STDEVPA

    STDEVPA(hodnota1, [hodnota2], ...) vypočíta štandardnú odchýlku populácie vrátane textových a logických hodnôt. Pokiaľ ide o nečíselné hodnoty, funkcia STDEVPA pracuje presne tak, ako funkcia STDEVA.

    Poznámka: Nech použijete akýkoľvek vzorec štandardnej odchýlky programu Excel, vráti chybu, ak jeden alebo viac argumentov obsahuje chybovú hodnotu vrátenú inou funkciou alebo text, ktorý nemožno interpretovať ako číslo.

    Ktorú funkciu štandardnej odchýlky programu Excel použiť?

    Rôzne funkcie štandardnej odchýlky v programe Excel môžu určite spôsobiť zmätok, najmä neskúseným používateľom. Ak chcete vybrať správny vzorec štandardnej odchýlky pre konkrétnu úlohu, stačí odpovedať na nasledujúce 3 otázky:

    • Vypočítavate štandardnú odchýlku vzorky alebo populácie?
    • Akú verziu programu Excel používate?
    • Obsahuje váš súbor údajov len čísla alebo aj logické hodnoty a text?

    Výpočet štandardnej odchýlky na základe číselného vzorka , použite funkciu STDEV.S v programe Excel 2010 a novších; STDEV v programe Excel 2007 a starších.

    Zistenie štandardnej odchýlky populácia , použite funkciu STDEV.P v programe Excel 2010 a novších; STDEVP v programe Excel 2007 a starších.

    Ak chcete logické alebo text hodnoty, ktoré sa majú zahrnúť do výpočtu, použite buď STDEVA (štandardná odchýlka vzorky), alebo STDEVPA (štandardná odchýlka populácie). Hoci ma nenapadá žiadny scenár, v ktorom by mohla byť niektorá z týchto funkcií užitočná sama o sebe, môžu sa hodiť vo väčších vzorcoch, kde jeden alebo viac argumentov vracajú iné funkcie ako logické hodnoty alebo textové reprezentácie čísel.

    Aby ste sa mohli rozhodnúť, ktorá z funkcií štandardnej odchýlky programu Excel je najvhodnejšia pre vaše potreby, prečítajte si nasledujúcu tabuľku, ktorá sumarizuje informácie, ktoré ste sa už naučili.

    STDEV STDEV.S STDEVP STDEV.P STDEVA STDEVPA
    Verzia programu Excel 2003 - 2019 2010 - 2019 2003 - 2019 2010 - 2019 2003 - 2019 2003 - 2019
    Vzorka
    Obyvateľstvo
    Logické hodnoty v poliach alebo odkazoch Ignorované Vyhodnotené

    (TRUE=1, FALSE=0)

    Text v poliach alebo odkazoch Ignorované Vyhodnotené ako nula
    Logické hodnoty a "textové čísla" v zozname argumentov Vyhodnotené

    (TRUE=1, FALSE=0)

    Prázdne bunky Ignorované

    Príklady vzorca štandardnej odchýlky programu Excel

    Po výbere funkcie, ktorá zodpovedá vášmu typu údajov, by ste nemali mať žiadne ťažkosti pri písaní vzorca - syntax je taká jednoduchá a prehľadná, že nedáva priestor na chyby :) Nasledujúce príklady ukazujú niekoľko vzorcov štandardnej odchýlky Excelu v praxi.

    Výpočet štandardnej odchýlky vzorky a populácie

    V závislosti od povahy vašich údajov použite jeden z nasledujúcich vzorcov:

    • Výpočet štandardnej odchýlky na základe celého populácia t. j. úplný zoznam hodnôt (v tomto príklade B2:B50), použite funkciu STDEV.P:

      =STDEV.P(B2:B50)

    • Zistenie štandardnej odchýlky na základe vzorka ktorá tvorí časť alebo podmnožinu populácie (B2:B10 v tomto príklade), použite funkciu STDEV.S:

      =STDEV.S(B2:B10)

    Ako môžete vidieť na snímke obrazovky nižšie, vzorce poskytujú mierne odlišné čísla (čím menšia vzorka, tým väčší rozdiel):

    V programe Excel 2007 a nižších verziách sa namiesto toho používajú funkcie STDEVP a STDEV:

    • Získanie štandardnej odchýlky populácie:

      =STDEVP(B2:B50)

    • Výpočet štandardnej odchýlky vzorky:

      =STDEV(B2:B10)

    Výpočet štandardnej odchýlky pre textové reprezentácie čísel

    Pri diskusii o rôznych funkciách na výpočet štandardnej odchýlky v programe Excel sme niekedy spomínali "textové reprezentácie čísel" a možno vás zaujíma, čo to vlastne znamená.

    V tomto kontexte sú "textové reprezentácie čísel" jednoducho čísla formátované ako text. Ako sa takéto čísla môžu objaviť vo vašich pracovných listoch? Najčastejšie sú exportované z externých zdrojov. Alebo sú vrátené takzvanými textovými funkciami, ktoré sú určené na manipuláciu s textovými reťazcami, napríklad TEXT, MID, RIGHT, LEFT atď. Niektoré z týchto funkcií môžu pracovať aj s číslami, ale ich výstupom je vždy text, dokoncaak sa podobá na číslo.

    Pre lepšiu ilustráciu uvažujte o nasledujúcom príklade. Predpokladajme, že máte stĺpec s kódmi výrobkov ako "Jeans-105", kde číslice za pomlčkou označujú množstvo. Vaším cieľom je extrahovať množstvo každej položky a potom nájsť štandardnú odchýlku extrahovaných čísel.

    Prenesenie množstva do iného stĺpca nie je problém:

    =RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))

    Problémom je, že použitie vzorca štandardnej odchýlky programu Excel na extrahované čísla vráti buď #DIV/0! alebo 0, ako je znázornené na nasledujúcej snímke obrazovky:

    Prečo takéto čudné výsledky? Ako už bolo spomenuté vyššie, výstupom funkcie RIGHT je vždy textový reťazec. Ale ani STDEV.S, ani STDEVA nedokážu spracovať čísla formátované ako text v odkazoch (prvý z nich ich jednoducho ignoruje, zatiaľ čo druhý ich počíta ako nuly). Ak chcete získať štandardnú odchýlku takýchto "textových čísel", musíte ich dodať priamo do zoznamu argumentov, čo možno urobiť vložením všetkýchRIGHT do vzorca STDEV.S alebo STDEVA:

    =STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    =STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    Vzorce sú trochu ťažkopádne, ale pre malú vzorku by to mohlo byť funkčné riešenie. Pre väčšiu vzorku, nehovoriac o celej populácii, to určite nie je riešenie. V tomto prípade by bolo elegantnejším riešením, keby funkcia VALUE konvertovala "textové čísla" na čísla, ktorým rozumie akýkoľvek vzorec pre štandardnú odchýlku (všimnite si, prosím, čísla zarovnané doprava na snímke obrazovkynižšie na rozdiel od textových reťazcov zarovnaných doľava na obrázku vyššie):

    Ako vypočítať štandardnú chybu priemeru v programe Excel

    V štatistike existuje ešte jedno opatrenie na odhad variability údajov - štandardná chyba priemeru Štandardná odchýlka a štandardná chyba priemeru sú dva úzko súvisiace pojmy, ale nie sú to isté.

    Zatiaľ čo štandardná odchýlka meria variabilitu súboru údajov od priemeru, štandardná chyba priemeru (SEM) odhaduje, ako ďaleko je priemer vzorky od skutočného priemeru populácie. Povedané inak - ak by ste odobrali viacero vzoriek z tej istej populácie, štandardná chyba priemeru by ukázala rozptyl medzi priemermi týchto vzoriek. Pretože zvyčajne počítame len jednupriemer pre súbor údajov, nie viacero priemerov, štandardná chyba priemeru sa skôr odhaduje ako meria.

    V matematike sa štandardná chyba priemeru vypočíta podľa tohto vzorca:

    Kde SD je štandardná odchýlka a n je veľkosť vzorky (počet hodnôt vo vzorke).

    V pracovných listoch programu Excel môžete použiť funkciu COUNT na získanie počtu hodnôt vo vzorke, SQRT na získanie druhej odmocniny z tohto počtu a STDEV.S na výpočet štandardnej odchýlky vzorky.

    Ak toto všetko spojíte, dostanete vzorec pre štandardnú chybu priemeru v programe Excel:

    STDEV.S( rozsah )/SQRT(COUNT( rozsah ))

    Za predpokladu, že údaje o vzorke sú v B2:B10, náš vzorec SEM by vyzeral takto:

    =STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))

    Výsledok by mohol byť podobný tomuto:

    Ako pridať štandardné odchýlky v programe Excel

    Ak chcete vizuálne zobraziť rozpätie štandardnej odchýlky, môžete do grafu programu Excel pridať stĺpce štandardnej odchýlky. Tu je postup:

    1. Vytvorte graf obvyklým spôsobom ( Vložte karta> Grafy skupina).
    2. Kliknutím kdekoľvek na grafe ho vyberte a potom kliknite na Prvky grafu tlačidlo.
    3. Kliknite na šípku vedľa položky Chybové stĺpce a vybrať Štandardná odchýlka .

    Tým sa pre všetky dátové body vložia rovnaké stĺpce štandardnej odchýlky.

    Takto sa robí štandardná odchýlka v programe Excel. Dúfam, že vám tieto informácie pomôžu. Každopádne vám ďakujem za prečítanie a dúfam, že sa uvidíme na našom blogu budúci týždeň.

    Michael Brown je nadšený technologický nadšenec s vášňou pre zjednodušovanie zložitých procesov pomocou softvérových nástrojov. S viac ako desaťročnými skúsenosťami v technologickom priemysle si zdokonalil svoje zručnosti v programoch Microsoft Excel a Outlook, ako aj Tabuľky Google a Dokumenty. Michaelov blog je venovaný zdieľaniu svojich vedomostí a odborných znalostí s ostatnými a poskytuje jednoduché tipy a návody na zlepšenie produktivity a efektivity. Či už ste skúsený profesionál alebo začiatočník, Michaelov blog ponúka cenné poznatky a praktické rady, ako z týchto základných softvérových nástrojov vyťažiť maximum.