Směrodatná odchylka v aplikaci Excel: příklady funkcí a vzorců

  • Sdílet Toto
Michael Brown

Výukový program vysvětluje podstatu směrodatné odchylky a směrodatné chyby průměru a také to, který vzorec je nejlepší použít pro výpočet směrodatné odchylky v aplikaci Excel.

V popisné statistice jsou aritmetický průměr (nazývaný také průměr) a směrodatná odchylka a dva úzce související pojmy. Ale zatímco prvnímu z nich většina lidí dobře rozumí, druhému rozumí jen málokdo. Cílem tohoto kurzu je osvětlit, co to vlastně směrodatná odchylka je a jak ji v Excelu vypočítat.

    Co je to směrodatná odchylka?

    Na stránkách směrodatná odchylka je míra, která udává, jak moc se hodnoty souboru dat odchylují (rozptylují) od průměru. Jinak řečeno, směrodatná odchylka ukazuje, zda jsou vaše data blízko průměru, nebo hodně kolísají.

    Účelem směrodatné odchylky je pomoci pochopit, zda průměr skutečně vrací "typická" data. Čím blíže je směrodatná odchylka nule, tím menší je variabilita dat a tím spolehlivější je průměr. Směrodatná odchylka rovná 0 znamená, že každá hodnota v souboru dat se přesně rovná průměru. Čím vyšší je směrodatná odchylka, tím větší je variabilita v souboru dat.dat a tím méně přesný je průměr.

    Pro lepší představu o tom, jak to funguje, se podívejte na následující údaje:

    U biologie je směrodatná odchylka 5 (zaokrouhleno na celé číslo), což nám říká, že většina výsledků se od průměru neodchyluje o více než 5 bodů. Je to dobře? Ano, znamená to, že výsledky žáků v biologii jsou poměrně vyrovnané.

    V matematice je směrodatná odchylka 23. Ukazuje, že výsledky jsou velmi rozptýlené, což znamená, že někteří žáci dosáhli mnohem lepších výsledků a někteří mnohem horších než průměr.

    Směrodatná odchylka je v praxi často používána obchodními analytiky jako měřítko investičního rizika - čím vyšší je směrodatná odchylka, tím vyšší je volatilita výnosů.

    Směrodatná odchylka vzorku vs. směrodatná odchylka populace

    V souvislosti se směrodatnou odchylkou můžete často slyšet pojmy "vzorek" a "populace", které se vztahují k úplnosti dat, s nimiž pracujete. Hlavní rozdíl je následující:

    • Obyvatelstvo obsahuje všechny prvky z datové sady.
    • Ukázka je podmnožina dat, která zahrnuje jeden nebo více prvků z populace.

    Výzkumníci a analytici pracují se směrodatnou odchylkou vzorku a populace v různých situacích. Například při shrnutí výsledků zkoušek třídy studentů použije učitel směrodatnou odchylku populace. Statistici, kteří počítají průměrný výsledek celostátních testů SAT, použijí směrodatnou odchylku vzorku, protože mají k dispozici pouze data ze vzorku, nikoliv ze vzorku.z celé populace.

    Porozumění vzorci pro výpočet směrodatné odchylky

    Na povaze dat záleží proto, že směrodatná odchylka populace a výběrová směrodatná odchylka se počítají podle mírně odlišných vzorců:

    Směrodatná odchylka vzorku

    Směrodatná odchylka populace

    Kde:

    • x i jsou jednotlivé hodnoty v souboru dat
    • x je průměr všech x hodnoty
    • n je celkový počet x hodnoty v souboru dat

    Máte potíže s pochopením vzorců? Možná vám pomůže jejich rozdělení do jednoduchých kroků. Nejdříve si však připravme vzorová data, se kterými budeme pracovat:

    1. Vypočítejte průměr (průměr)

    Nejprve zjistíte průměr všech hodnot v souboru dat ( x Při ručním výpočtu se čísla sečtou a pak se součet vydělí počtem těchto čísel takto:

    (1+2+4+5+6+8+9)/7=5

    Chcete-li v aplikaci Excel zjistit průměr, použijte funkci PRŮMĚR, např. =PRŮMĚR(A2:G2).

    2. U každého čísla odečtěte průměr a výsledek odmocněte.

    Toto je část vzorce pro směrodatnou odchylku, která říká: ( x i - x )2

    Chcete-li si představit, co se vlastně děje, podívejte se na následující obrázky.

    V tomto příkladu je průměr 5, takže vypočítáme rozdíl mezi každým datovým bodem a hodnotou 5.

    Poté rozdíly odmocníte, čímž je všechny převedete na kladná čísla:

    3. Sečtěte čtvercové rozdíly

    Když se v matematice řekne "sečíst věci", použije se sigma Σ. Nyní tedy sečteme čtvercové rozdíly a doplníme tuto část vzorce: Σ( x i - x )2

    16 + 9 + 1 + 1 + 9 + 16 = 52

    4. Vydělte celkový počet čtvercových rozdílů počtem hodnot.

    Doposud byly vzorce pro výběrovou a populační směrodatnou odchylku totožné. V tomto okamžiku se liší.

    Pro směrodatná odchylka vzorku , získáte výběrový rozptyl vydělením celkových kvadratických rozdílů velikostí vzorku minus 1:

    52 / (7-1) = 8.67

    Pro směrodatná odchylka populace , najdete střední hodnota čtvercových rozdílů vydělením celkových čtvercových rozdílů jejich počtem:

    52 / 7 = 7.43

    Proč je ve vzorcích tento rozdíl? Protože ve vzorci pro výběrovou směrodatnou odchylku je třeba opravit zkreslení odhadu výběrového průměru namísto skutečného populačního průměru. n - 1 místo n , která se nazývá Besselova korekce.

    5. Udělejte druhou odmocninu

    Nakonec odečtěte druhou odmocninu z výše uvedených čísel a získáte směrodatnou odchylku (v níže uvedených rovnicích zaokrouhlenou na 2 desetinná místa):

    Směrodatná odchylka vzorku Směrodatná odchylka populace
    √ 8.67 = 2.94 √ 7.43 = 2.73

    V programu Microsoft Excel se směrodatná odchylka počítá stejným způsobem, ale všechny výše uvedené výpočty se provádějí v zákulisí. Klíčové pro vás bude zvolit správnou funkci směrodatné odchylky, o které vám napoví následující kapitola.

    Jak vypočítat směrodatnou odchylku v aplikaci Excel

    Celkem existuje šest různých funkcí pro zjištění směrodatné odchylky v aplikaci Excel. Kterou z nich použít, závisí především na povaze dat, s nimiž pracujete - zda se jedná o celou populaci, nebo o vzorek.

    Funkce pro výpočet směrodatné odchylky vzorku v aplikaci Excel

    Pro výpočet směrodatné odchylky na základě vzorku použijte jeden z následujících vzorců (všechny vycházejí z výše popsané metody "n-1").

    Funkce STDEV aplikace Excel

    STDEV(číslo1,[číslo2],...) je nejstarší funkcí Excelu pro odhad směrodatné odchylky na základě vzorku a je k dispozici ve všech verzích Excelu 2003 až 2019.

    V aplikaci Excel 2007 a novějších může funkce STDEV přijmout až 255 argumentů, které mohou být reprezentovány čísly, poli, pojmenovanými rozsahy nebo odkazy na buňky obsahující čísla. V aplikaci Excel 2003 může funkce přijmout pouze 30 argumentů.

    Počítají se logické hodnoty a textové reprezentace čísel zadaných přímo v seznamu argumentů. V polích a odkazech se počítají pouze čísla; prázdné buňky, logické hodnoty TRUE a FALSE, text a chybové hodnoty se ignorují.

    Poznámka: Excel STDEV je zastaralá funkce, která je v novějších verzích Excelu zachována pouze kvůli zpětné kompatibilitě. Microsoft však neslibuje nic ohledně budoucích verzí. V Excelu 2010 a novějších verzích se proto doporučuje používat místo STDEV.S funkci STDEV.

    Funkce Excel STDEV.S

    STDEV.S(číslo1,[číslo2],...) je vylepšená verze STDEV, která byla zavedena v aplikaci Excel 2010.

    Stejně jako funkce STDEV vypočítá funkce STDEV.S výběrovou směrodatnou odchylku souboru hodnot na základě klasického vzorce pro výběrovou směrodatnou odchylku popsaného v předchozí části.

    Funkce STDEVA aplikace Excel

    STDEVA(hodnota1, [hodnota2], ...) je další funkce pro výpočet směrodatné odchylky vzorku v Excelu. Od dvou výše uvedených se liší pouze způsobem, jakým pracuje s logickými a textovými hodnotami:

    • Všechny logické hodnoty se počítají, ať už jsou obsaženy v polích nebo referencích, nebo jsou zapsány přímo v seznamu argumentů (TRUE se vyhodnotí jako 1, FALSE jako 0).
    • Textové hodnoty v rámci polí nebo referenčních argumentů se počítají jako 0, včetně prázdných řetězců (""), textových reprezentací čísel a jakéhokoli jiného textu. Textové reprezentace čísel zadaných přímo v seznamu argumentů se počítají jako čísla, která reprezentují (zde je příklad vzorce).
    • Prázdné buňky jsou ignorovány.

    Poznámka: Aby vzorec pro výběrovou směrodatnou odchylku fungoval správně, musí zadané argumenty obsahovat alespoň dvě číselné hodnoty, jinak je vrácena chyba #DIV/0!.

    Funkce pro výpočet směrodatné odchylky populace v aplikaci Excel

    Pokud pracujete s celou populací, použijte k provedení směrodatné odchylky v Excelu jednu z následujících funkcí. Tyto funkce jsou založeny na metodě "n".

    Funkce STDEVP aplikace Excel

    STDEVP(číslo1,[číslo2],...) je stará funkce Excelu pro zjištění směrodatné odchylky populace.

    V nových verzích aplikace Excel 2010, 2013, 2016 a 2019 je nahrazena vylepšenou funkcí STDEV.P, ale kvůli zpětné kompatibilitě je stále zachována.

    Funkce STDEV.P aplikace Excel

    STDEV.P(číslo1,[číslo2],...) je moderní verze funkce STDEVP, která poskytuje vyšší přesnost. Je k dispozici v aplikaci Excel 2010 a novějších verzích.

    Stejně jako jejich protějšky v podobě výběrové směrodatné odchylky počítají funkce STDEVP a STDEV.P v rámci polí nebo referenčních argumentů pouze čísla. V seznamu argumentů počítají také logické hodnoty a textové reprezentace čísel.

    Funkce STDEVPA aplikace Excel

    STDEVPA(hodnota1, [hodnota2], ...) vypočítá směrodatnou odchylku populace, včetně textových a logických hodnot. Pokud jde o nečíselné hodnoty, funkce STDEVPA pracuje stejně jako funkce STDEVA.

    Poznámka: Ať už použijete jakýkoli vzorec standardní odchylky aplikace Excel, vrátí chybu, pokud jeden nebo více argumentů obsahuje chybovou hodnotu vrácenou jinou funkcí nebo text, který nelze interpretovat jako číslo.

    Jakou funkci směrodatné odchylky v aplikaci Excel použít?

    Množství funkcí směrodatné odchylky v Excelu může rozhodně způsobit zmatek, zejména nezkušeným uživatelům. Chcete-li vybrat správný vzorec směrodatné odchylky pro konkrétní úlohu, stačí odpovědět na následující 3 otázky:

    • Vypočítáváte směrodatnou odchylku vzorku nebo populace?
    • Jakou verzi aplikace Excel používáte?
    • Obsahuje váš datový soubor pouze čísla nebo i logické hodnoty a text?

    Výpočet směrodatné odchylky na základě číselného údaje vzorek , použijte funkci STDEV.S v aplikaci Excel 2010 a novější; STDEV v aplikaci Excel 2007 a starší.

    Zjištění směrodatné odchylky populace , použijte funkci STDEV.P v aplikaci Excel 2010 a novější; STDEVP v aplikaci Excel 2007 a starší.

    Pokud chcete logické nebo text hodnoty, které mají být zahrnuty do výpočtu, použijte buď STDEVA (výběrová směrodatná odchylka), nebo STDEVPA (populační směrodatná odchylka). I když mě nenapadá žádný scénář, ve kterém by některá z funkcí mohla být užitečná sama o sobě, mohou se hodit ve větších vzorcích, kde jeden nebo více argumentů vracejí jiné funkce jako logické hodnoty nebo textové reprezentace čísel.

    Abyste se mohli rozhodnout, která z funkcí standardní odchylky aplikace Excel je pro vaše potřeby nejvhodnější, prostudujte si následující tabulku, která shrnuje informace, které jste se již naučili.

    STDEV STDEV.S STDEVP STDEV.P STDEVA STDEVPA
    Verze aplikace Excel 2003 - 2019 2010 - 2019 2003 - 2019 2010 - 2019 2003 - 2019 2003 - 2019
    Ukázka
    Obyvatelstvo
    Logické hodnoty v polích nebo referencích Ignorováno Hodnoceno

    (TRUE=1, FALSE=0)

    Text v polích nebo referencích Ignorováno Vyhodnoceno jako nula
    Logické hodnoty a "textová čísla" v seznamu argumentů Hodnoceno

    (TRUE=1, FALSE=0)

    Prázdné buňky Ignorováno

    Příklady vzorců pro standardní odchylku aplikace Excel

    Jakmile si vyberete funkci, která odpovídá vašemu datovému typu, neměli byste mít se zápisem vzorce žádné potíže - syntaxe je tak jednoduchá a přehledná, že nedává prostor pro chyby :) Následující příklady ukazují několik vzorců pro směrodatnou odchylku v aplikaci Excel v praxi.

    Výpočet směrodatné odchylky vzorku a populace

    V závislosti na povaze dat použijte jeden z následujících vzorců:

    • Výpočet směrodatné odchylky na základě celého souboru populace , tj. úplný seznam hodnot (v tomto příkladu B2:B50), použijte funkci STDEV.P:

      =STDEV.P(B2:B50)

    • Zjištění směrodatné odchylky na základě vzorek která tvoří část nebo podmnožinu populace (v tomto příkladu B2:B10), použijte funkci STDEV.S:

      =STDEV.S(B2:B10)

    Jak vidíte na obrázku níže, vzorce vracejí mírně odlišná čísla (čím menší vzorek, tím větší rozdíl):

    V aplikaci Excel 2007 a nižších verzích se místo toho používají funkce STDEVP a STDEV:

    • Získání směrodatné odchylky populace:

      =STDEVP(B2:B50)

    • Výpočet směrodatné odchylky vzorku:

      =STDEV(B2:B10)

    Výpočet směrodatné odchylky pro textové znázornění čísel

    Když jsme se bavili o různých funkcích pro výpočet směrodatné odchylky v aplikaci Excel, občas jsme se zmiňovali o "textových reprezentacích čísel" a možná vás zajímá, co to vlastně znamená.

    V tomto kontextu jsou "textové reprezentace čísel" jednoduše čísla formátovaná jako text. Jak se taková čísla mohou objevit ve vašich pracovních listech? Nejčastěji jsou exportována z externích zdrojů. Nebo je vracejí tzv. textové funkce, které jsou určeny k manipulaci s textovými řetězci, např. TEXT, MID, RIGHT, LEFT atd. Některé z těchto funkcí mohou pracovat i s čísly, ale jejich výstupem je vždy text, dokonce ipokud vypadá jako číslo.

    Pro lepší ilustraci uvažujte následující příklad. Předpokládejme, že máte sloupec kódů výrobků jako "Džíny-105", kde číslice za pomlčkou označují množství. Vaším cílem je extrahovat množství každé položky a poté zjistit směrodatnou odchylku extrahovaných čísel.

    Přetažení množství do jiného sloupce není problém:

    =RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))

    Problém spočívá v tom, že použití vzorce směrodatné odchylky aplikace Excel na extrahovaná čísla vrátí buď #DIV/0!, nebo 0, jak je znázorněno na obrázku níže:

    Proč takové podivné výsledky? Jak bylo uvedeno výše, výstupem funkce RIGHT je vždy textový řetězec. Ale ani STDEV.S, ani STDEVA neumí pracovat s čísly formátovanými jako text v odkazech (první z nich je prostě ignoruje, zatímco druhý počítá jako nuly). Chcete-li získat směrodatnou odchylku takových "textových čísel", musíte je dodat přímo do seznamu argumentů, což lze provést vložením všechRIGHT do vzorce STDEV.S nebo STDEVA:

    =STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))).

    =STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))).

    Vzorce jsou poněkud těžkopádné, ale pro malý vzorek by to mohlo být funkční řešení. Pro větší vzorek, nemluvě o celé populaci, to rozhodně nepřipadá v úvahu. V tomto případě by bylo elegantnějším řešením, kdyby funkce VALUE převedla "textová čísla" na čísla, kterým rozumí jakýkoli vzorec pro směrodatnou odchylku (všimněte si prosím čísel zarovnaných vpravo na snímku obrazovkyna rozdíl od textových řetězců zarovnaných vlevo na obrázku výše):

    Jak vypočítat standardní chybu průměru v aplikaci Excel

    Ve statistice existuje ještě jedno měřítko pro odhad variability dat - standardní chyba průměru , která se někdy zkracuje (i když nesprávně) na pouhou "směrodatnou odchylku". Směrodatná odchylka a směrodatná chyba průměru jsou dva úzce související pojmy, ale nejsou totožné.

    Zatímco směrodatná odchylka měří variabilitu souboru dat od průměru, směrodatná chyba průměru (SEM) odhaduje, jak daleko je pravděpodobně výběrový průměr od skutečného populačního průměru. Jinak řečeno - pokud byste odebrali více vzorků ze stejné populace, směrodatná chyba průměru by ukázala rozptyl mezi těmito výběrovými průměry. Protože obvykle počítáme pouze jedenprůměr pro soubor dat, nikoli více průměrů, standardní chyba průměru se spíše odhaduje než měří.

    V matematice se standardní chyba průměru počítá podle tohoto vzorce:

    Kde: SD je směrodatná odchylka a n je velikost vzorku (počet hodnot ve vzorku).

    V tabulkách aplikace Excel můžete použít funkci COUNT pro zjištění počtu hodnot ve vzorku, SQRT pro výpočet druhé odmocniny z tohoto počtu a STDEV.S pro výpočet směrodatné odchylky vzorku.

    Když to všechno spojíte dohromady, získáte vzorec pro standardní chybu průměru v aplikaci Excel:

    STDEV.S( rozsah )/SQRT(COUNT( rozsah ))

    Za předpokladu, že data vzorku jsou v rozmezí B2:B10, náš vzorec SEM by vypadal následovně:

    =STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))

    A výsledek by mohl být podobný tomuto:

    Jak přidat sloupce směrodatné odchylky v aplikaci Excel

    Chcete-li vizuálně zobrazit rozpětí směrodatné odchylky, můžete do grafu aplikace Excel přidat sloupce směrodatné odchylky. Zde je uveden postup:

    1. Vytvořte graf obvyklým způsobem ( Vložte karta> Grafy skupina).
    2. Kliknutím kdekoli na grafu jej vyberte a poté klikněte na tlačítko Prvky grafu tlačítko.
    3. Klikněte na šipku vedle Chybové sloupce a vybrat Směrodatná odchylka .

    Tím se pro všechny datové body vloží stejné sloupce směrodatné odchylky.

    Takto se provádí standardní odchylka v Excelu. Doufám, že vám tyto informace pomohou. Každopádně vám děkuji za přečtení a doufám, že se příští týden uvidíme na našem blogu.

    Michael Brown je oddaný technologický nadšenec s vášní pro zjednodušování složitých procesů pomocí softwarových nástrojů. S více než desetiletými zkušenostmi v technologickém průmyslu zdokonalil své dovednosti v aplikacích Microsoft Excel a Outlook a také v Tabulkách a Dokumentech Google. Michaelův blog je věnován sdílení jeho znalostí a odborných znalostí s ostatními a poskytuje snadno pochopitelné tipy a návody pro zlepšení produktivity a efektivity. Ať už jste zkušený profesionál nebo začátečník, Michaelův blog nabízí cenné postřehy a praktické rady, jak tyto základní softwarové nástroje co nejlépe využít.