Obsah
V tomto tutoriálu se podíváme na to, jak provést analýzu rozptylu v aplikaci Excel a jaké vzorce použít ke zjištění rozptylu vzorku a populace.
Rozptyl je jedním z nejužitečnějších nástrojů v teorii pravděpodobnosti a statistice. Ve vědě popisuje, jak daleko je každé číslo v souboru dat od průměru. V praxi často ukazuje, jak moc se něco mění. Například teplota v blízkosti rovníku má menší rozptyl než v jiných klimatických pásmech. V tomto článku budeme analyzovat různé metody výpočtu rozptylu v aplikaci Excel.
Co je to odchylka?
Odchylka je míra variability souboru dat, která udává, jak moc jsou různé hodnoty rozprostřeny. Matematicky je definována jako průměr čtverců rozdílů od průměru.
Abyste lépe pochopili, co vlastně počítáte s rozptylem, vezměte prosím v úvahu tento jednoduchý příklad.
Předpokládejme, že v místní zoo je pět tygrů ve věku 14, 10, 8, 6 a 2 roky.
Chcete-li zjistit odchylku, postupujte podle následujících jednoduchých kroků:
- Vypočítejte průměr (prostý průměr) těchto pěti čísel:
- Od každého čísla odečtěte průměr a zjistěte rozdíly. Pro vizualizaci vyneseme rozdíly do grafu:
- Každý rozdíl je čtvercový.
- Vypočítejte průměr čtvercových rozdílů.
Rozptyl je tedy 16. Co ale toto číslo vlastně znamená?
Ve skutečnosti vám rozptyl pouze poskytuje velmi obecnou představu o rozptylu souboru dat. Hodnota 0 znamená, že neexistuje žádná variabilita, tj. všechna čísla v souboru dat jsou stejná. Čím větší číslo, tím jsou data rozptýlenější.
Tento příklad se týká populačního rozptylu (tj. 5 tygrů je celá skupina, která vás zajímá). Pokud jsou vaše data výběrem z větší populace, musíte vypočítat výběrový rozptyl pomocí trochu jiného vzorce.
Jak vypočítat rozptyl v aplikaci Excel
V aplikaci Excel je k dispozici 6 vestavěných funkcí, které slouží k provádění variací: VAR, VAR.S, VARP, VAR.P, VARA a VARPA.
Volba vzorce pro rozptyl je určena následujícími faktory:
- Verze aplikace Excel, kterou používáte.
- Ať už počítáte výběrový nebo populační rozptyl.
- Zda chcete vyhodnocovat nebo ignorovat textové a logické hodnoty.
Funkce rozptylu aplikace Excel
Následující tabulka obsahuje přehled variačních funkcí dostupných v aplikaci Excel, který vám pomůže vybrat vzorec nejvhodnější pro vaše potřeby.
Název | Verze aplikace Excel | Datový typ | Text a logické prvky |
VAR | 2000 - 2019 | Ukázka | Ignorováno |
VAR.S | 2010 - 2019 | Ukázka | Ignorováno |
VARA | 2000 - 2019 | Ukázka | Hodnoceno |
VARP | 2000 - 2019 | Obyvatelstvo | Ignorováno |
VAR.P | 2010 - 2019 | Obyvatelstvo | Ignorováno |
VARPA | 2000 - 2019 | Obyvatelstvo | Hodnoceno |
VAR.S vs. VARA a VAR.P vs. VARPA
Funkce VARA a VARPA se od ostatních variančních funkcí liší pouze způsobem, jakým pracují s logickými a textovými hodnotami v odkazech. Následující tabulka obsahuje přehled způsobu vyhodnocování textových reprezentací čísel a logických hodnot.
Typ argumentu | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Logické hodnoty v polích a referencích | Ignorováno | Hodnoceno (TRUE=1, FALSE=0) |
Textová reprezentace čísel v polích a referencích | Ignorováno | Vyhodnoceno jako nula |
Logické hodnoty a textové reprezentace čísel zadaných přímo do argumentů | Hodnoceno (TRUE=1, FALSE=0) | |
Prázdné buňky | Ignorováno |
Jak vypočítat výběrový rozptyl v aplikaci Excel
A vzorek je soubor dat vybraný z celé populace. A rozptyl vypočítaný ze vzorku se nazývá výběrový rozptyl .
Pokud například chcete zjistit, jak se liší výška lidí, bylo by pro vás technicky neproveditelné změřit každého člověka na zemi. Řešením je vzít vzorek populace, například 1 000 lidí, a na základě tohoto vzorku odhadnout výšku celé populace.
Výběrový rozptyl se vypočítá podle tohoto vzorce:
Kde:
- x̄ je průměr (prostý průměr) hodnot vzorku.
- n je velikost vzorku, tj. počet hodnot ve vzorku.
V aplikaci Excel existují 3 funkce pro zjištění výběrového rozptylu: VAR, VAR.S a VARA.
Funkce VAR v aplikaci Excel
Jedná se o nejstarší funkci aplikace Excel pro odhad rozptylu na základě vzorku. Funkce VAR je k dispozici ve všech verzích aplikace Excel 2000 až 2019.
VAR(číslo1, [číslo2], ...)Poznámka: V aplikaci Excel 2010 byla funkce VAR nahrazena funkcí VAR.S, která poskytuje vyšší přesnost. Přestože je funkce VAR stále k dispozici kvůli zpětné kompatibilitě, doporučuje se v současných verzích aplikace Excel používat funkci VAR.S.
Funkce VAR.S v aplikaci Excel
Jedná se o moderní obdobu funkce VAR v aplikaci Excel. Funkci VAR.S použijte ke zjištění výběrového rozptylu v aplikaci Excel 2010 a novějších.
VAR.S(číslo1, [číslo2], ...)Funkce VARA v aplikaci Excel
Funkce VARA aplikace Excel vrací výběrový rozptyl na základě sady čísel, textu a logických hodnot, jak je uvedeno v této tabulce.
VARA(hodnota1, [hodnota2], ...)Ukázka vzorce pro rozptyl v aplikaci Excel
Při práci s číselným souborem dat můžete k výpočtu výběrového rozptylu v aplikaci Excel použít kteroukoli z výše uvedených funkcí.
Jako příklad uveďme rozptyl vzorku složeného ze 6 položek (B2:B7). K tomu můžete použít jeden z níže uvedených vzorců:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Jak ukazuje obrázek, všechny vzorce vracejí stejný výsledek (zaokrouhlený na 2 desetinná místa):
Pro kontrolu výsledku proveďme výpočet var ručně:
- Zjistěte průměr pomocí funkce AVERAGE:
=PRŮMĚR(B2:B7)
Průměr jde do libovolné prázdné buňky, například B8.
- Odečtěte průměr od každého čísla ve vzorku:
=B2-$B$8
Rozdíly se přenesou do sloupce C, počínaje C2.
- Každý rozdíl vynásobte čtvercem a výsledky zapište do sloupce D, počínaje D2:
=C2^2
- Sečtěte čtvercové rozdíly a výsledek vydělte počtem položek ve vzorku minus 1:
=SOUČET(D2:D7)/(6-1)
Jak vidíte, výsledek našeho ručního výpočtu var je přesně stejný jako číslo vrácené vestavěnými funkcemi aplikace Excel:
Pokud vaše datová sada obsahuje Boolean a/nebo text funkce VARA vrátí jiný výsledek. Důvodem je, že VAR a VAR.S ignorují jiné hodnoty než čísla v odkazech, zatímco VARA vyhodnocuje textové hodnoty jako nuly, TRUE jako 1 a FALSE jako 0. Proto pečlivě vybírejte funkci VARA pro své výpočty podle toho, zda chcete zpracovávat nebo ignorovat text a logické znaky.
Jak vypočítat populační rozptyl v aplikaci Excel
Obyvatelstvo jsou všichni členové dané skupiny, tj. všechna pozorování ve zkoumané oblasti. Rozptyl populace popisuje, jak jsou datové body v celé populaci rozloženy.
Populační rozptyl lze zjistit podle tohoto vzorce:
Kde:
- x̄ je střední hodnota populace.
- n je velikost populace, tj. celkový počet hodnot v populaci.
V aplikaci Excel existují 3 funkce pro výpočet populačního rozptylu: VARP, VAR.P a VARPA.
Funkce VARP v aplikaci Excel
Funkce VARP aplikace Excel vrací rozptyl populace na základě celého souboru čísel. Je k dispozici ve všech verzích aplikace Excel 2000 až 2019.
VARP(číslo1, [číslo2], ...)Poznámka: V Excelu 2010 byla funkce VARP nahrazena funkcí VAR.P, ale je stále zachována kvůli zpětné kompatibilitě. Doporučuje se používat VAR.P v současných verzích Excelu, protože není zaručeno, že funkce VARP bude k dispozici i v budoucích verzích Excelu.
Funkce VAR.P v aplikaci Excel
Jedná se o vylepšenou verzi funkce VARP, která je k dispozici v aplikaci Excel 2010 a novějších verzích.
VAR.P(číslo1, [číslo2], ...)Funkce VARPA v aplikaci Excel
Funkce VARPA vypočítá rozptyl populace na základě celého souboru čísel, textu a logických hodnot. Je k dispozici ve všech verzích aplikace Excel 2000 až 2019.
VARA(hodnota1, [hodnota2], ...)Vzorec pro populační rozptyl v aplikaci Excel
V ukázkovém příkladu výpočtu var jsme zjistili rozptyl výsledků 5 zkoušek za předpokladu, že tyto výsledky byly výběrem z větší skupiny studentů. Pokud shromáždíte údaje o všech studentech ve skupině, budou tyto údaje představovat celou populaci a pomocí výše uvedených funkcí vypočtete populační rozptyl.
Řekněme, že máme k dispozici výsledky zkoušek skupiny 10 studentů (B2:B11). Tyto výsledky tvoří celou populaci, takže budeme provádět rozptyl pomocí těchto vzorců:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
A všechny vzorce vrátí stejný výsledek:
Chcete-li se ujistit, že Excel provedl rozptyl správně, můžete jej zkontrolovat pomocí vzorce pro ruční výpočet var, který je uveden na obrázku níže:
Pokud se někteří studenti zkoušky nezúčastnili a místo čísla skóre mají N/A, funkce VARPA vrátí jiný výsledek. Důvodem je, že VARPA vyhodnocuje textové hodnoty jako nuly, zatímco VARP a VAR.P textové a logické hodnoty v odkazech ignorují. Podrobné informace naleznete v části VAR.P vs. VARPA.
Vzorec pro výpočet odchylky v aplikaci Excel - poznámky k použití
Chcete-li správně provést analýzu rozptylu v aplikaci Excel, dodržujte tato jednoduchá pravidla:
- Argumenty zadávejte jako hodnoty, pole nebo odkazy na buňky.
- V aplikaci Excel 2007 a novější můžete zadat až 255 argumentů odpovídajících vzorku nebo populaci; v aplikaci Excel 2003 a starší - až 30 argumentů.
- Vyhodnocení pouze čísla v odkazech, bez ohledu na prázdné buňky, text a logické hodnoty, použijte funkci VAR nebo VAR.S pro výpočet výběrového rozptylu a VARP nebo VAR.P pro zjištění populačního rozptylu.
- Vyhodnocení logické a text hodnoty v referencích, použijte funkci VARA nebo VARPA.
- Poskytněte alespoň dvě číselné hodnoty do vzorce pro výběrový rozptyl a alespoň jedna číselná hodnota do vzorce populačního rozptylu v Excelu, jinak dojde k chybě #DIV/0!.
- Argumenty obsahující text, který nelze interpretovat jako čísla, způsobují chyby #VALUE!.
Rozptyl vs. směrodatná odchylka v aplikaci Excel
Rozptyl je ve vědě nepochybně užitečný pojem, ale poskytuje jen velmi málo praktických informací. Například jsme zjistili věk populace tygrů v místní zoo a vypočítali rozptyl, který se rovná 16. Otázka zní - jak toto číslo vlastně můžeme použít?
Pomocí rozptylu můžete zjistit směrodatnou odchylku, která je mnohem lepším měřítkem míry variability souboru dat.
Směrodatná odchylka se vypočítá jako druhá odmocnina z rozptylu. Vezmeme tedy druhou odmocninu z 16 a dostaneme směrodatnou odchylku 4.
Směrodatná odchylka v kombinaci s průměrem může říci, jak stará je většina tygrů. Například pokud je průměr 8 a směrodatná odchylka 4, většina tygrů v zoo je stará od 4 let (8 - 4) do 12 let (8 + 4).
Microsoft Excel má speciální funkce pro výpočet směrodatné odchylky vzorku a populace. Podrobné vysvětlení všech funkcí najdete v tomto návodu: Jak vypočítat směrodatnou odchylku v Excelu.
Takto se v Excelu provádí variance. Chcete-li se blíže seznámit se vzorci probíranými v tomto návodu, můžete si stáhnout náš ukázkový sešit na konci tohoto příspěvku. Děkuji vám za přečtení a doufám, že se příští týden uvidíme na našem blogu!
Cvičebnice
Výpočet odchylky v aplikaci Excel - příklady (.xlsx soubor)