Obsah
V tomto návode sa pozrieme na to, ako urobiť analýzu rozptylu v programe Excel a aké vzorce použiť na zistenie rozptylu vzorky a populácie.
Rozptyl je jedným z najužitočnejších nástrojov v teórii pravdepodobnosti a štatistike. Vo vede opisuje, ako ďaleko je každé číslo v súbore údajov od priemeru. V praxi často ukazuje, ako veľmi sa niečo mení. Napríklad teplota v blízkosti rovníka má menší rozptyl ako v iných klimatických pásmach. V tomto článku budeme analyzovať rôzne metódy výpočtu rozptylu v programe Excel.
Čo je to odchýlka?
Odchýlka je miera variability súboru údajov, ktorá udáva, ako ďaleko sú rozptýlené rôzne hodnoty. Matematicky je definovaná ako priemer štvorcových rozdielov od priemeru.
Aby ste lepšie pochopili, čo vlastne počítate s odchýlkou, zvážte tento jednoduchý príklad.
Predpokladajme, že v miestnej zoo je 5 tigrov, ktoré majú 14, 10, 8, 6 a 2 roky.
Ak chcete zistiť odchýlku, postupujte podľa týchto jednoduchých krokov:
- Vypočítajte priemer (jednoduchý priemer) piatich čísel:
- Od každého čísla odpočítajte priemer a zistite rozdiely. Aby ste to mohli vizualizovať, zakreslite rozdiely do grafu:
- Každý rozdiel vyčíslite štvorcovým číslom.
- Vypočítajte priemer štvorcových rozdielov.
Rozdiel je teda 16. Čo však toto číslo vlastne znamená?
V skutočnosti vám rozptyl poskytuje len veľmi všeobecnú predstavu o rozptyle súboru údajov. Hodnota 0 znamená, že neexistuje žiadna variabilita, t. j. všetky čísla v súbore údajov sú rovnaké. Čím väčšie číslo, tým sú údaje rozptýlenejšie.
Tento príklad sa týka populačného rozptylu (t. j. 5 tigrov je celá skupina, ktorá vás zaujíma). Ak sú vaše údaje výberom z väčšej populácie, potom musíte vypočítať výberový rozptyl pomocou trochu iného vzorca.
Ako vypočítať odchýlku v programe Excel
V programe Excel je zabudovaných 6 funkcií na výpočet odchýlky: VAR, VAR.S, VARP, VAR.P, VARA a VARPA.
Výber vzorca odchýlky je podmienený nasledujúcimi faktormi:
- Verzia programu Excel, ktorú používate.
- Či už počítate výberový alebo populačný rozptyl.
- Či chcete vyhodnotiť alebo ignorovať textové a logické hodnoty.
Funkcie odchýlky programu Excel
V nasledujúcej tabuľke je uvedený prehľad variačných funkcií dostupných v programe Excel, ktorý vám pomôže vybrať vzorec, ktorý najlepšie vyhovuje vašim potrebám.
Názov | Verzia programu Excel | Typ údajov | Text a logické prvky |
VAR | 2000 - 2019 | Vzorka | Ignorované |
VAR.S | 2010 - 2019 | Vzorka | Ignorované |
VARA | 2000 - 2019 | Vzorka | Vyhodnotené |
VARP | 2000 - 2019 | Obyvateľstvo | Ignorované |
VAR.P | 2010 - 2019 | Obyvateľstvo | Ignorované |
VARPA | 2000 - 2019 | Obyvateľstvo | Vyhodnotené |
VAR.S vs. VARA a VAR.P vs. VARPA
Funkcie VARA a VARPA sa od ostatných funkcií variácie líšia len v spôsobe, akým narábajú s logickými a textovými hodnotami v odkazoch. Nasledujúca tabuľka poskytuje prehľad o tom, ako sa vyhodnocujú textové reprezentácie čísel a logických hodnôt.
Typ argumentu | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Logické hodnoty v poliach a referenciách | Ignorované | Vyhodnotené (TRUE=1, FALSE=0) |
Textové reprezentácie čísel v poliach a odkazoch | Ignorované | Vyhodnotené ako nula |
Logické hodnoty a textové reprezentácie čísel zadaných priamo do argumentov | Vyhodnotené (TRUE=1, FALSE=0) | |
Prázdne bunky | Ignorované |
Ako vypočítať výberový rozptyl v programe Excel
A vzorka je súbor údajov získaných z celej populácie. A rozptyl vypočítaný zo vzorky sa nazýva rozptyl vzorky .
Ak napríklad chcete zistiť, ako sa líši výška ľudí, bolo by pre vás technicky nerealizovateľné merať každého človeka na zemi. Riešením je vziať vzorku populácie, napríklad 1 000 ľudí, a na základe tejto vzorky odhadnúť výšku celej populácie.
Rozptyl vzorky sa vypočíta podľa tohto vzorca:
Kde:
- x̄ je priemer (jednoduchý priemer) hodnôt vzorky.
- n je veľkosť vzorky, t. j. počet hodnôt vo vzorke.
V programe Excel existujú 3 funkcie na zistenie výberového rozptylu: VAR, VAR.S a VARA.
Funkcia VAR v programe Excel
Je to najstaršia funkcia programu Excel na odhad rozptylu na základe vzorky. Funkcia VAR je k dispozícii vo všetkých verziách programu Excel 2000 až 2019.
VAR(číslo1, [číslo2], ...)Poznámka: V programe Excel 2010 bola funkcia VAR nahradená funkciou VAR.S, ktorá poskytuje vyššiu presnosť. Hoci je funkcia VAR stále k dispozícii kvôli spätnej kompatibilite, v súčasných verziách programu Excel sa odporúča používať funkciu VAR.S.
Funkcia VAR.S v programe Excel
Je to moderná obdoba funkcie VAR programu Excel. Funkciu VAR.S použite na zistenie výberového rozptylu v programe Excel 2010 a novších.
VAR.S(číslo1, [číslo2], ...)Funkcia VARA v programe Excel
Funkcia VARA programu Excel vráti vzorový rozptyl na základe súboru čísel, textu a logických hodnôt, ako je uvedené v tejto tabuľke.
VARA(hodnota1, [hodnota2], ...)Ukážka vzorca pre odchýlky v programe Excel
Pri práci s číselným súborom údajov môžete na výpočet výberového rozptylu v programe Excel použiť ktorúkoľvek z uvedených funkcií.
Ako príklad uvedieme zistenie rozptylu vzorky pozostávajúcej zo 6 položiek (B2:B7). Na tento účel môžete použiť jeden z nižšie uvedených vzorcov:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Ako je znázornené na snímke obrazovky, všetky vzorce vrátia rovnaký výsledok (zaokrúhlený na 2 desatinné miesta):
Ak chcete skontrolovať výsledok, vykonajme výpočet var ručne:
- Nájdite priemer pomocou funkcie AVERAGE:
=PRIEMER(B2:B7)
Priemer sa dostane do ľubovoľnej prázdnej bunky, napríklad B8.
- Od každého čísla vo vzorke odpočítajte priemer:
=B2-$B$8
Rozdiely sa prenesú do stĺpca C, začínajúceho v C2.
- Každý rozdiel vyčíslite na druhú stranu a výsledky zapíšte do stĺpca D, počnúc D2:
=C2^2
- Súčet štvorcových rozdielov a výsledok vydeľte počtom položiek vo vzorke mínus 1:
=SUM(D2:D7)/(6-1)
Ako vidíte, výsledok nášho ručného výpočtu var je presne rovnaký ako číslo vrátené vstavanými funkciami programu Excel:
Ak váš súbor údajov obsahuje Boolean a/alebo text VARA vráti iný výsledok. Dôvodom je, že VAR a VAR.S ignorujú akékoľvek iné hodnoty ako čísla v odkazoch, zatiaľ čo VARA vyhodnocuje textové hodnoty ako nuly, TRUE ako 1 a FALSE ako 0. Preto starostlivo vyberte funkciu VARA pre svoje výpočty v závislosti od toho, či chcete spracovať alebo ignorovať text a logické znaky.
Ako vypočítať populačný rozptyl v programe Excel
Obyvateľstvo sú všetci členovia danej skupiny, t. j. všetky pozorovania v skúmanej oblasti. Rozptyl populácie opisuje, ako sú rozložené dátové body v celej populácii.
Populačný rozptyl možno zistiť pomocou tohto vzorca:
Kde:
- x̄ je priemer populácie.
- n je veľkosť populácie, t. j. celkový počet hodnôt v populácii.
V programe Excel existujú 3 funkcie na výpočet populačného rozptylu: VARP, VAR.P a VARPA.
Funkcia VARP v programe Excel
Funkcia VARP programu Excel vracia rozptyl populácie na základe celého súboru čísel. Je k dispozícii vo všetkých verziách programu Excel 2000 až 2019.
VARP(číslo1, [číslo2], ...)Poznámka: V programe Excel 2010 bola funkcia VARP nahradená funkciou VAR.P, ale je stále zachovaná kvôli spätnej kompatibilite. V súčasných verziách programu Excel sa odporúča používať funkciu VAR.P, pretože nie je zaručené, že funkcia VARP bude k dispozícii aj v budúcich verziách programu Excel.
Funkcia VAR.P v programe Excel
Ide o vylepšenú verziu funkcie VARP, ktorá je k dispozícii v programe Excel 2010 a novších.
VAR.P(číslo1, [číslo2], ...)Funkcia VARPA v programe Excel
Funkcia VARPA vypočíta rozptyl populácie na základe celého súboru čísel, textu a logických hodnôt. Je k dispozícii vo všetkých verziách programu Excel 2000 až 2019.
VARA(hodnota1, [hodnota2], ...)Vzorec pre populačný rozptyl v programe Excel
V ukážke výpočtu var sme zistili rozptyl výsledkov 5 skúšok za predpokladu, že tieto výsledky boli výberom z väčšej skupiny študentov. Ak zozbierate údaje o všetkých študentoch v skupine, tieto údaje budú predstavovať celú populáciu a pomocou uvedených funkcií vypočítate populačný rozptyl.
Povedzme, že máme výsledky skúšok skupiny 10 študentov (B2:B11). Výsledky tvoria celú populáciu, takže budeme robiť variácie pomocou týchto vzorcov:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
A všetky vzorce vrátia rovnaký výsledok:
Ak sa chcete uistiť, že program Excel vykonal odchýlku správne, môžete ju skontrolovať pomocou vzorca na ručný výpočet var, ktorý je uvedený na nasledujúcej snímke obrazovky:
Ak sa niektorí študenti nezúčastnili skúšky a namiesto čísla skóre majú N/A, funkcia VARPA vráti iný výsledok. Dôvodom je, že VARPA vyhodnocuje textové hodnoty ako nuly, zatiaľ čo VARP a VAR.P ignorujú textové a logické hodnoty v odkazoch. Podrobné informácie nájdete v časti VAR.P vs. VARPA.
Vzorec pre odchýlku v programe Excel - poznámky k použitiu
Ak chcete správne vykonať analýzu odchýlok v programe Excel, dodržiavajte tieto jednoduché pravidlá:
- Argumenty zadávajte ako hodnoty, polia alebo odkazy na bunky.
- V programe Excel 2007 a novších môžete zadať až 255 argumentov zodpovedajúcich vzorke alebo populácii; v programe Excel 2003 a starších až 30 argumentov.
- Vyhodnotiť iba čísla v odkazoch, pričom ignorujte prázdne bunky, text a logické hodnoty, použite funkciu VAR alebo VAR.S na výpočet výberového rozptylu a VARP alebo VAR.P na zistenie populačného rozptylu.
- Vyhodnotiť logické a text hodnoty v odkazoch, použite funkciu VARA alebo VARPA.
- Poskytnite aspoň dve číselné hodnoty do vzorca pre výberový rozptyl a aspoň jedna číselná hodnota do vzorca populačného rozptylu v programe Excel, inak sa vyskytne chyba #DIV/0!.
- Argumenty obsahujúce text, ktorý nemožno interpretovať ako čísla, spôsobujú chyby #VALUE!.
Rozptyl vs. štandardná odchýlka v programe Excel
Rozptyl je vo vede nepochybne užitočný pojem, ale poskytuje veľmi málo praktických informácií. Napríklad sme zistili vek populácie tigrov v miestnej zoo a vypočítali sme rozptyl, ktorý sa rovná 16. Otázka znie - ako môžeme toto číslo skutočne použiť?
Na určenie smerodajnej odchýlky môžete použiť rozptyl, ktorý je oveľa lepším meradlom množstva odchýlok v súbore údajov.
Štandardná odchýlka sa vypočíta ako druhá odmocnina z rozptylu. Takže zoberieme druhú odmocninu zo 16 a dostaneme štandardnú odchýlku 4.
V kombinácii s priemerom vám štandardná odchýlka môže povedať, koľko rokov má väčšina tigrov. Ak je napríklad priemer 8 a štandardná odchýlka 4, väčšina tigrov v zoo má od 4 rokov (8 - 4) do 12 rokov (8 + 4).
Microsoft Excel má špeciálne funkcie na výpočet štandardnej odchýlky vzorky a populácie. Podrobné vysvetlenie všetkých funkcií nájdete v tomto návode: Ako vypočítať štandardnú odchýlku v programe Excel.
To je spôsob, ako urobiť odchýlku v programe Excel. Ak sa chcete bližšie pozrieť na vzorce, o ktorých sa hovorí v tomto návode, môžete si stiahnuť náš vzorový zošit na konci tohto príspevku. Ďakujem vám za prečítanie a dúfam, že sa uvidíme na našom blogu budúci týždeň!
Cvičný zošit
Výpočet odchýlky v programe Excel - príklady (.xlsx súbor)