Ako vypočítať rozptyl v programe Excel - vzorka & vzorec pre populačný rozptyl

  • Zdieľajte To
Michael Brown

V tomto návode sa pozrieme na to, ako urobiť analýzu rozptylu v programe Excel a aké vzorce použiť na zistenie rozptylu vzorky a populácie.

Rozptyl je jedným z najužitočnejších nástrojov v teórii pravdepodobnosti a štatistike. Vo vede opisuje, ako ďaleko je každé číslo v súbore údajov od priemeru. V praxi často ukazuje, ako veľmi sa niečo mení. Napríklad teplota v blízkosti rovníka má menší rozptyl ako v iných klimatických pásmach. V tomto článku budeme analyzovať rôzne metódy výpočtu rozptylu v programe Excel.

    Čo je to odchýlka?

    Odchýlka je miera variability súboru údajov, ktorá udáva, ako ďaleko sú rozptýlené rôzne hodnoty. Matematicky je definovaná ako priemer štvorcových rozdielov od priemeru.

    Aby ste lepšie pochopili, čo vlastne počítate s odchýlkou, zvážte tento jednoduchý príklad.

    Predpokladajme, že v miestnej zoo je 5 tigrov, ktoré majú 14, 10, 8, 6 a 2 roky.

    Ak chcete zistiť odchýlku, postupujte podľa týchto jednoduchých krokov:

    1. Vypočítajte priemer (jednoduchý priemer) piatich čísel:

    2. Od každého čísla odpočítajte priemer a zistite rozdiely. Aby ste to mohli vizualizovať, zakreslite rozdiely do grafu:

    3. Každý rozdiel vyčíslite štvorcovým číslom.
    4. Vypočítajte priemer štvorcových rozdielov.

    Rozdiel je teda 16. Čo však toto číslo vlastne znamená?

    V skutočnosti vám rozptyl poskytuje len veľmi všeobecnú predstavu o rozptyle súboru údajov. Hodnota 0 znamená, že neexistuje žiadna variabilita, t. j. všetky čísla v súbore údajov sú rovnaké. Čím väčšie číslo, tým sú údaje rozptýlenejšie.

    Tento príklad sa týka populačného rozptylu (t. j. 5 tigrov je celá skupina, ktorá vás zaujíma). Ak sú vaše údaje výberom z väčšej populácie, potom musíte vypočítať výberový rozptyl pomocou trochu iného vzorca.

    Ako vypočítať odchýlku v programe Excel

    V programe Excel je zabudovaných 6 funkcií na výpočet odchýlky: VAR, VAR.S, VARP, VAR.P, VARA a VARPA.

    Výber vzorca odchýlky je podmienený nasledujúcimi faktormi:

    • Verzia programu Excel, ktorú používate.
    • Či už počítate výberový alebo populačný rozptyl.
    • Či chcete vyhodnotiť alebo ignorovať textové a logické hodnoty.

    Funkcie odchýlky programu Excel

    V nasledujúcej tabuľke je uvedený prehľad variačných funkcií dostupných v programe Excel, ktorý vám pomôže vybrať vzorec, ktorý najlepšie vyhovuje vašim potrebám.

    Názov Verzia programu Excel Typ údajov Text a logické prvky
    VAR 2000 - 2019 Vzorka Ignorované
    VAR.S 2010 - 2019 Vzorka Ignorované
    VARA 2000 - 2019 Vzorka Vyhodnotené
    VARP 2000 - 2019 Obyvateľstvo Ignorované
    VAR.P 2010 - 2019 Obyvateľstvo Ignorované
    VARPA 2000 - 2019 Obyvateľstvo Vyhodnotené

    VAR.S vs. VARA a VAR.P vs. VARPA

    Funkcie VARA a VARPA sa od ostatných funkcií variácie líšia len v spôsobe, akým narábajú s logickými a textovými hodnotami v odkazoch. Nasledujúca tabuľka poskytuje prehľad o tom, ako sa vyhodnocujú textové reprezentácie čísel a logických hodnôt.

    Typ argumentu VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Logické hodnoty v poliach a referenciách Ignorované Vyhodnotené

    (TRUE=1, FALSE=0)

    Textové reprezentácie čísel v poliach a odkazoch Ignorované Vyhodnotené ako nula
    Logické hodnoty a textové reprezentácie čísel zadaných priamo do argumentov Vyhodnotené

    (TRUE=1, FALSE=0)

    Prázdne bunky Ignorované

    Ako vypočítať výberový rozptyl v programe Excel

    A vzorka je súbor údajov získaných z celej populácie. A rozptyl vypočítaný zo vzorky sa nazýva rozptyl vzorky .

    Ak napríklad chcete zistiť, ako sa líši výška ľudí, bolo by pre vás technicky nerealizovateľné merať každého človeka na zemi. Riešením je vziať vzorku populácie, napríklad 1 000 ľudí, a na základe tejto vzorky odhadnúť výšku celej populácie.

    Rozptyl vzorky sa vypočíta podľa tohto vzorca:

    Kde:

    • x̄ je priemer (jednoduchý priemer) hodnôt vzorky.
    • n je veľkosť vzorky, t. j. počet hodnôt vo vzorke.

    V programe Excel existujú 3 funkcie na zistenie výberového rozptylu: VAR, VAR.S a VARA.

    Funkcia VAR v programe Excel

    Je to najstaršia funkcia programu Excel na odhad rozptylu na základe vzorky. Funkcia VAR je k dispozícii vo všetkých verziách programu Excel 2000 až 2019.

    VAR(číslo1, [číslo2], ...)

    Poznámka: V programe Excel 2010 bola funkcia VAR nahradená funkciou VAR.S, ktorá poskytuje vyššiu presnosť. Hoci je funkcia VAR stále k dispozícii kvôli spätnej kompatibilite, v súčasných verziách programu Excel sa odporúča používať funkciu VAR.S.

    Funkcia VAR.S v programe Excel

    Je to moderná obdoba funkcie VAR programu Excel. Funkciu VAR.S použite na zistenie výberového rozptylu v programe Excel 2010 a novších.

    VAR.S(číslo1, [číslo2], ...)

    Funkcia VARA v programe Excel

    Funkcia VARA programu Excel vráti vzorový rozptyl na základe súboru čísel, textu a logických hodnôt, ako je uvedené v tejto tabuľke.

    VARA(hodnota1, [hodnota2], ...)

    Ukážka vzorca pre odchýlky v programe Excel

    Pri práci s číselným súborom údajov môžete na výpočet výberového rozptylu v programe Excel použiť ktorúkoľvek z uvedených funkcií.

    Ako príklad uvedieme zistenie rozptylu vzorky pozostávajúcej zo 6 položiek (B2:B7). Na tento účel môžete použiť jeden z nižšie uvedených vzorcov:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Ako je znázornené na snímke obrazovky, všetky vzorce vrátia rovnaký výsledok (zaokrúhlený na 2 desatinné miesta):

    Ak chcete skontrolovať výsledok, vykonajme výpočet var ručne:

    1. Nájdite priemer pomocou funkcie AVERAGE:

      =PRIEMER(B2:B7)

      Priemer sa dostane do ľubovoľnej prázdnej bunky, napríklad B8.

    2. Od každého čísla vo vzorke odpočítajte priemer:

      =B2-$B$8

      Rozdiely sa prenesú do stĺpca C, začínajúceho v C2.

    3. Každý rozdiel vyčíslite na druhú stranu a výsledky zapíšte do stĺpca D, počnúc D2:

      =C2^2

    4. Súčet štvorcových rozdielov a výsledok vydeľte počtom položiek vo vzorke mínus 1:

      =SUM(D2:D7)/(6-1)

    Ako vidíte, výsledok nášho ručného výpočtu var je presne rovnaký ako číslo vrátené vstavanými funkciami programu Excel:

    Ak váš súbor údajov obsahuje Boolean a/alebo text VARA vráti iný výsledok. Dôvodom je, že VAR a VAR.S ignorujú akékoľvek iné hodnoty ako čísla v odkazoch, zatiaľ čo VARA vyhodnocuje textové hodnoty ako nuly, TRUE ako 1 a FALSE ako 0. Preto starostlivo vyberte funkciu VARA pre svoje výpočty v závislosti od toho, či chcete spracovať alebo ignorovať text a logické znaky.

    Ako vypočítať populačný rozptyl v programe Excel

    Obyvateľstvo sú všetci členovia danej skupiny, t. j. všetky pozorovania v skúmanej oblasti. Rozptyl populácie opisuje, ako sú rozložené dátové body v celej populácii.

    Populačný rozptyl možno zistiť pomocou tohto vzorca:

    Kde:

    • x̄ je priemer populácie.
    • n je veľkosť populácie, t. j. celkový počet hodnôt v populácii.

    V programe Excel existujú 3 funkcie na výpočet populačného rozptylu: VARP, VAR.P a VARPA.

    Funkcia VARP v programe Excel

    Funkcia VARP programu Excel vracia rozptyl populácie na základe celého súboru čísel. Je k dispozícii vo všetkých verziách programu Excel 2000 až 2019.

    VARP(číslo1, [číslo2], ...)

    Poznámka: V programe Excel 2010 bola funkcia VARP nahradená funkciou VAR.P, ale je stále zachovaná kvôli spätnej kompatibilite. V súčasných verziách programu Excel sa odporúča používať funkciu VAR.P, pretože nie je zaručené, že funkcia VARP bude k dispozícii aj v budúcich verziách programu Excel.

    Funkcia VAR.P v programe Excel

    Ide o vylepšenú verziu funkcie VARP, ktorá je k dispozícii v programe Excel 2010 a novších.

    VAR.P(číslo1, [číslo2], ...)

    Funkcia VARPA v programe Excel

    Funkcia VARPA vypočíta rozptyl populácie na základe celého súboru čísel, textu a logických hodnôt. Je k dispozícii vo všetkých verziách programu Excel 2000 až 2019.

    VARA(hodnota1, [hodnota2], ...)

    Vzorec pre populačný rozptyl v programe Excel

    V ukážke výpočtu var sme zistili rozptyl výsledkov 5 skúšok za predpokladu, že tieto výsledky boli výberom z väčšej skupiny študentov. Ak zozbierate údaje o všetkých študentoch v skupine, tieto údaje budú predstavovať celú populáciu a pomocou uvedených funkcií vypočítate populačný rozptyl.

    Povedzme, že máme výsledky skúšok skupiny 10 študentov (B2:B11). Výsledky tvoria celú populáciu, takže budeme robiť variácie pomocou týchto vzorcov:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    A všetky vzorce vrátia rovnaký výsledok:

    Ak sa chcete uistiť, že program Excel vykonal odchýlku správne, môžete ju skontrolovať pomocou vzorca na ručný výpočet var, ktorý je uvedený na nasledujúcej snímke obrazovky:

    Ak sa niektorí študenti nezúčastnili skúšky a namiesto čísla skóre majú N/A, funkcia VARPA vráti iný výsledok. Dôvodom je, že VARPA vyhodnocuje textové hodnoty ako nuly, zatiaľ čo VARP a VAR.P ignorujú textové a logické hodnoty v odkazoch. Podrobné informácie nájdete v časti VAR.P vs. VARPA.

    Vzorec pre odchýlku v programe Excel - poznámky k použitiu

    Ak chcete správne vykonať analýzu odchýlok v programe Excel, dodržiavajte tieto jednoduché pravidlá:

    • Argumenty zadávajte ako hodnoty, polia alebo odkazy na bunky.
    • V programe Excel 2007 a novších môžete zadať až 255 argumentov zodpovedajúcich vzorke alebo populácii; v programe Excel 2003 a starších až 30 argumentov.
    • Vyhodnotiť iba čísla v odkazoch, pričom ignorujte prázdne bunky, text a logické hodnoty, použite funkciu VAR alebo VAR.S na výpočet výberového rozptylu a VARP alebo VAR.P na zistenie populačného rozptylu.
    • Vyhodnotiť logické a text hodnoty v odkazoch, použite funkciu VARA alebo VARPA.
    • Poskytnite aspoň dve číselné hodnoty do vzorca pre výberový rozptyl a aspoň jedna číselná hodnota do vzorca populačného rozptylu v programe Excel, inak sa vyskytne chyba #DIV/0!.
    • Argumenty obsahujúce text, ktorý nemožno interpretovať ako čísla, spôsobujú chyby #VALUE!.

    Rozptyl vs. štandardná odchýlka v programe Excel

    Rozptyl je vo vede nepochybne užitočný pojem, ale poskytuje veľmi málo praktických informácií. Napríklad sme zistili vek populácie tigrov v miestnej zoo a vypočítali sme rozptyl, ktorý sa rovná 16. Otázka znie - ako môžeme toto číslo skutočne použiť?

    Na určenie smerodajnej odchýlky môžete použiť rozptyl, ktorý je oveľa lepším meradlom množstva odchýlok v súbore údajov.

    Štandardná odchýlka sa vypočíta ako druhá odmocnina z rozptylu. Takže zoberieme druhú odmocninu zo 16 a dostaneme štandardnú odchýlku 4.

    V kombinácii s priemerom vám štandardná odchýlka môže povedať, koľko rokov má väčšina tigrov. Ak je napríklad priemer 8 a štandardná odchýlka 4, väčšina tigrov v zoo má od 4 rokov (8 - 4) do 12 rokov (8 + 4).

    Microsoft Excel má špeciálne funkcie na výpočet štandardnej odchýlky vzorky a populácie. Podrobné vysvetlenie všetkých funkcií nájdete v tomto návode: Ako vypočítať štandardnú odchýlku v programe Excel.

    To je spôsob, ako urobiť odchýlku v programe Excel. Ak sa chcete bližšie pozrieť na vzorce, o ktorých sa hovorí v tomto návode, môžete si stiahnuť náš vzorový zošit na konci tohto príspevku. Ďakujem vám za prečítanie a dúfam, že sa uvidíme na našom blogu budúci týždeň!

    Cvičný zošit

    Výpočet odchýlky v programe Excel - príklady (.xlsx súbor)

    Michael Brown je nadšený technologický nadšenec s vášňou pre zjednodušovanie zložitých procesov pomocou softvérových nástrojov. S viac ako desaťročnými skúsenosťami v technologickom priemysle si zdokonalil svoje zručnosti v programoch Microsoft Excel a Outlook, ako aj Tabuľky Google a Dokumenty. Michaelov blog je venovaný zdieľaniu svojich vedomostí a odborných znalostí s ostatnými a poskytuje jednoduché tipy a návody na zlepšenie produktivity a efektivity. Či už ste skúsený profesionál alebo začiatočník, Michaelov blog ponúka cenné poznatky a praktické rady, ako z týchto základných softvérových nástrojov vyťažiť maximum.