Kako izračunati varianco v Excelu - vzorec & amp; formula variance populacije

  • Deliti To
Michael Brown

V tem vodniku si bomo ogledali, kako opraviti analizo variance v Excelu in katere formule uporabiti za ugotavljanje variance vzorca in populacije.

Varianca je eno najuporabnejših orodij v teoriji verjetnosti in statistiki. V znanosti opisuje, kako daleč je vsako število v nizu podatkov od povprečja. V praksi pogosto kaže, kako zelo se nekaj spreminja. Na primer, temperatura v bližini ekvatorja ima manjšo varianco kot v drugih podnebnih območjih. V tem članku bomo analizirali različne metode izračuna variance v programu Excel.

    Kaj je odstopanje?

    Odstopanje je merilo variabilnosti podatkovnega niza, ki kaže, kako zelo so različne vrednosti razpršene. Matematično je opredeljeno kot povprečje kvadratnih razlik od povprečja.

    Da bi bolje razumeli, kaj dejansko izračunavate z varianco, si oglejte ta preprost primer.

    Recimo, da je v vašem lokalnem živalskem vrtu pet tigrov, starih 14, 10, 8, 6 in 2 leti.

    Če želite poiskati odstopanja, sledite naslednjim preprostim korakom:

    1. Izračunajte povprečje petih števil:

    2. Od vsakega števila odštejte srednjo vrednost, da ugotovite razlike. Za vizualizacijo tega prikažite razlike na grafu:

    3. Vsako razliko izravnajte v kvadrat.
    4. Izračunajte povprečje kvadratnih razlik.

    Razlika je torej 16. Toda kaj ta številka dejansko pomeni?

    V resnici vam varianta daje le zelo splošno predstavo o razpršenosti podatkovnega niza. Vrednost 0 pomeni, da variance ni, tj. da so vsa števila v podatkovnem nizu enaka. Večje kot je število, bolj razpršeni so podatki.

    V tem primeru gre za populacijsko varianco (tj. 5 tigrov je celotna skupina, ki vas zanima). Če so vaši podatki izbor iz večje populacije, morate izračunati vzorčno varianco z uporabo nekoliko drugačne formule.

    Kako izračunati odstopanje v Excelu

    V Excelu je vgrajenih šest funkcij, s katerimi lahko izvajate variance: VAR, VAR.S, VARP, VAR.P, VARA in VARPA.

    Izbira formule variance je odvisna od naslednjih dejavnikov:

    • Različica programa Excel, ki jo uporabljate.
    • Ali izračunavate vzorčno ali populacijsko varianco.
    • Ali želite ovrednotiti ali prezreti besedilne in logične vrednosti.

    Funkcije variance programa Excel

    Spodnja preglednica vsebuje pregled funkcij za spreminjanje, ki so na voljo v Excelu, in vam pomaga izbrati formulo, ki je najprimernejša za vaše potrebe.

    Ime Različica programa Excel Vrsta podatkov Besedilo in logični elementi
    VAR 2000 - 2019 Vzorec Ignorirano
    VAR.S 2010 - 2019 Vzorec Ignorirano
    VARA 2000 - 2019 Vzorec Ocenjeno
    VARP 2000 - 2019 Prebivalstvo Ignorirano
    VAR.P 2010 - 2019 Prebivalstvo Ignorirano
    VARPA 2000 - 2019 Prebivalstvo Ocenjeno

    VAR.S proti VARA in VAR.P proti VARPA

    Funkciji VARA in VARPA se od drugih funkcij variance razlikujeta le po tem, kako obravnavata logične in besedilne vrednosti v referencah. V naslednji preglednici je povzetek načina vrednotenja besedilnih predstavitev števil in logičnih vrednosti.

    Vrsta argumenta VAR, VAR.S, VARP, VAR.P VARA & amp; VARPA
    Logične vrednosti v poljih in referencah Ignorirano Ocenjeno

    (TRUE=1, FALSE=0)

    Besedilne predstavitve števil v poljih in referencah Ignorirano Vrednoteno kot nič
    Logične vrednosti in besedilne predstavitve številk, vnesenih neposredno v argumente Ocenjeno

    (TRUE=1, FALSE=0)

    Prazne celice Ignorirano

    Kako izračunati vzorčno varianco v Excelu

    A vzorec je nabor podatkov, ki je bil odvzet iz celotne populacije. varianco, izračunano iz vzorca, imenujemo vzorčna varianta .

    Če želite na primer ugotoviti, kako se razlikuje višina ljudi, bi bilo tehnično neizvedljivo izmeriti vse ljudi na Zemlji. Rešitev je, da vzamete vzorec populacije, na primer 1 000 ljudi, in na podlagi tega vzorca ocenite višino celotne populacije.

    Vzorčna varianta se izračuna s to formulo:

    Kje:

    • x̄ je srednja vrednost (enostavno povprečje) vzorčnih vrednosti.
    • n je velikost vzorca, tj. število vrednosti v vzorcu.

    V Excelu obstajajo tri funkcije za iskanje vzorčne variance: VAR, VAR.S in VARA.

    Funkcija VAR v programu Excel

    To je najstarejša funkcija programa Excel za oceno variance na podlagi vzorca. Funkcija VAR je na voljo v vseh različicah programa Excel od leta 2000 do 2019.

    VAR(število1, [število2], ...)

    Opomba: V Excelu 2010 je bila funkcija VAR nadomeščena s funkcijo VAR.S, ki zagotavlja večjo natančnost. Čeprav je VAR še vedno na voljo zaradi povratne združljivosti, je v trenutnih različicah Excela priporočljivo uporabljati VAR.S.

    Funkcija VAR.S v Excelu

    To je sodobna različica Excelove funkcije VAR. Funkcijo VAR.S uporabite za iskanje vzorčne variance v Excelu 2010 in novejših programih.

    VAR.S(število1, [število2], ...)

    Funkcija VARA v programu Excel

    Excelova funkcija VARA vrne vzorčno varianco na podlagi niza številk, besedila in logičnih vrednosti, kot je prikazano v tej tabeli.

    VARA(vrednost1, [vrednost2], ...)

    Vzorec formule variance v Excelu

    Pri delu s številčnimi podatki lahko za izračun vzorčne variance v Excelu uporabite katero koli od zgornjih funkcij.

    Kot primer poiščimo varianco vzorca, ki ga sestavlja 6 elementov (B2:B7). Za to lahko uporabite eno od spodnjih formul:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Kot je prikazano na sliki zaslona, vse formule vrnejo enak rezultat (zaokrožen na 2 decimalni mesti):

    Če želite preveriti rezultat, ročno izračunajte var:

    1. S funkcijo AVERAGE poiščite srednjo vrednost:

      =POVPREČJE(B2:B7)

      Povprečje se prenese v katero koli prazno celico, na primer B8.

    2. Od vsakega števila v vzorcu odštejte povprečje:

      =B2-$B$8

      Razlike se prenesejo v stolpec C, začenši s C2.

    3. Vsako razliko izravnajte s kvadratom in rezultate vpišite v stolpec D, začenši z D2:

      =C2^2

    4. Seštejte kvadratne razlike in rezultat delite s številom predmetov v vzorcu minus 1:

      =SUM(D2:D7)/(6-1)

    Kot lahko vidite, je rezultat našega ročnega izračuna var popolnoma enak številu, ki ga vrnejo Excelove vgrajene funkcije:

    Če vaš nabor podatkov vsebuje Boolean in/ali besedilo VARA bo vrnila drugačen rezultat. Razlog za to je, da VAR in VAR.S ne upoštevata nobenih vrednosti, ki niso številke v referencah, medtem ko VARA vrednoti besedilne vrednosti kot ničle, TRUE kot 1 in FALSE kot 0. Zato skrbno izberite funkcijo variance za svoje izračune glede na to, ali želite obdelati ali prezreti besedilo in logične znake.

    Kako izračunati populacijsko varianco v Excelu

    Prebivalstvo so vsi člani dane skupine, tj. vsa opazovanja na področju študije. Populacijska varianta opisuje, kako so razporejene podatkovne točke v celotni populaciji.

    Populacijsko disperzijo lahko ugotovimo s to formulo:

    Kje:

    • x̄ je srednja vrednost populacije.
    • n je velikost populacije, tj. skupno število vrednosti v populaciji.

    V Excelu obstajajo tri funkcije za izračun populacijske variance: VARP, VAR.P in VARPA.

    Funkcija VARP v programu Excel

    Excelova funkcija VARP vrne varianco populacije na podlagi celotnega niza številk. Na voljo je v vseh različicah programa Excel od 2000 do 2019.

    VARP(število1, [število2], ...)

    Opomba: V Excelu 2010 je bila funkcija VARP nadomeščena s funkcijo VAR.P, vendar je še vedno ohranjena zaradi povratne združljivosti. Priporočljivo je, da v trenutnih različicah Excela uporabljate VAR.P, saj ni nobenega zagotovila, da bo funkcija VARP na voljo v prihodnjih različicah Excela.

    Funkcija VAR.P v Excelu

    Gre za izboljšano različico funkcije VARP, ki je na voljo v Excelu 2010 in novejših programih.

    VAR.P(število1, [število2], ...)

    Funkcija VARPA v programu Excel

    Funkcija VARPA izračuna varianco populacije na podlagi celotnega niza številk, besedila in logičnih vrednosti. Na voljo je v vseh različicah programa Excel od 2000 do 2019.

    VARA(vrednost1, [vrednost2], ...)

    Formula za populacijsko varianco v Excelu

    V vzorčnem primeru izračuna variance smo ugotovili varianco 5 izpitnih rezultatov ob predpostavki, da so bili ti rezultati izbor iz večje skupine študentov. Če boste zbrali podatke o vseh študentih v skupini, bodo ti podatki predstavljali celotno populacijo in boste izračunali varianco populacije z uporabo zgornjih funkcij.

    Recimo, da imamo rezultate izpitov skupine 10 študentov (B2:B11). Rezultati predstavljajo celotno populacijo, zato bomo s temi formulami naredili varianco:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    Vse formule bodo dale enak rezultat:

    Če želite preveriti, ali je Excel pravilno izračunal varianco, jo lahko preverite z ročno formulo za izračun variance, ki je prikazana na spodnji sliki zaslona:

    Če nekateri učenci niso opravljali izpita in imajo namesto števila točk N/A, bo funkcija VARPA vrnila drugačen rezultat. Razlog za to je, da funkcija VARPA besedilne vrednosti ovrednoti kot ničle, medtem ko VARP in VAR.P ne upoštevata besedilnih in logičnih vrednosti v referencah. Za vse podrobnosti glejte VAR.P proti VARPA.

    Formula variance v Excelu - opombe o uporabi

    Če želite v Excelu pravilno opraviti analizo odstopanj, upoštevajte naslednja preprosta pravila:

    • Argumente navedite kot vrednosti, polja ali reference na celice.
    • V Excelu 2007 in novejših različicah lahko navedete do 255 argumentov, ki ustrezajo vzorcu ali populaciji; v Excelu 2003 in starejših različicah pa do 30 argumentov.
    • Ocenjevanje samo številke v referencah, brez upoštevanja praznih celic, besedila in logičnih vrednosti, uporabite funkcijo VAR ali VAR.S za izračun vzorčne variance in VARP ali VAR.P za določitev populacijske variance.
    • Ocenjevanje logično in . besedilo vrednosti v referencah, uporabite funkcijo VARA ali VARPA.
    • Zagotovite vsaj dve številčni vrednosti po formuli vzorčne variance in vsaj ena številčna vrednost v formulo populacijske variance v Excelu, sicer se pojavi napaka #DIV/0!.
    • Argumenti, ki vsebujejo besedilo, ki ga ni mogoče razlagati kot številke, povzročijo napake #VALUE!.

    Varianca v primerjavi s standardnim odklonom v programu Excel

    Varianca je nedvomno koristen pojem v znanosti, vendar daje zelo malo praktičnih informacij. Na primer, ugotovili smo starost populacije tigrov v lokalnem živalskem vrtu in izračunali varianco, ki je enaka 16. Vprašanje je, kako lahko to število dejansko uporabimo?

    Z varianco lahko izračunate standardni odklon, ki je veliko boljše merilo za količino variacije v nizu podatkov.

    Standardni odklon se izračuna kot kvadratni koren variance, torej vzamemo kvadratni koren iz 16 in dobimo standardni odklon 4.

    Standardni odklon vam lahko v kombinaciji s povprečjem pove, koliko je stara večina tigrov. Če je na primer povprečje 8 in standardni odklon 4, je večina tigrov v živalskem vrtu stara od 4 let (8 - 4) do 12 let (8 + 4).

    Microsoft Excel ima posebne funkcije za izračun standardnega odklona vzorca in populacije. Podrobna razlaga vseh funkcij je na voljo v tem priročniku: Kako izračunati standardni odklon v Excelu.

    Če si želite podrobneje ogledati formule, obravnavane v tem učbeniku, si lahko prenesete naš vzorčni delovni zvezek na koncu tega prispevka. Zahvaljujem se vam za branje in upam, da se naslednji teden vidimo na našem blogu!

    Delovni zvezek za prakso

    Izračun variance v Excelu - primeri (.xlsx datoteka)

    Michael Brown je predan tehnološki navdušenec s strastjo do poenostavljanja kompleksnih procesov z uporabo programskih orodij. Z več kot desetletnimi izkušnjami v tehnološki industriji je svoje veščine izpopolnil v Microsoft Excelu in Outlooku ter Google Preglednicah in Dokumentih. Michaelov blog je namenjen deljenju svojega znanja in strokovnega znanja z drugimi ter ponuja preproste nasvete in vadnice za izboljšanje produktivnosti in učinkovitosti. Ne glede na to, ali ste izkušen strokovnjak ali začetnik, Michaelov blog ponuja dragocene vpoglede in praktične nasvete, kako kar najbolje izkoristiti ta osnovna programska orodja.