Kuidas arvutada dispersiooni Excelis - valim & populatsiooni dispersioonivalem

  • Jaga Seda
Michael Brown

Selles õpetuses vaatleme, kuidas teha dispersioonianalüüsi Excelis ja milliseid valemeid kasutada valimi ja populatsiooni dispersiooni leidmiseks.

Variants on üks kasulikumaid vahendeid tõenäosusteoorias ja statistikas. Teaduses kirjeldab see, kui kaugel iga arv andmestikus on keskmisest. Praktikas näitab see sageli, kui palju midagi muutub. Näiteks temperatuuril ekvaatori lähedal on väiksem varieeruvus kui teistes kliimavööndites. Selles artiklis analüüsime erinevaid meetodeid varieeruvuse arvutamiseks Excelis.

    Mis on dispersioon?

    Erinevus on andmekogumi varieeruvuse mõõt, mis näitab, kui suur on erinevate väärtuste hajuvus. Matemaatiliselt on see defineeritud kui keskmisest erinevuste ruutkeskmine.

    Et paremini mõista, mida te tegelikult variatsiooniga arvutate, vaadake palun seda lihtsat näidet.

    Oletame, et teie kohalikus loomaaias on 5 tiigrit, kes on 14, 10, 8, 6 ja 2 aastat vanad.

    Erinevuse leidmiseks järgige järgmisi lihtsaid samme:

    1. Arvutage viie arvu keskmine (lihtkeskmine):

    2. Igast arvust lahutame keskmise, et leida erinevused. Selle visualiseerimiseks joonistame erinevused graafikule:

    3. Iga erinevuse ruut.
    4. Arvutage erinevuste ruutude keskmine.

    Seega on dispersioon 16. Aga mida see number tegelikult tähendab?

    Tegelikult annab dispersioon lihtsalt väga üldise ettekujutuse andmekogumi hajuvusest. 0 tähendab, et varieeruvus puudub, st kõik arvud andmekogumis on ühesugused. Mida suurem number, seda rohkem on andmed hajutatud.

    See näide on populatsiooni dispersiooni jaoks (st 5 tiigrit on kogu rühm, mis teid huvitab). Kui teie andmed on valik suuremast populatsioonist, siis peate valimi dispersiooni arvutamiseks kasutama veidi teistsugust valemit.

    Kuidas arvutada varieeruvust Excelis

    Excelis on 6 sisseehitatud funktsiooni variatsiooni tegemiseks: VAR, VAR.S, VARP, VAR.P, VARA ja VARPA.

    Teie variatsioonivalemi valik sõltub järgmistest teguritest:

    • Kasutatava Exceli versioon.
    • Kas arvutate valimi või populatsiooni dispersiooni.
    • Kas soovite hinnata või ignoreerida teksti ja loogilisi väärtusi.

    Exceli variatsioonifunktsioonid

    Alljärgnevas tabelis on esitatud ülevaade Excelis olemasolevatest variatsioonifunktsioonidest, mis aitavad teil valida teie vajadustele kõige paremini sobiva valemi.

    Nimi Exceli versioon Andmetüüp Tekst ja loogika
    VAR 2000 - 2019 Näide Ignoreeritud
    VAR.S 2010 - 2019 Näide Ignoreeritud
    VARA 2000 - 2019 Näide Hinnatud
    VARP 2000 - 2019 Rahvastik Ignoreeritud
    VAR.P 2010 - 2019 Rahvastik Ignoreeritud
    VARPA 2000 - 2019 Rahvastik Hinnatud

    VAR.S vs. VARA ja VAR.P vs. VARPA

    VARA ja VARPA erinevad teistest variatsioonifunktsioonidest ainult selle poolest, kuidas nad käitlevad loogilisi ja tekstilisi väärtusi viidetes. Järgnevas tabelis on esitatud kokkuvõte sellest, kuidas hinnatakse numbrite ja loogiliste väärtuste tekstilisi esitusi.

    Argumendi tüüp VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Loogilised väärtused massiivides ja viited Ignoreeritud Hinnatud

    (TRUE=1, FALSE=0)

    Numbrite tekstiline esitus massiivides ja viidetes Ignoreeritud Hinnatakse nullena
    Loogilised väärtused ja numbrite tekstiline esitus, mis on sisestatud otse argumentidesse Hinnatud

    (TRUE=1, FALSE=0)

    Tühjad lahtrid Ignoreeritud

    Kuidas arvutada valimi dispersiooni Excelis

    A näidis on kogu populatsioonist võetud andmete kogum. Ja valimi põhjal arvutatud dispersiooni nimetatakse proovi dispersioon .

    Näiteks kui soovite teada saada, kuidas inimeste pikkused varieeruvad, oleks tehniliselt võimatu mõõta kõiki inimesi maa peal. Lahendus on võtta valim rahvastikust, näiteks 1000 inimest, ja hinnata kogu rahvastiku pikkust selle valimi põhjal.

    Valimi dispersioon arvutatakse järgmise valemiga:

    Kus:

    • x̄ on valimi väärtuste keskmine (lihtkeskmine).
    • n on valimi suurus, st väärtuste arv valimis.

    Excelis on 3 funktsiooni valimi dispersiooni leidmiseks: VAR, VAR.S ja VARA.

    VAR-funktsioon Excelis

    See on vanim Exceli funktsioon, mille abil saab hinnata dispersiooni valimi põhjal. VAR-funktsioon on saadaval kõigis Exceli versioonides 2000 kuni 2019.

    VAR(number1, [number2], ...)

    Märkus. 2010. aasta Excelis asendati funktsioon VAR funktsiooniga VAR.S, mis pakub paremat täpsust. Kuigi VAR on tagasiulatuva ühilduvuse huvides endiselt saadaval, on soovitatav kasutada praegustes Exceli versioonides VAR.S funktsiooni.

    VAR.S funktsioon Excelis

    See on Exceli VAR-funktsiooni kaasaegne vaste. Kasutage funktsiooni VAR.S valimi dispersiooni leidmiseks Excel 2010 ja hilisemates programmides.

    VAR.S(number1, [number2], ...)

    VARA funktsioon Excelis

    Exceli VARA-funktsioon tagastab arvude, teksti ja loogiliste väärtuste kogumil põhineva näidisvariandi, nagu on näidatud selles tabelis.

    VARA(value1, [value2], ...)

    Näidisvariandi valem Excelis

    Kui töötate numbrilise andmekogumiga, võite kasutada mis tahes eespool nimetatud funktsioone valimi dispersiooni arvutamiseks Excelis.

    Leiame näiteks 6 elemendist (B2:B7) koosneva valimi dispersiooni. Selleks võite kasutada ühte alljärgnevatest valemitest:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Nagu on näidatud ekraanipildil, annavad kõik valemid sama tulemuse (ümardatud 2 kümnendkohani):

    Tulemuse kontrollimiseks teeme var-arvutuse käsitsi:

    1. Leia keskmine, kasutades funktsiooni AVERAGE:

      =KESKMINE(B2:B7)

      Keskmine läheb mis tahes tühja lahtrisse, näiteks B8.

    2. Vähendage iga valimi arvust keskmine:

      =B2-$B$8

      Erinevused lähevad veergu C, alustades C2-st.

    3. Ruuduta iga erinevus ja pane tulemused veergu D, alustades D2-st:

      =C2^2

    4. Liitke ruutdiferentsid kokku ja jagage tulemus valimis olevate objektide arvuga miinus 1:

      =SUMMA(D2:D7)/(6-1)

    Nagu näete, on meie käsitsi tehtud var-arvutuse tulemus täpselt sama, mis Exceli sisseehitatud funktsioonide poolt tagastatud arv:

    Kui teie andmekogum sisaldab Boolean ja/või tekst väärtusi, siis funktsioon VARA annab teistsuguse tulemuse. Põhjus on selles, et VAR ja VAR.S ignoreerivad viites kõiki muid väärtusi peale numbrite, samas kui VARA hindab tekstiväärtusi nullideks, TRUE kui 1 ja FALSE kui 0. Seega valige palun hoolikalt oma arvutuste jaoks variatsioonifunktsioon sõltuvalt sellest, kas soovite teksti ja loogilisi väärtusi töödelda või ignoreerida.

    Kuidas arvutada populatsiooni dispersiooni Excelis

    Rahvastik on kõik antud rühma liikmed, st kõik vaatlused uurimisalal. Rahvastiku varieeruvus kirjeldab, kuidas andmepunktid kogu populatsioonis jaotuvad.

    Populatsiooni dispersiooni saab leida järgmise valemiga:

    Kus:

    • x̄ on populatsiooni keskmine.
    • n on populatsiooni suurus, st väärtuste koguarv populatsioonis.

    Excelis on 3 funktsiooni populatsiooni dispersiooni arvutamiseks: VARP, VAR.P ja VARPA.

    VARP funktsioon Excelis

    Exceli funktsioon VARP annab tagasi populatsiooni dispersiooni, mis põhineb kogu arvude kogumil. See on saadaval kõigis Exceli versioonides 2000 kuni 2019.

    VARP(number1, [number2], ...)

    Märkus. 2010. aasta Excelis asendati VARP funktsiooniga VAR.P, kuid see on tagasiulatuva ühilduvuse huvides siiski alles jäetud. Praegustes Exceli versioonides on soovitatav kasutada VAR.P funktsiooni, sest ei ole mingit garantiid, et VARP funktsioon on saadaval ka Exceli tulevastes versioonides.

    VAR.P funktsioon Excelis

    Tegemist on täiustatud versiooniga funktsioonist VARP, mis on saadaval Excel 2010 ja hilisemates versioonides.

    VAR.P(number1, [number2], ...)

    VARPA funktsioon Excelis

    Funktsioon VARPA arvutab populatsiooni dispersiooni kogu arvude, teksti ja loogiliste väärtuste kogumi põhjal. See on saadaval kõigis Exceli versioonides 2000 kuni 2019.

    VARA(value1, [value2], ...)

    Populatsiooni dispersiooni valem Excelis

    Näites var arvutamise näites leidsime 5 eksamitulemuse dispersiooni, eeldades, et need tulemused olid valik suuremast õpilaste rühmast. Kui kogute andmeid kõigi rühma õpilaste kohta, esindavad need andmed kogu populatsiooni ja te arvutate populatsiooni dispersiooni, kasutades ülaltoodud funktsioone.

    Oletame, et meil on 10 õpilase (B2:B11) eksamitulemused. Need tulemused moodustavad kogu populatsiooni, seega teeme nende valemitega variatsiooni:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    Ja kõik valemid annavad identse tulemuse:

    Et veenduda, et Excel on variatsiooni õigesti teinud, saate seda kontrollida alltoodud ekraanipildil näidatud manuaalse var-arvutuse valemi abil:

    Kui mõned üliõpilased ei ole eksamit sooritanud ja neil on punktiarvu asemel N/A, annab funktsioon VARPA teistsuguse tulemuse. Selle põhjuseks on see, et VARPA hindab tekstiväärtusi nullidena, samas kui VARP ja VAR.P ignoreerivad teksti- ja loogilisi väärtusi viidetes. Täiendavaid üksikasju vt VAR.P vs. VARPA.

    Variatsioonivalem Excelis - kasutamismärkused

    Selleks, et teha Excelis korrektselt dispersioonianalüüsi, järgige järgmisi lihtsaid reegleid:

    • Anda argumendid väärtuste, massiivi või lahtriviidetena.
    • Excel 2007 ja uuemates versioonides saate esitada kuni 255 argumenti, mis vastavad valimile või populatsioonile; Excel 2003 ja vanemates versioonides kuni 30 argumenti.
    • Hinnata ainult numbrid viites, ignoreerides tühje lahtreid, teksti ja loogilisi väärtusi, kasutage valimi dispersiooni arvutamiseks funktsiooni VAR või VAR.S ja populatsiooni dispersiooni leidmiseks funktsiooni VARP või VAR.P.
    • Hinnata loogiline ja tekst väärtused viidetes, kasutage funktsiooni VARA või VARPA.
    • Anda vähemalt kaks numbrilist väärtust valimi variatsioonivalemile ja vähemalt üks arvväärtus populatsiooni dispersiooni valemile Excelis, vastasel juhul tekib viga #DIV/0!.
    • Argumendid, mis sisaldavad teksti, mida ei saa tõlgendada numbritena, põhjustavad #VALUE! vigu.

    Variatsioon vs. standardhälve Excelis

    Variants on teaduses kahtlemata kasulik mõiste, kuid see annab väga vähe praktilist teavet. Näiteks leidsime kohaliku loomaaia tiigripopulatsiooni vanuse ja arvutasime välja dispersiooni, mis on võrdne 16. Küsimus on - kuidas me seda arvu tegelikult kasutada saame?

    Standardhälbe arvutamiseks saab kasutada dispersiooni, mis on palju parem mõõdik andmekogumi varieeruvuse hulga kohta.

    Standardhälve arvutatakse kui ruutjuur variatsioonist. Seega võtame ruutjuure 16-st ja saame standardhälve 4.

    Kombineerituna keskmisega saab standardhälve abil teada, kui vanad on enamik tiigreid. Näiteks kui keskmine on 8 ja standardhälve 4, siis on enamik loomaaias olevatest tiigritest 4-aastased (8 - 4) kuni 12-aastased (8 + 4).

    Microsoft Excelil on valimi ja üldkogumi standardhälbe arvutamiseks spetsiaalsed funktsioonid. Kõigi funktsioonide üksikasjalik selgitus on esitatud selles õpetuses: Kuidas arvutada standardhälvet Excelis.

    See ongi see, kuidas Exceli varieeruvust teha. Et lähemalt tutvuda selles õpetuses käsitletud valemitega, võite selle postituse lõpus alla laadida meie näidistöövihiku. Tänan teid lugemise eest ja loodan, et näeme teid järgmisel nädalal meie blogis!

    Praktiline töövihik

    Variantide arvutamine Excelis - näited (.xlsx fail)

    Michael Brown on pühendunud tehnoloogia entusiast, kelle kirg on tarkvaratööriistade abil keerukate protsesside lihtsustamine. Rohkem kui kümneaastase kogemusega tehnoloogiatööstuses on ta lihvinud oma oskusi Microsoft Excelis ja Outlookis, samuti Google Sheetsis ja Docsis. Michaeli ajaveebi eesmärk on jagada oma teadmisi ja teadmisi teistega, pakkudes hõlpsasti järgitavaid näpunäiteid ja õpetusi tootlikkuse ja tõhususe parandamiseks. Olenemata sellest, kas olete kogenud professionaal või algaja, pakub Michaeli ajaveebi väärtuslikke teadmisi ja praktilisi nõuandeid nende oluliste tarkvaratööriistade maksimaalseks kasutamiseks.