Kā aprēķināt dispersiju programmā Excel - paraugs & amp; populācijas dispersijas formula

  • Dalīties Ar Šo
Michael Brown

Šajā pamācībā mēs aplūkosim, kā veikt dispersijas analīzi programmā Excel un kādas formulas izmantot, lai atrastu izlases un populācijas dispersiju.

Variance ir viens no noderīgākajiem rīkiem varbūtību teorijā un statistikā. Zinātnē tā apraksta, cik tālu katrs skaitlis datu kopā ir no vidējā. Praksē tā bieži parāda, cik ļoti kaut kas mainās. Piemēram, temperatūrai pie ekvatora ir mazāka variance nekā citās klimata zonās. Šajā rakstā mēs analizēsim dažādas variances aprēķināšanas metodes programmā Excel.

    Kas ir dispersija?

    Novirze ir datu kopas mainīguma mērs, kas norāda, cik lielā mērā ir izkliedētas dažādas vērtības. Matemātiski to definē kā vidējo kvadrātu starpību no vidējā lieluma.

    Lai labāk saprastu, ko jūs patiesībā aprēķināt ar dispersiju, aplūkojiet šo vienkāršo piemēru.

    Pieņemsim, ka jūsu vietējā zoodārzā ir 5 tīģeri, kuri ir 14, 10, 8, 6 un 2 gadus veci.

    Lai atrastu dispersiju, izpildiet šos vienkāršos soļus:

    1. Aprēķiniet piecu skaitļu vidējo vērtību (vienkāršo vidējo):

    2. No katra skaitļa atņem vidējo vērtību, lai atrastu atšķirības. Lai to vizualizētu, attēlosim atšķirības diagrammā:

    3. Katra starpība ir kvadrāts.
    4. Izrēķiniet vidējo starpību kvadrātu.

    Tātad dispersija ir 16. Bet ko šis skaitlis patiesībā nozīmē?

    Patiesībā dispersija tikai sniedz ļoti vispārīgu priekšstatu par datu kopas izkliedētību. 0 vērtība nozīmē, ka dispersijas nav, t. i., visi skaitļi datu kopā ir vienādi. Jo lielāks skaitlis, jo vairāk izkliedēti dati.

    Šis piemērs attiecas uz populācijas dispersiju (t. i., 5 tīģeri ir visa grupa, kas jūs interesē). Ja jūsu dati ir atlase no lielākas populācijas, tad jums jāaprēķina izlases dispersija, izmantojot nedaudz citu formulu.

    Kā aprēķināt dispersiju programmā Excel

    Excel programmā ir 6 iebūvētas funkcijas, ar kurām var variēt: VAR, VAR.S, VARP, VAR.P, VARA un VARPA.

    Dispersijas formulas izvēli nosaka šādi faktori:

    • Izmantotā Excel versija.
    • Vai aprēķināt izlases vai populācijas dispersiju.
    • Vai vēlaties novērtēt vai ignorēt teksta un loģiskās vērtības.

    Excel dispersijas funkcijas

    Tālāk tabulā sniegts pārskats par Excel programmā Excel pieejamajām variāciju funkcijām, lai palīdzētu jums izvēlēties savām vajadzībām vispiemērotāko formulu.

    Nosaukums Excel versija Datu tips Teksts un loģikas
    VAR 2000 - 2019 Paraugs Ignorēts
    VAR.S 2010 - 2019 Paraugs Ignorēts
    VARA 2000 - 2019 Paraugs Novērtēts
    VARP 2000 - 2019 Iedzīvotāju skaits Ignorēts
    VAR.P 2010 - 2019 Iedzīvotāju skaits Ignorēts
    VARPA 2000 - 2019 Iedzīvotāju skaits Novērtēts

    VAR.S pret VARA un VAR.P pret VARPA

    VARA un VARPA atšķiras no citām variāciju funkcijām tikai ar to, kā tās rīkojas ar loģiskajām un teksta vērtībām atsaucēs. Tālāk tabulā sniegts kopsavilkums par to, kā tiek novērtēti skaitļu un loģisko vērtību teksta attēlojumi.

    Argumenta veids VAR, VAR.S, VARP, VAR.P VARA & amp; VARPA
    Loģiskās vērtības masīvos un atsauces Ignorēts Novērtēts

    (TRUE=1, FALSE=0)

    Skaitļu teksta attēlojums masīvos un atsaucēs Ignorēts Izvērtēts kā nulle
    Loģiskās vērtības un tieši argumentos ievadīto skaitļu teksta attēlojums Novērtēts

    (TRUE=1, FALSE=0)

    Tukšas šūnas Ignorēts

    Kā aprēķināt izlases dispersiju programmā Excel

    A paraugs ir datu kopa, kas iegūta no visas populācijas. Un dispersiju, kas aprēķināta no izlases, sauc par. parauga dispersija .

    Piemēram, ja vēlaties noskaidrot, kā atšķiras cilvēku augums, tehniski nav iespējams izmērīt visus cilvēkus uz zemes. Risinājums ir ņemt iedzīvotāju izlasi, piemēram, 1000 cilvēku, un, pamatojoties uz šo izlasi, novērtēt visas populācijas augstumu.

    Parauga dispersiju aprēķina, izmantojot šo formulu:

    Kur:

    • x̄ ir izlases vērtību vidējā vērtība (vienkāršais vidējais).
    • n ir izlases lielums, t. i., vērtību skaits izlasē.

    Excel ir trīs funkcijas, lai atrastu izlases dispersiju: VAR, VAR.S un VARA.

    VAR funkcija programmā Excel

    Tā ir vecākā Excel funkcija, kas ļauj novērtēt dispersiju, pamatojoties uz izlasi. VAR funkcija ir pieejama visās Excel 2000. līdz 2019. gada versijās.

    VAR(numurs1, [numurs2], ...)

    Piezīme. 2010. gada Excel versijā funkcija VAR tika aizstāta ar VAR.S, kas nodrošina uzlabotu precizitāti. Lai gan VAR joprojām ir pieejama atpakaļejošas saderības nolūkā, pašreizējās Excel versijās ieteicams izmantot VAR.S.

    VAR.S funkcija programmā Excel

    Tas ir mūsdienīgs Excel VAR funkcijas analogs. Izmantojot VAR.S funkciju, varat atrast izlases dispersiju programmā Excel 2010 un jaunākās versijās.

    VAR.S(numurs1, [numurs2], ...)

    VARA funkcija programmā Excel

    Excel VARA funkcija atgriež parauga dispersiju, pamatojoties uz skaitļu, teksta un loģisko vērtību kopumu, kā parādīts šajā tabulā.

    VARA(vērtība1, [vērtība2], ...)

    Dispersijas formulas paraugs programmā Excel

    Strādājot ar skaitlisku datu kopu, varat izmantot jebkuru no iepriekš minētajām funkcijām, lai aprēķinātu izlases dispersiju programmā Excel.

    Piemēram, noskaidrosim dispersiju izlasei, kas sastāv no 6 vienībām (B2:B7). Šim nolūkam var izmantot vienu no turpmāk minētajām formulām:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Kā redzams ekrānšāviņā, visas formulas dod vienādu rezultātu (noapaļots līdz 2 zīmēm aiz komata):

    Lai pārbaudītu rezultātu, izdarīsim var aprēķinu manuāli:

    1. Atrodiet vidējo vērtību, izmantojot funkciju AVERAGE:

      = VIDĒJAIS(B2:B7)

      Vidējais rādītājs tiek iegūts jebkurā tukšā šūnā, piemēram, B8.

    2. Atņemiet vidējo vērtību no katra parauga skaitļa:

      =B2-$B$8

      Atšķirības pāriet uz C aili, sākot no C2.

    3. Katru starpību kvadrātā un rezultātus ierakstiet D slejā, sākot ar D2:

      =C2^2

    4. Saskaitiet kvadrātu starpības un rezultātu daliet ar izlasē esošo vienību skaitu mīnus 1:

      =SUM(D2:D7)/(6-1)

    Kā redzat, mūsu manuālā var aprēķina rezultāts ir tieši tāds pats kā Excel iebūvētās funkcijas iegūtais skaitlis:

    Ja jūsu datu kopa satur Boolean un/vai teksts VARA funkcija atgriezīs atšķirīgu rezultātu. Iemesls ir tāds, ka VAR un VAR.S ignorē jebkādas vērtības, kas nav skaitļi, bet VARA teksta vērtības novērtē kā nulles, TRUE kā 1 un FALSE kā 0. Tāpēc rūpīgi izvēlieties variāciju funkciju saviem aprēķiniem atkarībā no tā, vai vēlaties apstrādāt vai ignorēt tekstu un loģiskos simbolus.

    Kā aprēķināt populācijas dispersiju programmā Excel

    Iedzīvotāju skaits ir visi konkrētās grupas locekļi, t. i., visi novērojumi pētāmajā jomā. Iedzīvotāju dispersija apraksta, kā datu punkti visā populācijā ir sadalīti.

    Populācijas dispersiju var noteikt ar šo formulu:

    Kur:

    • x̄ ir populācijas vidējais lielums.
    • n ir populācijas lielums, t. i., kopējais vērtību skaits populācijā.

    Excel programmā ir 3 funkcijas populācijas dispersijas aprēķināšanai: VARP, VAR.P un VARPA.

    VARP funkcija programmā Excel

    Excel funkcija VARP atgriež populācijas dispersiju, pamatojoties uz visu skaitļu kopu. Tā ir pieejama visās Excel 2000 līdz 2019 versijās.

    VARP(numurs1, [numurs2], ...)

    Piezīme. 2010. gada Excel versijā VARP tika aizstāta ar VAR.P, taču tā joprojām tiek saglabāta atpakaļejošas saderības dēļ. Pašreizējās Excel versijās ieteicams izmantot VAR.P, jo nav garantijas, ka VARP funkcija būs pieejama arī nākamajās Excel versijās.

    VAR.P funkcija programmā Excel

    Tā ir uzlabota VARP funkcijas versija, kas pieejama programmā Excel 2010 un jaunākās versijās.

    VAR.P(numurs1, [numurs2], ...)

    VARPA funkcija programmā Excel

    Funkcija VARPA aprēķina populācijas dispersiju, pamatojoties uz visu skaitļu, teksta un loģisko vērtību kopumu. Tā ir pieejama visās Excel 2000 līdz 2019 versijās.

    VARA(vērtība1, [vērtība2], ...)

    Populācijas dispersijas formula programmā Excel

    Var aprēķina piemērā mēs atradām 5 eksāmenu rezultātu dispersiju, pieņemot, ka šie rezultāti bija atlase no lielākas studentu grupas. Ja jūs savācat datus par visiem grupas studentiem, šie dati būs visa populācija, un jūs aprēķināsiet populācijas dispersiju, izmantojot iepriekš minētās funkcijas.

    Pieņemsim, ka mums ir 10 studentu grupas (B2:B11) eksāmenu rezultāti. Rezultāti veido visu populāciju, tāpēc mēs veiksim variāciju ar šīm formulām:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    Un visas formulas dos identisku rezultātu:

    Lai pārliecinātos, ka Excel ir pareizi aprēķinājis dispersiju, varat to pārbaudīt, izmantojot manuālo var aprēķina formulu, kas parādīta zemāk redzamajā ekrānšāviņas attēlā:

    Ja daži no skolēniem nav kārtojuši eksāmenu un punktu skaita vietā viņiem ir N/A, VARPA funkcija atgriezīs atšķirīgu rezultātu. Iemesls ir tāds, ka VARPA teksta vērtības novērtē kā nulles, bet VARP un VAR.P ignorē teksta un loģiskās vērtības atsaucēs. Sīkākai informācijai skatiet VAR.P pret VARPA.

    Varianču formula programmā Excel - lietošanas piezīmes

    Lai pareizi veiktu dispersijas analīzi programmā Excel, ievērojiet šos vienkāršos noteikumus:

    • Sniedziet argumentus kā vērtības, masīvus vai šūnu atsauces.
    • Programmā Excel 2007 un jaunākās versijās var norādīt līdz 255 argumentiem, kas atbilst izlasei vai populācijai; programmā Excel 2003 un vecākās versijās - līdz 30 argumentiem.
    • Novērtēt tikai skaitļi atsaucēs, neņemot vērā tukšās šūnas, tekstu un loģiskās vērtības, izmantojiet VAR vai VAR.S funkciju, lai aprēķinātu izlases dispersiju, un VARP vai VAR.P, lai atrastu populācijas dispersiju.
    • Novērtēt loģisks un teksts vērtības atsaucēs, izmantojiet VARA vai VARPA funkciju.
    • Nodrošināt vismaz divas skaitliskās vērtības izlases dispersijas formulai un vismaz viena skaitliskā vērtība uz populācijas dispersijas formulu programmā Excel, pretējā gadījumā tiek pieļauta kļūda #DIV/0!.
    • Argumenti, kas satur tekstu, kuru nevar interpretēt kā skaitļus, izraisa #VALUE! kļūdas.

    Variance pret standarta novirzi programmā Excel

    Variance neapšaubāmi ir noderīgs jēdziens zinātnē, taču tas sniedz ļoti maz praktiskas informācijas. Piemēram, mēs noskaidrojām tīģeru populācijas vecumu vietējā zoodārzā un aprēķinājām variāciju, kas ir 16. Jautājums ir - kā mēs šo skaitli varam reāli izmantot?

    Varat izmantot dispersiju, lai noteiktu standartnovirzi, kas ir daudz labāks rādītājs, lai noteiktu datu kopas variāciju apjomu.

    Standarta novirze aprēķina kā kvadrātsakni no dispersijas, tātad mēs ņemam kvadrātsakni no 16 un iegūstam standartnovirzi 4.

    Kombinācijā ar vidējo vērtību standartnovirze var noteikt, cik veca ir lielākā daļa tīģeru. Piemēram, ja vidējā vērtība ir 8 un standartnovirze ir 4, tad lielākā daļa zoodārza tīģeru ir vecumā no 4 gadiem (8 - 4) līdz 12 gadiem (8 + 4).

    Microsoft Excel ir īpašas funkcijas izlases un populācijas standartnovirzes aprēķināšanai. Visu funkciju detalizētu skaidrojumu var atrast šajā pamācībā: Kā aprēķināt standartnovirzi programmā Excel.

    Lūk, kā Excel programmā veikt dispersiju. Lai tuvāk aplūkotu šajā pamācībā aplūkotās formulas, aicinām lejupielādēt mūsu parauga darbgrāmatu šī raksta beigās. Paldies, ka izlasījāt, un ceru, ka nākamnedēļ tiksimies mūsu emuārā!

    Prakses darba burtnīca

    Variances aprēķināšana programmā Excel - piemēri (.xlsx fails)

    Maikls Brauns ir īpašs tehnoloģiju entuziasts, kura aizraušanās ir sarežģītu procesu vienkāršošana, izmantojot programmatūras rīkus. Ar vairāk nekā desmit gadu pieredzi tehnoloģiju nozarē viņš ir pilnveidojis savas prasmes programmās Microsoft Excel un Outlook, kā arī Google izklājlapās un dokumentos. Maikla emuārs ir veltīts tam, lai dalītos savās zināšanās un pieredzē ar citiem, sniedzot viegli izpildāmus padomus un pamācības produktivitātes un efektivitātes uzlabošanai. Neatkarīgi no tā, vai esat pieredzējis profesionālis vai iesācējs, Maikla emuārs piedāvā vērtīgas atziņas un praktiskus padomus, kā maksimāli izmantot šos būtiskos programmatūras rīkus.