INHOUDSOPGAWE
In hierdie tutoriaal sal ons kyk na hoe om afwykingsanalise Excel te doen en watter formules om te gebruik om afwyking van 'n steekproef en populasie te vind.
Afwyking is een van die nuttigste gereedskap in waarskynlikheidsteorie en statistiek. In die wetenskap beskryf dit hoe ver elke getal in die datastel van die gemiddelde is. In die praktyk wys dit dikwels hoeveel iets verander. Byvoorbeeld, temperatuur naby die ewenaar het minder variansie as in ander klimaatsones. In hierdie artikel gaan ons verskillende metodes ontleed om variansie in Excel te bereken.
Wat is variansie?
Variansie is die maatstaf van veranderlikheid van 'n datastel wat aandui hoe ver verskillende waardes versprei is. Wiskundig word dit gedefinieer as die gemiddelde van die kwadraatverskille van die gemiddelde.
Om beter te verstaan wat jy eintlik met die variansie bereken, oorweeg asseblief hierdie eenvoudige voorbeeld.
Gestel daar is 5 tiere in jou plaaslike dieretuin wat 14, 10, 8, 6 en 2 jaar oud is.
Volg hierdie eenvoudige stappe om afwyking te vind:
- Bereken die gemiddelde (eenvoudige gemiddelde) van die vyf getalle:
- Van elke getal, trek die gemiddelde af om die verskille te vind. Om dit te visualiseer, kom ons teken die verskille op die grafiek:
- Kwadraat elke verskil.
- Werk die gemiddelde van die kwadraatverskille uit.
So, die variansie is 16. Maar wat beteken hierdie getaleintlik bedoel?
In werklikheid gee variansie jou net 'n baie algemene idee van die verspreiding van die datastel. 'n Waarde van 0 beteken daar is geen veranderlikheid nie, dit wil sê al die getalle in die datastel is dieselfde. Hoe groter die getal, hoe meer verspreid is die data.
Hierdie voorbeeld is vir bevolkingsafwyking (m.a.w. 5 tiere is die hele groep waarin jy belangstel). As jou data 'n seleksie uit 'n groter populasie is, dan moet jy steekproefafwyking bereken deur 'n effens ander formule te gebruik.
Hoe om variansie in Excel te bereken
Daar is 6 ingeboude funksies om afwyking in Excel te doen: VAR, VAR.S, VARP, VAR.P, VARA en VARPA.
Jou keuse van die afwykingsformule word deur die volgende faktore bepaal:
- Die weergawe van Excel wat jy gebruik.
- Of jy steekproef- of populasieafwyking bereken.
- Of jy teks- en logiese waardes wil evalueer of ignoreer.
Excel-afwykingsfunksies
Die onderstaande tabel verskaf 'n oorsig van die variasiefunksies wat in Excel beskikbaar is om jou te help om die formule te kies wat die beste by jou behoeftes pas.
Naam | Excel-weergawe | Datatipe | Teks en logika |
VAR | 2000 - 2019 | Voorbeeld | Ignoreer |
VAR.S | 2010 - 2019 | Voorbeeld | Ignoreer |
VARA | 2000 -2019 | Voorbeeld | Geëvalueer |
VARP | 2000 - 2019 | Bevolking | Ignoreer |
VAR.P | 2010 - 2019 | Bevolking | Ignoreer |
VARPA | 2000 - 2019 | Bevolking | Geëvalueer |
VAR.S vs. VARA en VAR.P vs. VARPA
VARA en VARPA verskil slegs van ander variansiefunksies in die manier waarop hulle logiese en tekswaardes in verwysings hanteer. Die volgende tabel verskaf 'n opsomming van hoe teksvoorstellings van getalle en logiese waardes geëvalueer word.
Argumenttipe | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Logiese waardes binne skikkings en verwysings | Ignoreer | Geëvalueer (WAAR=1, ONWAAR=0) |
Teksvoorstellings van getalle binne skikkings en verwysings | Ignoreer | Geëvalueer as nul |
Logies waardes en teksvoorstellings van getalle wat direk in argumente getik is | Geëvalueer (WAAR=1, ONWAAR=0) | |
Leë selle | Ignoreer |
Hoe om steekproefafwyking in Excel te bereken
'n steekproef is 'n stel data wat uit die hele populasie onttrek word. En die afwyking wat uit 'n steekproef bereken word, word steekproefvariansie genoem.
As jy byvoorbeeld wil weet hoe mense se hoogtes verskil, sal dit vir jou tegnies onhaalbaar wees om elke persoon op die aarde.Die oplossing is om 'n steekproef van die populasie te neem, sê 1 000 mense, en die hoogtes van die hele populasie te skat gebaseer op daardie steekproef.
Stekproefafwyking word met hierdie formule bereken:
Waar:
- x̄ die gemiddelde (eenvoudige gemiddelde) van die steekproefwaardes is.
- n is die steekproefgrootte, dit wil sê die aantal waardes in die voorbeeld.
Daar is 3 funksies om voorbeeldafwyking in Excel te vind: VAR, VAR.S en VARA.
VAR-funksie in Excel
Dit is die oudste Excel-funksie om variansie te skat gebaseer op 'n steekproef. Die VAR-funksie is beskikbaar in alle weergawes van Excel 2000 tot 2019.
VAR(nommer1, [nommer2], …)Let wel. In Excel 2010 is die VAR-funksie vervang met VAR.S wat verbeterde akkuraatheid bied. Alhoewel VAR steeds beskikbaar is vir terugwaartse versoenbaarheid, word dit aanbeveel om VAR.S in die huidige weergawes van Excel te gebruik.
VAR.S-funksie in Excel
Dit is die moderne eweknie van die Excel VAR funksie. Gebruik die VAR.S-funksie om voorbeeldafwyking in Excel 2010 en later te vind.
VARA-funksie in Excel
Die Excel VARA-funksie gee 'n voorbeeldafwyking gebaseer op 'n stel getalle, teks en logiese waardes soos in hierdie tabel getoon.
VARA(waarde1, [waarde2], …)Voorbeeldafwykingformule in Excel
Wanneer daar gewerk word met 'n numeriese stel data kan jy enige van die bogenoemde funksies gebruik om steekproefafwyking te berekenin Excel.
As 'n voorbeeld, kom ons vind die variansie van 'n steekproef wat uit 6 items bestaan (B2:B7). Hiervoor kan jy een van die onderstaande formules gebruik:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Soos in die skermkiekie gewys, gee al die formules die dieselfde resultaat (afgerond tot 2 desimale plekke):
Om die resultaat na te gaan, kom ons doen var-berekening met die hand:
- Vind die gemiddelde deur te gebruik die AVERAGE-funksie:
=AVERAGE(B2:B7)
Die gemiddelde gaan na enige leë sel, sê B8.
- Trek die gemiddelde van elke getal in die steekproef af:
=B2-$B$8
Die verskille gaan na kolom C, wat in C2 begin.
- Kwadrateer elke verskil en plaas die resultate in kolom D, wat begin in D2:
=C2^2
- Tel die kwadraatverskille by en deel die resultaat deur die aantal items in die voorbeeld minus 1:
=SUM(D2:D7)/(6-1)
Soos jy kan sien, is die resultaat van ons handmatige var-berekening presies dieselfde as die getal wat deur Excel se ingeboude funksies teruggestuur word:
As jou datastel die Booleaanse - en/of teks -waardes bevat, sal die VARA-funksie 'n ander resultaat gee. Die rede is dat VAR en VAR.S enige waardes anders as getalle in verwysings ignoreer, terwyl VARA tekswaardes as nulle evalueer, WAAR as 1 en ONWAAR as 0. Kies dus asseblief die afwykingsfunksie vir jou berekeninge versigtig, afhangende van of jy teks en logika wil verwerk of ignoreer.
Hoe ombereken populasievariansie in Excel
Bevolking is alle lede van 'n gegewe groep, dit wil sê alle waarnemings in die studieveld. Bevolkingsafwyking beskryf hoe data in die geheel wys bevolking is versprei.
Die bevolkingsafwyking kan gevind word met hierdie formule:
Waar:
- x̄ die gemiddelde van die populasie.
- n is die populasiegrootte, dit wil sê die totale aantal waardes in die populasie.
Daar is 3 funksies om populasieafwyking in Excel te bereken: VARP, VAR .P en VARPA.
VARP-funksie in Excel
Die Excel VARP-funksie gee die variansie van 'n populasie terug op grond van die hele stel getalle. Dit is beskikbaar in alle weergawes van Excel 2000 tot 2019.
VARP(nommer1, [nommer2], …)Let wel. In Excel 2010 is VARP vervang met VAR.P, maar word steeds gehou vir terugwaartse versoenbaarheid. Dit word aanbeveel om VAR.P in die huidige weergawes van Excel te gebruik omdat daar geen waarborg is dat die VARP-funksie in toekomstige weergawes van Excel beskikbaar sal wees nie.
VAR.P-funksie in Excel
Dit is 'n verbeterde weergawe van die VARP-funksie beskikbaar in Excel 2010 en later.
VAR.P(nommer1, [nommer2], …)VARPA-funksie in Excel
Die VARPA-funksie bereken die variansie van 'n populasie gebaseer op die hele stel getalle, teks en logiese waardes. Dit is beskikbaar in alle weergawes van Excel 2000 tot 2019.
VARA(waarde1,[waarde2], …)Bevolkingsafwykingsformule in Excel
In die steekproefvar-berekeningsvoorbeeld het ons 'n afwyking van 5 eksamentellings gevind, met die veronderstelling dat daardie tellings 'n keuse uit 'n groter groep studente was. As jy data van al die studente in die groep insamel, sal daardie data die hele populasie verteenwoordig, en jy sal 'n bevolkingsafwyking bereken deur die bogenoemde funksies te gebruik.
Kom ons sê, ons het die eksamentellings van 'n groep van 10 studente (B2:B11). Die tellings maak die hele populasie uit, so ons sal variasie met hierdie formules doen:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
En al die formules sal die identiese resultaat:
Om seker te maak dat Excel die afwyking reg gedoen het, kan jy dit nagaan met die handmatige var-berekeningsformule wat in die skermkiekie hieronder gewys word:
As sommige van die studente nie die eksamen afgelê het nie en NVT het in plaas van 'n tellingnommer, sal die VARPA-funksie 'n ander uitslag gee. Die rede is dat VARPA tekswaardes as nulle evalueer terwyl VARP en VAR.P teks- en logiese waardes in verwysings ignoreer. Sien asseblief VAR.P vs. VARPA vir volledige besonderhede.
Afwykingsformule in Excel - gebruiksnotas
Om afwykingsanalise in Excel korrek te doen, volg asseblief hierdie eenvoudige reëls:
- Verskaf argumente as waardes, skikkings of selverwysings.
- In Excel 2007 en later kan jy tot 255 argumente verskaf wat ooreenstem met 'nsteekproef of populasie; in Excel 2003 en ouer - tot 30 argumente.
- Om slegs nommers in verwysings te evalueer, deur leë selle, teks en die logiese waardes te ignoreer, gebruik die VAR- of VAR.S-funksie om bereken steekproefafwyking en VARP of VAR.P om populasieafwyking te vind.
- Om logiese - en teks -waardes in verwysings te evalueer, gebruik die VARA- of VARPA-funksie.
- Verskaf ten minste twee numeriese waardes aan 'n steekproefafwykingformule en ten minste een numeriese waarde aan 'n populasieafwykingsformule in Excel, anders 'n #DIV/0! fout kom voor.
- Argumente wat teks bevat wat nie as getalle geïnterpreteer kan word nie, veroorsaak #WAARDE! foute.
Afwyking vs. standaardafwyking in Excel
Afwyking is ongetwyfeld 'n nuttige konsep in die wetenskap, maar dit gee baie min praktiese inligting. Ons het byvoorbeeld die ouderdomme van die bevolking van tiere in 'n plaaslike dieretuin gevind en die variansie bereken, wat gelyk is aan 16. Die vraag is - hoe kan ons hierdie getal eintlik gebruik?
Jy kan variansie gebruik om uit te werk standaardafwyking, wat 'n baie beter maatstaf is van die hoeveelheid variasie in 'n datastel.
Standaardafwyking word as die vierkantswortel van die variansie bereken. Dus, ons neem die vierkantswortel van 16 en kry die standaardafwyking van 4.
In kombinasie met die gemiddelde kan die standaardafwyking jou vertel hoe oud die meeste van die tiere is. Byvoorbeeld, asdie gemiddelde is 8 en die standaardafwyking is 4, die meerderheid van die tiere in die dieretuin is tussen 4 jaar (8 - 4) en 12 jaar (8 + 4).
Microsoft Excel het spesiale funksies om standaardafwyking van 'n steekproef en populasie uit te werk. Die gedetailleerde verduideliking van al die funksies kan gevind word in hierdie tutoriaal: Hoe om standaardafwyking in Excel te bereken.
Dis hoe om afwyking in Excel te doen. Om die formules wat in hierdie tutoriaal bespreek word van nader te bekyk, is u welkom om ons voorbeeldwerkboek aan die einde van hierdie pos af te laai. Ek bedank jou vir die lees en hoop om jou volgende week op ons blog te sien!
Oefen werkboek
Bereken Variansie in Excel - voorbeelde (.xlsx lêer)