Hogyan kell kiszámítani a szórást Excelben - minta & samp; populációs szórásképlet

  • Ossza Meg Ezt
Michael Brown

Ebben a bemutatóban megnézzük, hogyan kell elvégezni az Excel varianciaelemzést, és milyen képleteket kell használni a minta és a populáció varianciájának meghatározásához.

A variancia a valószínűségelmélet és a statisztika egyik leghasznosabb eszköze. A tudományban azt írja le, hogy az adathalmaz egyes számai milyen messze vannak az átlagtól. A gyakorlatban gyakran azt mutatja meg, hogy valami mennyire változik. Például az egyenlítő közelében a hőmérsékletnek kisebb a varianciája, mint más éghajlati övezetekben. Ebben a cikkben a variancia kiszámításának különböző módszereit elemezzük Excelben.

    Mi az eltérés?

    Eltérés egy adathalmaz variabilitásának mérőszáma, amely azt mutatja, hogy a különböző értékek mennyire szóródnak. Matematikailag az átlagtól való eltérések négyzetének átlagaként definiálják.

    Ahhoz, hogy jobban megértsük, mit is számolunk a varianciával, nézzük meg ezt az egyszerű példát.

    Tegyük fel, hogy a helyi állatkertben 5 tigris van, amelyek 14, 10, 8, 6 és 2 évesek.

    Az eltérés megtalálásához kövesse az alábbi egyszerű lépéseket:

    1. Számítsa ki az öt szám átlagát (egyszerű átlag):

    2. Minden számból vonjuk ki az átlagot, hogy megtaláljuk a különbségeket. Ennek szemléltetéséhez ábrázoljuk a különbségeket a diagramon:

    3. Négyzetbe minden különbség.
    4. Számítsuk ki a négyzetes különbségek átlagát.

    Az eltérés tehát 16. De mit is jelent valójában ez a szám?

    A variancia valójában csak egy nagyon általános képet ad az adathalmaz szóródásáról. 0 érték azt jelenti, hogy nincs szóródás, azaz az adathalmazban minden szám egyforma. Minél nagyobb a szám, annál jobban szóródnak az adatok.

    Ez a példa a populációs varianciára vonatkozik (azaz 5 tigris az egész csoport, amely iránt érdeklődik). Ha az adatai egy nagyobb populációból való kiválasztás, akkor a minta varianciáját egy kissé eltérő képlet segítségével kell kiszámítania.

    Hogyan számítsuk ki a varianciát Excelben

    Az Excelben 6 beépített függvény van a variancia kiszámítására: VAR, VAR.S, VARP, VAR.P, VARA és VARPA.

    A varianciaformula kiválasztását a következő tényezők határozzák meg:

    • Az Ön által használt Excel verziója.
    • Akár a minta, akár a populáció szórását számítja ki.
    • A szöveges és logikai értékek kiértékelése vagy figyelmen kívül hagyása.

    Excel variancia funkciók

    Az alábbi táblázat áttekintést nyújt az Excelben rendelkezésre álló variációs függvényekről, hogy segítsen kiválasztani az Ön igényeinek leginkább megfelelő képletet.

    Név Excel verzió Adattípus Szöveg és logikai elemek
    VAR 2000 - 2019 Minta Figyelmen kívül hagyta
    VAR.S 2010 - 2019 Minta Figyelmen kívül hagyta
    VARA 2000 - 2019 Minta Értékelt
    VARP 2000 - 2019 Népesség Figyelmen kívül hagyta
    VAR.P 2010 - 2019 Népesség Figyelmen kívül hagyta
    VARPA 2000 - 2019 Népesség Értékelt

    VAR.S vs. VARA és VAR.P vs. VARPA

    A VARA és a VARPA csak abban különbözik a többi varianciafüggvénytől, ahogyan a logikai és szöveges értékeket kezeli a hivatkozásokban. A következő táblázat összefoglalja, hogy a számok és logikai értékek szöveges ábrázolása hogyan kerül kiértékelésre.

    Argumentum típusa VAR, VAR.S, VARP, VAR.P VARA és VARPA
    Logikai értékek tömbökben és hivatkozásokban Figyelmen kívül hagyta Értékelt

    (TRUE=1, FALSE=0)

    Számok szöveges ábrázolása tömbökben és hivatkozásokban Figyelmen kívül hagyta Nulla értékűként értékelve
    Logikai értékek és közvetlenül az argumentumokba beírt számok szöveges ábrázolása Értékelt

    (TRUE=1, FALSE=0)

    Üres cellák Figyelmen kívül hagyta

    Hogyan számítsuk ki a minta szórását Excelben

    A minta a teljes sokaságból kivont adatok halmaza. A mintából számított varianciát pedig minta szórása .

    Ha például azt szeretnénk megtudni, hogy az emberek magassága hogyan változik, technikailag kivitelezhetetlen lenne, hogy a Földön minden egyes embert megmérjünk. A megoldás az, hogy a népességből mintát veszünk, mondjuk 1000 embert, és a minta alapján megbecsüljük a teljes népesség magasságát.

    A minta szórását ezzel a képlettel számoljuk ki:

    Hol:

    • x̄ a mintaértékek átlaga (egyszerű átlaga).
    • n a minta mérete, azaz a mintában szereplő értékek száma.

    Az Excelben 3 függvény létezik a minta szórásának meghatározására: VAR, VAR.S és VARA.

    VAR funkció Excelben

    Ez a legrégebbi Excel-funkció, amely a variancia becslésére szolgál egy minta alapján. A VAR funkció az Excel 2000-től 2019-ig minden verziójában elérhető.

    VAR(szám1, [szám2], ...)

    Megjegyzés: Az Excel 2010-ben a VAR függvényt felváltotta a VAR.S, amely jobb pontosságot biztosít. Bár a VAR továbbra is elérhető a visszafelé kompatibilitás érdekében, az Excel jelenlegi verzióiban ajánlott a VAR.S használata.

    VAR.S funkció Excelben

    Ez az Excel VAR függvényének modern megfelelője. A VAR.S függvényt az Excel 2010 és újabb programokban a mintavételi variancia meghatározásához használja.

    VAR.S(szám1, [szám2], ...)

    VARA funkció Excelben

    Az Excel VARA függvény egy számok, szövegek és logikai értékek halmazán alapuló mintaarányt ad vissza, amint az ebben a táblázatban látható.

    VARA(érték1, [érték2], ...)

    Minta variancia képlet Excelben

    Ha numerikus adatsorral dolgozik, a fenti függvények bármelyikét használhatja a minta szórásának kiszámításához az Excelben.

    Példaként keressük meg egy 6 tételből álló minta varianciáját (B2:B7). Ehhez használhatjuk az alábbi képletek egyikét:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Amint a képernyőképen látható, minden képlet ugyanazt az eredményt adja vissza (2 tizedesjegyre kerekítve):

    Az eredmény ellenőrzéséhez végezzük el manuálisan a var-számítást:

    1. Keresse meg az átlagot az AVERAGE függvény segítségével:

      =ÁTLAG(B2:B7)

      Az átlag bármelyik üres cellába, mondjuk B8-ba kerül.

    2. Vonja ki az átlagot a minta minden egyes számából:

      =B2-$B$8

      A különbségek a C2-től kezdődően a C oszlopba kerülnek.

    3. Négyzeteljük ki az egyes különbségeket, és az eredményeket a D2-től kezdődően írjuk a D oszlopba:

      =C2^2

    4. Adja össze a négyzetes különbségeket, és az eredményt ossza el a mintában lévő tételek számával mínusz 1:

      =ÖSSZEG(D2:D7)/(6-1)

    Mint látható, a kézi var-számításunk eredménye pontosan megegyezik az Excel beépített függvényei által visszaadott számmal:

    Ha az adatkészlet tartalmazza a Boolean és/vagy szöveg értékeket, a VARA függvény más eredményt fog visszaadni. Ennek oka, hogy a VAR és a VAR.S figyelmen kívül hagyja a hivatkozásokban szereplő számokon kívüli értékeket, míg a VARA a szöveges értékeket nullaként, a TRUE-t 1-ként, a FALSE-t pedig 0-ként értékeli. Ezért kérjük, hogy gondosan válassza ki a számításaihoz a varianciafüggvényt attól függően, hogy a szöveges és logikai értékeket feldolgozza vagy figyelmen kívül hagyja.

    Hogyan számítsuk ki a populációs varianciát Excelben

    Népesség egy adott csoport összes tagja, azaz a vizsgált terület összes megfigyelése. Népesség szórása leírja, hogy az adatpontok hogyan oszlanak el a teljes populációban.

    A populáció szórása a következő képlettel határozható meg:

    Hol:

    • x̄ a populáció átlaga.
    • n a populáció mérete, azaz a populációban lévő értékek teljes száma.

    Az Excelben 3 funkció áll rendelkezésre a populációs variancia kiszámítására: VARP, VAR.P és VARPA.

    VARP funkció Excelben

    Az Excel VARP függvény a teljes számhalmazon alapuló sokaság varianciáját adja vissza. Az Excel 2000-től 2019-ig minden Excel-verzióban elérhető.

    VARP(szám1, [szám2], ...)

    Megjegyzés: Az Excel 2010-ben a VARP funkciót felváltotta a VAR.P, de a visszafelé kompatibilitás miatt továbbra is megmaradt. Az Excel jelenlegi verzióiban ajánlott a VAR.P funkció használata, mivel nincs garancia arra, hogy a VARP funkció elérhető lesz az Excel jövőbeli verzióiban.

    VAR.P funkció Excelben

    Ez az Excel 2010-ben és újabb verziókban elérhető VARP funkció továbbfejlesztett változata.

    VAR.P(szám1, [szám2], ...)

    VARPA funkció Excelben

    A VARPA függvény kiszámítja egy sokaság szórását a számok, szövegek és logikai értékek teljes halmaza alapján. Az Excel 2000 és 2019 közötti összes verziójában elérhető.

    VARA(érték1, [érték2], ...)

    Népesség szórásképlet Excelben

    A var-számítási példában 5 vizsgaeredmény varianciáját találtuk meg, feltételezve, hogy ezek a pontszámok egy nagyobb tanulócsoportból való kiválasztás voltak. Ha a csoport összes tanulójáról adatokat gyűjt, akkor ezek az adatok a teljes populációt képviselik, és a fenti függvények segítségével kiszámíthatja a populációs varianciát.

    Tegyük fel, hogy rendelkezésünkre állnak egy 10 diákból álló csoport (B2:B11) vizsgaeredményei. A pontszámok a teljes sokaságot alkotják, így a varianciát ezekkel a képletekkel fogjuk elvégezni:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    És az összes képlet azonos eredményt fog visszaadni:

    Hogy megbizonyosodjon arról, hogy az Excel helyesen végezte el a variancia kiszámítását, ellenőrizheti azt az alábbi képernyőképen látható manuális var számítási képlettel:

    Ha a diákok közül néhányan nem vettek részt a vizsgán, és a pontszám helyett N / N van, a VARPA függvény más eredményt fog visszaadni. Ennek oka, hogy a VARPA a szöveges értékeket nullaként értékeli, míg a VARP és a VAR.P figyelmen kívül hagyja a szöveges és logikai értékeket a hivatkozásokban. A részletekért lásd: VAR.P vs. VARPA.

    Eltérési képlet Excelben - használati megjegyzések

    Az Excelben végzett varianciaelemzés helyes elvégzéséhez kövesse az alábbi egyszerű szabályokat:

    • Az argumentumokat értékek, tömbök vagy cellahivatkozások formájában adja meg.
    • Az Excel 2007 és újabb programokban legfeljebb 255 argumentumot adhat meg egy mintának vagy populációnak megfelelően; az Excel 2003 és régebbi programokban legfeljebb 30 argumentumot.
    • Csak a következők értékelése számok a hivatkozásokban, figyelmen kívül hagyva az üres cellákat, a szöveget és a logikai értékeket, használja a VAR vagy VAR.S függvényt a minta szórásának kiszámításához és a VARP vagy VAR.P függvényt a populáció szórásának meghatározásához.
    • A következők értékelése logikai és szöveg a hivatkozásokban szereplő értékeket, használja a VARA vagy VARPA függvényt.
    • Legalább két numerikus érték egy minta szórásképletre és legalább egy numerikus érték egy populációs szórásképlethez az Excelben, különben #DIV/0! hiba lép fel.
    • A számként nem értelmezhető szöveget tartalmazó argumentumok #VALUE! hibát okoznak.

    Szórás vs. szórás Excelben

    A variancia kétségtelenül hasznos fogalom a tudományban, de nagyon kevés gyakorlati információt ad. Például megtaláltuk a helyi állatkertben élő tigrisek populációjának életkorát, és kiszámítottuk a varianciát, ami 16. A kérdés az, hogy hogyan tudjuk ezt a számot ténylegesen felhasználni?

    A variancia segítségével kiszámíthatja a szórást, amely sokkal jobb mérőszáma az adathalmazban lévő szórás mértékének.

    Standard eltérés a variancia négyzetgyökeként számítjuk ki. Tehát a 16 négyzetgyökét vesszük, és megkapjuk a 4-es szórást.

    Az átlaggal kombinálva a szórás megmondja, hogy a tigrisek többsége hány éves. Ha például az átlag 8, a szórás pedig 4, akkor az állatkertben lévő tigrisek többsége 4 év (8 - 4) és 12 év (8 + 4) között van.

    A Microsoft Excel speciális funkciókkal rendelkezik a minta és a sokaság szórásának kiszámításához. Az összes függvény részletes magyarázata megtalálható ebben a bemutatóban: Hogyan számítsuk ki a szórást Excelben.

    Így kell az eltérést Excelben elvégezni. Ha közelebbről meg szeretné nézni a bemutatóban tárgyalt képleteket, akkor szívesen látjuk, ha letölti a bejegyzés végén található minta munkafüzetünket. Köszönöm, hogy elolvasta, és remélem, hogy jövő héten találkozunk a blogunkon!

    Gyakorló munkafüzet

    Variancia kiszámítása Excelben - példák (.xlsx fájl)

    Michael Brown elkötelezett technológiai rajongó, aki szenvedélyesen egyszerűsíti a bonyolult folyamatokat szoftvereszközök segítségével. A technológiai iparban szerzett több mint egy évtizedes tapasztalatával a Microsoft Excel és az Outlook, valamint a Google Táblázatok és a Dokumentumok területén fejlesztette tudását. Michael blogja célja, hogy megossza tudását és szakértelmét másokkal, könnyen követhető tippeket és oktatóanyagokat adva a termelékenység és a hatékonyság javításához. Akár tapasztalt szakember, akár kezdő, Michael blogja értékes betekintést és gyakorlati tanácsokat kínál, amelyek segítségével a legtöbbet hozhatja ki ezekből az alapvető szoftvereszközökből.