Sisällysluettelo
Ohjeessa selitetään keskihajonnan ja keskiarvon keskivirheen ydin sekä se, mitä kaavaa on paras käyttää keskihajonnan laskemiseen Excelissä.
Kuvailevassa tilastotieteessä aritmeettinen keskiarvo (jota kutsutaan myös keskiarvoksi) ja keskihajonta ja ovat kaksi läheisesti toisiinsa liittyvää käsitettä. Useimmat ymmärtävät ensimmäisen hyvin, mutta vain harvat ymmärtävät jälkimmäisen. Tämän ohjeen tavoitteena on valaista, mitä keskihajonta oikeastaan on ja miten se lasketaan Excelissä.
Mikä on keskihajonta?
The keskihajonta on mittari, joka osoittaa, kuinka paljon aineiston arvot poikkeavat (hajoavat) keskiarvosta. Toisin sanoen keskihajonta osoittaa, ovatko tietosi lähellä keskiarvoa vai vaihtelevatko ne paljon.
Keskihajonnan tarkoituksena on auttaa ymmärtämään, antaako keskiarvo todella "tyypillistä" dataa. Mitä lähempänä nollaa keskihajonta on, sitä pienempi on datan vaihtelu ja sitä luotettavampi on keskiarvo. Keskihajonta, joka on yhtä suuri kuin 0, tarkoittaa, että jokainen arvo datajoukossa on täsmälleen yhtä suuri kuin keskiarvo. Mitä suurempi keskihajonta on, sitä enemmän vaihtelua on datassa.ja sitä epätarkempi keskiarvo on.
Jos haluat saada paremman käsityksen siitä, miten tämä toimii, katso seuraavia tietoja:
Biologian osalta keskihajonta on 5 (pyöristettynä kokonaisluvuksi), mikä kertoo, että suurin osa tuloksista poikkeaa enintään 5 pisteen päähän keskiarvosta. Onko se hyvä? No, kyllä, se osoittaa, että oppilaiden biologian tulokset ovat melko tasaisia.
Matematiikan osalta keskihajonta on 23. Se osoittaa, että pistemäärissä on valtava hajonta (hajonta), mikä tarkoittaa, että jotkut oppilaat suoriutuivat paljon paremmin ja/tai jotkut paljon huonommin kuin keskiarvo.
Käytännössä yritysanalyytikot käyttävät keskihajontaa usein sijoitusriskin mittarina - mitä suurempi keskihajonta, sitä suurempi tuottojen volatiliteetti.
Otoksen keskihajonta vs. populaation keskihajonta
Keskihajontaan liittyen saatat usein kuulla termit "otos" ja "populaatio", jotka viittaavat käsiteltävien tietojen täydellisyyteen. Tärkein ero on seuraava:
- Väestö sisältää kaikki tietokokonaisuuden elementit.
- Näyte on tietojen osajoukko, joka sisältää yhden tai useamman elementin perusjoukosta.
Tutkijat ja analyytikot käyttävät otoksen ja perusjoukon keskihajontaa eri tilanteissa. Esimerkiksi kun opettaja tekee yhteenvedon luokan oppilaiden koepisteistä, hän käyttää perusjoukon keskihajontaa. Tilastotieteilijät, jotka laskevat kansallisen SAT-kokeiden keskiarvopistemäärän, käyttäisivät otoksen keskihajontaa, koska heillä on käytettävissään vain otoksen tiedot, ei perusjoukon keskihajontaa.koko väestöstä.
Keskihajonnan kaavan ymmärtäminen
Aineiston luonteella on merkitystä siksi, että populaation keskihajonta ja otoksen keskihajonta lasketaan hieman eri kaavoilla:
Näytteen keskihajonta | Väestön keskihajonta |
Missä:
- x i ovat yksittäisiä arvoja tietojoukossa
- x on kaikkien x arvot
- n on seuraavien kokonaislukumäärä x aineiston arvot
Onko sinulla vaikeuksia kaavojen ymmärtämisessä? Niiden jakaminen yksinkertaisiin vaiheisiin saattaa auttaa. Mutta ensin otetaan käyttöön esimerkkitietoja:
1. Laske keskiarvo (keskiarvo).
Ensin etsitään aineiston kaikkien arvojen keskiarvo ( x Kun lasket käsin, lasket luvut yhteen ja jaat summan näiden lukujen lukumäärällä, esimerkiksi näin:
(1+2+4+5+6+8+9)/7=5
Keskiarvon löytämiseksi Excelissä käytetään AVERAGE-funktiota, esim. =AVERAGE(A2:G2).
2. Vähennä jokaisesta luvusta keskiarvo ja neliöi tulos.
Tämä on se osa keskihajonnan kaavasta, jossa sanotaan: ( x i - x )2
Voit havainnollistaa, mitä oikeastaan tapahtuu, katsomalla seuraavia kuvia.
Tässä esimerkissä keskiarvo on 5, joten lasketaan kunkin datapisteen ja 5:n välinen ero.
Neliöi sitten erotukset, jolloin ne kaikki muuttuvat positiivisiksi luvuiksi:
3. Laske yhteen neliöerot
Matematiikassa sanotaan "summa" käyttämällä sigmaa Σ. Nyt siis lasketaan yhteen neliöerot, jotta kaavan tämä osa saadaan valmiiksi: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. Jaa neliöerojen kokonaismäärä arvojen lukumäärällä.
Tähän asti otoksen keskihajonta ja populaation keskihajonta ovat olleet identtisiä. Tässä vaiheessa ne ovat erilaisia.
Sillä näytteen keskihajonta , saatte näytteen varianssi jakamalla neliölliset erot yhteensä otoskoolla miinus 1:
52 / (7-1) = 8.67
Sillä populaation keskihajonta , löydät neliöerojen keskiarvo jakamalla neliöerojen kokonaismäärä niiden lukumäärällä:
52 / 7 = 7.43
Miksi kaavat eroavat toisistaan? Koska otoksen keskihajonnan kaavassa on korjattava otoskeskiarvon estimoinnin harha todellisen populaatiokeskiarvon sijasta. Tämä tehdään käyttämällä seuraavaa kaavaa n - 1 sen sijaan, että n , jota kutsutaan Besselin korjaukseksi.
5. Ota neliöjuuri
Lopuksi otetaan edellä mainittujen lukujen neliöjuuri, jolloin saadaan keskihajonta (alla olevissa yhtälöissä pyöristettynä kahteen desimaaliin):
Näytteen keskihajonta | Väestön keskihajonta |
√ 8.67 = 2.94 | √ 7.43 = 2.73 |
Microsoft Excelissä keskihajonta lasketaan samalla tavalla, mutta kaikki edellä mainitut laskutoimitukset suoritetaan kulissien takana. Tärkeintä on valita oikea keskihajontafunktio, josta seuraava jakso antaa sinulle vihjeitä.
Kuinka laskea keskihajonta Excelissä
Excelissä on kuusi erilaista funktiota keskihajonnan määrittämiseen. Se, mitä funktiota käytät, riippuu ensisijaisesti siitä, millaisten tietojen kanssa työskentelet - onko kyseessä koko perusjoukko vai otos.
Toiminnot otoksen keskihajonnan laskemiseksi Excelissä
Jos haluat laskea keskihajonnan otoksen perusteella, käytä jotakin seuraavista kaavoista (kaikki perustuvat edellä kuvattuun n-1-menetelmään).
Excelin STDEV-toiminto
STDEV(numero1,[numero2],...)
on vanhin Excel-funktio, jolla voidaan arvioida otokseen perustuva keskihajonta, ja se on käytettävissä kaikissa Excelin versioissa 2003-2019.
Excel 2007:ssä ja sitä uudemmissa versioissa STDEV voi hyväksyä enintään 255 argumenttia, jotka voidaan esittää numeroina, matriiseina, nimettyinä alueina tai viittauksina numeroita sisältäviin soluihin. Excel 2003:ssa funktio voi hyväksyä vain enintään 30 argumenttia.
Suoraan argumenttiluettelossa annettujen numeroiden loogiset arvot ja tekstimuotoiset esitykset lasketaan. Malleissa ja viittauksissa lasketaan vain numerot; tyhjiä soluja, loogisia arvoja TRUE ja FALSE, teksti- ja virhearvoja ei oteta huomioon.
Huomautus: Excel STDEV on vanhentunut funktio, joka on säilytetty uudemmissa Excel-versioissa vain taaksepäin yhteensopivuuden vuoksi. Microsoft ei kuitenkaan anna mitään lupauksia tulevista versioista. Excel 2010:ssä ja uudemmissa versioissa on siis suositeltavaa käyttää STDEV.S:ää STDEV.S:n sijasta.
Excelin STDEV.S-toiminto
STDEV.S(numero1,[numero2],...).
on parannettu versio STDEV:stä, joka otettiin käyttöön Excel 2010:ssä.
Kuten STDEV, myös STDEV.S-funktio laskee arvojen joukon otoksen keskihajonnan edellisessä jaksossa käsitellyn klassisen otoksen keskihajonnan kaavan perusteella.
Excel STDEVA-toiminto
STDEVA(arvo1, [arvo2], ...)
on toinen funktio otoksen keskihajonnan laskemiseen Excelissä. Se eroaa kahdesta edellä mainitusta vain siinä, miten se käsittelee loogisia ja tekstiarvoja:
- Kaikki loogiset arvot lasketaan riippumatta siitä, ovatko ne matriisien tai viittausten sisällä vai kirjoitetaanko ne suoraan argumenttiluetteloon (TRUE on 1, FALSE on 0).
- Tekstiarvot lasketaan 0:ksi, mukaan lukien tyhjät merkkijonot (""), numeroiden tekstimuotoiset esitykset ja muu teksti. Suoraan argumenttiluettelossa annettujen numeroiden tekstimuotoiset esitykset lasketaan niiden esittäminä numeroina (tässä on esimerkki kaavasta).
- Tyhjiä soluja ei oteta huomioon.
Huomautus: Jotta näytteen keskihajonnan kaava toimisi oikein, annettujen argumenttien on sisällettävä vähintään kaksi numeerista arvoa, muuten palautetaan virhe #DIV/0!.
Toiminnot populaation keskihajonnan laskemiseksi Excelissä
Jos käsittelet koko perusjoukkoa, voit tehdä keskihajonnan Excelissä jollakin seuraavista funktioista. Nämä funktiot perustuvat "n"-menetelmään.
Excelin STDEVP-toiminto
STDEVP(numero1,[numero2],...)
on vanha Excel-funktio perusjoukon keskihajonnan löytämiseksi.
Excelin uusissa versioissa 2010, 2013, 2016 ja 2019 se on korvattu parannetulla STDEV.P-funktiolla, mutta se säilytetään edelleen taaksepäin yhteensopivuuden vuoksi.
Excelin STDEV.P-toiminto
STDEV.P(numero1,[numero2],...).
on nykyaikainen versio STDEVP-funktiosta, joka tarjoaa paremman tarkkuuden. Se on käytettävissä Excel 2010:ssä ja sitä uudemmissa versioissa.
STDEVP- ja STDEV.P-funktiot laskevat näytteen keskihajonnan vastaavien funktioidensa tapaan matriisissa tai viiteargumenteissa vain numeroita. Argumenttiluettelossa ne laskevat myös loogisia arvoja ja numeroiden tekstimuotoisia esityksiä.
Excel STDEVPA-toiminto
STDEVPA(arvo1, [arvo2], ...)
laskee perusjoukon keskihajonnan, mukaan lukien teksti- ja loogiset arvot. Muiden kuin numeeristen arvojen osalta STDEVPA toimii täsmälleen samoin kuin STDEVA-funktio.
Huomautus: Mitä tahansa Excelin standardipoikkeaman kaavaa käytätkin, se palauttaa virheen, jos yksi tai useampi argumentti sisältää toisen funktion palauttaman virhearvon tai tekstiä, jota ei voida tulkita numeroksi.
Mitä Excelin keskihajontafunktiota käyttää?
Erilaiset keskihajontafunktiot Excelissä voivat varmasti aiheuttaa sekaannusta, erityisesti kokemattomille käyttäjille. Jos haluat valita oikean keskihajontakaavan tiettyä tehtävää varten, vastaa vain seuraaviin kolmeen kysymykseen:
- Lasketaanko otoksen vai perusjoukon keskihajonta?
- Mitä Excel-versiota käytät?
- Sisältääkö aineistosi vain numeroita vai myös loogisia arvoja ja tekstiä?
Keskihajonnan laskeminen numeerisen luvun perusteella näyte , käytä STDEV.S-funktiota Excel 2010:ssä ja uudemmissa ohjelmissa; STDEV-funktiota Excel 2007:ssä ja aikaisemmissa ohjelmissa.
A:n keskihajonnan löytämiseksi väestö , käytä STDEV.P-funktiota Excel 2010:ssä ja uudemmissa ohjelmissa; STDEVP-funktiota Excel 2007:ssä ja aikaisemmissa ohjelmissa.
Jos haluat looginen tai teksti laskennassa mukana olevat arvot, käytä joko STDEVA (otoksen keskihajonta) tai STDEVPA (populaation keskihajonta). Vaikka en keksi mitään skenaariota, jossa kumpikaan funktio voisi olla hyödyllinen yksinään, ne voivat olla käteviä suuremmissa kaavoissa, joissa yksi tai useampi argumentti palautetaan muilla funktioilla loogisina arvoina tai numeroiden tekstimuotoisina esityksinä.
Jotta voit päättää, mikä Excelin keskihajontafunktioista sopii parhaiten tarpeisiisi, tutustu seuraavaan taulukkoon, jossa on yhteenveto jo oppimistasi tiedoista.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Excel-versio | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Näyte | ✓ | ✓ | ✓ | |||
Väestö | ✓ | ✓ | ✓ | |||
Loogiset arvot matriiseissa tai viittauksissa | Ei huomioitu | Arvioitu (TRUE=1, FALSE=0) | ||||
Teksti malleissa tai viitteissä | Ei huomioitu | Arvioidaan nollaksi | ||||
Loogiset arvot ja "tekstinumerot" argumenttiluettelossa | Arvioitu (TRUE=1, FALSE=0) | |||||
Tyhjät solut | Ei huomioitu |
Excelin keskihajonnan kaavan esimerkkejä
Kun olet valinnut tietotyyppiäsi vastaavan funktion, kaavan kirjoittamisessa ei pitäisi olla vaikeuksia - syntaksi on niin yksinkertainen ja läpinäkyvä, että se ei jätä tilaa virheille :) Seuraavat esimerkit havainnollistavat paria Excelin standardipoikkeaman kaavaa toiminnassa.
Otoksen ja perusjoukon keskihajonnan laskeminen
Tietojesi luonteesta riippuen voit käyttää jotakin seuraavista kaavoista:
- Keskihajonnan laskeminen koko väestö eli koko arvoluettelo (tässä esimerkissä B2:B50), käytä STDEV.P-funktiota:
=STDEV.P(B2:B50)
- Keskihajonnan löytäminen perustuen näyte joka muodostaa osan tai osajoukon perusjoukosta (tässä esimerkissä B2:B10), käytä STDEV.S-funktiota:
=STDEV.S(B2:B10)
Kuten alla olevasta kuvakaappauksesta näkyy, kaavat antavat hieman erilaisia lukuja (mitä pienempi otos, sitä suurempi ero):
Excel 2007:ssä ja sitä uudemmissa ohjelmissa käytetään sen sijaan STDEVP- ja STDEV-funktioita:
- Populaation keskihajonnan saamiseksi:
=STDEVP(B2:B50)
- Otoksen keskihajonnan laskeminen:
=STDEV(B2:B10)
Keskihajonnan laskeminen lukujen tekstimuotoisille esityksille
Keskustellessamme erilaisista funktioista keskihajonnan laskemiseksi Excelissä olemme joskus maininneet "numeroiden tekstimuotoiset esitykset", ja saatat olla utelias tietämään, mitä se oikeastaan tarkoittaa.
Tässä yhteydessä "numeroiden tekstimuotoiset esitykset" ovat yksinkertaisesti numeroita, jotka on muotoiltu tekstiksi. Miten tällaiset numerot voivat esiintyä laskentataulukoissasi? Useimmiten ne viedään ulkoisista lähteistä. Tai ne palautetaan niin sanotuilla Teksti-funktioilla, jotka on suunniteltu käsittelemään tekstijonoja, esim. TEXT, MID, RIGHT, LEFT jne. Jotkin näistä funktioista voivat työskennellä myös numeroiden kanssa, mutta niiden tulosteena on aina tekstiä, vaikkajos se näyttää paljolti numerolta.
Asiaa havainnollistaa paremmin seuraava esimerkki: Oletetaan, että sinulla on sarake, jossa on tuotekoodeja, kuten "Jeans-105", jossa väliviivan jälkeiset numerot merkitsevät määrää. Tavoitteenasi on poimia kunkin tuotteen määrä ja löytää sitten poimittujen lukujen keskihajonta.
Määrän siirtäminen toiseen sarakkeeseen ei ole ongelma:
=RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))
Ongelmana on, että Excelin keskihajontakaavan käyttäminen poimittuihin lukuihin palauttaa joko #DIV/0! tai 0, kuten alla olevassa kuvakaappauksessa:
Miksi näin oudot tulokset? Kuten edellä mainittiin, RIGHT-funktion tuloste on aina tekstijono. Mutta STDEV.S tai STDEVA eivät pysty käsittelemään tekstiksi muotoiltuja lukuja viitteissä (edellinen jättää ne yksinkertaisesti huomiotta, kun taas jälkimmäinen laskee ne nollina). Saadaksesi standardipoikkeaman tällaisille "tekstiluvuille" sinun on annettava ne suoraan argumenttiluetteloon, mikä voidaan tehdä upottamalla kaikkiRIGHT-funktioita STDEV.S- tai STDEVA-kaavaan:
=STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))))
Kaavat ovat hieman hankalia, mutta se saattaa olla toimiva ratkaisu pienelle otokselle. Suuremmalle otokselle, puhumattakaan koko perusjoukosta, se ei todellakaan ole vaihtoehto. Tässä tapauksessa tyylikkäämpi ratkaisu olisi, että VALUE-funktio muuntaa "tekstinumerot" numeroiksi, joita mikä tahansa keskihajonnan kaava ymmärtää (huomaa oikealle tasatut numerot kuvakaappauksessa).alla, toisin kuin vasemmalle tasatut tekstirivit yllä olevassa kuvakaappauksessa):
Kuinka laskea keskiarvon keskivirhe Excelissä
Tilastotieteessä on vielä yksi mittari, jolla voidaan arvioida aineiston vaihtelua - keskiarvon keskivirhe Keskihajonta ja keskiarvon keskivirhe ovat kaksi toisiinsa läheisesti liittyvää käsitettä, mutta eivät sama asia.
Kun keskihajonta mittaa tietokokonaisuuden vaihtelua keskiarvosta, keskiarvon keskivirhe (SEM) arvioi, kuinka kaukana otoksen keskiarvo todennäköisesti on todellisesta populaation keskiarvosta. Toisella tavalla sanottuna - jos samasta populaatiosta otettaisiin useita näytteitä, keskiarvon keskivirhe osoittaisi näiden otosten keskiarvojen välisen hajonnan. Koska yleensä lasketaan vain yksi keskiarvon keskivirhe, keskiarvon keskivirhe on vain yksi.keskiarvo aineistolle, ei moninkertaisia keskiarvoja, keskiarvon keskivirhe estimoidaan eikä mitata.
Matematiikassa keskiarvon keskivirhe lasketaan tällä kaavalla:
Missä SD on keskihajonta ja n on otoskoko (arvojen lukumäärä otoksessa).
Excel-taulukoissa voit käyttää COUNT-funktiota otoksen arvojen lukumäärän laskemiseen, SQRT-funktiota lukumäärän neliöjuuren muodostamiseen ja STDEV.S-funktiota otoksen keskihajonnan laskemiseen.
Kun kaikki tämä yhdistetään, saat Excelin keskiarvon keskivirheen kaavan:
STDEV.S( alue )/SQRT(COUNT( alue ))Jos oletetaan, että otoksen tiedot ovat B2:B10, SEM-kaavamme on seuraava:
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
Tulos voi olla samankaltainen kuin tämä:
Kuinka lisätä keskihajontapalkit Excelissä
Voit näyttää keskihajonnan marginaalin visuaalisesti lisäämällä Excel-kaavioon keskihajontapalkkeja. Näin menetellään:
- Luo kuvaaja tavalliseen tapaan ( Lisää tab> Kaaviot ryhmä).
- Valitse kuvaaja napsauttamalla mitä tahansa kohtaa kuvaajasta ja napsauta sitten painiketta Kaavion elementit nappi.
- Napsauta nuolta vieressä olevan Virhepalkit ja valitse Keskihajonta .
Tämä lisää samat keskihajontapalkit kaikille datapisteille.
Näin tehdään keskihajonta Excelissä. Toivottavasti löydät tästä tietoa hyödyllistä. Joka tapauksessa, kiitän sinua lukemisesta ja toivon, että tapaamme blogissamme ensi viikolla.