Sisällysluettelo
Ohjeessa selitetään Spearmanin korrelaation perusteet yksinkertaisella kielellä ja näytetään, miten Spearmanin korrelaatiokerroin lasketaan Excelissä.
Kun teet korrelaatioanalyysiä Excelissä, useimmissa tapauksissa käytät Pearsonin korrelaatiota. Koska Pearsonin korrelaatiokerroin mittaa kuitenkin vain kahden muuttujan välistä lineaarista suhdetta, se ei sovellu kaikkiin tietotyyppeihin - muuttujasi voivat olla vahvasti sidoksissa toisiinsa epälineaarisella tavalla, ja silti kerroin voi olla lähellä nollaa. Tällaisissa tilanteissa voit käyttää Spearmaninrank-korrelaatio Pearsonin korrelaation sijasta.
Spearmanin korrelaatio - perusteet
The Spearmanin korrelaatio on Pearsonin korrelaatiokertoimen ei-parametrinen versio, joka mittaa kahden muuttujan välisen yhteyden astetta niiden järjestyksen perusteella.
The Pearsonin tuotehetken korrelaatio testaa lineaarinen kahden jatkuvan muuttujan välinen suhde. Lineaarinen tarkoittaa suhdetta, jossa kaksi muuttujaa muuttuu samaan suuntaan vakionopeudella.
Spearmanin järjestyskorrelaatio arvioi monotoninen Monotonisessa suhteessa muuttujilla on myös taipumus muuttua yhdessä, mutta ei välttämättä vakionopeudella.
Milloin Spearmanin korrelaatio kannattaa tehdä
Spearmanin korrelaatioanalyysia on käytettävä seuraavissa tapauksissa, kun Pearsonin korrelaation perusoletukset eivät täyty:
- Jos tiedoissasi on epälineaarinen suhde tai ne eivät ole normaalisti jakautuneita.
- Jos vähintään yksi muuttuja on järjestysluku Jos arvot voidaan asettaa järjestykseen "ensimmäinen, toinen, kolmas...", kyseessä on ordinaalitieto.
- Jos on olemassa merkittäviä outliers Toisin kuin Pearsonin korrelaatio, Spearmanin korrelaatio ei ole herkkä poikkeaville arvoille, koska se suorittaa laskutoimitukset riveille, joten todellisten arvojen välisellä erolla ei ole merkitystä.
Voit esimerkiksi käyttää Spearmanin korrelaatiota löytääksesi vastaukset seuraaviin kysymyksiin:
- Ovatko korkeammin koulutetut ihmiset enemmän huolissaan ympäristöstä?
- Onko potilaan oireiden määrä yhteydessä hänen halukkuuteensa ottaa lääkkeitä?
Spearmanin korrelaatiokerroin
Tilastoissa Spearmanin korrelaatiokerroin edustaa joko r s tai kreikankielinen kirjain ρ ("rho"), minkä vuoksi sitä kutsutaan usein nimellä Spearmanin rho .
Spearmanin arvojärjestyskorrelaatiokerroin mittaa sekä aineiston arvojärjestysten välisen suhteen voimakkuutta että suuntaa. Se voi olla mikä tahansa arvo välillä -1-1, ja mitä lähempänä kertoimen absoluuttinen arvo on 1, sitä voimakkaampi suhde on:
- 1 on täydellinen positiivinen korrelaatio
- -1 on täydellinen negatiivinen korrelaatio
- 0 ei korrelaatiota
Spearmanin rank-korrelaatiokaava
Riippuen siitä, onko luokittelussa yhtäläisyyksiä (sama sijoitus kahdelle tai useammalle havainnolle), Spearmanin korrelaatiokerroin voidaan laskea jollakin seuraavista kaavoista.
Jos on ei sidottuja rivejä , yksinkertaisempi kaava riittää:
Missä:
- d i on parin sijoitusten välinen ero
- n on havaintojen lukumäärä
Käsittelemään tasatilanteessa , on käytettävä Spearmanin korrelaatiokaavan täydellistä versiota, joka on hieman muunnettu versio Pearsonin r:stä:
Missä:
- R(x) ja R(y) ovat rivejä, jotka ovat x ja y muuttujat
- R(x) ja R(y) ovat keskiarvorivejä.
Spearmanin korrelaation laskeminen Excelissä CORREL-toiminnolla
Valitettavasti Excelissä ei ole sisäänrakennettua funktiota Spearmanin rank-korrelaatiokertoimen laskemiseen. Se ei kuitenkaan tarkoita, että sinun pitäisi raataa aivojasi edellä mainittujen kaavojen kanssa. Manipuloimalla Exceliä hieman voimme keksiä paljon yksinkertaisemman tavan tehdä Spearmanin korrelaatio.
Yritetään esimerkiksi selvittää, onko fyysisellä aktiivisuudellamme yhteyttä verenpaineeseemme. Sarakkeessa B on kymmenen samanikäisen miehen päivittäin kuntosalilla viettämien minuuttien määrä, ja sarakkeessa C on heidän systolinen verenpaineensa.
Voit määrittää Spearmanin korrelaatiokertoimen Excelissä seuraavasti:
- Järjestä tietosi paremmuusjärjestykseen
Koska Spearmanin korrelaatio arvioi kahden muuttujan välisiä yhteyksiä niiden järjestyksen perusteella, sinun on asetettava lähdetiedot järjestykseen. Tämä voidaan tehdä nopeasti Excelin RANK.AVG-toiminnon avulla.
Ensimmäisen muuttujan (fyysinen aktiivisuus) luokittelemiseksi kirjoita alla oleva kaava D2:een ja vedä se sitten D11:een:
=RANK.AVG(B2,$B$2:$B$11,0)
Toisen muuttujan (verenpaine) sijoittamiseksi järjestykseen laita seuraava kaava soluun E2 ja kopioi se sarakkeeseen:
=RANK.AVG(C2,$C$2:$C$11,0)
Jotta kaavat toimisivat oikein, varmista, että lukitset alueet absoluuttisilla soluviittauksilla.
Tässä vaiheessa lähdetietojesi pitäisi näyttää samankaltaisilta:
- Spearmanin korrelaatiokertoimen löytäminen
Kun rivit on määritetty, voimme nyt käyttää Excelin CORREL-toimintoa saadaksemme Spearmanin rho:n:
=CORREL(D2:D11, E2:E11)
Kaava antaa kertoimeksi -0,7576 (pyöristettynä 4-numeroiseksi), mikä osoittaa melko vahvaa negatiivista korrelaatiota ja antaa meille mahdollisuuden päätellä, että mitä enemmän henkilö harrastaa liikuntaa, sitä alhaisempi on hänen verenpaineensa.
Saman otoksen Pearsonin korrelaatiokerroin (-0,7445) osoittaa hieman heikompaa korrelaatiota, mutta on silti tilastollisesti merkitsevä:
Menetelmän kauneus on siinä, että se on nopea, helppo ja toimii riippumatta siitä, onko rankingissa tasapisteitä vai ei.
Spearmanin korrelaatiokertoimen laskeminen Excelissä perinteisellä kaavalla
Jos et ole aivan varma, että CORREL-funktio on laskenut Spearmanin rho:n oikein, voit tarkistaa tuloksen perinteisellä tilastotieteessä käytetyllä kaavalla. Näin:
- Etsitään kunkin riviparin välinen ero ( d ) vähentämällä toinen arvo toisesta:
=D2-E2
Tämä kaava siirtyy F2:een ja kopioidaan sitten sarakkeeseen.
- Nosta jokainen arvoero kahden potenssiin ( d2 ):
=F2^2
Tämä kaava menee sarakkeeseen G.
- Laske yhteen neliöerot:
=SUM(G2:G11)
Tämä kaava voi mennä mihin tahansa tyhjään soluun, meidän tapauksessamme G12:een.
Seuraavasta kuvakaappauksesta saat todennäköisesti paremman käsityksen tietojen järjestelystä:
- Riippuen siitä, onko aineistossasi sidottuja rivejä vai ei, voit laskea Spearmanin korrelaatiokertoimen jollakin näistä kaavoista.
Esimerkissämme ei ole tasapelejä, joten voimme käyttää yksinkertaisempaa kaavaa:
Osoitteessa d2 on 290 ja n (havaintojen lukumäärä) on 10, kaava muuttuu seuraavasti:
Tulokseksi saadaan -0,75757575758, joka vastaa täysin edellisessä esimerkissä laskettua Spearmanin korrelaatiokerrointa.
Microsoft Excelissä edellä mainitut laskelmat voidaan suorittaa seuraavalla yhtälöllä:
=1-(6*G12/(10*(10^2-1)))
Missä G12 on sijoituserojen neliöiden summa (d2).
Spearmanin korrelaation tekeminen Excelissä kuvaajan avulla
Excelin korrelaatiokertoimet mittaavat vain lineaarisia (Pearson) tai monotonisia (Spearman) suhteita. Muutkin yhteydet ovat kuitenkin mahdollisia. Riippumatta siitä, minkä korrelaation teet, muuttujien välinen suhde on aina hyvä esittää kuvaajassa.
Jos haluat piirtää korrelaatiokuvion luokitelluista tiedoista, sinun on toimittava seuraavasti:
- Laske sijoitukset käyttämällä RANK.AVG-funktiota, kuten tässä esimerkissä selitetään.
- Valitse kaksi saraketta riveillä.
- Lisää XY-pistekaavio. Napsauta tätä varten painiketta Scatter kaavio kuvaketta Inset välilehdellä, kohdassa Keskustelut ryhmä.
- Lisää trendiviiva kaavioon. Nopein tapa on napsauttaa painiketta Kaavion elementit painike> Lisää trendiviiva... .
- Näytä R-kvartiilin arvo kaaviossa. Avaa trendiviiva kaksoisnapsauttamalla sitä, vaihda ruudulle Trendiviivavaihtoehdot välilehti ja valitse Näytä R-kvartiilin arvo kartalla laatikko.
- Näytä enemmän numeroita R2-arvossa tarkkuuden parantamiseksi.
Tuloksena saat visuaalisen esityksen sijoitusten välisestä suhteesta. Lisäksi saatte käyttöönne Määrityskerroin (R2), jonka neliöjuuri on Pearsonin korrelaatiokerroin (r). Mutta koska olet piirtänyt sijoitetut tiedot, tämä Pearsonin r ei ole muuta kuin Spearmanin rho.
Huomautus: R-neliö on aina positiivinen luku, joten myös Spearmanin korrelaatiokerroin on aina positiivinen. Jos haluat lisätä sopivan merkin, katso korrelaatiokuvion viivaa - ylöspäin suuntautuva kaltevuus osoittaa positiivista korrelaatiota (plusmerkki) ja alaspäin suuntautuva kaltevuus osoittaa negatiivista korrelaatiota (miinusmerkki).
Tapauksessamme R2 on 0,5739210285. Käytä SQRT-funktiota neliöjuuren etsimiseen:
=SQRT(0.5739210285)
...ja saat jo tutun kertoimen 0,75757575758.
Kuvaajan alamäki osoittaa negatiivista korrelaatiota, joten lisäämme miinusmerkin ja saamme oikean Spearmanin korrelaatiokertoimen -0,75757575758.
Näin voit laskea Spearmanin rank-korrelaatiokertoimen Excelissä. Jos haluat tutustua tarkemmin tässä oppaassa käsiteltyihin esimerkkeihin, voit ladata alla olevan esimerkkityökirjan. Kiitän lukemisesta ja toivon, että tapaamme blogissamme ensi viikolla!
Harjoitustyökirja
Spearman Rank Correlation Excelissä (.xlsx-tiedosto)