Spearmani pingerea korrelatsioon Excelis: valem ja graafik

  • Jaga Seda
Michael Brown

Õpik selgitab Spearmani korrelatsiooni põhitõdesid lihtsas keeles ja näitab, kuidas arvutada Spearmani korrelatsioonikoefitsienti Excelis.

Kui teete Excelis korrelatsioonianalüüsi, siis enamasti tegelete Pearsoni korrelatsiooniga. Kuid kuna Pearsoni korrelatsioonikoefitsient mõõdab ainult kahe muutuja vahelist lineaarset seost, ei tööta see kõikide andmetüüpide puhul - teie muutujad võivad olla tugevalt seotud mittelineaarselt ja koefitsient on siiski nullilähedane. Sellistel juhtudel võite teha SpearmaniPearsoni korrelatsiooni asemel.

    Spearmani korrelatsioon - põhitõed

    The Spearmani korrelatsioon on Pearsoni korrelatsioonikoefitsiendi mitteparameetriline versioon, mis mõõdab kahe muutuja vahelise seose astet nende järjestuse alusel.

    The Pearsoni tootemomendi korrelatsioon katsetab lineaarne seos kahe pideva muutuja vahel. Lineaarne tähendab seost, kui kaks muutujat muutuvad ühes suunas konstantse kiirusega.

    Spearmani pingerea korrelatsioon hindab monotooniline seos järjestatud väärtuste vahel. Monotoonilise seose puhul kipuvad muutujad samuti koos muutuma, kuid mitte tingimata konstantse kiirusega.

    Millal teha Spearmani korrelatsiooni

    Spearmani korrelatsioonianalüüsi tuleb kasutada mis tahes järgmistel juhtudel, kui Pearsoni korrelatsiooni eeldused ei ole täidetud:

    1. Kui teie andmed näitavad mittelineaarsed suhe või ei ole normaalselt jaotunud.
    2. Kui vähemalt üks muutuja on ordinaal Kui teie väärtusi saab paigutada järjekorras "esimene, teine, kolmas...", siis on tegemist ordinaalsete andmetega.
    3. Kui on märkimisväärseid väljapoole jääjad Erinevalt Pearsoni korrelatsioonist ei ole Spearmani korrelatsioon tundlik kõrvalekallete suhtes, sest see teeb arvutusi ridadega, nii et tegelike väärtuste erinevus ei oma tähendust.

    Näiteks võite kasutada Spearmani korrelatsiooni, et leida vastused järgmistele küsimustele:

    • Kas kõrgema haridustasemega inimesed tunnevad rohkem muret keskkonna pärast?
    • Kas patsiendi sümptomite arv on seotud tema valmisolekuga võtta ravimeid?

    Spearmani korrelatsioonikoefitsient

    Statistikas on Spearmani korrelatsioonikoefitsient on esindatud kas r s või kreekakeelne täht ρ ("rho"), mistõttu seda nimetatakse sageli ka Spearmani rho .

    Spearmani pingekorrelatsioonikoefitsient mõõdab nii andmete ridade vahelise seose tugevust kui ka suunda. See võib olla mis tahes väärtus vahemikus -1 kuni 1 ja mida lähemal on koefitsiendi absoluutväärtus 1-le, seda tugevam on seos:

    • 1 on täiuslik positiivne korrelatsioon
    • -1 on täiuslik negatiivne korrelatsioon
    • 0 ei ole korrelatsioon

    Spearmani korrelatsioonivalem

    Sõltuvalt sellest, kas pingereas on või ei ole sidemeid (kahele või mitmele vaatlusele on määratud sama koht), võib Spearmani korrelatsioonikoefitsiendi arvutada ühega järgmistest valemitest.

    Kui on olemas ei ole seotud ridadesse , piisab ka lihtsamast valemist:

    Kus:

    • d i on erinevus kahe järjestuse vahel
    • n on vaatluste arv

    Tegelemiseks võrdsed kohad tuleb kasutada Spearmani korrelatsioonivalemi täisversiooni, mis on Pearsoni r-i veidi modifitseeritud versioon:

    Kus:

    • R(x) ja R(y) on ridadesse kuuluvad x ja y muutujad
    • R(x) ja R(y) on keskmised reastused.

    Kuidas arvutada Spearmani korrelatsiooni Excelis funktsiooniga CORREL

    Kahjuks ei ole Excelis sisseehitatud funktsiooni Spearmani pingkorrelatsioonikoefitsiendi arvutamiseks. See ei tähenda siiski, et peate ülaltoodud valemitega oma aju rabama. Exceli pisut manipuleerides saame tulla välja palju lihtsama viisiga Spearmani korrelatsiooni tegemiseks.

    Proovime näiteks välja selgitada, kas meie kehaline aktiivsus on kuidagi seotud meie vererõhuga. Veerus B on toodud minutite arv, mille 10 samaealist meest veedavad iga päev jõusaalis, ja veerus C nende süstoolne vererõhk.

    Spearmani korrelatsioonikoefitsiendi leidmiseks Excelis tehke järgmised toimingud:

    1. Seadke oma andmed paremusjärjestusse

      Kuna Spearmani korrelatsioon hindab kahe muutuja vahelisi seoseid nende järjestuse alusel, peate oma lähteandmed järjestama. Seda saab kiiresti teha Exceli funktsiooni RANK.AVG abil.

      Esimese muutuja (kehaline aktiivsus) järjestamiseks sisestage allpool esitatud valem D2-sse ja lohistage see seejärel D11-sse:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Teise muutuja (vererõhk) järjestamiseks sisestage järgmine valem lahtrisse E2 ja kopeerige see veergu:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Et valemid töötaksid õigesti, lukustage vahemikud kindlasti absoluutsete lahtriviidetega.

      Sel hetkel peaksid teie lähteandmed nägema välja umbes nii:

    2. Leia Spearmani korrelatsioonikoefitsient

      Kui ridadeks on määratud, saame nüüd kasutada Exceli funktsiooni CORREL, et saada Spearmani rho:

      =CORREL(D2:D11, E2:E11)

      Valem annab koefitsiendi -0,7576 (ümardatud 4-kohaliseks), mis näitab üsna tugevat negatiivset korrelatsiooni ja võimaldab järeldada, et mida rohkem inimene treenib, seda madalam on tema vererõhk.

      Sama valimi Pearsoni korrelatsioonikoefitsient (-0,7445) näitab veidi nõrgemat korrelatsiooni, kuid on siiski statistiliselt oluline:

    Selle meetodi ilu seisneb selles, et see on kiire, lihtne ja toimib sõltumata sellest, kas pingereas on sidemeid või mitte.

    Spearmani korrelatsioonikoefitsiendi arvutamine Excelis traditsioonilise valemiga

    Kui te ei ole päris kindel, et funktsioon CORREL on Spearmani rho õigesti arvutanud, saate tulemust kontrollida traditsioonilise statistikas kasutatava valemiga. Siin on toodud, kuidas:

    1. Leidke iga rea paari vahe ( d ), lahutades ühe auastme teisest:

      =D2-E2

      See valem läheb F2-sse ja kopeeritakse seejärel veergu.

    2. Tõsta iga astmete erinevus kahe võimsuseni ( d2 ):

      =F2^2

      See valem läheb veergu G.

    3. Lisage ruutude erinevused kokku:

      =SUM(G2:G11)

      See valem võib minna mis tahes tühja lahtrisse, meie puhul G12.

      Järgnevast ekraanipildist saate tõenäoliselt paremini aru andmete paigutusest:

    4. Sõltuvalt sellest, kas teie andmekogumil on seotud ridu või mitte, kasutage Spearmani korrelatsioonikoefitsiendi arvutamiseks ühte neist valemitest.

    Meie näites puuduvad sidemed, seega võime kasutada lihtsamat valemit:

    Koos d2 võrdne 290 ja n (vaatluste arv) võrdub 10, siis toimub valemiga järgmine ümberkujundamine:

    Tulemuseks saadakse -0,75757575758, mis on täiesti kooskõlas eelmises näites arvutatud Spearmani korrelatsioonikoefitsiendiga.

    Microsoft Excelis saab ülaltoodud arvutusi teha järgmise võrrandi abil:

    =1-(6*G12/(10*(10^2-1)))

    Kus G12 on ruuduarvude erinevuste summa (d2).

    Kuidas teha Spearmani korrelatsiooni Excelis graafiku abil

    Exceli korrelatsioonikoefitsiendid mõõdavad ainult lineaarseid (Pearson) või monotoonseid (Spearman) seoseid. Siiski on võimalikud ka muud seosed. Seega, olenemata sellest, millist korrelatsiooni teete, on alati hea mõte esitada muutujate vaheline seos graafikus.

    Selleks, et joonistada järjestatud andmete korrelatsioonigraafik, tuleb teha järgmist:

    1. Arvutage reastmed, kasutades funktsiooni RANK.AVG, nagu on selgitatud selles näites.
    2. Valige kaks veergu koos ridadega.
    3. Sisestage XY hajuvusdiagramm. Selleks klõpsake nuppu Scatter kaart ikooni kohta Sisemine vahekaardil Vestlused rühm.
    4. Lisage graafikule trendijoon. Kõige kiirem viis on klõpsata klahvi Diagrammi elemendid nupp> Lisa Trendline... .
    5. Kuvage diagrammil R-kvoodi väärtus. Topeltklõpsake trendijoonel, et avada selle paan, lülitage see ümber Trendijoone valikud vahekaart ja valige Kuva R-ruutväärtus diagrammil kast.
    6. Näita R2 väärtuses rohkem numbreid parema täpsuse saavutamiseks.

    Tulemusena saate visuaalse esituse ridade vahelisest suhtest. Lisaks saate te ka Määratluskoefitsient (R2), mille ruutjuureks on Pearsoni korrelatsioonikoefitsient (r). Kuid kuna te olete joonistanud järjestatud andmed, siis see Pearsoni r ei ole midagi muud kui Spearmani rho.

    Märkus. R-ruut on alati positiivne arv, seega on ka tuletatud Spearmani korrelatsioonikoefitsient alati positiivne. Sobiva märgi lisamiseks vaadake lihtsalt joont oma korrelatsioonigraafikul - ülespoole kalle näitab positiivset korrelatsiooni (plussmärk) ja allapoole kalle näitab negatiivset korrelatsiooni (miinusmärk).

    Meie puhul on R2 võrdne 0,5739210285. Ruutjuure leidmiseks kasutage funktsiooni SQRT:

    =SQRT(0.5739210285)

    ...ja saad juba tuttava koefitsiendi 0,75757575758.

    Graafiku allapoole suunatud kalle näitab negatiivset korrelatsiooni, seega lisame miinusmärgi ja saame õigeks Spearmani korrelatsioonikoefitsiendiks -0,75757575758.

    Nii saab Excelis arvutada Spearmani korrelatsioonikoefitsienti. Et lähemalt tutvuda selles õpetuses käsitletud näidetega, olete oodatud alljärgnevalt alla laadima meie näidistööraamatu. Tänan teid lugemise eest ja loodan, et näeme teid järgmisel nädalal meie blogis!

    Praktiline töövihik

    Spearmani pingerea korrelatsioon Excelis (.xlsx fail)

    Michael Brown on pühendunud tehnoloogia entusiast, kelle kirg on tarkvaratööriistade abil keerukate protsesside lihtsustamine. Rohkem kui kümneaastase kogemusega tehnoloogiatööstuses on ta lihvinud oma oskusi Microsoft Excelis ja Outlookis, samuti Google Sheetsis ja Docsis. Michaeli ajaveebi eesmärk on jagada oma teadmisi ja teadmisi teistega, pakkudes hõlpsasti järgitavaid näpunäiteid ja õpetusi tootlikkuse ja tõhususe parandamiseks. Olenemata sellest, kas olete kogenud professionaal või algaja, pakub Michaeli ajaveebi väärtuslikke teadmisi ja praktilisi nõuandeid nende oluliste tarkvaratööriistade maksimaalseks kasutamiseks.