Spearmanova rang korelacija v Excelu: formula in graf

  • Deliti To
Michael Brown

V učbeniku so v preprostem jeziku razložene osnove Spearmanove korelacije in prikazano, kako v Excelu izračunati Spearmanov koeficient korelacije ranga.

Pri izvajanju korelacijske analize v programu Excel se v večini primerov ukvarjate s Pearsonovo korelacijo. Ker pa Pearsonov korelacijski koeficient meri le linearno povezavo med dvema spremenljivkama, ne deluje za vse vrste podatkov - vaše spremenljivke so lahko močno povezane na nelinearen način, a je koeficient še vedno blizu nič. V takih okoliščinah lahko uporabite Spearmanovo korelacijo.rang korelacije namesto Pearsonove.

    Spearmanova korelacija - osnove

    Spletna stran Spearmanova korelacija je neparametrična različica Pearsonovega korelacijskega koeficienta, ki meri stopnjo povezanosti med dvema spremenljivkama na podlagi njunih rangov.

    Spletna stran Pearsonova korelacija produktnega momenta preizkusi linearni razmerje med dvema zveznima spremenljivkama. linearno pomeni razmerje, ko se dve spremenljivki spreminjata v isto smer s konstantno hitrostjo.

    Spearmanova korelacija ranga ovrednoti monotonično Pri monotonem razmerju se spremenljivki prav tako spreminjata skupaj, vendar ne nujno s konstantno hitrostjo.

    Kdaj uporabiti Spearmanovo korelacijo

    Spearmanovo korelacijsko analizo je treba uporabiti v naslednjih primerih, ko temeljne predpostavke Pearsonove korelacije niso izpolnjene:

    1. Če imajo vaši podatki nelinearno ali niso normalno porazdeljene.
    2. Če je vsaj ena spremenljivka ordinalni Če lahko vaše vrednosti razvrstite po vrstnem redu "prvi, drugi, tretji...", imate opravka z ordinalnimi podatki.
    3. Če so prisotni pomembni odkloni Za razliko od Pearsonove korelacije Spearmanova korelacija ni občutljiva na izstopajoče vrednosti, saj izvaja izračune na rangih, zato razlika med dejanskimi vrednostmi nima pomena.

    S Spearmanovo korelacijo lahko na primer poiščete odgovore na naslednja vprašanja:

    • Ali ljudje z višjo stopnjo izobrazbe bolj skrbijo za okolje?
    • Ali je število simptomov, ki jih ima bolnik, povezano z njegovo pripravljenostjo za jemanje zdravil?

    Spearmanov korelacijski koeficient

    V statistiki je Spearmanov korelacijski koeficient predstavlja bodisi r s ali grška črka ρ ("rho"), zato se pogosto imenuje Spearmanov rho .

    Spearmanov koeficient korelacije rangov meri moč in smer povezave med rangi podatkov. Lahko ima poljubno vrednost od -1 do 1, in čim bližje je absolutna vrednost koeficienta 1, tem močnejša je povezava:

    • 1 je popolna pozitivna korelacija
    • -1 je popolna negativna korelacija
    • 0 pomeni, da ni korelacije

    Spearmanova korelacijska formula

    Odvisno od tega, ali so v razvrstitvi (dve ali več opazovanj imata enak rang) ali ne, lahko Spearmanov korelacijski koeficient izračunamo z eno od naslednjih formul.

    Če obstajajo brez vezanih rangov , je dovolj preprostejša formula:

    Kje:

    • d i je razlika med parom rangov
    • n je število opazovanj

    Obravnavati vezane uvrstitve , je treba uporabiti polno različico Spearmanove korelacijske formule, ki je nekoliko spremenjena različica Pearsonovega r:

    Kje:

    • R(x) in R(y) sta ranga x in . y spremenljivke
    • R(x) in R(y) sta srednji vrednosti

    Kako izračunati Spearmanovo korelacijo v Excelu s funkcijo CORREL

    Žal Excel nima vgrajene funkcije za izračun korelacijskega koeficienta Spearmanovega ranga. Vendar to ne pomeni, da si boste morali razbijati glavo z zgornjimi formulami. Z nekaj manipulacije z Excelom lahko najdemo veliko preprostejši način za izračun Spearmanove korelacije.

    Kot primer poskušajmo ugotoviti, ali je naša telesna dejavnost kakor koli povezana z našim krvnim tlakom. V stolpcu B imamo število minut, ki jih 10 moških iste starosti dnevno preživi v telovadnici, v stolpcu C pa imamo njihov sistolični krvni tlak.

    Za iskanje Spearmanovega korelacijskega koeficienta v programu Excel naredite naslednje korake:

    1. Razvrstite svoje podatke

      Ker Spearmanova korelacija ocenjuje povezave med dvema spremenljivkama na podlagi njunih rangov, morate svoje izvorne podatke razvrstiti. To lahko hitro storite z uporabo Excelove funkcije RANK.AVG.

      Če želite razvrstiti prvo spremenljivko (telesna dejavnost), vnesite spodnjo formulo v D2 in jo povlecite navzdol v D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Če želite razvrstiti drugo spremenljivko (krvni tlak), v celico E2 vnesite naslednjo formulo in jo kopirajte navzdol po stolpcu:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Da bodo formule delovale pravilno, poskrbite, da bodo območja zaklenjena z absolutnimi referencami na celice.

      Na tej točki morajo biti vaši izvorni podatki videti podobno:

    2. Poiščite Spearmanov korelacijski koeficient

      Ko smo določili range, lahko z Excelovo funkcijo CORREL dobimo Spearmanov rho:

      =CORREL(D2:D11, E2:E11)

      Enačba je dobila koeficient -0,7576 (zaokroženo na štiri števke), kar kaže na precej močno negativno korelacijo in omogoča sklepanje, da bolj ko oseba telovadi, nižji je njen krvni tlak.

      Pearsonov korelacijski koeficient za isti vzorec (-0,7445) kaže na nekoliko šibkejšo korelacijo, vendar še vedno statistično pomembno:

    Lepota te metode je v tem, da je hitra, enostavna in deluje ne glede na to, ali so na lestvici povezave ali ne.

    Izračunajte Spearmanov korelacijski koeficient v Excelu s tradicionalno formulo

    Če niste povsem prepričani, da je funkcija CORREL pravilno izračunala Spearmanov rho, lahko rezultat preverite s tradicionalno formulo, ki se uporablja v statistiki:

    1. Poišči razliko med vsakim parom vrst ( d ) z odštevanjem enega ranga od drugega:

      =D2-E2

      Ta formula se prenese v F2 in se nato kopira navzdol po stolpcu.

    2. Vsako razliko v rangu povišajte do števila dve ( d2 ):

      =F2^2

      Ta formula je v stolpcu G.

    3. Seštejte kvadratne razlike:

      =SUM(G2:G11)

      To formulo lahko prenesete v katero koli prazno celico, v našem primeru G12.

      Na naslednji zaslonski sliki boste verjetno bolje razumeli razporeditev podatkov:

    4. Odvisno od tega, ali ima vaš niz podatkov vezane rangove ali ne, uporabite eno od teh formul za izračun Spearmanovega korelacijskega koeficienta.

    V našem primeru ni vez, zato lahko uporabimo preprostejšo formulo:

    S spletno stranjo d2 enak 290 in n (število opazovanj), ki je enako 10, se enačba spremeni na naslednji način:

    Rezultat je -0,757575758, ki se popolnoma ujema s Spearmanovim korelacijskim koeficientom, izračunanim v prejšnjem primeru.

    V programu Microsoft Excel lahko zgornje izračune izvedete z naslednjo enačbo:

    =1-(6*G12/(10*(10^2-1)))

    Pri čemer je G12 vsota kvadratnih razlik v rangu (d2).

    Kako narediti Spearmanovo korelacijo v Excelu z uporabo grafa

    Korelacijski koeficienti v programu Excel merijo samo linearne (Pearson) ali monotone (Spearman) povezave. Vendar so možne tudi druge povezave. Zato je ne glede na to, katero korelacijo izvajate, vedno dobro, da povezavo med spremenljivkami predstavite v grafu.

    Če želite narisati korelacijski graf za razvrščene podatke, morate storiti naslednje:

    1. Izračunajte razvrstitve s funkcijo RANK.AVG, kot je razloženo v tem primeru.
    2. Izberite dva stolpca z rangom.
    3. Vstavite razpršeni graf XY. V ta namen kliknite Razpršitev grafikon ikona na zaslonu Vstavljena stran v zavihku Pogovori skupina.
    4. V graf dodajte trendno črto. Najhitreje lahko kliknete Elementi grafikona gumb> Dodajte Trendline... .
    5. Prikažite vrednost R-kvadrat na grafu. Dvakrat kliknite trendno črto, da odprete njeno podokno, preklopite na Možnosti trendne črte in izberite zavihek Prikaži vrednost R-kvadrata na grafikonu škatla.
    6. Za večjo natančnost prikažite več številk v vrednosti R2.

    Tako boste dobili vizualni prikaz razmerja med vrstami. Poleg tega boste dobili Koeficient določitve (R2), katerega kvadratni koren je Pearsonov korelacijski koeficient (r). Ker pa ste narisali rangirane podatke, ta Pearsonov r ni nič drugega kot Spearmanov rho.

    Opomba: R-kvadrat je vedno pozitivno število, zato bo tudi izpeljani Spearmanov koeficient korelacije vedno pozitiven. Za dodajanje ustreznega znaka poglejte črto v korelacijskem grafu - naklon navzgor pomeni pozitivno korelacijo (znak plus), naklon navzdol pa negativno korelacijo (znak minus).

    V našem primeru je R2 enak 0,5739210285. Za iskanje kvadratnega korena uporabite funkcijo SQRT:

    =SQRT(0,5739210285)

    ...in dobili boste že znani koeficient 0,757575758.

    Padajoči naklon v grafu kaže negativno korelacijo, zato dodamo znak minus in dobimo pravilen Spearmanov korelacijski koeficient -0,757575758.

    Tako lahko v Excelu izračunate Spearmanov koeficient korelacije. Če si želite podrobneje ogledati primere, obravnavane v tem učbeniku, si lahko spodaj prenesete naš vzorčni delovni zvezek. Zahvaljujem se vam za branje in upam, da se naslednji teden vidimo na našem blogu!

    Delovni zvezek za prakso

    Spearmanova vrstna korelacija v Excelu (.xlsx datoteka)

    Michael Brown je predan tehnološki navdušenec s strastjo do poenostavljanja kompleksnih procesov z uporabo programskih orodij. Z več kot desetletnimi izkušnjami v tehnološki industriji je svoje veščine izpopolnil v Microsoft Excelu in Outlooku ter Google Preglednicah in Dokumentih. Michaelov blog je namenjen deljenju svojega znanja in strokovnega znanja z drugimi ter ponuja preproste nasvete in vadnice za izboljšanje produktivnosti in učinkovitosti. Ne glede na to, ali ste izkušen strokovnjak ali začetnik, Michaelov blog ponuja dragocene vpoglede in praktične nasvete, kako kar najbolje izkoristiti ta osnovna programska orodja.