Spearmanova korelacija ranga u Excelu: formula i grafikon

  • Podijeli Ovo
Michael Brown

Udžbenik objašnjava osnove Spearmanove korelacije na jednostavnom jeziku i pokazuje kako izračunati Spearmanov koeficijent korelacije ranga u Excelu.

Kada radite analizu korelacije u Excelu, u većini slučajeva bavit ćete se Pearsonovom korelacijom. No budući da Pearsonov koeficijent korelacije mjeri samo linearni odnos između dviju varijabli, ne radi za sve vrste podataka - vaše varijable mogu biti snažno povezane na nelinearan način, a koeficijent i dalje biti blizak nuli. U takvim okolnostima možete napraviti Spearmanovu korelaciju ranga umjesto Pearsonove.

    Spearmanova korelacija - osnove

    Spearmanova korelacija je neparametarska verzija Pearsonovog koeficijenta korelacije koji mjeri stupanj povezanosti između dviju varijabli na temelju njihovih rangova.

    Korelacija Pearsonovog momenta proizvoda testira linearni odnos između dva kontinuirana varijable. Linearno znači odnos kada se dvije varijable mijenjaju u istom smjeru konstantnom brzinom.

    Spearmanova rang korelacija procjenjuje monotoni odnos između rangiranih vrijednosti. U monotonom odnosu, varijable također imaju tendenciju da se mijenjaju zajedno, ali ne nužno konstantnom brzinom.

    Kada raditi Spearmanovu korelaciju

    Spearmanovu korelacijsku analizu treba koristiti u bilo kojem od slijedećiokolnosti kada temeljne pretpostavke Pearsonove korelacije nisu ispunjene:

    1. Ako vaši podaci pokazuju nelinearan odnos ili nisu normalno distribuirani.
    2. Ako barem jedna varijabla je ordinalna . Ako se vaše vrijednosti mogu smjestiti u "prvi, drugi, treći..." redoslijed, imate posla s rednim podacima.
    3. Ako postoje značajni outliers . Za razliku od Pearsonove korelacije, Spearmanova korelacija nije osjetljiva na izvanredne vrijednosti jer izvodi izračune na rangovima, tako da razlika između stvarnih vrijednosti nema značenje.

    Na primjer, možete koristiti Spearmanovu korelaciju pronaći odgovore na sljedeća pitanja:

    • Jesu li ljudi s višim stupnjem obrazovanja zabrinutiji za okoliš?
    • Je li broj simptoma koje pacijent ima povezan s njihovom voljom uzimati lijekove?

    Spearmanov koeficijent korelacije

    U statistici, Spearmanov koeficijent korelacije predstavlja r s ili grčko slovo ρ ("rho"), zbog čega se često naziva Spearmanov rho .

    Spearmanov koeficijent korelacije ranga mjeri i jačina i smjer odnosa između redova podataka. Može biti bilo koja vrijednost od -1 do 1, a što je apsolutna vrijednost koeficijenta bliža 1, to je veza jača:

    • 1 je savršeno pozitivnokorelacija
    • -1 je savršena negativna korelacija
    • 0 nema korelacije

    Spearmanova formula korelacije ranga

    Ovisno o tome postoje li ili postoje nema izjednačenosti u poretku (isti rang dodijeljen dvama ili više promatranja), Spearmanov koeficijent korelacije može se izračunati pomoću jedne od sljedećih formula.

    Ako nema nema izjednačenih poretka , poslužit će jednostavnija formula:

    Gdje je:

    • d i razlika između para rangova
    • n je broj opažanja

    Za rješavanje povezanih rangova , puna verzija Spearmanove korelacije mora se koristiti formula koja je malo modificirana verzija Pearsonovog r:

    Gdje je:

    • R(x) i R(y ) su rangovi varijabli x i y
    • R(x) i R(y) su srednji rangovi

    Kako izračunati Spearmanovu korelaciju u Excelu s funkcijom CORREL

    Nažalost, Excel nema ugrađenu funkciju za izračun Spea rmanov koeficijent korelacije ranga. Međutim, to ne znači da ćete morati razbijati glavu s gornjim formulama. Malo manipulirajući Excelom, možemo smisliti mnogo jednostavniji način za Spearmanovu korelaciju.

    Kao primjer, pokušajmo otkriti ima li naša fizička aktivnost ikakve veze s našim krvnim tlakom. U koloni B imamo broj minuta koje provede 10 muškaraca iste dobidnevno u teretani, a u stupcu C imamo njihov sistolički krvni tlak.

    Da biste pronašli Spearmanov koeficijent korelacije u Excelu, izvršite ove korake:

    1. Rangirajte svoje podatke

      Budući da Spearmanova korelacija procjenjuje povezanost između dviju varijabli na temelju njihovih rangova, morate rangirati svoje izvorne podatke. To se može brzo učiniti pomoću funkcije Excel RANK.AVG.

      Za rangiranje prve varijable (fizička aktivnost), unesite donju formulu u D2 i zatim je povucite dolje do D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Za rangiranje druge varijable (krvni tlak), stavite sljedeću formulu u ćeliju E2 i kopirajte je niz stupac:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Da bi formule ispravno radile , obavezno zaključajte raspone s apsolutnim referencama ćelija.

      U ovom trenutku bi vaši izvorni podaci trebali izgledati slično ovome:

    2. Pronađi Spearmanov koeficijent korelacije

      S utvrđenim rangovima, sada možemo koristiti Excel CORREL funkciju da dobijemo Spearmanov rho:

      =CORREL(D2:D11, E2:E11)

      Formula vraća koeficijent od -0,7576 (zaokruženo na 4 znamenke), što pokazuje prilično jaku negativnu korelaciju i omogućuje nam zaključak da što više osoba vježba, to je niži njen krvni tlak.

      Pearsonov koeficijent korelacije za isti uzorak (- 0,7445) označava malo slabiju korelaciju, ali još uvijek statistiku lly značajno:

    Ljepota ovogaMetoda je da je brza, laka i funkcionira bez obzira na to postoje li izjednačenja na ljestvici ili ne.

    Izračunajte Spearmanov koeficijent korelacije u Excelu s tradicionalnom formulom

    Ako niste posve sigurni da je funkcija CORREL točno izračunala Spearmanov rho, rezultat možete provjeriti tradicionalnom formulom koja se koristi u statistici. Evo kako:

    1. Pronađite razliku između svakog para rangova ( d ) oduzimanjem jednog ranga od drugog:

      =D2-E2

      Ova formula ide na F2 i zatim se kopira niz stupac.

    2. Podignite svaku razliku ranga na potenciju dva ( d2 ):

      =F2^2

      Ova formula ide u stupac G.

    3. Zbrojite razlike na kvadrat:

      =SUM(G2:G11)

      Ova formula može ići u bilo koju praznu ćeliju, G12 u našem slučaju.

      Na sljedećoj snimci zaslona vjerojatno ćete bolje dobiti razumijevanje rasporeda podataka:

    4. Ovisno o tome ima li vaš skup podataka vezane rangove ili ne, upotrijebite jednu od ovih formula za izračun Spearmanova korelacijskog koeficijenta.

    U našem primjeru nema veza, pa možemo ići s jednostavnijom formulom:

    S d2 jednako do 290 i n (broj opažanja) jednak 10, formula prolazi kroz sljedeće transformacije:

    Kao rezultat, dobivate -0,757575758 , što se savršeno slaže sa Spearmanovim koeficijentom korelacije izračunatim uprethodni primjer.

    U Microsoft Excelu, gore navedeni izračuni mogu se izvesti sa sljedećom jednadžbom:

    =1-(6*G12/(10*(10^2-1)))

    Gdje je G12 zbroj kvadrata rang razlika (d2) .

    Kako napraviti Spearmanovu korelaciju u Excelu pomoću grafikona

    Korelacijski koeficijenti u Excelu mjere samo linearne (Pearson) ili monotone (Spearman) odnose. Međutim, moguće su i druge asocijacije. Dakle, bez obzira koju korelaciju radite, uvijek je dobra ideja prikazati odnos između varijabli u grafikonu.

    Da biste nacrtali korelacijski grafikon za rangirane podatke, evo što trebate učiniti:

    1. Izračunajte rangove pomoću funkcije RANK.AVG kao što je objašnjeno u ovom primjeru.
    2. Odaberite dva stupca s rangovima.
    3. Umetnite XY raspršeni grafikon. U tu svrhu kliknite ikonu Scatter chart na kartici Inset , u grupi Chats .
    4. Dodajte liniju trenda na vaš grafikon. Najbrži način je kliknuti gumb Elementi grafikona > Dodaj liniju trenda… .
    5. Prikaži vrijednost R-kvadrata na grafikonu. Dvaput kliknite liniju trenda da biste otvorili njeno okno, prebacite se na karticu Opcije linije trenda i odaberite okvir Prikaži R-kvadrat vrijednosti na grafikonu .
    6. Prikaži više znamenki u vrijednosti R2 za bolju točnost.

    Kao rezultat, dobit ćete vizualni prikaz odnosa između rangova. Osim toga, dobit ćete Koeficijent determinacije (R2), čiji je kvadratni korijen Pearsonov korelacijski koeficijent (r). Ali budući da ste nacrtali rangirane podatke, ovaj Pearsonov r nije ništa drugo nego Spearmanov rho.

    Napomena. R-kvadrat je uvijek pozitivan broj, stoga će izvedeni Spearmanov koeficijent korelacije također uvijek biti pozitivan. Da biste dodali odgovarajući predznak, samo pogledajte liniju na svom korelacijskom grafikonu - nagib prema gore označava pozitivnu korelaciju (predznak plus), a nagib prema dolje označava negativnu korelaciju (predznak minus).

    U našem slučaju, R2 je jednak 0,5739210285. Upotrijebite funkciju SQRT da biste pronašli kvadratni korijen:

    =SQRT(0.5739210285)

    …i dobit ćete već poznati koeficijent od 0,757575758.

    Nagib prema dolje na grafikonu pokazuje negativan korelacije, pa dodajemo znak minus i dobivamo točan Spearmanov koeficijent korelacije od -0,757575758.

    Tako možete izračunati Spearmanov koeficijent korelacije ranga u Excelu. Da biste pobliže pogledali primjere o kojima se govori u ovom vodiču, slobodno možete preuzeti naš primjer radne knjige u nastavku. Zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeći tjedan!

    Radna bilježnica

    Spearman Rank Correlation u Excelu (.xlsx datoteka)

    Michael Brown predani je tehnološki entuzijast sa strašću za pojednostavljivanjem složenih procesa pomoću softverskih alata. S više od desetljeća iskustva u tehnološkoj industriji, usavršio je svoje vještine u Microsoft Excelu i Outlooku, kao i Google tablicama i dokumentima. Michaelov blog posvećen je dijeljenju znanja i stručnosti s drugima, pružajući savjete i upute koje je lako slijediti za poboljšanje produktivnosti i učinkovitosti. Bez obzira jeste li iskusni profesionalac ili početnik, Michaelov blog nudi vrijedne uvide i praktične savjete za izvlačenje maksimuma iz ovih osnovnih softverskih alata.