Sadržaj
Vodič objašnjava osnove Spearmanove korelacije na jednostavnom jeziku i pokazuje kako izračunati koeficijent korelacije Spearmanovog ranga u Excel-u.
Kada radite analizu korelacije u Excelu, u većini slučajeva bavit ćete se Pirsonovom korelacijom. Ali pošto Pearsonov koeficijent korelacije mjeri samo linearni odnos između dvije varijable, on ne radi za sve tipove podataka – vaše varijable mogu biti snažno povezane na nelinearan način i još uvijek imaju koeficijent blizu nule. U takvim okolnostima, možete napraviti Spearmanovu rang korelaciju umjesto Pearsonove.
Spearmanova korelacija - osnove
Spearmanova korelacija je neparametarska verzija Pearsonovog koeficijenta korelacije koji mjeri stupanj povezanosti između dvije varijable na osnovu njihovih rangova.
Pearsonova korelacija momenta proizvoda testira linearnu vezu između dvije kontinuirane varijable. Linearni znači odnos kada se dvije varijable mijenjaju u istom smjeru konstantnom brzinom.
Spearmanova korelacija ranga procjenjuje monotonični odnos između rangiranih vrijednosti. U monotonom odnosu, varijable također imaju tendenciju da se mijenjaju zajedno, ali ne nužno konstantnom brzinom.
Kada raditi Spearmanova korelacija
Spearmanova korelacija se koristi u bilo kojoj od pratećiokolnosti kada temeljne pretpostavke Pearsonove korelacije nisu ispunjene:
- Ako vaši podaci pokazuju nelinearnu vezu ili nisu normalno raspoređeni.
- Ako barem jedna varijabla je redna . Ako se vaše vrijednosti mogu postaviti u redoslijedu "prvi, drugi, treći...", imate posla s rednim podacima.
- Ako postoje značajni odstupnici . Za razliku od Pearsonove korelacije, Spearmanova korelacija nije osjetljiva na outliers jer vrši proračune na rangovima, tako da razlika između stvarnih vrijednosti nema smisla.
Na primjer, možete koristiti Spearmanovu korelaciju pronaći odgovore na sljedeća pitanja:
- Da li su ljudi s višim nivoom obrazovanja više zabrinuti za okolinu?
- Da li je broj simptoma koje pacijent ima povezan s njihovom voljom uzimati lijekove?
Spearmanov koeficijent korelacije
U statistici, Spearmanov koeficijent korelacije je predstavljen ili sa r s ili grčko slovo ρ ("rho"), zbog čega se često naziva Spearmanov rho .
Spearmanov koeficijent korelacije ranga mjeri oba jačina i smjer odnosa između rangova podataka. Može biti bilo koja vrijednost od -1 do 1, a što je apsolutna vrijednost koeficijenta bliža 1, to je odnos jači:
- 1 je savršena pozitivna vrijednostkorelacija
- -1 je savršena negativna korelacija
- 0 nije korelacija
Formula korelacije Spearmanovog ranga
Zavisno od toga da li postoje ili postoje nema veze u rangiranju (isti rang je dodijeljen dvama ili više opservacija), Spearmanov koeficijent korelacije može se izračunati pomoću jedne od sljedećih formula.
Ako nema nema vezanih rangova , jednostavnija formula će učiniti:
Gdje je:
- d i razlika između para rangova
- n je broj zapažanja
Za rješavanje vezanih rangova , puna verzija Spearmanove korelacije mora se koristiti formula, koja je malo izmijenjena verzija Pearsonovog r:
Gdje:
- R(x) i R(y ) su rangovi varijabli x i y
- R(x) i R(y) su srednji rangovi
Kako izračunati Spearmanovu korelaciju u Excelu s CORREL funkcijom
Nažalost, Excel nema ugrađenu funkciju za izračunavanje Spea rman koeficijent korelacije ranga. Međutim, to ne znači da ćete morati da mučite glavu gore navedenim formulama. Malo manipulirajući Excelom, možemo smisliti mnogo jednostavniji način za Spearmanovu korelaciju.
Kao primjer, pokušajmo otkriti ima li naša fizička aktivnost ikakvu vezu s našim krvnim tlakom. U koloni B imamo broj minuta koje provede 10 muškaraca istih godinadnevno u teretani, au koloni C imamo njihov sistolički krvni tlak.
Da biste pronašli Spearmanov koeficijent korelacije u Excelu, izvršite ove korake:
- Razredite svoje podatke
Budući da Spearmanova korelacija procjenjuje povezanost između dvije varijable na osnovu njihovih rangova, morate rangirati svoje izvorne podatke. Ovo se može brzo uraditi pomoću funkcije Excel RANK.AVG.
Da biste rangirali prvu varijablu (fizička aktivnost), unesite formulu ispod u D2, a zatim je povucite dolje do D11:
=RANK.AVG(B2,$B$2:$B$11,0)
Da biste rangirali drugu varijablu (krvni pritisak), stavite sljedeću formulu u ćeliju E2 i kopirajte je u kolonu:
=RANK.AVG(C2,$C$2:$C$11,0)
Da bi formule ispravno radile , obavezno zaključajte raspone apsolutnim referencama ćelija.
U ovom trenutku, vaši izvorni podaci bi trebali izgledati slično ovome:
- Pronađi Spearmanov koeficijent korelacije
Sa utvrđenim rangovima, sada možemo koristiti Excel CORREL funkciju da dobijemo Spearmanov rho:
=CORREL(D2:D11, E2:E11)
Formula vraća koeficijent od -0,7576 (zaokruženo na 4 znamenke), što pokazuje prilično jaku negativnu korelaciju i omogućava nam da zaključimo da što više osoba vježba, to joj je niži krvni tlak.
Pearsonov koeficijent korelacije za isti uzorak (- 0,7445) ukazuje na nešto slabiju korelaciju, ali ipak statistiku lly značajno:
Ljepota ovogametoda je da je brza, laka i funkcionira bez obzira na to da li postoje veze u rangiranju ili ne.
Izračunajte Spearmanov koeficijent korelacije u Excelu sa tradicionalnom formulom
Ako niste sasvim sigurni da je funkcija CORREL izračunala Spearmanov rho desno, možete provjeriti rezultat pomoću tradicionalne formule koja se koristi u statistici. Evo kako:
- Nađite razliku između svakog para rangova ( d ) oduzimanjem jednog ranga od drugog:
=D2-E2
Ova formula ide na F2 i zatim se kopira niz kolonu.
- Podignite svaku razliku u rangu na stepen dva ( d2 ):
=F2^2
Ova formula ide u kolonu G.
- Saberite kvadratne razlike:
=SUM(G2:G11)
Ova formula može ići u bilo koju praznu ćeliju, G12 u našem slučaju.
Sa sljedećeg snimka ekrana, vjerojatno ćete dobiti bolje razumijevanje rasporeda podataka:
- U zavisnosti od toga da li vaš skup podataka ima neke vezane rangove ili ne, koristite jednu od ovih formula za izračunavanje Spearmanovog koeficijenta korelacije.
U našem primjeru nema veza, tako da možemo ići s jednostavnijom formulom:
Sa d2 jednako na 290, i n (broj opažanja) jednak 10, formula prolazi kroz sljedeće transformacije:
Kao rezultat, dobijate -0,757575758 , što se savršeno slaže sa Spearmanovim koeficijentom korelacije izračunatim uprethodni primjer.
U Microsoft Excelu, gornji proračuni se mogu izvesti sa sljedećom jednadžbom:
=1-(6*G12/(10*(10^2-1)))
Gdje je G12 zbir kvadrata razlike u rangu (d2) .
Kako napraviti Spearmanovu korelaciju u Excelu koristeći graf
Koeficijenti korelacije u Excelu mjere samo linearne (Pearsonove) ili monotone (Spearman) odnose. Međutim, moguće su i druge asocijacije. Dakle, bez obzira koju korelaciju radite, uvijek je dobra ideja da odnos između varijabli predstavite u grafikonu.
Da biste nacrtali graf korelacije za rangirane podatke, evo što trebate učiniti:
- Izračunajte rangove koristeći funkciju RANK.AVG kao što je objašnjeno u ovom primjeru.
- Odaberite dvije kolone s rangovima.
- Umetnite XY grafikon raspršenja. Za ovo, kliknite na ikonu Scatter chart na kartici Inset , u grupi Chats .
- Dodajte linija trenda na vašem grafikonu. Najbrži način je da kliknete na dugme Elementi grafikona > Dodaj liniju trenda... .
- Prikaži vrijednost R-kvadrata na grafikonu. Dvaput kliknite na liniju trenda da otvorite njeno okno, prebacite se na karticu Opcije linije trenda i odaberite okvir Prikaži vrijednost R-kvadrata na grafikonu .
- Prikažite više cifara u vrijednosti R2 radi bolje preciznosti.
Kao rezultat, dobit ćete vizualni prikaz odnosa između rangova. Osim toga, dobićete Koeficijent determinacije (R2), čiji je kvadratni korijen Pearsonov koeficijent korelacije (r). Ali pošto ste nacrtali rangirane podatke, ovaj Pearsonov r nije ništa drugo nego Spearmanov rho.
Napomena. R-kvadrat je uvijek pozitivan broj, stoga će izvedeni koeficijent korelacije Spearmanovog ranga također uvijek biti pozitivan. Da biste dodali odgovarajući znak, samo pogledajte liniju na vašem korelacionom grafu - nagib nagore ukazuje na pozitivnu korelaciju (znak plus), a nagib nadole na negativnu korelaciju (znak minus).
U našem slučaju, R2 je jednak 0,5739210285. Koristite SQRT funkciju da pronađete kvadratni korijen:
=SQRT(0.5739210285)
…i dobit ćete već poznati koeficijent od 0,757575758.
Nagib na grafiku pokazuje negativan korelaciju, pa dodajemo znak minus i dobijamo ispravan Spearmanov koeficijent korelacije od -0,757575758.
Tako možete izračunati koeficijent korelacije Spearmanovog ranga u Excelu. Da biste bliže pogledali primjere o kojima se govori u ovom vodiču, možete preuzeti našu radnu svesku u nastavku. Zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeće sedmice!
Vježbanje
Spearman rang korelacija u Excelu (.xlsx datoteka)