Tabela e përmbajtjes
Tutoriali shpjegon bazat e korrelacionit Spearman në një gjuhë të thjeshtë dhe tregon se si të llogaritet koeficienti i korrelacionit të renditjes Spearman në Excel.
Kur bëni analizën e korrelacionit në Excel, në shumicën e rasteve do të merreni me korrelacionin Pearson. Por për shkak se koeficienti i korrelacionit Pearson mat vetëm një marrëdhënie lineare midis dy variablave, ai nuk funksionon për të gjitha llojet e të dhënave - variablat tuaja mund të jenë të lidhura fort në një mënyrë jolineare dhe ende kanë koeficientin afër zeros. Në rrethana të tilla, ju mund të bëni korrelacionin e renditjes së Spearman në vend të atij të Pearson.
Korrelacioni i Spearman - bazat
Korelacioni Spearman është joparametrik versioni i koeficientit të korrelacionit Pearson që mat shkallën e lidhjes midis dy variablave bazuar në radhët e tyre.
Korrelacioni i momentit të produktit Pearson teston marrëdhënien lineare ndërmjet dy variablave të vazhdueshme variablave. Linear do të thotë një marrëdhënie kur dy ndryshore ndryshojnë në të njëjtin drejtim me një shpejtësi konstante.
Spearman Rank Correlation vlerëson marrëdhënien monotone midis vlerave të renditura. Në një marrëdhënie monotonike, variablat gjithashtu priren të ndryshojnë së bashku, por jo domosdoshmërisht me një ritëm konstant.
Kur të bëhet korrelacioni Spearman
Analiza e korrelacionit Spearman duhet të përdoret në ndonjë nga në vijimrrethanat kur supozimet themelore të korrelacionit Pearson nuk përmbushen:
- Nëse të dhënat tuaja shfaqin një marrëdhënie jolineare ose nuk janë të shpërndara normalisht.
- Nëse të dhënat tuaja shfaqin një marrëdhënie jolineare . të paktën një variabël është rendor . Nëse vlerat tuaja mund të vendosen në rendin "e para, e dyta, e treta...", ju keni të bëni me të dhëna rendore.
- Nëse ka përcaktime të rëndësishme . Ndryshe nga korrelacioni Pearson, korrelacioni Spearman nuk është i ndjeshëm ndaj vlerave të jashtme sepse kryen llogaritje në rangje, kështu që diferenca midis vlerave aktuale nuk ka kuptim.
Për shembull, mund të përdorni korrelacionin Spearman për të gjetur përgjigjet e pyetjeve të mëposhtme:
- A janë njerëzit me një nivel më të lartë arsimor më të shqetësuar për mjedisin?
- A lidhet numri i simptomave që një pacient ka me gatishmërinë e tyre për të marrë mjekim?
Koeficienti i korrelacionit Spearman
Në statistikë, Koeficienti i korrelacionit Spearman përfaqësohet nga njëra prej r s ose shkronja greke ρ ("rho"), kjo është arsyeja pse shpesh quhet rho e Spearman .
Koeficienti i korrelacionit të gradës Spearman mat të dyja forca dhe drejtimi i marrëdhënies ndërmjet radhëve të të dhënave. Mund të jetë çdo vlerë nga -1 në 1, dhe sa më afër vlera absolute e koeficientit me 1, aq më e fortë është marrëdhënia:
- 1 është një pozitiv i përsosurkorrelacioni
- -1 është një korrelacion i përsosur negativ
- 0 nuk ka korrelacion
Formula e korrelacionit të gradës Spearman
Varësisht nëse ka apo ka nuk ka asnjë lidhje në renditje (e njëjta renditje u caktohet dy ose më shumë vëzhgimeve), koeficienti i korrelacionit Spearman mund të llogaritet me një nga formulat e mëposhtme.
Nëse nuk ka nuk ka renditje të barabarta , një formulë më e thjeshtë do të bëjë:
Ku:
- d i është ndryshimi ndërmjet një çifti gradash
- n është numri i vëzhgimeve
Për t'u marrë me gradat e lidhura , versioni i plotë i korrelacionit Spearman duhet të përdoret formula, e cila është një version pak i modifikuar i r-së së Pearson:
Where:
- R(x) dhe R(y ) janë radhët e variablave x dhe y
- R(x) dhe R(y) janë renditjet mesatare
Si të llogarisni korrelacionin Spearman në Excel me funksionin CORREL
Fatkeqësisht, Excel nuk ka një funksion të integruar për llogaritjen e Spea koeficienti i korrelacionit të rangut rman. Megjithatë, kjo nuk do të thotë që ju do të duhet të grumbulloni trurin tuaj me formulat e mësipërme. Duke manipuluar pak Excel-in, mund të gjejmë një mënyrë shumë më të thjeshtë për të bërë korrelacionin Spearman.
Si shembull, le të përpiqemi të zbulojmë nëse aktiviteti ynë fizik ka ndonjë lidhje me presionin e gjakut. Në kolonën B kemi numrin e minutave që shpenzojnë 10 meshkuj të së njëjtës moshëçdo ditë në palestër dhe në kolonën C kemi presionin e tyre sistolik të gjakut.
Për të gjetur koeficientin e korrelacionit Spearman në Excel, kryeni këto hapa:
- Rendisni të dhënat tuaja
Për shkak se korrelacioni Spearman vlerëson lidhjet midis dy variablave bazuar në renditjen e tyre, ju duhet të renditni të dhënat tuaja burimore. Kjo mund të bëhet shpejt duke përdorur funksionin Excel RANK.AVG.
Për të renditur variablin e parë (aktiviteti fizik), futni formulën e mëposhtme në D2 dhe më pas tërhiqeni poshtë në D11:
=RANK.AVG(B2,$B$2:$B$11,0)
Për të renditur variablin e dytë (presionin e gjakut), vendosni formulën e mëposhtme në qelizën E2 dhe kopjoni atë në kolonë:
=RANK.AVG(C2,$C$2:$C$11,0)
Që formulat të funksionojnë si duhet , ju lutemi sigurohuni që të kyçni intervalet me referenca absolute të qelizave.
Në këtë pikë, të dhënat tuaja burimore duhet të duken të ngjashme me këtë:
Shiko gjithashtu: Llogaritni interesin e përbërë në Excel: formula dhe kalkulator - Gjeni koeficientin e korrelacionit të Spearman
Me gradat e vendosura, tani mund të përdorim funksionin Excel CORREL për të marrë rho-në e Spearman:
=CORREL(D2:D11, E2:E11)
Formula kthen një koeficient prej -0,7576 (rrumbullakosur në 4 shifra), e cila tregon një korrelacion mjaft të fortë negativ dhe na lejon të konkludojmë se sa më shumë një person ushtrohet, aq më i ulët është presioni i gjakut.
Koeficienti i korrelacionit Pearson për të njëjtin kampion (- 0.7445) tregon një korrelacion pak më të dobët, por ende statistikë lly i rëndësishëm:
Bukuria e kësajmetoda është se është e shpejtë, e lehtë dhe funksionon pavarësisht nëse ka lidhje në renditje apo jo.
Llogaritni koeficientin e korrelacionit të Spearman në Excel me formulën tradicionale
Nëse nuk jeni mjaft të sigurt që funksioni CORREL ka llogaritur saktë rho-në e Spearman-it, mund ta verifikoni rezultatin me formulën tradicionale të përdorur në statistika. Ja se si:
- Gjeni ndryshimin midis çdo çifti të gradave ( d ) duke zbritur njërën nga tjetra:
=D2-E2
Kjo formulë shkon në F2 dhe më pas kopjohet në kolonë.
- Ngritni çdo ndryshim të renditjes në fuqinë e dy ( d2 ):
=F2^2
Kjo formulë shkon në kolonën G.
- Shto diferencat në katror:
=SUM(G2:G11)
Kjo formulë mund të shkojë në çdo qelizë të zbrazët, në rastin tonë G12.
Nga pamja e mëposhtme e ekranit, ndoshta do të fitoni më mirë kuptimi i renditjes së të dhënave:
- Në varësi të faktit nëse grupi juaj i të dhënave ka ndonjë renditje të lidhur apo jo, përdorni një nga këto formula për të llogaritur koeficientin e korrelacionit Spearman.
Në shembullin tonë, nuk ka lidhje, kështu që mund të shkojmë me një formulë më të thjeshtë:
Me d2 të barabartë në 290, dhe n (numri i vëzhgimeve) i barabartë me 10, formula pëson transformimet e mëposhtme:
Si rezultat, ju merrni -0,757575758 , e cila përputhet plotësisht me koeficientin e korrelacionit Spearman të llogaritur nëshembulli i mëparshëm.
Në Microsoft Excel, llogaritjet e mësipërme mund të kryhen me ekuacionin e mëposhtëm:
=1-(6*G12/(10*(10^2-1)))
Ku G12 është shuma e diferencave të renditjes në katror (d2) .
Si të bëhet korrelacioni Spearman në Excel duke përdorur një grafik
Koeficientët e korrelacionit në Excel matin vetëm marrëdhëniet lineare (Pearson) ose monotonike (Spearman). Megjithatë, shoqata të tjera janë të mundshme. Pra, pavarësisht se cilin korrelacion bëni, është gjithmonë një ide e mirë të përfaqësoni marrëdhënien midis variablave në një grafik.
Për të vizatuar një grafik korrelacioni për të dhënat e renditura, ja çfarë duhet të bëni:
- Llogaritni renditjet duke përdorur funksionin RANK.AVG siç shpjegohet në këtë shembull.
- Zgjidhni dy kolona me renditjet.
- Futni një tabelë shpërndarjeje XY. Për këtë, klikoni ikonën Scatter grafiku në skedën Inset , në grupin Chats .
- Shto një trendi në grafikun tuaj. Mënyra më e shpejtë është të klikoni butonin Elementet e grafikut > Shto Trendline... .
- Shfaq vlerën e katrorit R në grafik. Klikoni dy herë në linjën e prirjes për të hapur panelin e saj, kaloni në skedën Opsionet e linjës së trendit dhe zgjidhni kutinë Shfaq vlerën e katrorit R në grafik .
- Tregoni më shumë shifra në vlerën R2 për saktësi më të mirë.
Si rezultat, do të merrni një paraqitje vizuale të marrëdhënies midis gradave. Për më tepër, ju do të merrni Koeficienti i Përcaktimit (R2), rrënja katrore e të cilit është koeficienti i korrelacionit Pearson (r). Por për shkak se ju keni grafikuar të dhënat e renditura, ky r i Pearson nuk është gjë tjetër veçse rho i Spearman-it.
Shënim. R-katrori është gjithmonë një numër pozitiv, prandaj edhe koeficienti i korrelacionit të renditjes së Spearman-it do të jetë gjithmonë pozitiv. Për të shtuar një shenjë të përshtatshme, thjesht shikoni vijën në grafikun tuaj të korrelacionit - një pjerrësi lart tregon një korrelacion pozitiv (shenjë plus) dhe një pjerrësi në rënie tregon një korrelacion negativ (shenjë minus).
Në rastin tonë, R2 është e barabartë me 0.5739210285. Përdorni funksionin SQRT për të gjetur rrënjën katrore:
=SQRT(0.5739210285)
...dhe do të merrni koeficientin tashmë të njohur prej 0.757575758.
Pjerrësia në rënie në grafik shfaq një negativ korrelacion, kështu që ne shtojmë shenjën minus dhe marrim koeficientin e saktë të korrelacionit Spearman prej -0,757575758.
Kështu mund të llogarisni koeficientin e korrelacionit të gradës Spearman në Excel. Për të parë më nga afër shembujt e diskutuar në këtë tutorial, jeni të mirëpritur të shkarkoni mostrën e librit tonë të punës më poshtë. Ju falënderoj që lexoni dhe shpresoj t'ju shohim në blogun tonë javën e ardhshme!
Praktikoni librin e punës
Spearman Rank Korrelation në Excel (skedari .xlsx)