Spearman rank correlation sa Excel: formula at graph

  • Ibahagi Ito
Michael Brown

Ipinapaliwanag ng tutorial ang mga pangunahing kaalaman ng Spearman correlation sa isang simpleng wika at ipinapakita kung paano kalkulahin ang Spearman rank correlation coefficient sa Excel.

Kapag gumagawa ng correlation analysis sa Excel, sa karamihan ng mga kaso haharapin mo ang ugnayan ng Pearson. Ngunit dahil ang Pearson correlation coefficient ay sumusukat lamang ng isang linear na ugnayan sa pagitan ng dalawang variable, hindi ito gumagana para sa lahat ng uri ng data - ang iyong mga variable ay maaaring malakas na nauugnay sa isang non-linear na paraan at mayroon pa ring coefficient na malapit sa zero. Sa ganitong mga sitwasyon, maaari mong gawin ang ugnayan ng ranggo ng Spearman sa halip na ang kay Pearson.

    Karelasyon ng Spearman - ang mga pangunahing kaalaman

    Ang kaugnayan ng Spearman ay ang nonparametric bersyon ng Pearson correlation coefficient na sumusukat sa antas ng pagkakaugnay sa pagitan ng dalawang variable batay sa kanilang mga ranggo.

    Ang Pearson Product Moment Correlation ay sumusubok sa linear na relasyon sa pagitan ng dalawang tuluy-tuloy mga variable. Ang ibig sabihin ng linear ay isang relasyon kapag nagbabago ang dalawang variable sa parehong direksyon sa pare-parehong rate.

    Spearman Rank Correlation sinusuri ang monotonic na relasyon sa pagitan ng mga value na niraranggo. Sa isang monotonikong relasyon, ang mga variable ay may posibilidad ding magbago nang magkasama, ngunit hindi kinakailangan sa pare-parehong bilis.

    Kailan gagawin ang Spearman correlation

    Ang pagsusuri ng ugnayan ng Spearman ay gagamitin sa alinman sa mga sumusunodmga pangyayari kung kailan hindi natutugunan ang pinagbabatayan na mga pagpapalagay ng ugnayan ng Pearson:

    1. Kung ang iyong data ay nagpapakita ng isang hindi linear na relasyon o hindi karaniwang ipinamamahagi.
    2. Kung kahit isang variable ay ordinal . Kung ang iyong mga halaga ay maaaring ilagay sa "una, pangalawa, pangatlo..." na pagkakasunud-sunod, ikaw ay nakikitungo sa ordinal na data.
    3. Kung mayroong makabuluhang outlier . Hindi tulad ng Pearson correlation, ang Spearman correlation ay hindi sensitibo sa outlier dahil ito ay nagsasagawa ng mga kalkulasyon sa mga rank, kaya ang pagkakaiba sa pagitan ng mga aktwal na value ay walang kahulugan.

    Halimbawa, maaari mong gamitin ang Spearman correlation. upang mahanap ang mga sagot sa mga sumusunod na tanong:

    • Ang mga taong may mas mataas na antas ng edukasyon ba ay mas nababahala tungkol sa kapaligiran?
    • Ang bilang ba ng mga sintomas na mayroon ang isang pasyente ay may kaugnayan sa kanilang pagpayag para uminom ng gamot?

    Spearman correlation coefficient

    Sa mga istatistika, ang Spearman correlation coefficient ay kinakatawan ng alinman sa r s o ang letrang Griyego na ρ ("rho"), kaya naman madalas itong tinatawag na rho ng Spearman .

    Ang koepisyent ng ugnayan ng ranggo ng Spearman ay sumusukat sa parehong lakas at direksyon ng ugnayan sa pagitan ng mga hanay ng data. Maaari itong maging anumang halaga mula -1 hanggang 1, at mas malapit ang ganap na halaga ng koepisyent sa 1, mas malakas ang relasyon:

    • 1 ay isang perpektong positibocorrelation
    • -1 ay isang perpektong negatibong correlation
    • 0 ay walang correlation

    Spearman rank correlation formula

    Depende sa kung mayroon o mayroon ay walang mga ugnayan sa ranking (kaparehong ranggo na itinalaga sa dalawa o higit pang mga obserbasyon), ang Spearman correlation coefficient ay maaaring kalkulahin gamit ang isa sa mga sumusunod na formula.

    Kung mayroong walang mga nakatali na ranggo , gagawin ng mas simpleng formula:

    Kung saan:

    • d i ang pagkakaiba sa pagitan ng isang pares ng mga ranggo
    • n ay ang bilang ng mga obserbasyon

    Upang harapin ang nakatali na mga ranggo , ang buong bersyon ng Spearman correlation kailangang gumamit ng formula, na isang bahagyang binagong bersyon ng Pearson's r:

    Saan:

    • R(x) at R(y ) ay ang mga ranggo ng x at y na mga variable
    • R(x) at R(y) ang ibig sabihin ng mga ranggo

    Paano kalkulahin ang ugnayan ng Spearman sa Excel gamit ang CORREL function

    Sa kasamaang palad, walang inbuilt function ang Excel para sa pagkalkula ng Spea rman rank correlation coefficient. Gayunpaman, hindi ito nangangahulugan na kailangan mong i-rack ang iyong utak sa mga formula sa itaas. Sa pamamagitan ng kaunting pagmamanipula sa Excel, makakagawa tayo ng mas simpleng paraan para gawin ang Spearman correlation.

    Bilang halimbawa, subukan nating alamin kung ang ating pisikal na aktibidad ay may kaugnayan sa ating presyon ng dugo. Sa column B, mayroon kaming bilang ng mga minuto na ginugugol ng 10 lalaki sa parehong edadaraw-araw sa gym, at sa column C, mayroon tayong systolic blood pressure.

    Upang mahanap ang Spearman correlation coefficient sa Excel, gawin ang mga hakbang na ito:

    1. Ranggo ang iyong data

      Dahil sinusuri ng ugnayan ng Spearman ang mga ugnayan sa pagitan ng dalawang variable batay sa kanilang mga ranggo, kailangan mong i-rank ang iyong source data. Mabilis itong magagawa sa pamamagitan ng paggamit ng Excel RANK.AVG function.

      Upang i-rank ang unang variable (pisikal na aktibidad), ilagay ang formula sa ibaba sa D2 at pagkatapos ay i-drag ito pababa sa D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Upang i-rank ang pangalawang variable (presyon ng dugo), ilagay ang sumusunod na formula sa cell E2 at kopyahin ito pababa sa column:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Para gumana nang tama ang mga formula , pakitiyak na i-lock ang mga saklaw na may ganap na mga sanggunian sa cell.

      Sa puntong ito, ang iyong source data ay dapat magmukhang katulad nito:

    2. Hanapin ang koepisyent ng ugnayan ng Spearman

      Sa naitatag na mga ranggo, magagamit na natin ang Excel CORREL function upang makuha ang rho ng Spearman:

      =CORREL(D2:D11, E2:E11)

      Ang formula ay nagbabalik ng koepisyent ng -0.7576 (binulong sa 4 na digit), na nagpapakita ng medyo malakas na negatibong ugnayan at nagbibigay-daan sa amin na magdesisyon na kapag mas nag-eehersisyo ang isang tao, mas mababa ang kanyang presyon ng dugo.

      Ang koepisyent ng ugnayan ng Pearson para sa parehong sample (- 0.7445) ay nagpapahiwatig ng medyo mahinang ugnayan, ngunit statistica pa rin lly significant:

    Ang ganda nitoAng pamamaraan ay mabilis, madali, at gumagana kahit na may kaugnayan sa ranggo o wala.

    Kalkulahin ang koepisyent ng ugnayan ng Spearman sa Excel gamit ang tradisyonal na formula

    Kung hindi ka sigurado na ang CORREL function ay na-compute ang Spearman's rho right, maaari mong i-verify ang resulta gamit ang tradisyonal na formula na ginamit sa mga istatistika. Ganito:

    1. Hanapin ang pagkakaiba sa pagitan ng bawat pares ng mga ranggo ( d ) sa pamamagitan ng pagbabawas ng isang ranggo mula sa isa pa:

      =D2-E2

      Ang formula na ito ay napupunta sa F2 at pagkatapos ay kinopya sa column.

    2. Itaas ang bawat pagkakaiba sa ranggo sa kapangyarihan ng dalawa ( d2 ):

      =F2^2

      Ang formula na ito ay papunta sa column G.

    3. Idagdag ang mga squared differences:

      =SUM(G2:G11)

      Ang formula na ito ay maaaring pumunta sa anumang blangkong cell, G12 sa aming kaso.

      Mula sa sumusunod na screenshot, malamang na mas mahusay kang makakuha pag-unawa sa pagsasaayos ng data:

    4. Depende sa kung ang iyong set ng data ay may anumang nakatali na ranggo o wala, gamitin ang isa sa mga formula na ito upang kalkulahin ang koepisyent ng ugnayan ng Spearman.

    Sa aming halimbawa, walang mga ugnayan, kaya maaari kaming gumamit ng mas simpleng formula:

    Na may d2 na katumbas hanggang 290, at n (bilang ng mga obserbasyon) na katumbas ng 10, ang formula ay sumasailalim sa mga sumusunod na pagbabago:

    Bilang resulta, makakakuha ka ng -0.757575758 , na lubos na sumasang-ayon sa koepisyent ng ugnayan ng Spearman na kinakalkula sanakaraang halimbawa.

    Sa Microsoft Excel, ang mga kalkulasyon sa itaas ay maaaring isagawa gamit ang sumusunod na equation:

    =1-(6*G12/(10*(10^2-1)))

    Kung saan ang G12 ay ang kabuuan ng mga pagkakaiba sa squared rank (d2) .

    Paano gawin ang Spearman correlation sa Excel gamit ang isang graph

    Ang mga coefficient ng correlation sa Excel ay sumusukat lamang sa mga linear (Pearson) o monotonic (Spearman) na relasyon. Gayunpaman, posible ang iba pang mga asosasyon. Kaya, kahit anong ugnayan ang gawin mo, palaging magandang ideya na katawanin ang ugnayan sa pagitan ng mga variable sa isang graph.

    Upang gumuhit ng correlation graph para sa ranggo na data, narito ang kailangan mong gawin:

    1. Kalkulahin ang mga rank sa pamamagitan ng paggamit ng RANK.AVG function gaya ng ipinaliwanag sa halimbawang ito.
    2. Pumili ng dalawang column na may mga rank.
    3. Maglagay ng XY scatter chart. Para dito, i-click ang icon na Scatter chart sa tab na Inset , sa grupong Mga Chat .
    4. Magdagdag ng trendline sa iyong chart. Ang pinakamabilis na paraan ay ang pag-click sa button na Mga Elemento ng Chart > Magdagdag ng Trendline... .
    5. Ipakita ang R-squared na halaga sa chart. I-double click ang trendline upang buksan ang pane nito, lumipat sa tab na Trendline Options at piliin ang kahon na Display R-squared value sa chart .
    6. Magpakita ng higit pang mga digit sa halaga ng R2 para sa mas mahusay na katumpakan.

    Bilang resulta, makakakuha ka ng visual na representasyon ng ugnayan sa pagitan ng mga ranggo. Bukod pa rito, makukuha mo ang Coefficient of Determination (R2), ang square root kung saan ay ang Pearson correlation coefficient (r). Ngunit dahil na-plot mo ang ranggo na data, itong Pearson's r ay walang iba kundi ang Spearman's rho.

    Tandaan. Ang R-squared ay palaging isang positibong numero, kaya ang deduced Spearman rank correlation coefficient ay palaging magiging positibo. Para magdagdag ng naaangkop na sign, tingnan lamang ang linya sa iyong correlation graph - ang pataas na slope ay nagpapahiwatig ng positibong ugnayan (plus sign) at ang pababang slope ay nagpapahiwatig ng negatibong correlation (minus sign).

    Sa aming kaso, ang R2 ay katumbas ng 0.5739210285. Gamitin ang SQRT function upang mahanap ang square root:

    =SQRT(0.5739210285)

    …at makukuha mo ang pamilyar na coefficient na 0.757575758.

    Ang pababang slope sa graph ay nagpapakita ng negatibo correlation, kaya idinagdag namin ang minus sign at makuha ang tamang Spearman correlation coefficient na -0.757575758.

    Ganyan mo makalkula ang Spearman rank correlation coefficient sa Excel. Upang mas masusing tingnan ang mga halimbawang tinalakay sa tutorial na ito, malugod kang i-download ang aming sample na workbook sa ibaba. Salamat sa pagbabasa at umaasa akong makita ka sa aming blog sa susunod na linggo!

    Practice workbook

    Spearman Rank Correlation in Excel (.xlsx file)

    Si Michael Brown ay isang dedikadong mahilig sa teknolohiya na may hilig sa pagpapasimple ng mga kumplikadong proseso gamit ang mga tool sa software. Sa higit sa isang dekada ng karanasan sa industriya ng tech, hinasa niya ang kanyang mga kasanayan sa Microsoft Excel at Outlook, pati na rin ang Google Sheets at Docs. Ang blog ni Michael ay nakatuon sa pagbabahagi ng kanyang kaalaman at kadalubhasaan sa iba, na nagbibigay ng madaling sundan na mga tip at mga tutorial para sa pagpapabuti ng pagiging produktibo at kahusayan. Isa ka mang batikang propesyonal o baguhan, nag-aalok ang blog ni Michael ng mahahalagang insight at praktikal na payo para masulit ang mahahalagang software tool na ito.