Correlació de rang de Spearman a Excel: fórmula i gràfic

  • Comparteix Això
Michael Brown

El tutorial explica els conceptes bàsics de la correlació de Spearman en un llenguatge senzill i mostra com calcular el coeficient de correlació de rang de Spearman a Excel.

Quan es fa anàlisi de correlació a Excel, en la majoria dels casos tractaràs la correlació de Pearson. Però com que el coeficient de correlació de Pearson només mesura una relació lineal entre dues variables, no funciona per a tots els tipus de dades; les vostres variables poden estar fortament associades d'una manera no lineal i encara tenen el coeficient proper a zero. En aquestes circumstàncies, podeu fer la correlació de rang de Spearman en lloc de la de Pearson.

    Correlació de Spearman: conceptes bàsics

    La correlació de Spearman és la no paramètrica versió del coeficient de correlació de Pearson que mesuren el grau d'associació entre dues variables en funció dels seus rangs.

    La correlació del moment del producte de Pearson prova la relació lineal entre dues contínues les variables. Lineal significa una relació quan dues variables canvien en la mateixa direcció a una velocitat constant.

    La correlació de rang de Spearman avalua la relació monotònica entre els valors classificats. En una relació monòtona, les variables també tendeixen a canviar juntes, però no necessàriament a un ritme constant.

    Quan fer la correlació de Spearman

    L'anàlisi de correlació de Spearman s'ha d'utilitzar en qualsevol dels següentcircumstàncies en què no es compleixen els supòsits subjacents de la correlació de Pearson:

    1. Si les vostres dades mostren una relació no lineal o no es distribueixen normalment.
    2. Si almenys una variable és ordinal . Si els vostres valors es poden col·locar en l'ordre "primer, segon, tercer...", esteu tractant amb dades ordinals.
    3. Si hi ha outliers significatius. A diferència de la correlació de Pearson, la correlació de Spearman no és sensible als valors atípics perquè realitza càlculs sobre els rangs, de manera que la diferència entre els valors reals no té sentit.

    Per exemple, podeu utilitzar la correlació de Spearman. per trobar les respostes a les preguntes següents:

    • Les persones amb un nivell educatiu més elevat estan més preocupades pel medi ambient?
    • El nombre de símptomes que té un pacient està relacionat amb la seva voluntat. prendre medicaments?

    Coeficient de correlació de Spearman

    En estadístiques, el coeficient de correlació de Spearman està representat per r s o la lletra grega ρ ("rho"), motiu pel qual sovint s'anomena rho de Spearman .

    El coeficient de correlació de rang de Spearman mesura tant el força i direcció de la relació entre els rangs de dades. Pot ser qualsevol valor de -1 a 1, i com més proper sigui el valor absolut del coeficient a 1, més forta serà la relació:

    • 1 és un positiu perfecte.correlació
    • -1 és una correlació negativa perfecta
    • 0 no és cap correlació

    Fórmula de correlació de rang de Spearman

    Depenent de si hi ha o hi ha no hi ha empats a la classificació (el mateix rang assignat a dues o més observacions), el coeficient de correlació de Spearman es pot calcular amb una de les fórmules següents.

    Si no hi ha no hi ha rangs empatats , una fórmula més senzilla farà:

    On:

    • d i és la diferència entre un parell de rangs
    • n és el nombre d'observacions

    Per tractar amb rangues lligades , la versió completa de la correlació de Spearman s'ha d'utilitzar la fórmula, que és una versió lleugerament modificada de la r de Pearson:

    On:

    • R(x) i R(y ) són els rangs de les variables x i y
    • R(x) i R(y) són els rangs mitjans

    Com calcular la correlació de Spearman a Excel amb la funció CORREL

    Lamentablement, Excel no té una funció integrada per calcular Spea coeficient de correlació de rang rman. Tanmateix, això no vol dir que us haureu d'aixecar el cervell amb les fórmules anteriors. Manipulant una mica l'Excel, podem trobar una manera molt més senzilla de fer la correlació de Spearman.

    Com a exemple, intentem esbrinar si la nostra activitat física té alguna relació amb la nostra pressió arterial. A la columna B, tenim el nombre de minuts que dediquen 10 homes de la mateixa edatdiàriament en un gimnàs, i a la columna C, tenim la seva pressió arterial sistòlica.

    Per trobar el coeficient de correlació de Spearman a Excel, seguiu aquests passos:

    1. Classifica les teves dades

      Com que la correlació de Spearman avalua les associacions entre dues variables en funció dels seus rangs, has de classificar les teves dades font. Això es pot fer ràpidament mitjançant la funció Excel RANK.AVG.

      Per classificar la primera variable (activitat física), introduïu la fórmula següent a D2 i després arrossegueu-la cap a D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Per classificar la segona variable (tensió arterial), poseu la fórmula següent a la cel·la E2 i copieu-la a la columna:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Perquè les fórmules funcionin correctament , assegureu-vos de bloquejar els intervals amb referències de cel·les absolutes.

      En aquest punt, les vostres dades d'origen haurien de ser semblants a això:

    2. Trobar el coeficient de correlació de Spearman

      Amb els rangs establerts, ara podem utilitzar la funció CORREL d'Excel per obtenir el rho de Spearman:

      =CORREL(D2:D11, E2:E11)

      La fórmula retorna un coeficient de -0,7576 (arrodonit a 4 dígits), que mostra una correlació negativa força forta i ens permet concloure que com més exercici una persona, més baixa la seva pressió arterial.

      El coeficient de correlació de Pearson per a la mateixa mostra (- 0,7445) indica una correlació una mica més feble, però encara estadístiques Molt significatiu:

    La bellesa d'aixòEl mètode és que és ràpid, fàcil i funciona independentment de si hi ha empats en el rànquing o no.

    Calculeu el coeficient de correlació de Spearman a Excel amb la fórmula tradicional

    Si no esteu del tot segur. que la funció CORREL ha calculat el dret rho de Spearman, podeu verificar el resultat amb la fórmula tradicional utilitzada a les estadístiques. A continuació s'explica com:

    1. Trobeu la diferència entre cada parell de rangs ( d ) restant un rang de l'altre:

      =D2-E2

      Aquesta fórmula és a F2 i després es copia a la columna.

    2. Augmenta cada diferència de rang a la potència de dos ( d2 ):

      =F2^2

      Aquesta fórmula va a la columna G.

    3. Sumeu les diferències al quadrat:

      =SUM(G2:G11)

      Aquesta fórmula pot anar a qualsevol cel·la en blanc, G12 en el nostre cas.

      A partir de la captura de pantalla següent, probablement guanyareu millor comprensió de la disposició de les dades:

    4. Depenent de si el vostre conjunt de dades té rangs lligats o no, utilitzeu una d'aquestes fórmules per calcular el coeficient de correlació de Spearman.

    En el nostre exemple, no hi ha enllaços, així que podem anar amb una fórmula més senzilla:

    Amb d2 igual a 290 i n (nombre d'observacions) igual a 10, la fórmula experimenta les transformacions següents:

    Com a resultat, s'obté -0,757575758 , que concorda perfectament amb el coeficient de correlació de Spearman calculat alexemple anterior.

    A Microsoft Excel, els càlculs anteriors es poden realitzar amb l'equació següent:

    =1-(6*G12/(10*(10^2-1)))

    On G12 és la suma de les diferències de rang al quadrat (d2) .

    Com fer la correlació de Spearman a Excel mitjançant un gràfic

    Els coeficients de correlació a Excel només mesuren relacions lineals (Pearson) o monòtòniques (Spearman). Tanmateix, altres associacions són possibles. Per tant, independentment de la correlació que feu, sempre és una bona idea representar la relació entre les variables en un gràfic.

    Per dibuixar un gràfic de correlació per a les dades classificades, heu de fer el següent:

    1. Calculeu les classificacions utilitzant la funció RANK.AVG tal com s'explica en aquest exemple.
    2. Seleccioneu dues columnes amb les classificacions.
    3. Inseriu un gràfic de dispersió XY. Per fer-ho, feu clic a la icona Dispersió diagrama de la pestanya Inserció , al grup Xats .
    4. Afegiu un línia de tendència al vostre gràfic. La manera més ràpida és fer clic al botó Elements del gràfic > Afegeix una línia de tendència... .
    5. Mostra el valor R-quadrat al gràfic. Feu doble clic a la línia de tendència per obrir-ne el panell, canvieu a la pestanya Opcions de línia de tendència i seleccioneu la casella Mostra el valor R-quadrat al gràfic .
    6. Mostra més dígits en el valor R2 per a una millor precisió.

    Com a resultat, obtindreu una representació visual de la relació entre els rangs. A més, obtindreu el Coeficient de determinació (R2), l'arrel quadrada del qual és el coeficient de correlació de Pearson (r). Però com que heu representat les dades classificades, aquesta r de Pearson no és altra cosa que la rho de Spearman.

    Nota. R-quadrat és sempre un nombre positiu, per tant, el coeficient de correlació de rang de Spearman deduït també serà sempre positiu. Per afegir un signe adequat, només cal que mireu la línia del vostre gràfic de correlació: un pendent ascendent indica una correlació positiva (signe més) i un pendent descendent indica una correlació negativa (signe menys).

    En el nostre cas, R2 és igual a 0,5739210285. Utilitzeu la funció SQRT per trobar l'arrel quadrada:

    =SQRT(0.5739210285)

    ...i obtindreu el ja conegut coeficient de 0,757575758.

    El pendent descendent del gràfic mostra un negatiu correlació, de manera que afegim el signe menys i obtenim el coeficient de correlació de Spearman correcte de -0,757575758.

    Així és com podeu calcular el coeficient de correlació del rang de Spearman a Excel. Per veure amb més detall els exemples tractats en aquest tutorial, us convidem a descarregar el nostre quadern de treball de mostra a continuació. Us agraeixo la lectura i espero veure-us al nostre bloc la setmana vinent!

    Quader de pràctiques

    Correlació de rang de Spearman a Excel (fitxer .xlsx)

    Michael Brown és un entusiasta de la tecnologia dedicat amb una passió per simplificar processos complexos mitjançant eines de programari. Amb més d'una dècada d'experiència en la indústria tecnològica, ha perfeccionat les seves habilitats en Microsoft Excel i Outlook, així com en Google Sheets i Docs. El bloc de Michael es dedica a compartir els seus coneixements i experiència amb altres persones, oferint consells i tutorials fàcils de seguir per millorar la productivitat i l'eficiència. Tant si sou un professional experimentat com si sou un principiant, el bloc de Michael ofereix valuoses idees i consells pràctics per treure el màxim profit d'aquestes eines de programari essencials.