Correlación de rangos de Spearman en Excel: fórmula e gráfico

  • Comparte Isto
Michael Brown

O titorial explica os conceptos básicos da correlación de Spearman nunha linguaxe sinxela e mostra como calcular o coeficiente de correlación de rango de Spearman en Excel.

Ao facer análise de correlación en Excel, na maioría dos casos tratarás a correlación de Pearson. Pero debido a que o coeficiente de correlación de Pearson mide só unha relación lineal entre dúas variables, non funciona para todos os tipos de datos; as súas variables poden estar fortemente asociadas de forma non lineal e aínda teñen o coeficiente próximo a cero. En tales circunstancias, pode facer a correlación de rango de Spearman en lugar da de Pearson.

    Correlación de Spearman: conceptos básicos

    A correlación de Spearman é a non paramétrica versión do coeficiente de correlación de Pearson que miden o grao de asociación entre dúas variables en función dos seus rangos.

    A Correlación do momento do produto de Pearson proba a relación lineal entre dúas variables continuas. variables. Lineal significa unha relación cando dúas variables cambian na mesma dirección a un ritmo constante.

    A correlación de rangos de Spearman avalía a relación monótona entre os valores clasificados. Nunha relación monótona, as variables tamén tenden a cambiar xuntas, pero non necesariamente a un ritmo constante.

    Cando facer a correlación de Spearman

    A análise de correlación de Spearman debe utilizarse en calquera das seguindocircunstancias nas que non se cumpren os supostos subxacentes da correlación de Pearson:

    1. Se os teus datos presentan unha relación non lineal ou non se distribúen normalmente.
    2. Se polo menos unha variable é ordinal . Se os teus valores se poden colocar na orde "primeiro, segundo, terceiro...", estás tratando con datos ordinais.
    3. Se hai outliers significativos. A diferenza da correlación de Pearson, a correlación de Spearman non é sensible aos valores atípicos porque realiza cálculos sobre os rangos, polo que a diferenza entre os valores reais non ten significado.

    Por exemplo, pode usar a correlación de Spearman. para atopar as respostas ás seguintes preguntas:

    • As persoas con maior nivel educativo preocúpanse máis o medio ambiente?
    • O número de síntomas que ten un paciente está relacionado coa súa disposición tomar medicamentos?

    Coeficiente de correlación de Spearman

    En estatística, o coeficiente de correlación de Spearman está representado por r s ou a letra grega ρ ("rho"), polo que a miúdo se lle chama rho de Spearman .

    O coeficiente de correlación de rango de Spearman mide tanto o forza e dirección da relación entre os rangos de datos. Pode ser calquera valor de -1 a 1, e canto máis preto estea o valor absoluto do coeficiente a 1, máis forte será a relación:

    • 1 é un positivo perfecto.correlación
    • -1 é unha correlación negativa perfecta
    • 0 non é correlación

    Fórmula de correlación de rango de Spearman

    Depende de se hai ou hai non hai empates na clasificación (o mesmo rango asignado a dúas ou máis observacións), o coeficiente de correlación de Spearman pódese calcular cunha das seguintes fórmulas.

    Se non hai non hai rangos empatados , unha fórmula máis sinxela fará:

    Onde:

    • d i é a diferenza entre un par de rangos
    • n é o número de observacións

    Para tratar con rangos empatados , a versión completa da correlación de Spearman debe utilizarse a fórmula, que é unha versión lixeiramente modificada da r de Pearson:

    Onde:

    • R(x) e R(y ) son os rangos das variables x e y
    • R(x) e R(y) son os rangos medios

    Como calcular a correlación de Spearman en Excel coa función CORREL

    Lamentablemente, Excel non ten unha función incorporada para calcular o Spea coeficiente de correlación de rango rman. Non obstante, iso non significa que teñas que meter o cerebro coas fórmulas anteriores. Ao manipular un pouco Excel, podemos atopar un xeito moito máis sinxelo de facer a correlación de Spearman.

    A modo de exemplo, intentemos descubrir se a nosa actividade física ten algunha relación coa nosa presión arterial. Na columna B, temos o número de minutos que pasan 10 homes da mesma idadediariamente nun ximnasio, e na columna C, temos a súa presión arterial sistólica.

    Para atopar o coeficiente de correlación de Spearman en Excel, siga estes pasos:

    1. Clasifica os teus datos

      Dado que a correlación de Spearman avalía as asociacións entre dúas variables en función dos seus rangos, cómpre clasificar os teus datos de orixe. Isto pódese facer rapidamente usando a función RANK.AVG de Excel.

      Para clasificar a primeira variable (actividade física), introduza a seguinte fórmula en D2 e ​​despois arrástrea ata D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Para clasificar a segunda variable (presión arterial), pon a seguinte fórmula na cela E2 e cópiaa na columna:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Para que as fórmulas funcionen correctamente , asegúrate de bloquear os intervalos con referencias de cela absolutas.

      Neste punto, os teus datos de orixe deberían ser semellantes a este:

    2. Atopa o coeficiente de correlación de Spearman

      Cos rangos establecidos, agora podemos usar a función CORREL de Excel para obter o rho de Spearman:

      =CORREL(D2:D11, E2:E11)

      A fórmula devolve un coeficiente de -0,7576 (redondeado a 4 díxitos), o que amosa unha correlación negativa bastante forte e permite concluír que canto máis se faga unha persoa, menor será a súa presión arterial.

      O coeficiente de correlación de Pearson para a mesma mostra (- 0.7445) indica unha correlación un pouco máis débil, pero aínda así estatística Moi significativo:

    A beleza distométodo é que é rápido, sinxelo e funciona independentemente de que existan empates na clasificación ou non.

    Calcula o coeficiente de correlación de Spearman en Excel coa fórmula tradicional

    Se non estás moi seguro que a función CORREL calculou o dereito rho de Spearman, pode verificar o resultado coa fórmula tradicional usada nas estatísticas. Así é como:

    1. Atopa a diferenza entre cada par de rangos ( d ) restando un rango do outro:

      =D2-E2

      Esta fórmula vai a F2 e despois cópiase na columna.

    2. Sube cada diferenza de rango á potencia de dous ( d2 ):

      =F2^2

      Esta fórmula vai á columna G.

    3. Sume as diferenzas ao cadrado:

      =SUM(G2:G11)

      Esta fórmula pode ir a calquera cela en branco, G12 no noso caso.

      A partir da seguinte captura de pantalla, probablemente gañará mellor comprensión da disposición dos datos:

    4. Según se o seu conxunto de datos teña ou non rangos vinculados, use unha destas fórmulas para calcular o coeficiente de correlación de Spearman.

    No noso exemplo, non hai empates, polo que podemos ir cunha fórmula máis sinxela:

    Con d2 igual a 290 e n (número de observacións) igual a 10, a fórmula sofre as seguintes transformacións:

    Como resultado, obtén -0,757575758 , que concorda perfectamente co coeficiente de correlación de Spearman calculado noexemplo anterior.

    En Microsoft Excel, os cálculos anteriores pódense realizar coa seguinte ecuación:

    =1-(6*G12/(10*(10^2-1)))

    Onde G12 é a suma das diferenzas de rango ao cadrado (d2) .

    Como facer a correlación de Spearman en Excel mediante un gráfico

    Os coeficientes de correlación en Excel só miden relacións lineais (Pearson) ou monótonas (Spearman). Non obstante, outras asociacións son posibles. Polo tanto, independentemente da correlación que fagas, sempre é unha boa idea representar a relación entre as variables nun gráfico.

    Para debuxar un gráfico de correlación para os datos clasificados, isto é o que debes facer:

    1. Calcula as clasificacións usando a función RANK.AVG como se explica neste exemplo.
    2. Selecciona dúas columnas coas clasificacións.
    3. Insire un gráfico de dispersión XY. Para iso, faga clic na icona Dispersión diagrama da pestana Insertar , no grupo Chats .
    4. Engadir un liña de tendencia ao teu gráfico. O xeito máis rápido é facer clic no botón Elementos do gráfico > Engadir liña de tendencia... .
    5. Mostrar o valor R-cadrado no gráfico. Fai dobre clic na liña de tendencia para abrir o seu panel, cambia á pestana Opcións da liña de tendencia e selecciona a caixa Mostrar valor R-cadrado no gráfico .
    6. Mostra máis díxitos no valor R2 para unha mellor precisión.

    Como resultado, obterás unha representación visual da relación entre os rangos. Ademais, obterás o Coeficiente de determinación (R2), cuxa raíz cadrada é o coeficiente de correlación de Pearson (r). Pero debido a que trazou os datos clasificados, esta r de Pearson non é outra cousa que a rho de Spearman.

    Nota. R-cadrado é sempre un número positivo, polo que o coeficiente de correlación de rango de Spearman deducido tamén será sempre positivo. Para engadir un signo apropiado, só tes que mirar a liña do teu gráfico de correlación: unha pendente ascendente indica unha correlación positiva (signo máis) e unha pendente descendente indica unha correlación negativa (signo menos).

    No noso caso, R2 é igual a 0,5739210285. Usa a función SQRT para atopar a raíz cadrada:

    =SQRT(0.5739210285)

    ...e obterás o xa familiar coeficiente de 0,757575758.

    A pendente descendente da gráfica mostra un negativo correlación, polo que engadimos o signo menos e obtemos o coeficiente de correlación de Spearman correcto de -0,757575758.

    Así podes calcular o coeficiente de correlación de rango de Spearman en Excel. Para ver os exemplos que se comentan neste tutorial, podes descargar o noso libro de exemplo a continuación. Grazas por ler e espero verte no noso blogue a vindeira semana!

    Practice workbook

    Spearman Rank Correlation in Excel (ficheiro .xlsx)

    Michael Brown é un entusiasta da tecnoloxía dedicada á súa paixón por simplificar procesos complexos mediante ferramentas de software. Con máis dunha década de experiencia na industria tecnolóxica, perfeccionou as súas habilidades en Microsoft Excel e Outlook, así como en Follas de cálculo e Documentos de Google. O blog de Michael está dedicado a compartir o seu coñecemento e experiencia con outros, proporcionando consellos e titoriais fáciles de seguir para mellorar a produtividade e a eficiencia. Tanto se es un profesional experimentado como un principiante, o blog de Michael ofrece valiosas ideas e consellos prácticos para sacar o máximo proveito destas ferramentas de software esenciais.