Excel의 Spearman 순위 상관관계: 수식 및 그래프

  • 이 공유
Michael Brown

튜토리얼은 Spearman 상관관계의 기초를 간단한 언어로 설명하고 엑셀에서 스피어만 순위 상관계수를 계산하는 방법을 보여줍니다.

엑셀에서 상관관계 분석을 할 때 대부분의 경우 Pearson 상관 관계를 다룰 것입니다. 그러나 Pearson 상관 계수는 두 변수 사이의 선형 관계만 측정하기 때문에 모든 데이터 유형에 대해 작동하지 않습니다. 변수가 비선형 방식으로 강하게 연관되어 있어도 여전히 계수가 0에 가까울 수 있습니다. 이러한 상황에서 Pearson's 대신 Spearman rank correlation을 수행할 수 있습니다.

    Spearman correlation - the basics

    The Spearman correlation is nonparametric 순위를 기준으로 두 변수 사이의 연관성 정도를 측정하는 Pearson 상관 계수 버전입니다.

    Pearson Product Moment Correlation 은 두 연속 변수 사이의 선형 관계를 테스트합니다. 변수. 선형은 두 변수가 일정한 비율로 같은 방향으로 변할 때의 관계를 의미합니다.

    Spearman Rank Correlation 은 순위 값 간의 단조적인 관계를 평가합니다. 단조로운 관계에서 변수는 함께 변하는 경향이 있지만 반드시 일정한 비율로 변하는 것은 아닙니다.

    Spearman 상관 분석을 수행하는 경우

    Spearman 상관 분석은 수행원Pearson 상관관계의 기본 가정이 충족되지 않는 경우:

    1. 데이터가 비선형 관계를 나타내거나 정규 분포를 따르지 않는 경우.
    2. 경우 적어도 하나의 변수는 서수 입니다. 값을 "첫 번째, 두 번째, 세 번째…" 순서로 배치할 수 있는 경우 서수 데이터를 처리하고 있는 것입니다.
    3. 중요한 이상치 가 있는 경우. Pearson 상관관계와 달리 Spearman 상관관계는 순위에 대한 계산을 하기 때문에 이상값에 민감하지 않으므로 실제 값 간의 차이는 의미가 없습니다.

    예를 들어 Spearman 상관관계를 사용할 수 있습니다. 다음 질문에 대한 답을 찾으려면:

    • 교육 수준이 높은 사람들이 환경에 대해 더 염려합니까?
    • 환자가 나타내는 증상의 수는 환자의 의지와 관련이 있습니까?

    스피어만 상관계수

    통계에서 스피어만 상관계수 r s 또는 그리스 문자 ρ ("rho"), 이것이 종종 Spearman's rho 라고 불리는 이유입니다.

    Spearman 순위 상관 계수는 데이터 순위 간 관계의 강도와 방향. -1에서 1 사이의 값이 될 수 있으며 계수의 절대값이 1에 가까울수록 관계가 더 강해집니다.

    • 1은 완벽한 양수입니다.상관관계
    • -1은 완벽한 음의 상관관계
    • 0은 상관관계가 없다

    스피어만 순위 상관관계식

    있느냐 없느냐에 따라 순위에 동점이 없는 경우(2개 이상의 관측치에 할당된 동일한 순위) Spearman 상관 계수는 다음 공식 중 하나로 계산할 수 있습니다.

    동률 순위가 없는 경우 , 더 간단한 수식이 수행됩니다.

    여기서:

    • d i 는 차이입니다. 순위 쌍 사이
    • n 는 관찰 수입니다.

    동점 순위 를 처리하기 위해 Spearman 상관 관계의 정식 버전 Pearson의 r:

    여기서:

    • R(x) 및 R(y )는 x y 변수의 순위입니다.
    • R(x) 및 R(y)는 평균 순위입니다

    Excel에서 CORREL 함수로 Spearman 상관관계를 계산하는 방법

    안타깝게도 Excel에는 Spea를 계산하는 내장 함수가 없습니다. rman 순위 상관 계수. 그러나 그렇다고 해서 위의 공식으로 머리를 숙여야 한다는 의미는 아닙니다. Excel을 조금만 조작하면 Spearman 상관 관계를 훨씬 간단하게 수행할 수 있습니다.

    예를 들어 신체 활동이 혈압과 관련이 있는지 알아봅시다. B 열에는 같은 나이의 남성 10명이 보낸 시간(분)이 있습니다.매일 체육관에서 C열에 수축기 혈압이 표시됩니다.

    Excel에서 Spearman 상관 계수를 찾으려면 다음 단계를 수행하십시오.

    1. 데이터 순위 지정

      Spearman 상관 관계는 순위를 기준으로 두 변수 간의 연관성을 평가하므로 소스 데이터의 순위를 지정해야 합니다. 이것은 엑셀 RANK.AVG 함수를 사용하여 빠르게 수행할 수 있습니다.

      첫 번째 변수(신체 활동)의 순위를 매기려면 D2에 아래 수식을 입력한 다음 D11로 아래로 드래그합니다.

      =RANK.AVG(B2,$B$2:$B$11,0)

      두 번째 변수(혈압)의 순위를 지정하려면 셀 E2에 다음 수식을 입력하고 열 아래로 복사합니다.

      =RANK.AVG(C2,$C$2:$C$11,0)

      수식이 올바르게 작동하려면 , 절대 셀 참조로 범위를 잠그십시오.

      이 시점에서 소스 데이터는 다음과 유사해야 합니다.

    2. Spearman 상관 계수 찾기

      순위가 설정되면 이제 Excel CORREL 함수를 사용하여 Spearman의 rho를 얻을 수 있습니다.

      =CORREL(D2:D11, E2:E11)

      공식은 계수를 반환합니다. -0.7576(4자리로 반올림), 상당히 강한 음의 상관관계를 보여주고 운동을 많이 할수록 혈압이 낮아진다는 결론을 내릴 수 있습니다.

      동일한 샘플에 대한 Pearson 상관 계수(- 0.7445)는 약간 약한 상관관계를 나타내지만 여전히 통계적 매우 중요:

    이것의 아름다움방법은 빠르고 쉬우며 순위에 동점이 있는지 여부에 관계없이 작동한다는 것입니다.

    기존 공식으로 Excel에서 Spearman 상관 계수 계산

    확실하지 않은 경우 CORREL 함수가 Spearman의 rho를 올바르게 계산했는지 확인하면 통계에 사용되는 기존 공식으로 결과를 확인할 수 있습니다. 방법은 다음과 같습니다.

    1. 다른 순위에서 한 순위를 빼서 각 순위 쌍( d ) 간의 차이를 찾습니다.

      =D2-E2

      이 공식은 F2로 복사한 다음 열 아래로 복사합니다.

    2. 각 순위 차이를 2의 거듭제곱으로 올립니다( d2 ):

      =F2^2

      이 수식은 G 열로 이동합니다.

    3. 차이 제곱을 합산합니다.

      =SUM(G2:G11)

      이 수식은 모든 빈 셀(이 경우 G12)에 사용할 수 있습니다.

      다음 스크린샷에서 더 나은 결과를 얻을 수 있습니다. 데이터 배열 이해:

    4. 데이터 세트에 동률 순위가 있는지 여부에 따라 다음 공식 중 하나를 사용하여 Spearman 상관 계수를 계산합니다.

    이 예에서는 동률이 없으므로 더 간단한 공식을 사용할 수 있습니다.

    d2 가 같음 290, 및 n (관찰 수)가 10인 경우 수식은 다음 변환을 거칩니다.

    결과적으로 -0.757575758을 얻습니다. 에서 계산된 Spearman 상관 계수와 완벽하게 일치합니다.이전 예.

    Microsoft Excel에서 위의 계산은 다음 방정식으로 수행할 수 있습니다.

    =1-(6*G12/(10*(10^2-1)))

    여기서 G12는 제곱 순위 차이(d2)의 합입니다. .

    그래프를 사용하여 Excel에서 Spearman 상관관계를 수행하는 방법

    Excel의 상관계수는 선형(Pearson) 또는 단순(Spearman) 관계만 측정합니다. 그러나 다른 연결이 가능합니다. 따라서 어떤 상관 관계를 수행하든 항상 변수 간의 관계를 그래프로 나타내는 것이 좋습니다.

    순위 데이터에 대한 상관 관계 그래프를 그리려면 다음과 같이 해야 합니다.

    1. 이 예에서 설명한 대로 RANK.AVG 함수를 사용하여 순위를 계산합니다.
    2. 순위가 있는 두 개의 열을 선택합니다.
    3. XY 분산형 차트를 삽입합니다. 이를 위해 삽입 탭의 채팅 그룹에 있는 분산형 차트 아이콘을 클릭합니다.
    4. 추가 차트에 대한 추세선. 가장 빠른 방법은 차트 요소 버튼 > 추세선 추가... 를 클릭하는 것입니다.
    5. 차트에 R-제곱 값을 표시합니다. 추세선을 두 번 클릭하여 창을 열고 추세선 옵션 탭으로 전환한 다음 R-제곱 값 표시 차트에 상자를 선택합니다.
    6. 정확도를 높이기 위해 R2 값에 더 많은 숫자를 표시합니다.

    결과적으로 순위 간의 관계를 시각적으로 표시할 수 있습니다. 또한, 당신은 얻을 것이다 결정 계수 (R2), 제곱근은 Pearson 상관 계수(r)입니다. 그러나 순위 데이터를 플로팅했기 때문에 이 Pearson의 r은 Spearman의 rho에 불과합니다.

    참고. R-제곱은 항상 양수이므로 추론된 Spearman 순위 상관 계수도 항상 양수입니다. 적절한 기호를 추가하려면 상관 관계 그래프의 선을 살펴보십시오. 위쪽 기울기는 양의 상관 관계(더하기 기호)를 나타내고 아래쪽 기울기는 음의 상관 관계(빼기 기호)를 나타냅니다.

    우리의 경우 R2는 0.5739210285입니다. SQRT 함수를 사용하여 제곱근을 찾으십시오:

    =SQRT(0.5739210285)

    …이미 친숙한 계수 0.757575758을 얻을 수 있습니다.

    그래프의 하향 기울기는 음수를 나타냅니다. 따라서 빼기 기호를 추가하고 올바른 Spearman 상관 계수 -0.757575758을 얻습니다.

    이렇게 Excel에서 Spearman 순위 상관 계수를 계산할 수 있습니다. 이 자습서에서 설명하는 예제를 자세히 살펴보려면 아래에서 샘플 통합 문서를 다운로드하십시오. 읽어 주셔서 감사합니다. 다음 주에 저희 블로그에서 뵙기를 바랍니다!

    연습 워크북

    Spearman Rank Correlation in Excel(.xlsx 파일)

    Michael Brown은 소프트웨어 도구를 사용하여 복잡한 프로세스를 단순화하려는 열정을 가진 열성적인 기술 애호가입니다. 기술 산업에서 10년 이상의 경험을 쌓은 그는 Microsoft Excel 및 Outlook은 물론 Google 스프레드시트 및 문서 도구에 대한 기술을 연마했습니다. Michael의 블로그는 자신의 지식과 전문 지식을 다른 사람과 공유하는 데 전념하며 따라하기 쉬운 팁과 생산성 및 효율성 향상을 위한 자습서를 제공합니다. 노련한 전문가이든 초보자이든 Michael의 블로그는 이러한 필수 소프트웨어 도구를 최대한 활용하기 위한 귀중한 통찰력과 실용적인 조언을 제공합니다.