Corelația de rang Spearman în Excel: formulă și grafic

  • Imparte Asta
Michael Brown

Tutorialul explică elementele de bază ale corelației Spearman într-un limbaj simplu și arată cum se calculează coeficientul de corelație de rang Spearman în Excel.

Atunci când efectuați o analiză de corelație în Excel, în majoritatea cazurilor veți avea de-a face cu corelația Pearson. Dar, deoarece coeficientul de corelație Pearson măsoară doar o relație liniară între două variabile, acesta nu funcționează pentru toate tipurile de date - variabilele dvs. pot fi puternic asociate într-un mod neliniar și totuși să aibă coeficientul aproape de zero. În astfel de circumstanțe, puteți efectua analiza Spearmanîn loc de corelația Pearson.

    Corelația Spearman - noțiuni de bază

    The Corelația Spearman este versiunea neparametrică a coeficientului de corelație Pearson care măsoară gradul de asociere dintre două variabile pe baza rangurilor acestora.

    The Corelația momentului produsului Pearson testează liniar relație între două variabile continue. Liniare înseamnă o relație în care două variabile se modifică în aceeași direcție cu o rată constantă.

    Corelația Spearman Rank evaluează monotonică Într-o relație monotonă, variabilele tind, de asemenea, să se modifice împreună, dar nu neapărat într-un ritm constant.

    Când se face corelația Spearman

    Analiza de corelație Spearman trebuie utilizată în oricare dintre următoarele situații, atunci când nu sunt îndeplinite ipotezele de bază ale corelației Pearson:

    1. În cazul în care datele dvs. prezintă o neliniară relație sau nu sunt distribuite în mod normal.
    2. În cazul în care cel puțin o variabilă este ordinal Dacă valorile dvs. pot fi plasate în ordinea "primul, al doilea, al treilea...", aveți de-a face cu date ordinale.
    3. În cazul în care există valori aberante Spre deosebire de corelația Pearson, corelația Spearman nu este sensibilă la valorile aberante, deoarece efectuează calcule pe ranguri, astfel încât diferența dintre valorile reale nu are nicio semnificație.

    De exemplu, puteți utiliza corelația Spearman pentru a găsi răspunsurile la următoarele întrebări:

    • Sunt persoanele cu un nivel de educație mai ridicat mai preocupate de mediu?
    • Este numărul de simptome pe care le are un pacient legat de disponibilitatea acestuia de a lua medicamente?

    Coeficientul de corelație Spearman

    În statistică, se utilizează Coeficientul de corelație Spearman este reprezentată fie prin r s sau litera greacă ρ ("rho"), motiv pentru care se numește adesea Rho lui Spearman .

    Coeficientul de corelație de rang Spearman măsoară atât intensitatea, cât și direcția relației dintre rangurile datelor. Acesta poate avea orice valoare de la -1 la 1, iar cu cât valoarea absolută a coeficientului este mai apropiată de 1, cu atât mai puternică este relația:

    • 1 reprezintă o corelație pozitivă perfectă
    • -1 reprezintă o corelație negativă perfectă
    • 0 reprezintă lipsa de corelație

    Formula de corelație de rang Spearman

    În funcție de faptul că există sau nu egalități în clasament (același rang atribuit la două sau mai multe observații), coeficientul de corelație Spearman poate fi calculat cu una dintre următoarele formule.

    În cazul în care există fără grade legate , este suficientă o formulă mai simplă:

    Unde:

    • d i este diferența dintre o pereche de ranguri
    • n este numărul de observații

    Pentru a face față la egalitate de puncte , trebuie utilizată versiunea completă a formulei de corelație Spearman, care este o versiune ușor modificată a lui Pearson r:

    Unde:

    • R(x) și R(y) sunt gradele de x și y variabile
    • R(x) și R(y) sunt rangurile medii

    Cum se calculează corelația Spearman în Excel cu funcția CORREL

    Din păcate, Excel nu dispune de o funcție încorporată pentru calcularea coeficientului de corelație de rang Spearman. Totuși, asta nu înseamnă că va trebui să vă storceți creierii cu formulele de mai sus. Manipulând puțin Excel, putem găsi o modalitate mult mai simplă de a face corelația Spearman.

    Ca exemplu, să încercăm să aflăm dacă activitatea noastră fizică are vreo legătură cu tensiunea arterială. În coloana B, avem numărul de minute pe care 10 bărbați de aceeași vârstă le petrec zilnic într-o sală de sport, iar în coloana C, avem tensiunea arterială sistolică a acestora.

    Pentru a găsi coeficientul de corelație Spearman în Excel, efectuați următorii pași:

    1. Clasificați-vă datele

      Deoarece corelația Spearman evaluează asocierile dintre două variabile pe baza rangurilor lor, trebuie să clasificați datele sursă. Acest lucru se poate face rapid utilizând funcția Excel RANK.AVG.

      Pentru a clasifica prima variabilă (activitatea fizică), introduceți formula de mai jos în D2 și apoi trageți-o în jos în D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Pentru a clasifica a doua variabilă (tensiunea arterială), introduceți următoarea formulă în celula E2 și copiați-o în josul coloanei:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Pentru ca formulele să funcționeze corect, asigurați-vă că blocați intervalele cu referințe de celule absolute.

      În acest moment, datele sursă ar trebui să arate asemănător cu acestea:

    2. Găsiți coeficientul de corelație Spearman

      Odată stabilite rangurile, putem utiliza funcția CORREL din Excel pentru a obține rho-ul lui Spearman:

      =CORREL(D2:D11, E2:E11)

      Formula returnează un coeficient de -0,7576 (rotunjit la 4 cifre), ceea ce arată o corelație negativă destul de puternică și ne permite să concluzionăm că, cu cât o persoană face mai multe exerciții fizice, cu atât tensiunea arterială este mai mică.

      Coeficientul de corelație Pearson pentru același eșantion (-0,7445) indică o corelație ceva mai slabă, dar totuși semnificativă din punct de vedere statistic:

    Frumusețea acestei metode este că este rapidă, ușoară și funcționează indiferent dacă există sau nu egalități în clasament.

    Calculați coeficientul de corelație Spearman în Excel cu formula tradițională

    Dacă nu sunteți sigur că funcția CORREL a calculat corect rho-ul lui Spearman, puteți verifica rezultatul cu ajutorul formulei tradiționale utilizate în statistică. Iată cum:

    1. Găsiți diferența dintre fiecare pereche de ranguri ( d ) prin scăderea unui rang din celălalt:

      =D2-E2

      Această formulă se introduce în F2 și apoi este copiată în josul coloanei.

    2. Creșteți fiecare diferență de rang la puterea a doua ( d2 ):

      =F2^2

      Această formulă se regăsește în coloana G.

    3. Adunați diferențele la pătrat:

      =SUM(G2:G11)

      Această formulă poate merge în orice celulă goală, G12 în cazul nostru.

      Din următoarea captură de ecran, veți înțelege probabil mai bine aranjamentul datelor:

    4. În funcție de faptul că setul de date are sau nu ranguri legate, utilizați una dintre aceste formule pentru a calcula coeficientul de corelație Spearman.

    În exemplul nostru, nu există egalități, așa că putem folosi o formulă mai simplă:

    Cu d2 egală cu 290 și n (numărul de observații) egal cu 10, formula suferă următoarele transformări:

    Ca rezultat, veți obține -0,75757575758, care corespunde perfect coeficientului de corelație Spearman calculat în exemplul anterior.

    În Microsoft Excel, calculele de mai sus pot fi efectuate cu următoarea ecuație:

    =1-(6*G12/(10*(10^2-1)))

    Unde G12 este suma diferențelor de rang la pătrat (d2).

    Cum se face corelația Spearman în Excel folosind un grafic

    Coeficienții de corelație din Excel măsoară doar relațiile liniare (Pearson) sau monotone (Spearman). Cu toate acestea, sunt posibile și alte asocieri. Așadar, indiferent de corelația pe care o faceți, este întotdeauna o idee bună să reprezentați relația dintre variabile într-un grafic.

    Pentru a trasa un grafic de corelație pentru datele clasate, iată ce trebuie să faceți:

    1. Calculați clasamentele utilizând funcția RANK.AVG, așa cum se explică în acest exemplu.
    2. Selectați două coloane cu ranguri.
    3. Introduceți o diagramă de dispersie XY. Pentru aceasta, faceți clic pe butonul Dispersie diagramă de pe pictograma Inserție în fila Discuții grup.
    4. Adăugați o linie de trend la graficul dvs. Cea mai rapidă metodă este să faceți clic pe butonul Elemente de diagramă buton> Adăugați Trendline... .
    5. Afișați valoarea R-pătrat pe grafic. Faceți dublu clic pe linia de trend pentru a deschide panoul acesteia, treceți la Opțiuni Trendline și selectați fila Afișați valoarea R pătrat pe hartă cutie.
    6. Afișați mai multe cifre în valoarea R2 pentru o mai bună precizie.

    Ca rezultat, veți obține o reprezentare vizuală a relației dintre ranguri. În plus, veți obține și Coeficientul de determinare (R2), a cărui rădăcină pătrată este coeficientul de corelație Pearson (r). Dar pentru că ați trasat datele clasate, acest r al lui Pearson nu este altceva decât rho al lui Spearman.

    Notă. R pătrat este întotdeauna un număr pozitiv, prin urmare, coeficientul de corelație de rang Spearman dedus va fi, de asemenea, întotdeauna pozitiv. Pentru a adăuga un semn corespunzător, este suficient să vă uitați la linia din graficul de corelație - o pantă ascendentă indică o corelație pozitivă (semnul plus), iar o pantă descendentă indică o corelație negativă (semnul minus).

    În cazul nostru, R2 este egal cu 0,5739210285. Utilizați funcția SQRT pentru a găsi rădăcina pătrată:

    =SQRT(0.5739210285)

    ...și veți obține coeficientul deja cunoscut de 0,75757575758.

    Panta descendentă a graficului prezintă o corelație negativă, așa că adăugăm semnul minus și obținem coeficientul de corelație Spearman corect de -0,75757575758.

    Iată cum puteți calcula coeficientul de corelație de rang Spearman în Excel. Pentru a vedea mai îndeaproape exemplele discutate în acest tutorial, vă invităm să descărcați exemplul nostru de registru de lucru de mai jos. Vă mulțumesc pentru lectură și sper să ne revedem pe blogul nostru săptămâna viitoare!

    Caiet de practică

    Corelația Spearman Rank în Excel (fișier .xlsx)

    Michael Brown este un pasionat de tehnologie dedicat, cu o pasiune pentru simplificarea proceselor complexe folosind instrumente software. Cu mai mult de un deceniu de experiență în industria tehnologiei, el și-a perfecționat abilitățile în Microsoft Excel și Outlook, precum și în Google Sheets și Docs. Blogul lui Michael este dedicat împărtășirii cunoștințelor și experienței sale cu alții, oferind sfaturi și tutoriale ușor de urmat pentru îmbunătățirea productivității și eficienței. Indiferent dacă sunteți un profesionist experimentat sau un începător, blogul lui Michael oferă informații valoroase și sfaturi practice pentru a profita la maximum de aceste instrumente software esențiale.