Spearman-rangkorrelasie in Excel: formule en grafiek

  • Deel Dit
Michael Brown

Die tutoriaal verduidelik die basiese beginsels van Spearman-korrelasie in 'n eenvoudige taal en wys hoe om die Spearman-rangkorrelasiekoëffisiënt in Excel te bereken.

Wanneer korrelasie-analise in Excel gedoen word, in die meeste gevalle jy sal die Pearson-korrelasie hanteer. Maar omdat die Pearson-korrelasiekoëffisiënt slegs 'n lineêre verwantskap tussen twee veranderlikes meet, werk dit nie vir alle datatipes nie - jou veranderlikes kan sterk geassosieer word op 'n nie-lineêre manier en steeds die koëffisiënt naby aan nul hê. In sulke omstandighede kan jy die Spearman-rangkorrelasie in plaas van Pearson s'n doen.

    Spearman-korrelasie - die basiese

    Die Spearman-korrelasie is die nieparametriese weergawe van die Pearson-korrelasiekoëffisiënt wat die mate van assosiasie tussen twee veranderlikes op grond van hul geledere meet.

    Die Pearson-produk-momentkorrelasie toets die lineêre -verwantskap tussen twee kontinue veranderlikes. Lineêr beteken 'n verwantskap wanneer twee veranderlikes in dieselfde rigting verander teen 'n konstante tempo.

    Spearman Rank Correlation evalueer die monotoniese verhouding tussen die gerangorde waardes. In 'n monotoniese verhouding is die veranderlikes ook geneig om saam te verander, maar nie noodwendig teen 'n konstante tempo nie.

    Wanneer om Spearman-korrelasie te doen

    Die Spearman-korrelasie-analise moet gebruik word in enige van die volgendeomstandighede wanneer die onderliggende aannames van die Pearson-korrelasie nie nagekom word nie:

    1. As jou data 'n nie-lineêre -verwantskap toon of nie normaalverspreid is nie.
    2. Indien ten minste een veranderlike is ordinaal . As jou waardes in "eerste, tweede, derde ..." volgorde geplaas kan word, het jy te doen met ordinale data.
    3. As daar beduidende uitskieters is. Anders as die Pearson-korrelasie, is die Spearman-korrelasie nie sensitief vir uitskieters nie omdat dit berekeninge op die rangorde uitvoer, dus het die verskil tussen werklike waardes nie betekenis nie.

    Jy kan byvoorbeeld die Spearman-korrelasie gebruik om die antwoorde op die volgende vrae te vind:

    • Is mense met 'n hoër vlak van opvoeding meer bekommerd oor die omgewing?
    • Het die aantal simptome wat 'n pasiënt het verband met hul gewilligheid om medikasie te neem?

    Spearman-korrelasiekoëffisiënt

    In statistieke word die Spearman-korrelasiekoëffisiënt verteenwoordig deur óf r s of die Griekse letter ρ ("rho"), en daarom word dit dikwels Spearman's rho genoem.

    Die Spearman-rangkorrelasiekoëffisiënt meet beide die sterkte en rigting van die verhouding tussen die geledere van data. Dit kan enige waarde van -1 tot 1 wees, en hoe nader die absolute waarde van die koëffisiënt aan 1 is, hoe sterker is die verwantskap:

    • 1 is 'n perfekte positiefkorrelasie
    • -1 is 'n perfekte negatiewe korrelasie
    • 0 is geen korrelasie

    Spearman rangkorrelasie formule

    Afhangende of daar is of daar geen bande in die rangorde is nie (dieselfde rang toegeken aan twee of meer waarnemings), kan die Spearman-korrelasiekoëffisiënt met een van die volgende formules bereken word.

    As daar geen gelyke rangorde is nie , 'n eenvoudiger formule sal doen:

    Waar:

    • d i die verskil is tussen 'n paar geledere
    • n is die aantal waarnemings

    Om te gaan met gebonde geledere , die volledige weergawe van Spearman-korrelasie formule moet gebruik word, wat 'n effens gewysigde weergawe is van Pearson se r:

    Where:

    • R(x) en R(y ) is die geledere van die x en y veranderlikes
    • R(x) en R(y) is die gemiddelde geledere

    Hoe om Spearman-korrelasie in Excel met CORREL-funksie te bereken

    Ongelukkig het Excel nie 'n ingeboude funksie om die Spea te bereken nie rman rangkorrelasiekoëffisiënt. Dit beteken egter nie dat jy jou brein met die bogenoemde formules sal moet rek nie. Deur Excel 'n bietjie te manipuleer, kan ons 'n baie eenvoudiger manier kry om Spearman-korrelasie te doen.

    As 'n voorbeeld, kom ons probeer uitvind of ons fisiese aktiwiteit enige verband hou met ons bloeddruk. In kolom B het ons die aantal minute wat 10 mans van dieselfde ouderdom spandeerdaagliks in 'n gimnasium, en in kolom C, het ons hul sistoliese bloeddruk.

    Om die Spearman-korrelasiekoëffisiënt in Excel te vind, voer hierdie stappe uit:

    1. Rangskik jou data

      Omdat die Spearman-korrelasie die assosiasies tussen twee veranderlikes evalueer op grond van hul geledere, moet jy jou brondata rangskik. Dit kan vinnig gedoen word deur die Excel RANK.AVG-funksie te gebruik.

      Om die eerste veranderlike (fisiese aktiwiteit) te rangskik, voer die onderstaande formule in D2 in en sleep dit dan af na D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Om die tweede veranderlike (bloeddruk) te rangskik, plaas die volgende formule in sel E2 en kopieer dit in die kolom af:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Vir die formules om korrek te werk , maak asseblief seker dat jy die reekse met absolute selverwysings sluit.

      Op hierdie stadium behoort jou brondata soortgelyk soos hierdie te lyk:

    2. Vind Spearman-korrelasiekoëffisiënt

      Met die geledere vasgestel, kan ons nou die Excel CORREL-funksie gebruik om Spearman se rho te kry:

      =CORREL(D2:D11, E2:E11)

      Die formule gee 'n koëffisiënt van -0.7576 (afgerond tot 4 syfers), wat 'n redelik sterk negatiewe korrelasie toon en ons toelaat om tot die gevolgtrekking te kom dat hoe meer 'n persoon oefen, hoe laer is hul bloeddruk.

      Die Pearson-korrelasiekoëffisiënt vir dieselfde steekproef (- 0.7445) dui op 'n bietjie swakker korrelasie, maar steeds statistica lly significant:

    Die skoonheid hiervanmetode is dat dit vinnig, maklik is en werk ongeag of daar bande in die rangorde is of nie.

    Bereken Spearman-korrelasiekoëffisiënt in Excel met tradisionele formule

    As jy nie heeltemal seker is nie dat die CORREL-funksie Spearman se rho reg bereken het, kan jy die resultaat verifieer met die tradisionele formule wat in statistiek gebruik word. Hier is hoe:

    1. Vind die verskil tussen elke paar geledere ( d ) deur een rang van die ander af te trek:

      =D2-E2

      Hierdie formule gaan na F2 en word dan in die kolom af gekopieer.

    2. Verhoog elke rangverskil tot die krag van twee ( d2 ):

      =F2^2

      Hierdie formule gaan na kolom G.

    3. Tel die kwadraatverskille by:

      =SUM(G2:G11)

      Hierdie formule kan na enige leë sel gaan, G12 in ons geval.

      Uit die volgende skermkiekie sal jy waarskynlik beter kry begrip van die datarangskikking:

    4. Gebruik een van hierdie formules om die Spearman-korrelasiekoëffisiënt te bereken, afhangend van of jou datastel enige gebonde rangorde het of nie.

    In ons voorbeeld is daar geen bande nie, dus kan ons met 'n eenvoudiger formule gaan:

    Met d2 gelyk tot 290, en n (aantal waarnemings) gelyk aan 10, ondergaan die formule die volgende transformasies:

    As gevolg hiervan kry jy -0.757575758 , wat perfek ooreenstem met die Spearman-korrelasiekoëffisiënt wat in dievorige voorbeeld.

    In Microsoft Excel kan die bogenoemde berekeninge uitgevoer word met die volgende vergelyking:

    =1-(6*G12/(10*(10^2-1)))

    Waar G12 die som van die kwadraatrangverskille is (d2) .

    Hoe om Spearman-korrelasie in Excel te doen deur 'n grafiek te gebruik

    Die korrelasiekoëffisiënte in Excel meet slegs lineêre (Pearson) of monotoniese (Spearman) verwantskappe. Ander assosiasies is egter moontlik. Dus, maak nie saak watter korrelasie jy doen nie, dit is altyd 'n goeie idee om die verwantskap tussen die veranderlikes in 'n grafiek voor te stel.

    Om 'n korrelasiegrafiek vir die gerangorde data te teken, is wat jy moet doen:

    1. Bereken die range deur die RANK.AVG-funksie te gebruik soos in hierdie voorbeeld verduidelik.
    2. Kies twee kolomme met die range.
    3. Voeg 'n XY-verspreidingsgrafiek in. Klik hiervoor op die Scatter grafiek -ikoon op die Inset -oortjie, in die Klets -groep.
    4. Voeg 'n tendenslyn na jou grafiek. Die vinnigste manier is om die Kaartelemente -knoppie > Voeg neiginglyn by... te klik.
    5. Vertoon R-kwadraatwaarde op die grafiek. Dubbelklik op die tendenslyn om sy paneel oop te maak, skakel oor na die Tendenslynopsies -oortjie en kies die Vertoon R-kwadraatwaarde op grafiek -blokkie.
    6. Wys meer syfers in die R2-waarde vir beter akkuraatheid.

    As gevolg hiervan sal jy 'n visuele voorstelling van die verhouding tussen die range kry. Daarbenewens sal jy die Bepalingskoëffisiënt (R2), waarvan die vierkantswortel die Pearson-korrelasiekoëffisiënt (r) is. Maar omdat jy die gerangskik data geplot het, is hierdie Pearson se r niks anders as Spearman se rho nie.

    Let wel. R-kwadraat is altyd 'n positiewe getal, dus sal die afgeleide Spearman rangkorrelasiekoëffisiënt ook altyd positief wees. Om 'n gepaste teken by te voeg, kyk net na die lyn in jou korrelasiegrafiek - 'n opwaartse helling dui op 'n positiewe korrelasie (plusteken) en 'n afwaartse helling dui op 'n negatiewe korrelasie (minusteken).

    In ons geval is R2 gelyk aan 0,5739210285. Gebruik die SQRT-funksie om die vierkantswortel te vind:

    =SQRT(0.5739210285)

    ...en jy sal die reeds bekende koëffisiënt van 0.757575758 kry.

    Die afwaartse helling in die grafiek vertoon 'n negatiewe korrelasie, dus voeg ons die minusteken by en kry die korrekte Spearman-korrelasiekoëffisiënt van -0.757575758.

    Dis hoe jy die Spearman-rangkorrelasiekoëffisiënt in Excel kan bereken. Om die voorbeelde wat in hierdie tutoriaal bespreek word van nader te bekyk, is u welkom om ons voorbeeldwerkboek hieronder af te laai. Ek bedank jou vir die lees en hoop om jou volgende week op ons blog te sien!

    Oefenwerkboek

    Spearman Rank Correlation in Excel (.xlsx-lêer)

    Michael Brown is 'n toegewyde tegnologie-entoesias met 'n passie om komplekse prosesse te vereenvoudig deur sagteware-instrumente te gebruik. Met meer as 'n dekade se ondervinding in die tegnologiebedryf, het hy sy vaardighede in Microsoft Excel en Outlook, sowel as Google Sheets en Docs, opgeskerp. Michael se blog is toegewy daaraan om sy kennis en kundigheid met ander te deel, en verskaf maklik-om-te volg wenke en tutoriale vir die verbetering van produktiwiteit en doeltreffendheid. Of jy nou 'n ervare professionele persoon of 'n beginner is, Michael se blog bied waardevolle insigte en praktiese raad om die meeste uit hierdie noodsaaklike sagteware-nutsmiddels te kry.