Spearman rangkorrelaasje yn Excel: formule en grafyk

  • Diel Dit
Michael Brown

De tutorial ferklearret de basis fan Spearman-korrelaasje yn in ienfâldige taal en lit sjen hoe't jo de Spearman-rangkorrelaasjekoëffisjint yn Excel kinne berekkenje.

By it dwaan fan korrelaasjeanalyse yn Excel, yn 'e measte gefallen jo sille omgean mei de Pearson-korrelaasje. Mar om't de Pearson-korrelaasjekoëffisjint allinich in lineêre relaasje mjit tusken twa fariabelen, wurket it net foar alle gegevenstypen - jo fariabelen kinne sterk assosjeare wurde op in net-lineêre manier en hawwe de koeffizient noch altyd tichtby nul. Yn sokke omstannichheden kinne jo de Spearman-rangkorrelaasje dwaan ynstee fan Pearson's.

    Spearman-korrelaasje - de basis

    De Spearman-korrelaasje is de nonparametric ferzje fan 'e Pearson-korrelaasjekoëffisjint dy't de mjitte fan assosjaasje mjitten tusken twa fariabelen basearre op har rangen.

    De Pearson Product Moment Correlation testet de lineêre relaasje tusken twa kontinuze fariabelen. Linear betsjut in relaasje as twa fariabelen feroarje yn deselde rjochting mei in konstante taryf.

    Spearman Rank Correlation evaluearret de monotone relaasje tusken de rangearre wearden. Yn in monotone relaasje hawwe de fariabelen ek de neiging om tegearre te feroarjen, mar net needsaaklik mei in konstante taryf.

    When to do Spearman correlation

    De Spearman correlation analysis is to used in any of the folgjendomstannichheden as de ûnderlizzende oannames fan 'e Pearson-korrelaasje net foldien wurde:

    1. As jo ​​gegevens in net-lineêre -relaasje fertoane of net normaal ferdield binne.
    2. op syn minst ien fariabele is ordinaal . As jo ​​wearden kinne wurde pleatst yn "earste, twadde, tredde ..." folchoarder, jo hawwe te krijen mei ordinale gegevens.
    3. As der signifikante outliers . Oars as de Pearson-korrelaasje is de Spearman-korrelaasje net gefoelich foar outliers, om't it berekkeningen op 'e rangen docht, sadat it ferskil tusken werklike wearden gjin betsjutting hat.

    Jo kinne bygelyks de Spearman-korrelaasje brûke om de antwurden te finen op de folgjende fragen:

    • Binne minsken mei in heger ûnderwiis mear soargen oer it miljeu?
    • Is it oantal symptomen dat in pasjint hat relatearre oan har reewilligens medikaasje nimme?

    Spearman-korrelaasjekoëffisjint

    Yn statistiken wurdt de Spearman-korrelaasjekoëffisjint fertsjintwurdige troch of r s of de Grykske letter ρ ("rho"), dêrom wurdt it faaks Spearman's rho neamd.

    De Spearman rangkorrelaasjekoëffisjint mjit sawol de sterkte en rjochting fan 'e relaasje tusken de rigen fan gegevens. It kin elke wearde wêze fan -1 oant 1, en hoe tichter de absolute wearde fan 'e koeffizient by 1 is, hoe sterker de relaasje:

    • 1 is in perfekte posityfkorrelaasje
    • -1 is in perfekte negative korrelaasje
    • 0 is gjin korrelaasje

    Spearman rangkorrelaasjeformule

    Ofhinklik fan oft der binne of dêr binne gjin bannen yn 'e ranglist (deselde rang tawiisd oan twa of mear observaasjes), kin de Spearman-korrelaasjekoëffisjint berekkene wurde mei ien fan' e folgjende formules.

    As der gjin bûnte rangen binne , in ienfâldiger formule sil dwaan:

    Wêr:

    • d i is it ferskil tusken in pear rangen
    • n is it oantal observaasjes

    Om te gean mei bûne rangen , de folsleine ferzje fan Spearman-korrelaasje formule moat brûkt wurde, dat is in wat feroare ferzje fan Pearson's r:

    Wêr:

    • R(x) en R(y ) binne de rangen fan de x en y fariabelen
    • R(x) en R(y) binne de gemiddelde rangen

    Hoe Spearman-korrelaasje te berekkenjen yn Excel mei CORREL-funksje

    Spitigernôch hat Excel gjin ynboude funksje foar it berekkenjen fan de Spea rman rang korrelaasje koëffisjint. Dat betsjut lykwols net dat jo jo harsens moatte rackje mei de boppesteande formules. Troch Excel in bytsje te manipulearjen kinne wy ​​in folle ienfâldiger manier komme om Spearman-korrelaasje te dwaan.

    Litte wy as foarbyld besykje út te finen oft ús fysike aktiviteit in relaasje hat mei ús bloeddruk. Yn kolom B hawwe wy it oantal minuten dat 10 manlju fan deselde leeftyd besteegjedeistich yn in gym, en yn kolom C, hawwe wy harren systolike bloeddruk.

    Om de Spearman-korrelaasjekoëffisjint yn Excel te finen, fiere dizze stappen út:

    1. Rangearje jo gegevens

      Om't de Spearman-korrelaasje de assosjaasjes tusken twa fariabelen evaluearret op basis fan har rangen, moatte jo jo boarnegegevens rangearje. Dit kin fluch dien wurde troch de Excel RANK.AVG-funksje te brûken.

      Om de earste fariabele (fysike aktiviteit) te rangearjen, fier de ûndersteande formule yn D2 yn en sleep it dan nei D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Om de twadde fariabele (bloeddruk) te rangearjen, set de folgjende formule yn sel E2 en kopiearje it yn 'e kolom:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Foar de formules om goed te wurkjen , wês asjebleaft der wis fan dat jo de berik mei absolute selferwizings beskoattelje.

      Op dit punt moatte jo boarnegegevens sa lykje:

    2. Fyn Spearman-korrelaasjekoëffisjint

      Mei de rangen fêststeld, kinne wy ​​no de Excel CORREL-funksje brûke om Spearman's rho te krijen:

      =CORREL(D2:D11, E2:E11)

      De formule jout in koeffizient werom fan -0.7576 (ôfrûn op 4 sifers), dy't in frij sterke negative korrelaasje toant en lit ús konkludearje dat hoe mear in persoan oefenet, hoe leger har bloeddruk.

      De Pearson-korrelaasjekoëffisjint foar deselde stekproef (- 0.7445) jout in wat swakkere korrelaasje oan, mar noch statistica lly wichtich:

    De skientme fan ditmetoade is dat it fluch, maklik is en wurket, nettsjinsteande oft der bannen binne yn 'e ranglist of net.

    Berekkenje Spearman-korrelaasjekoëffisjint yn Excel mei tradisjonele formule

    As jo ​​net hielendal wis binne dat de CORREL funksje hat berekkene Spearman syn rho rjochts, kinne jo ferifiearje it resultaat mei de tradisjonele formule brûkt yn statistyk. Hjir is hoe:

    1. Fyn it ferskil tusken elk pear rangen ( d ) troch de iene rang fan 'e oare te subtrahearjen:

      =D2-E2

      Dizze formule giet nei F2 en wurdt dan de kolom nei ûnderen kopiearre.

    2. Ferheegje elk rangferskil ta de macht fan twa ( d2 ):

      =F2^2

      Dizze formule giet nei kolom G.

    3. Tafoegje de kwadraten ferskillen op:

      =SUM(G2:G11)

      Dizze formule kin nei elke lege sel gean, G12 yn ús gefal.

      Fan 'e folgjende skermôfbylding sille jo wierskynlik better krije begryp fan 'e gegevensarrangement:

    4. Ofhinklik fan oft jo gegevensset al of net ferbûne rangen hat, brûk ien fan dizze formules om de Spearman-korrelaasjekoëffisjint te berekkenjen.

    Yn ús foarbyld binne d'r gjin bannen, dus kinne wy ​​​​gean mei in ienfâldiger formule:

    Mei d2 lykweardich nei 290, en n (oantal waarnimmings) lyk oan 10, de formule ûndergiet de folgjende transformaasjes:

    As resultaat krije jo -0.757575758 , dy't perfekt oerienkomt mei de Spearman-korrelaasjekoëffisjint berekkene yn 'efoarige foarbyld.

    Yn Microsoft Excel kinne de boppesteande berekkeningen útfierd wurde mei de folgjende fergeliking:

    =1-(6*G12/(10*(10^2-1)))

    Dêr't G12 de som is fan 'e kwadraatrangferskillen (d2) .

    Hoe kin ik Spearman-korrelaasje dwaan yn Excel mei in grafyk

    De korrelaasjekoeffisienten yn Excel mjitte allinich lineêre (Pearson) of monotonyske (Spearman) relaasjes. Oare ferienings binne lykwols mooglik. Dus, nettsjinsteande hokker korrelaasje jo dogge, it is altyd in goed idee om de relaasje tusken de fariabelen yn in grafyk te fertsjintwurdigjen.

    Om in korrelaasjegrafyk te tekenjen foar de rangoarde gegevens, is dit wat jo moatte dwaan:

    1. Berekkenje de rangen troch de funksje RANK.AVG te brûken lykas útlein yn dit foarbyld.
    2. Selektearje twa kolommen mei de rangen.
    3. Foegje in XY-spriedingskaart yn. Klikje hjirfoar op it ikoan Scatter diagram op it ljepblêd Ynset , yn de groep Chats .
    4. Foegje in trendline nei jo diagram. De fluchste manier is om op de knop Chart Elements te klikken > Trendline taheakje ... .
    5. Werjaan R-kwadraatwearde op it diagram. Dûbelklikje op de trendline om it paniel te iepenjen, wikselje nei it ljepblêd Trendline-opsjes en selektearje it fak R-kwadraatwearde werjaan op diagram .
    6. Lit mear sifers sjen yn 'e R2-wearde foar bettere krektens.

    As resultaat krije jo in fisuele foarstelling fan 'e relaasje tusken de rigen. Dêrneist krije jo de Bepalingskoëffisjint (R2), wêrfan de fjouwerkantswoartel de Pearson-korrelaasjekoëffisjint (r) is. Mar om't jo de rangoardere gegevens útsteld hawwe, is dizze Pearson's r neat oars as Spearman's rho.

    Opmerking. R-kwadraat is altyd in posityf getal, dêrom sil de ôflaat Spearman rangkorrelaasjekoëffisjint ek altyd posityf wêze. Om in passend teken ta te foegjen, sjoch gewoan nei de line yn jo korrelaasjegrafyk - in opwaartse helling jout in positive korrelaasje (plusteken) oan en in downward helling in negative korrelaasje (minteken).

    Yn ús gefal is R2 lyk oan 0,5739210285. Brûk de SQRT-funksje om de fjouwerkantswoartel te finen:

    =SQRT(0.5739210285)

    ...en jo krije de al bekende koëffisjint fan 0,757575758.

    De delslach yn 'e grafyk lit in negatyf sjen korrelaasje, dus foegje wy it minteken ta en krije de juste Spearman-korrelaasjekoëffisjint fan -0,757575758.

    Sa kinne jo de Spearman-rangkorrelaasjekoëffisjint yn Excel berekkenje. Om de foarbylden dy't yn dizze tutorial besprutsen binne tichterby te besjen, binne jo wolkom om ús foarbyldwurkboek hjirûnder te downloaden. Ik tankje jo foar it lêzen en hoopje jo nije wike op ús blog te sjen!

    Oefenwurkboek

    Spearman Rank Correlation yn Excel (.xlsx-bestân)

    Michael Brown is in tawijd technology-entûsjast mei in passy foar it ferienfâldigjen fan komplekse prosessen mei software-ark. Mei mear as in desennium ûnderfining yn 'e tech-yndustry hat hy syn feardigens yn Microsoft Excel en Outlook, lykas Google Blêden en Docs, oanskerpe. Michael's blog is wijd oan it dielen fan syn kennis en ekspertize mei oaren, en biedt maklik te folgjen tips en tutorials foar it ferbetterjen fan produktiviteit en effisjinsje. Oft jo in betûfte profesjonele of in begjinner binne, Michael's blog biedt weardefolle ynsjoch en praktysk advys om it measte út dizze essensjele software-ark te heljen.