Tartalomjegyzék
Az oktatóanyag egyszerű nyelven elmagyarázza a Spearman-féle korreláció alapjait, és bemutatja, hogyan lehet kiszámítani a Spearman-féle rangkorrelációs együtthatót Excelben.
Amikor korrelációelemzést végez Excelben, a legtöbb esetben a Pearson-féle korrelációval fog foglalkozni. Mivel azonban a Pearson-féle korrelációs együttható csak a két változó közötti lineáris kapcsolatot méri, nem minden adattípus esetében működik - előfordulhat, hogy a változók nem lineáris módon erősen összefüggnek, és az együttható mégis nulla közelében van. Ilyen körülmények között a Spearman-félerangkorreláció a Pearson-féle helyett.
Spearman korreláció - az alapok
A Spearman korreláció a Pearson-féle korrelációs együttható nem parametrikus változata, amely két változó közötti kapcsolat mértékét méri a rangsoruk alapján.
A Pearson Product Moment korreláció teszteli a lineáris két folytonos változó közötti kapcsolat. A lineáris olyan kapcsolatot jelent, amikor két változó azonos irányban, állandó sebességgel változik.
Spearman rangsor korreláció kiértékeli a monoton A monoton kapcsolat esetén a változók is hajlamosak együtt változni, de nem feltétlenül állandó ütemben.
Mikor kell Spearman korrelációt végezni
A Spearman-féle korrelációs elemzést a következő körülmények bármelyikében kell alkalmazni, ha a Pearson-féle korreláció alapfeltevései nem teljesülnek:
- Ha az adatai egy nem lineáris kapcsolat vagy nem normális eloszlásúak.
- Ha legalább egy változó ordinális Ha az értékek "első, második, harmadik..." sorrendbe állíthatók, akkor ordinális adatokkal van dolgunk.
- Ha vannak jelentős kiugró értékek A Pearson-féle korrelációval ellentétben a Spearman-féle korreláció nem érzékeny a kiugró értékekre, mivel a számításokat a rangsorokon végzi, így a tényleges értékek közötti különbségnek nincs jelentősége.
A Spearman-féle korrelációt például a következő kérdésekre adott válaszok megadására használhatja:
- A magasabb iskolai végzettségűek jobban aggódnak a környezetért?
- A betegek tüneteinek száma összefügg a gyógyszeres kezelésre való hajlandóságukkal?
Spearman korrelációs együttható
A statisztikában a Spearman korrelációs együttható vagy a következőkkel jelölik r s vagy a görög betű ρ ("rho"), ezért gyakran nevezik Spearman rho .
A Spearman-féle rangkorrelációs együttható az adatok rangsorai közötti kapcsolat erősségét és irányát is méri. -1 és 1 között bármilyen érték lehet, és minél közelebb van az együttható abszolút értéke az 1-hez, annál erősebb a kapcsolat:
- 1 tökéletes pozitív korreláció
- -1 tökéletes negatív korreláció
- 0 nincs korreláció
Spearman rangkorrelációs képlet
Attól függően, hogy a rangsorolásban vannak-e vagy nincsenek kapcsolatok (két vagy több megfigyeléshez ugyanazt a rangsort rendelik), a Spearman-féle korrelációs együttható az alábbi képletek valamelyikével számítható ki.
Ha vannak nincsenek kötött rangsorok , egy egyszerűbb képlet is megteszi:
Hol:
- d i a rangsorok párja közötti különbség
- n a megfigyelések száma
A következőkkel foglalkozni holtversenyben , a Spearman-féle korrelációs képlet teljes változatát kell használni, amely a Pearson-féle r kissé módosított változata:
Hol:
- R(x) és R(y) a rangsorok a x és y változók
- R(x) és R(y) az átlagos rangsorok.
Spearman korreláció kiszámítása Excelben a CORREL funkcióval
Sajnálatos módon az Excel nem rendelkezik beépített funkcióval a Spearman-rangkorrelációs együttható kiszámításához. Ez azonban nem jelenti azt, hogy a fenti képletekkel kell törnie a fejét. Az Excel egy kis manipulálásával egy sokkal egyszerűbb módszert találhatunk a Spearman-korreláció elvégzésére.
Példaként próbáljuk meg kideríteni, hogy a fizikai aktivitásunknak van-e valamilyen kapcsolata a vérnyomásunkkal. A B oszlopban van az a percszám, amit 10 azonos korú férfi naponta egy edzőteremben tölt, a C oszlopban pedig a szisztolés vérnyomásuk.
A Spearman-féle korrelációs együttható Excelben történő meghatározásához hajtsa végre a következő lépéseket:
- Az adatok rangsorolása
Mivel a Spearman-korreláció két változó közötti kapcsolatokat értékeli a rangsoruk alapján, a forrásadatokat rangsorolnia kell. Ez gyorsan elvégezhető az Excel RANK.AVG függvényének használatával.
Az első változó (fizikai aktivitás) rangsorolásához írja be az alábbi képletet a D2-be, majd húzza le a D11-be:
=RANK.AVG(B2,$B$2:$B$11,0)
A második változó (vérnyomás) rangsorolásához tegye a következő képletet az E2 cellába, és másolja le az oszlopba:
=RANK.AVG(C2,$C$2:$C$11,0)
Ahhoz, hogy a képletek megfelelően működjenek, kérjük, hogy a tartományokat abszolút cellahivatkozásokkal rögzítse.
Ezen a ponton a forrásadatoknak ehhez hasonlóan kell kinézniük:
- Spearman korrelációs együttható keresése
A rangsorok megállapításával most már használhatjuk az Excel CORREL funkcióját a Spearman rho kiszámításához:
=CORREL(D2:D11, E2:E11)
A képlet -0,7576-os együtthatót ad (4 számjegyre kerekítve), ami meglehetősen erős negatív korrelációt mutat, és arra enged következtetni, hogy minél többet mozog valaki, annál alacsonyabb a vérnyomása.
A Pearson-féle korrelációs együttható ugyanerre a mintára (-0,7445) egy kicsit gyengébb korrelációt jelez, de statisztikailag még mindig szignifikáns:
Ennek a módszernek az a szépsége, hogy gyors, egyszerű, és attól függetlenül működik, hogy a rangsorban van-e döntetlen vagy sem.
Spearman korrelációs együttható kiszámítása Excelben hagyományos képlettel
Ha nem vagy teljesen biztos benne, hogy a CORREL függvény helyesen számította ki a Spearman rho-t, akkor a statisztikában használt hagyományos képlettel is ellenőrizheted az eredményt. Íme, hogyan:
- Keresse meg az egyes rangsorpárok közötti különbséget ( d ) az egyik rangsor kivonásával a másikból:
=D2-E2
Ez a képlet az F2-be kerül, majd lemásolódik az oszlopba.
- Minden rangkülönbséget emeljük a kettő hatványára ( d2 ):
=F2^2
Ez a képlet a G oszlopba kerül.
- Adjuk össze a négyzetes különbségeket:
=SUM(G2:G11)
Ez a képlet bármelyik üres cellába mehet, esetünkben a G12-be.
A következő képernyőképen valószínűleg jobban megértheti az adatok elrendezését:
- Attól függően, hogy az adatkészlete tartalmaz-e kötött rangsorokat vagy sem, használja az alábbi képletek egyikét a Spearman korrelációs együttható kiszámításához.
A mi példánkban nincsenek döntetlenek, így egyszerűbb képletet használhatunk:
A címen d2 290, és n (a megfigyelések száma) 10, a képlet a következő átalakulásokon megy keresztül:
Az eredmény -0,75757575758 lesz, ami tökéletesen megegyezik az előző példában kiszámított Spearman korrelációs együtthatóval.
A Microsoft Excelben a fenti számítások a következő egyenlet segítségével végezhetők el:
=1-(6*G12/(10*(10^2-1)))
Ahol G12 a rangsorok négyzetelt különbségeinek összege (d2).
Spearman-korreláció Excelben, grafikon használatával
Az Excelben a korrelációs együtthatók csak lineáris (Pearson) vagy monoton (Spearman) kapcsolatokat mérnek. Lehetségesek azonban más összefüggések is. Tehát függetlenül attól, hogy milyen korrelációt végez, mindig érdemes a változók közötti kapcsolatot grafikonon ábrázolni.
A rangsorolt adatok korrelációs grafikonjának megrajzolásához a következőket kell tennie:
- Számítsa ki a rangsorokat a RANK.AVG függvény segítségével, ahogyan az ebben a példában szerepel.
- Jelöljön ki két oszlopot a rangsorokkal.
- Szúrjon be egy XY szórásdiagramot. Ehhez kattintson a Scatter chart ikon a Beépített lapon, a Beszélgetések csoport.
- Adjon hozzá egy trendvonalat a grafikonhoz. A leggyorsabb módja, ha a Diagram elemek gomb> Trendvonal hozzáadása... .
- Az R-négyzet értékének megjelenítése a grafikonon. Kattintson duplán a trendvonalra annak ablaktáblájának megnyitásához, váltson a Trendvonal lehetőségek lapot, és válassza ki a R-négyzet értékének megjelenítése a diagramon doboz.
- A nagyobb pontosság érdekében több számjegyet jelenítsen meg az R2 értékben.
Ennek eredményeképpen vizuálisan is megjelenik a rangsorok közötti kapcsolat. Ezen felül a Meghatározási együttható (R2), amelynek négyzetgyöke a Pearson-féle korrelációs együttható (r). Mivel azonban a rangsorolt adatokat ábrázoltad, ez a Pearson-féle r nem más, mint a Spearman-féle rho.
Megjegyzés: Az R-négyzet mindig pozitív szám, ezért a levezetett Spearman rangkorrelációs együttható is mindig pozitív lesz. A megfelelő előjel hozzáadásához csak nézze meg a korrelációs grafikon vonalát - a felfelé irányuló meredekség pozitív korrelációt (plusz jel), a lefelé irányuló meredekség pedig negatív korrelációt (mínusz jel) jelez.
Esetünkben az R2 értéke 0,5739210285. Az SQRT függvény segítségével megkereshetjük a négyzetgyökét:
=SQRT(0.5739210285)
...és a már ismert 0,75757575758-as együtthatót kapjuk.
A lefelé irányuló lejtő a grafikonon negatív korrelációt mutat, ezért hozzáadjuk a mínusz előjelet, és megkapjuk a helyes Spearman korrelációs együtthatót: -0,75757575758.
Így lehet kiszámítani a Spearman rangkorrelációs együtthatót Excelben. Ha közelebbről is meg szeretné nézni a bemutatóban tárgyalt példákat, akkor szívesen letölti az alábbi minta munkafüzetünket. Köszönöm, hogy elolvasta, és remélem, hogy jövő héten találkozunk a blogunkon!
Gyakorló munkafüzet
Spearman rangsor korreláció Excelben (.xlsx fájl)