Spearman rangsor korreláció Excelben: képlet és grafikon

  • Ossza Meg Ezt
Michael Brown

Az oktatóanyag egyszerű nyelven elmagyarázza a Spearman-féle korreláció alapjait, és bemutatja, hogyan lehet kiszámítani a Spearman-féle rangkorrelációs együtthatót Excelben.

Amikor korrelációelemzést végez Excelben, a legtöbb esetben a Pearson-féle korrelációval fog foglalkozni. Mivel azonban a Pearson-féle korrelációs együttható csak a két változó közötti lineáris kapcsolatot méri, nem minden adattípus esetében működik - előfordulhat, hogy a változók nem lineáris módon erősen összefüggnek, és az együttható mégis nulla közelében van. Ilyen körülmények között a Spearman-félerangkorreláció a Pearson-féle helyett.

    Spearman korreláció - az alapok

    A Spearman korreláció a Pearson-féle korrelációs együttható nem parametrikus változata, amely két változó közötti kapcsolat mértékét méri a rangsoruk alapján.

    A Pearson Product Moment korreláció teszteli a lineáris két folytonos változó közötti kapcsolat. A lineáris olyan kapcsolatot jelent, amikor két változó azonos irányban, állandó sebességgel változik.

    Spearman rangsor korreláció kiértékeli a monoton A monoton kapcsolat esetén a változók is hajlamosak együtt változni, de nem feltétlenül állandó ütemben.

    Mikor kell Spearman korrelációt végezni

    A Spearman-féle korrelációs elemzést a következő körülmények bármelyikében kell alkalmazni, ha a Pearson-féle korreláció alapfeltevései nem teljesülnek:

    1. Ha az adatai egy nem lineáris kapcsolat vagy nem normális eloszlásúak.
    2. Ha legalább egy változó ordinális Ha az értékek "első, második, harmadik..." sorrendbe állíthatók, akkor ordinális adatokkal van dolgunk.
    3. Ha vannak jelentős kiugró értékek A Pearson-féle korrelációval ellentétben a Spearman-féle korreláció nem érzékeny a kiugró értékekre, mivel a számításokat a rangsorokon végzi, így a tényleges értékek közötti különbségnek nincs jelentősége.

    A Spearman-féle korrelációt például a következő kérdésekre adott válaszok megadására használhatja:

    • A magasabb iskolai végzettségűek jobban aggódnak a környezetért?
    • A betegek tüneteinek száma összefügg a gyógyszeres kezelésre való hajlandóságukkal?

    Spearman korrelációs együttható

    A statisztikában a Spearman korrelációs együttható vagy a következőkkel jelölik r s vagy a görög betű ρ ("rho"), ezért gyakran nevezik Spearman rho .

    A Spearman-féle rangkorrelációs együttható az adatok rangsorai közötti kapcsolat erősségét és irányát is méri. -1 és 1 között bármilyen érték lehet, és minél közelebb van az együttható abszolút értéke az 1-hez, annál erősebb a kapcsolat:

    • 1 tökéletes pozitív korreláció
    • -1 tökéletes negatív korreláció
    • 0 nincs korreláció

    Spearman rangkorrelációs képlet

    Attól függően, hogy a rangsorolásban vannak-e vagy nincsenek kapcsolatok (két vagy több megfigyeléshez ugyanazt a rangsort rendelik), a Spearman-féle korrelációs együttható az alábbi képletek valamelyikével számítható ki.

    Ha vannak nincsenek kötött rangsorok , egy egyszerűbb képlet is megteszi:

    Hol:

    • d i a rangsorok párja közötti különbség
    • n a megfigyelések száma

    A következőkkel foglalkozni holtversenyben , a Spearman-féle korrelációs képlet teljes változatát kell használni, amely a Pearson-féle r kissé módosított változata:

    Hol:

    • R(x) és R(y) a rangsorok a x és y változók
    • R(x) és R(y) az átlagos rangsorok.

    Spearman korreláció kiszámítása Excelben a CORREL funkcióval

    Sajnálatos módon az Excel nem rendelkezik beépített funkcióval a Spearman-rangkorrelációs együttható kiszámításához. Ez azonban nem jelenti azt, hogy a fenti képletekkel kell törnie a fejét. Az Excel egy kis manipulálásával egy sokkal egyszerűbb módszert találhatunk a Spearman-korreláció elvégzésére.

    Példaként próbáljuk meg kideríteni, hogy a fizikai aktivitásunknak van-e valamilyen kapcsolata a vérnyomásunkkal. A B oszlopban van az a percszám, amit 10 azonos korú férfi naponta egy edzőteremben tölt, a C oszlopban pedig a szisztolés vérnyomásuk.

    A Spearman-féle korrelációs együttható Excelben történő meghatározásához hajtsa végre a következő lépéseket:

    1. Az adatok rangsorolása

      Mivel a Spearman-korreláció két változó közötti kapcsolatokat értékeli a rangsoruk alapján, a forrásadatokat rangsorolnia kell. Ez gyorsan elvégezhető az Excel RANK.AVG függvényének használatával.

      Az első változó (fizikai aktivitás) rangsorolásához írja be az alábbi képletet a D2-be, majd húzza le a D11-be:

      =RANK.AVG(B2,$B$2:$B$11,0)

      A második változó (vérnyomás) rangsorolásához tegye a következő képletet az E2 cellába, és másolja le az oszlopba:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Ahhoz, hogy a képletek megfelelően működjenek, kérjük, hogy a tartományokat abszolút cellahivatkozásokkal rögzítse.

      Ezen a ponton a forrásadatoknak ehhez hasonlóan kell kinézniük:

    2. Spearman korrelációs együttható keresése

      A rangsorok megállapításával most már használhatjuk az Excel CORREL funkcióját a Spearman rho kiszámításához:

      =CORREL(D2:D11, E2:E11)

      A képlet -0,7576-os együtthatót ad (4 számjegyre kerekítve), ami meglehetősen erős negatív korrelációt mutat, és arra enged következtetni, hogy minél többet mozog valaki, annál alacsonyabb a vérnyomása.

      A Pearson-féle korrelációs együttható ugyanerre a mintára (-0,7445) egy kicsit gyengébb korrelációt jelez, de statisztikailag még mindig szignifikáns:

    Ennek a módszernek az a szépsége, hogy gyors, egyszerű, és attól függetlenül működik, hogy a rangsorban van-e döntetlen vagy sem.

    Spearman korrelációs együttható kiszámítása Excelben hagyományos képlettel

    Ha nem vagy teljesen biztos benne, hogy a CORREL függvény helyesen számította ki a Spearman rho-t, akkor a statisztikában használt hagyományos képlettel is ellenőrizheted az eredményt. Íme, hogyan:

    1. Keresse meg az egyes rangsorpárok közötti különbséget ( d ) az egyik rangsor kivonásával a másikból:

      =D2-E2

      Ez a képlet az F2-be kerül, majd lemásolódik az oszlopba.

    2. Minden rangkülönbséget emeljük a kettő hatványára ( d2 ):

      =F2^2

      Ez a képlet a G oszlopba kerül.

    3. Adjuk össze a négyzetes különbségeket:

      =SUM(G2:G11)

      Ez a képlet bármelyik üres cellába mehet, esetünkben a G12-be.

      A következő képernyőképen valószínűleg jobban megértheti az adatok elrendezését:

    4. Attól függően, hogy az adatkészlete tartalmaz-e kötött rangsorokat vagy sem, használja az alábbi képletek egyikét a Spearman korrelációs együttható kiszámításához.

    A mi példánkban nincsenek döntetlenek, így egyszerűbb képletet használhatunk:

    A címen d2 290, és n (a megfigyelések száma) 10, a képlet a következő átalakulásokon megy keresztül:

    Az eredmény -0,75757575758 lesz, ami tökéletesen megegyezik az előző példában kiszámított Spearman korrelációs együtthatóval.

    A Microsoft Excelben a fenti számítások a következő egyenlet segítségével végezhetők el:

    =1-(6*G12/(10*(10^2-1)))

    Ahol G12 a rangsorok négyzetelt különbségeinek összege (d2).

    Spearman-korreláció Excelben, grafikon használatával

    Az Excelben a korrelációs együtthatók csak lineáris (Pearson) vagy monoton (Spearman) kapcsolatokat mérnek. Lehetségesek azonban más összefüggések is. Tehát függetlenül attól, hogy milyen korrelációt végez, mindig érdemes a változók közötti kapcsolatot grafikonon ábrázolni.

    A rangsorolt adatok korrelációs grafikonjának megrajzolásához a következőket kell tennie:

    1. Számítsa ki a rangsorokat a RANK.AVG függvény segítségével, ahogyan az ebben a példában szerepel.
    2. Jelöljön ki két oszlopot a rangsorokkal.
    3. Szúrjon be egy XY szórásdiagramot. Ehhez kattintson a Scatter chart ikon a Beépített lapon, a Beszélgetések csoport.
    4. Adjon hozzá egy trendvonalat a grafikonhoz. A leggyorsabb módja, ha a Diagram elemek gomb> Trendvonal hozzáadása... .
    5. Az R-négyzet értékének megjelenítése a grafikonon. Kattintson duplán a trendvonalra annak ablaktáblájának megnyitásához, váltson a Trendvonal lehetőségek lapot, és válassza ki a R-négyzet értékének megjelenítése a diagramon doboz.
    6. A nagyobb pontosság érdekében több számjegyet jelenítsen meg az R2 értékben.

    Ennek eredményeképpen vizuálisan is megjelenik a rangsorok közötti kapcsolat. Ezen felül a Meghatározási együttható (R2), amelynek négyzetgyöke a Pearson-féle korrelációs együttható (r). Mivel azonban a rangsorolt adatokat ábrázoltad, ez a Pearson-féle r nem más, mint a Spearman-féle rho.

    Megjegyzés: Az R-négyzet mindig pozitív szám, ezért a levezetett Spearman rangkorrelációs együttható is mindig pozitív lesz. A megfelelő előjel hozzáadásához csak nézze meg a korrelációs grafikon vonalát - a felfelé irányuló meredekség pozitív korrelációt (plusz jel), a lefelé irányuló meredekség pedig negatív korrelációt (mínusz jel) jelez.

    Esetünkben az R2 értéke 0,5739210285. Az SQRT függvény segítségével megkereshetjük a négyzetgyökét:

    =SQRT(0.5739210285)

    ...és a már ismert 0,75757575758-as együtthatót kapjuk.

    A lefelé irányuló lejtő a grafikonon negatív korrelációt mutat, ezért hozzáadjuk a mínusz előjelet, és megkapjuk a helyes Spearman korrelációs együtthatót: -0,75757575758.

    Így lehet kiszámítani a Spearman rangkorrelációs együtthatót Excelben. Ha közelebbről is meg szeretné nézni a bemutatóban tárgyalt példákat, akkor szívesen letölti az alábbi minta munkafüzetünket. Köszönöm, hogy elolvasta, és remélem, hogy jövő héten találkozunk a blogunkon!

    Gyakorló munkafüzet

    Spearman rangsor korreláció Excelben (.xlsx fájl)

    Michael Brown elkötelezett technológiai rajongó, aki szenvedélyesen egyszerűsíti a bonyolult folyamatokat szoftvereszközök segítségével. A technológiai iparban szerzett több mint egy évtizedes tapasztalatával a Microsoft Excel és az Outlook, valamint a Google Táblázatok és a Dokumentumok területén fejlesztette tudását. Michael blogja célja, hogy megossza tudását és szakértelmét másokkal, könnyen követhető tippeket és oktatóanyagokat adva a termelékenység és a hatékonyság javításához. Akár tapasztalt szakember, akár kezdő, Michael blogja értékes betekintést és gyakorlati tanácsokat kínál, amelyek segítségével a legtöbbet hozhatja ki ezekből az alapvető szoftvereszközökből.