Spearmanova korelácia hodnôt v programe Excel: vzorec a graf

  • Zdieľajte To
Michael Brown

V učebnici sú jednoduchým jazykom vysvetlené základy Spearmanovej korelácie a je v nej ukázané, ako vypočítať Spearmanov koeficient korelácie v programe Excel.

Pri vykonávaní korelačnej analýzy v programe Excel sa vo väčšine prípadov zaoberáte Pearsonovou koreláciou. Keďže však Pearsonov korelačný koeficient meria len lineárny vzťah medzi dvoma premennými, nefunguje pre všetky typy údajov - vaše premenné môžu byť silne spojené nelineárnym spôsobom a napriek tomu sa ich koeficient blíži k nule. Za takýchto okolností môžete vykonať Spearmanovunamiesto Pearsonovej korelácie.

    Spearmanova korelácia - základy

    Stránka Spearmanova korelácia je neparametrická verzia Pearsonovho korelačného koeficientu, ktorá meria stupeň asociácie medzi dvoma premennými na základe ich poradia.

    Stránka Pearsonova produktová momentová korelácia testuje lineárne vzťah medzi dvoma spojitými premennými. Lineárny znamená vzťah, keď sa dve premenné menia rovnakým smerom konštantnou rýchlosťou.

    Spearmanova rangová korelácia vyhodnocuje monotónne V monotónnom vzťahu majú premenné tiež tendenciu meniť sa spoločne, ale nie nevyhnutne konštantnou rýchlosťou.

    Kedy vykonať Spearmanovu koreláciu

    Spearmanova korelačná analýza sa má použiť v ktoromkoľvek z nasledujúcich prípadov, keď nie sú splnené základné predpoklady Pearsonovej korelácie:

    1. Ak vaše údaje vykazujú nelineárne vzťah alebo nie sú normálne rozdelené.
    2. Ak je aspoň jedna premenná poradové číslo Ak sa vaše hodnoty dajú zoradiť v poradí "prvý, druhý, tretí...", máte do činenia s poradovými údajmi.
    3. Ak sa vyskytnú významné odľahlé hodnoty . na rozdiel od Pearsonovej korelácie Spearmanova korelácia nie je citlivá na odľahlé hodnoty, pretože výpočty vykonáva na radoch, takže rozdiel medzi skutočnými hodnotami nemá význam.

    Spearmanovu koreláciu môžete použiť napríklad na zistenie odpovedí na nasledujúce otázky:

    • Majú ľudia s vyšším vzdelaním väčší záujem o životné prostredie?
    • Súvisí počet symptómov, ktoré pacient má, s jeho ochotou užívať lieky?

    Spearmanov korelačný koeficient

    V štatistikách sa Spearmanov korelačný koeficient je reprezentovaný buď r s alebo grécke písmeno ρ ("rho"), preto sa často nazýva Spearmanovo rho .

    Spearmanov koeficient korelácie hodnôt meria silu aj smer vzťahu medzi radmi údajov. Môže mať ľubovoľnú hodnotu od -1 do 1 a čím je absolútna hodnota koeficientu bližšie k 1, tým je vzťah silnejší:

    • 1 je dokonalá pozitívna korelácia
    • -1 je dokonalá záporná korelácia
    • 0 je bez korelácie

    Spearmanov korelačný vzorec

    V závislosti od toho, či v rebríčku existujú alebo neexistujú väzby (rovnaké poradie priradené dvom alebo viacerým pozorovaniam), možno Spearmanov korelačný koeficient vypočítať pomocou jedného z nasledujúcich vzorcov.

    Ak existujú žiadne viazané hodnosti , stačí jednoduchší vzorec:

    Kde:

    • d i je rozdiel medzi dvojicou hodnôt
    • n je počet pozorovaní

    Riešiť vyrovnané rebríčky , je potrebné použiť plnú verziu Spearmanovho korelačného vzorca, ktorý je mierne upravenou verziou Pearsonovho r:

    Kde:

    • R(x) a R(y) sú rady x a y premenné
    • R(x) a R(y) sú stredné hodnoty

    Ako vypočítať Spearmanovu koreláciu v programe Excel pomocou funkcie CORREL

    Žiaľ, Excel nemá zabudovanú funkciu na výpočet Spearmanovho koeficientu korelácie hodnôt. To však neznamená, že si budete musieť lámať hlavu s vyššie uvedenými vzorcami. Malou manipuláciou s programom Excel môžeme prísť na oveľa jednoduchší spôsob výpočtu Spearmanovej korelácie.

    Ako príklad skúsme zistiť, či naša fyzická aktivita nejako súvisí s naším krvným tlakom. V stĺpci B máme počet minút, ktoré 10 mužov rovnakého veku denne strávi v posilňovni, a v stĺpci C máme ich systolický krvný tlak.

    Ak chcete v programe Excel zistiť Spearmanov korelačný koeficient, vykonajte tieto kroky:

    1. Zaraďte svoje údaje

      Keďže Spearmanova korelácia vyhodnocuje asociácie medzi dvoma premennými na základe ich poradia, musíte svoje zdrojové údaje zoradiť. To môžete rýchlo urobiť pomocou funkcie Excel RANK.AVG.

      Ak chcete zoradiť prvú premennú (fyzická aktivita), zadajte nasledujúci vzorec do D2 a potom ho potiahnite nadol do D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Ak chcete zaradiť druhú premennú (krvný tlak), vložte do bunky E2 nasledujúci vzorec a skopírujte ho do stĺpca:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Aby vzorce fungovali správne, nezabudnite uzamknúť rozsahy pomocou absolútnych odkazov na bunky.

      V tomto okamihu by vaše zdrojové údaje mali vyzerať podobne:

    2. Nájdite Spearmanov korelačný koeficient

      Po stanovení hodnôt môžeme teraz použiť funkciu Excel CORREL na získanie Spearmanovho rho:

      =CORREL(D2:D11, E2:E11)

      Vzorec poskytuje koeficient -0,7576 (zaokrúhlený na štvorciferné číslo), ktorý ukazuje pomerne silnú negatívnu koreláciu a umožňuje nám dospieť k záveru, že čím viac človek cvičí, tým nižší má krvný tlak.

      Pearsonov korelačný koeficient pre tú istú vzorku (-0,7445) naznačuje o niečo slabšiu koreláciu, ale stále štatisticky významnú:

    Krása tejto metódy spočíva v tom, že je rýchla, jednoduchá a funguje bez ohľadu na to, či v rebríčku existujú väzby alebo nie.

    Výpočet Spearmanovho korelačného koeficientu v programe Excel pomocou tradičného vzorca

    Ak si nie ste úplne istí, či funkcia CORREL vypočítala Spearmanovo rho správne, môžete výsledok overiť pomocou tradičného vzorca používaného v štatistike:

    1. Nájdite rozdiel medzi každou dvojicou hodnôt ( d ) odpočítaním jednej hodnosti od druhej:

      =D2-E2

      Tento vzorec sa prenesie do F2 a potom sa skopíruje do stĺpca.

    2. Zvýšte každý rozdiel hodností na mocninu dvoch ( d2 ):

      =F2^2

      Tento vzorec sa zapíše do stĺpca G.

    3. Súčet štvorcových rozdielov:

      =SUM(G2:G11)

      Tento vzorec môže byť v ľubovoľnej prázdnej bunke, v našom prípade v bunke G12.

      Z nasledujúcej snímky obrazovky pravdepodobne lepšie pochopíte usporiadanie údajov:

    4. V závislosti od toho, či váš súbor údajov má alebo nemá viazané rady, použite na výpočet Spearmanovho korelačného koeficientu jeden z týchto vzorcov.

    V našom príklade nie sú žiadne väzby, takže môžeme použiť jednoduchší vzorec:

    S d2 rovná 290 a n (počet pozorovaní) rovná 10, vzorec prejde nasledujúcimi transformáciami:

    Výsledkom je hodnota -0,757575758, ktorá sa dokonale zhoduje so Spearmanovým korelačným koeficientom vypočítaným v predchádzajúcom príklade.

    V programe Microsoft Excel možno uvedené výpočty vykonať pomocou nasledujúcej rovnice:

    =1-(6*G12/(10*(10^2-1)))

    Kde G12 je súčet štvorcových rozdielov hodností (d2).

    Ako vykonať Spearmanovu koreláciu v programe Excel pomocou grafu

    Korelačné koeficienty v programe Excel merajú len lineárne (Pearson) alebo monotónne (Spearman) vzťahy. Sú však možné aj iné asociácie. Preto bez ohľadu na to, akú koreláciu robíte, je vždy dobré znázorniť vzťah medzi premennými v grafe.

    Ak chcete nakresliť korelačný graf pre zoradené údaje, postupujte takto:

    1. Vypočítajte poradie pomocou funkcie RANK.AVG, ako je vysvetlené v tomto príklade.
    2. Vyberte dva stĺpce s hodnosťami.
    3. Vložte graf rozptylu XY. Na tento účel kliknite na tlačidlo Rozptyl graf ikonu na Vložka na karte Chaty skupina.
    4. Najrýchlejší spôsob je kliknúť na tlačidlo Prvky grafu tlačidlo> Pridať trendovú čiaru... .
    5. Zobrazenie hodnoty R-kvadrát na grafe. Dvojitým kliknutím na trendovú čiaru otvorte jej podokno, prepnite na Možnosti trendovej čiary a vyberte kartu Zobrazenie hodnoty R-kvadrátu na grafe box.
    6. Pre lepšiu presnosť zobrazte viac číslic v hodnote R2.

    Výsledkom bude vizuálne znázornenie vzťahu medzi jednotlivými radmi. Okrem toho získate Koeficient stanovenia (R2), ktorého druhou odmocninou je Pearsonov korelačný koeficient (r). Keďže ste však vykreslili zoradené údaje, toto Pearsonovo r nie je nič iné ako Spearmanovo rho.

    Poznámka: R-kvadrát je vždy kladné číslo, preto aj odvodený Spearmanov koeficient korelácie bude vždy kladný. Ak chcete pridať príslušné znamienko, stačí sa pozrieť na čiaru v grafe korelácie - sklon smerom nahor znamená kladnú koreláciu (znamienko plus) a sklon smerom nadol znamená zápornú koreláciu (znamienko mínus).

    V našom prípade sa R2 rovná 0,5739210285. Na nájdenie druhej odmocniny použite funkciu SQRT:

    =SQRT(0,5739210285)

    ...a dostanete už známy koeficient 0,757575758.

    Sklon grafu smerom nadol vykazuje zápornú koreláciu, takže pridáme znamienko mínus a dostaneme správny Spearmanov korelačný koeficient -0,757575758.

    Takto môžete vypočítať Spearmanov koeficient korelácie v programe Excel. Ak sa chcete bližšie pozrieť na príklady rozoberané v tomto návode, môžete si stiahnuť náš vzorový zošit uvedený nižšie. Ďakujem vám za prečítanie a dúfam, že sa uvidíme na našom blogu budúci týždeň!

    Cvičný zošit

    Spearmanova ranková korelácia v programe Excel (.xlsx súbor)

    Michael Brown je nadšený technologický nadšenec s vášňou pre zjednodušovanie zložitých procesov pomocou softvérových nástrojov. S viac ako desaťročnými skúsenosťami v technologickom priemysle si zdokonalil svoje zručnosti v programoch Microsoft Excel a Outlook, ako aj Tabuľky Google a Dokumenty. Michaelov blog je venovaný zdieľaniu svojich vedomostí a odborných znalostí s ostatnými a poskytuje jednoduché tipy a návody na zlepšenie produktivity a efektivity. Či už ste skúsený profesionál alebo začiatočník, Michaelov blog ponúka cenné poznatky a praktické rady, ako z týchto základných softvérových nástrojov vyťažiť maximum.