Spearmanova korelace v aplikaci Excel: vzorec a graf

  • Sdílet Toto
Michael Brown

Výukový program vysvětluje základy Spearmanovy korelace jednoduchým jazykem a ukazuje, jak vypočítat Spearmanův korelační koeficient v aplikaci Excel.

Při provádění korelační analýzy v aplikaci Excel budete ve většině případů pracovat s Pearsonovou korelací. Protože však Pearsonův korelační koeficient měří pouze lineární vztah mezi dvěma proměnnými, nefunguje pro všechny typy dat - vaše proměnné mohou být silně spojeny nelineárním způsobem, a přesto se jejich koeficient blíží nule. Za takových okolností můžete provést Spearmanovu korelaci.místo Pearsonovy korelace.

    Spearmanova korelace - základy

    Na stránkách Spearmanova korelace je neparametrická verze Pearsonova korelačního koeficientu, která měří míru asociace mezi dvěma proměnnými na základě jejich pořadí.

    Na stránkách Pearsonův korelační součin testuje lineární Vztah mezi dvěma spojitými proměnnými. Lineární znamená vztah, kdy se dvě proměnné mění stejným směrem a konstantní rychlostí.

    Spearmanova korelace pořadí vyhodnocuje monotónní V monotónním vztahu mají proměnné také tendenci se měnit společně, ale ne nutně konstantním tempem.

    Kdy provádět Spearmanovu korelaci

    Spearmanovu korelační analýzu je třeba použít v následujících případech, kdy nejsou splněny základní předpoklady Pearsonovy korelace:

    1. Pokud vaše data vykazují nelineární vztah nebo nejsou normálně rozděleny.
    2. Pokud je alespoň jedna proměnná ordinální Pokud lze hodnoty seřadit v pořadí "první, druhý, třetí...", jedná se o ordinální data.
    3. Pokud se vyskytnou významné odlehlé hodnoty . na rozdíl od Pearsonovy korelace není Spearmanova korelace citlivá na odlehlé hodnoty, protože provádí výpočty na řadách, takže rozdíl mezi skutečnými hodnotami nemá význam.

    Spearmanovu korelaci můžete použít například ke zjištění odpovědí na následující otázky:

    • Zajímají se lidé s vyšším vzděláním více o životní prostředí?
    • Souvisí počet symptomů, které pacient má, s jeho ochotou užívat léky?

    Spearmanův korelační koeficient

    Ve statistice Spearmanův korelační koeficient je reprezentován buď r s nebo řecké písmeno ρ ("rho"), proto se často nazývá Spearmanovo rho .

    Spearmanův korelační koeficient měří jak sílu, tak směr vztahu mezi řadami dat. Může nabývat libovolných hodnot od -1 do 1, přičemž čím blíže je absolutní hodnota koeficientu k 1, tím silnější je vztah:

    • 1 je dokonalá pozitivní korelace
    • -1 je dokonalá záporná korelace
    • 0 je bez korelace

    Spearmanův korelační vzorec

    V závislosti na tom, zda v pořadí existují nebo neexistují vazby (stejné pořadí přiřazené dvěma nebo více pozorováním), lze Spearmanův korelační koeficient vypočítat podle jednoho z následujících vzorců.

    Pokud existují žádné vázané hodnosti , postačí jednodušší vzorec:

    Kde:

    • d i je rozdíl mezi dvojicí hodností
    • n je počet pozorování

    Vypořádat se s vyrovnané pořadí , je třeba použít plnou verzi Spearmanova korelačního vzorce, což je mírně upravená verze Pearsonova r:

    Kde:

    • R(x) a R(y) jsou stupně x a y proměnné
    • R(x) a R(y) jsou střední hodnoty.

    Jak vypočítat Spearmanovu korelaci v aplikaci Excel pomocí funkce CORREL

    Excel bohužel nemá vestavěnou funkci pro výpočet Spearmanova korelačního koeficientu. To však neznamená, že si budete muset lámat hlavu s výše uvedenými vzorci. Malou manipulací s programem Excel můžeme přijít na mnohem jednodušší způsob, jak Spearmanovu korelaci provést.

    Jako příklad si zkusme zjistit, zda má naše fyzická aktivita nějaký vztah k našemu krevnímu tlaku. Ve sloupci B máme počet minut, které 10 mužů stejného věku stráví denně v posilovně, a ve sloupci C jejich systolický krevní tlak.

    Chcete-li v aplikaci Excel zjistit Spearmanův korelační koeficient, proveďte následující kroky:

    1. Zařaďte svá data

      Protože Spearmanova korelace vyhodnocuje asociace mezi dvěma proměnnými na základě jejich pořadí, je třeba zdrojová data seřadit. To lze rychle provést pomocí funkce Excel RANK.AVG.

      Chcete-li zařadit první proměnnou (fyzická aktivita), zadejte níže uvedený vzorec do pole D2 a poté jej přetáhněte dolů do pole D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Chcete-li zařadit druhou proměnnou (krevní tlak), vložte do buňky E2 následující vzorec a zkopírujte jej dolů do sloupce:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Aby vzorce správně fungovaly, nezapomeňte uzamknout rozsahy pomocí absolutních odkazů na buňky.

      V tomto okamžiku by vaše zdrojová data měla vypadat podobně:

    2. Zjištění Spearmanova korelačního koeficientu

      Po stanovení pořadí můžeme nyní pomocí funkce Excel CORREL získat Spearmanovo rho:

      =CORREL(D2:D11, E2:E11)

      Ze vzorce dostaneme koeficient -0,7576 (zaokrouhleno na 4 číslice), který ukazuje poměrně silnou zápornou korelaci a umožňuje nám vyvodit závěr, že čím více člověk cvičí, tím nižší má krevní tlak.

      Pearsonův korelační koeficient pro stejný vzorek (-0,7445) naznačuje o něco slabší korelaci, ale stále statisticky významnou:

    Krása této metody spočívá v tom, že je rychlá, snadná a funguje bez ohledu na to, zda jsou v žebříčku vazby, nebo ne.

    Výpočet Spearmanova korelačního koeficientu v aplikaci Excel pomocí tradičního vzorce

    Pokud si nejste zcela jisti, že funkce CORREL vypočítala Spearmanovo rho správně, můžete výsledek ověřit pomocí tradičního vzorce používaného ve statistice:

    1. Zjistěte rozdíl mezi jednotlivými dvojicemi pořadí ( d ) odečtením jednoho stupně od druhého:

      =D2-E2

      Tento vzorec se přenese do pole F2 a poté se zkopíruje dolů do sloupce.

    2. Zvyšte každý rozdíl hodností na mocninu dvou ( d2 ):

      =F2^2

      Tento vzorec přejde do sloupce G.

    3. Sečtěte čtvercové rozdíly:

      =SUMA(G2:G11)

      Tento vzorec může přejít do libovolné prázdné buňky, v našem případě G12.

      Z následujícího snímku obrazovky pravděpodobně lépe pochopíte uspořádání dat:

    4. V závislosti na tom, zda má váš soubor dat nějaké vázané řady, nebo ne, použijte k výpočtu Spearmanova korelačního koeficientu jeden z těchto vzorců.

    V našem příkladu nejsou žádné vazby, takže můžeme použít jednodušší vzorec:

    S d2 rovná 290 a n (počet pozorování) rovná 10, vzorec projde následujícími transformacemi:

    Výsledkem je hodnota -0,757575758, která se dokonale shoduje se Spearmanovým korelačním koeficientem vypočteným v předchozím příkladu.

    V programu Microsoft Excel lze výše uvedené výpočty provést pomocí následující rovnice:

    =1-(6*G12/(10*(10^2-1)))

    Kde G12 je součet čtvercových rozdílů pořadí (d2).

    Jak provést Spearmanovu korelaci v aplikaci Excel pomocí grafu

    Korelační koeficienty v aplikaci Excel měří pouze lineární (Pearsonův) nebo monotónní (Spearmanův) vztah. Jsou však možné i jiné asociace. Ať už tedy provedete jakoukoli korelaci, vždy je dobré znázornit vztah mezi proměnnými v grafu.

    Chcete-li nakreslit korelační graf pro seřazená data, postupujte následovně:

    1. Vypočítejte pořadí pomocí funkce RANK.AVG, jak je vysvětleno v tomto příkladu.
    2. Vyberte dva sloupce s hodnostmi.
    3. Vložte rozptylový graf XY. K tomu klikněte na tlačítko Rozptyl graf na ikoně Vložka na kartě Chaty skupina.
    4. Přidejte do grafu trendovou čáru. Nejrychlejší způsob je kliknout na tlačítko Prvky grafu tlačítko> Přidat Trendline... .
    5. Zobrazení hodnoty R-kvadrátu v grafu. Dvojklikem na trendovou čáru otevřete její podokno, přepněte se do okna Možnosti trendové čáry a vyberte kartu Zobrazení hodnoty R-squared na grafu box.
    6. Pro lepší přesnost zobrazte v hodnotě R2 více číslic.

    Výsledkem bude vizuální znázornění vztahu mezi jednotlivými hodnostmi. Navíc získáte Koeficient determinace (R2), jehož druhou odmocninou je Pearsonův korelační koeficient (r). Protože jste však vynesli do grafu seřazená data, není toto Pearsonovo r nic jiného než Spearmanovo rho.

    Poznámka: R-kvadrát je vždy kladné číslo, a proto i odvozený Spearmanův korelační koeficient bude vždy kladný. Pro doplnění příslušného znaménka se stačí podívat na přímku v korelačním grafu - sklon nahoru znamená kladnou korelaci (znaménko plus) a sklon dolů znamená zápornou korelaci (znaménko minus).

    V našem případě se R2 rovná 0,5739210285. K nalezení druhé odmocniny použijte funkci SQRT:

    =SQRT(0,5739210285)

    ...a dostanete již známý koeficient 0,757575758.

    Sklon grafu směrem dolů vykazuje zápornou korelaci, takže přidáme znaménko minus a získáme správný Spearmanův korelační koeficient -0,757575758.

    Takto můžete v aplikaci Excel vypočítat Spearmanův korelační koeficient. Chcete-li se blíže seznámit s příklady probíranými v tomto kurzu, můžete si stáhnout náš ukázkový sešit níže. Děkuji vám za přečtení a doufám, že se příští týden uvidíme na našem blogu!

    Cvičebnice

    Spearmanova korelace v Excelu (.xlsx soubor)

    Michael Brown je oddaný technologický nadšenec s vášní pro zjednodušování složitých procesů pomocí softwarových nástrojů. S více než desetiletými zkušenostmi v technologickém průmyslu zdokonalil své dovednosti v aplikacích Microsoft Excel a Outlook a také v Tabulkách a Dokumentech Google. Michaelův blog je věnován sdílení jeho znalostí a odborných znalostí s ostatními a poskytuje snadno pochopitelné tipy a návody pro zlepšení produktivity a efektivity. Ať už jste zkušený profesionál nebo začátečník, Michaelův blog nabízí cenné postřehy a praktické rady, jak tyto základní softwarové nástroje co nejlépe využít.