Spearman-ranga korelacio en Excel: formulo kaj grafikaĵo

  • Kundividu Ĉi Tion
Michael Brown

La lernilo klarigas la bazojn de Spearman-korelacio en simpla lingvo kaj montras kiel kalkuli la Spearman-rangan korelacian koeficienton en Excel.

Kiam oni faras korelacian analizon en Excel, en la plej multaj kazoj. vi traktos la Pearson-korelacion. Sed ĉar la korelacia koeficiento de Pearson mezuras nur linearan rilaton inter du variabloj, ĝi ne funkcias por ĉiuj datumtipoj - viaj variabloj povas esti forte asociitaj en ne-linia maniero kaj ankoraŭ havas la koeficienton proksima al nulo. En tiaj cirkonstancoj, vi povas fari la Spearman-rangan korelacion anstataŭ tiu de Pearson.

    Spearman-korelacio - la bazaĵoj

    La Spearman-korelacio estas la neparametria versio de la Pearson-korelacia koeficiento kiu mezuras la gradon de asocio inter du variabloj surbaze de iliaj rangoj.

    La Pearson Product Moment Correlation testas la linian rilaton inter du kontinuaj variabloj. Linia signifas rilaton kiam du variabloj ŝanĝiĝas en la sama direkto kun konstanta rapideco.

    Spearman Rank Correlation taksas la monotonan rilaton inter la rangigitaj valoroj. En monotona rilato, la variabloj ankaŭ tendencas ŝanĝiĝi kune, sed ne nepre kun konstanta rapideco.

    Kiam fari Spearman-korelacion

    La Spearman-korelacianalizo estas uzota en iu ajn el la sekvantecirkonstancoj kiam la subestaj supozoj de la Pearson-korelacio ne estas plenumitaj:

    1. Se viaj datumoj elmontras ne-linian rilaton aŭ ne estas normale distribuitaj.
    2. Se almenaŭ unu variablo estas orda . Se viaj valoroj povas esti metitaj en "unua, dua, tria..." ordo, vi traktas ordajn datumojn.
    3. Se estas signifaj outlieroj . Male al la Pearson-korelacio, la Spearman-korelacio ne estas sentema al outliers ĉar ĝi faras kalkulojn sur la rangoj, do la diferenco inter realaj valoroj ne havas signifon.

    Ekzemple, vi povas uzi la Spearman-korelacion. por trovi la respondojn al la sekvaj demandoj:

    • Ĉu homoj kun pli alta edukado pli zorgas pri la medio?
    • Ĉu la nombro da simptomoj de paciento rilatas al sia volo. preni medikamenton?

    Spearman-korelacia koeficiento

    En statistiko, la Spearman-korelacia koeficiento estas reprezentita per aŭ r s aŭ la greka litero ρ ("rho"), tial ĝi estas ofte nomata Spearman rho .

    La koeficiento de korelacio de la rango de Spearman mezuras ambaŭ la forto kaj direkto de la rilato inter la vicoj de datumoj. Ĝi povas esti ajna valoro de -1 ĝis 1, kaj ju pli proksima la absoluta valoro de la koeficiento al 1, des pli forta estas la rilato:

    • 1 estas perfekta pozitivo.korelacio
    • -1 estas perfekta negativa korelacio
    • 0 estas neniu korelacio

    Spearman-ranga korelacia formulo

    Dependante ĉu ekzistas aŭ ekzistas estas neniuj kravatoj en la rangotabelo (la sama rango asignita al du aŭ pli da observoj), la korelacia koeficiento de Spearman povas esti kalkulita per unu el la sekvaj formuloj.

    Se ekzistas neniuj ligitaj rangoj , pli simpla formulo faros:

    Kie:

    • d i estas la diferenco inter paro da rangoj
    • n estas la nombro da observoj

    Por trakti ligitajn rangojn , la plena versio de Spearman-korelacio formulo devas esti uzata, kiu estas iomete modifita versio de r de Pearson:

    Kie:

    • R(x) kaj R(y ) estas la rangoj de la x kaj y variabloj
    • R(x) kaj R(y) estas la mezaj rangoj

    Kiel kalkuli Spearman-korelacion en Excel kun CORREL-funkcio

    Bedaŭrinde, Excel ne havas enkonstruitan funkcion por kalkuli Spea. rman rango korelaciokoeficiento. Tamen, tio ne signifas, ke vi devos truki vian cerbon per la supraj formuloj. Iom manipulante Excel, ni povas elpensi multe pli simplan manieron fari Spearman-korelacion.

    Ekzemple, ni provu ekscii ĉu nia fizika aktiveco havas ian rilaton al nia sangopremo. En kolumno B, ni havas la nombron da minutoj kiujn pasigas 10 viroj de sama aĝoĉiutage en gimnazio, kaj en kolumno C, ni havas ilian sistola sangopremon.

    Por trovi la korelacian koeficienton de Spearman en Excel, faru ĉi tiujn paŝojn:

    1. Rangigi viajn datumojn

      Ĉar la korelacio Spearman taksas la asociojn inter du variabloj surbaze de iliaj rangoj, vi devas rangigi viajn fontajn datumojn. Ĉi tio povas esti rapide farita uzante la funkcion Excel RANK.AVG.

      Por rangigi la unuan variablon (fizika aktiveco), enigu la suban formulon en D2 kaj tiam trenu ĝin malsupren al D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Por rangigi la duan variablon (sangopremo), metu la jenan formulon en la ĉelon E2 kaj kopiu ĝin laŭ la kolumno:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Por ke la formuloj funkciu ĝuste , bonvolu nepre ŝlosi la intervalojn per absolutaj ĉelaj referencoj.

      Je ĉi tiu punkto, viaj fontaj datumoj devus aspekti similaj al ĉi tio:

    2. Trovu la korelacian koeficienton de Spearman

      Kun la rangoj establitaj, ni nun povas uzi la funkcion de Excel CORREL por akiri la rho de Spearman:

      =CORREL(D2:D11, E2:E11)

      La formulo liveras koeficienton de -0.7576 (rondita al 4 ciferoj), kio montras sufiĉe fortan negativan korelacion kaj permesas al ni konkludi, ke ju pli oni ekzercas, des pli malaltiĝas ilia sangopremo.

      La korelacia koeficiento de Pearson por la sama specimeno (- 0.7445) indikas iom pli malfortan korelacion, sed ankoraŭ statistikon Tre signifa:

    La beleco de ĉi tiometodo estas ke ĝi estas rapida, facila, kaj funkcias sendepende de ĉu estas ligoj en la rangotabelo aŭ ne.

    Kalkulu Spearman-koeficienton de korelacio en Excel kun tradicia formulo

    Se vi ne estas tute certa. ke la funkcio CORREL kalkulis la rho-rajton de Spearman, vi povas kontroli la rezulton per la tradicia formulo uzata en statistiko. Jen kiel:

    1. Trovu la diferencon inter ĉiu paro de rangoj ( d ) per subtraho de unu rango de la alia:

      =D2-E2

      Ĉi tiu formulo iras al F2 kaj tiam estas kopiita laŭ la kolono.

    2. Levu ĉiun rangodiferencon al la potenco de du ( d2 ):

      =F2^2

      Ĉi tiu formulo iras al kolumno G.

    3. Aldonu la kvadratajn diferencojn:

      =SUM(G2:G11)

      Ĉi tiu formulo povas iri al iu ajn malplena ĉelo, G12 en nia kazo.

      El la sekva ekrankopio, vi verŝajne gajnos pli bone. kompreno de la datuma aranĝo:

    4. Laŭ ĉu via datumaro havas iujn ajn ligitajn rangojn aŭ ne, uzu unu el ĉi tiuj formuloj por kalkuli la korelacian koeficienton de Spearman.

    En nia ekzemplo, ne estas ligoj, do ni povas iri kun pli simpla formulo:

    Kun d2 egala al 290, kaj n (nombro da observoj) egala al 10, la formulo spertas la jenajn transformojn:

    Kiel rezulto, oni ricevas -0.757575758 , kiu perfekte konsentas kun la korelacia koeficiento de Spearman kalkulita en laantaŭa ekzemplo.

    En Microsoft Excel, la supraj kalkuloj povas esti faritaj per la jena ekvacio:

    =1-(6*G12/(10*(10^2-1)))

    Kie G12 estas la sumo de la kvadrataj rangodiferencoj (d2) .

    Kiel fari Spearman-korelacion en Excel uzante grafeon

    La korelaciaj koeficientoj en Excel nur mezuras liniajn (Pearson) aŭ monotonajn (Spearman) rilatojn. Tamen aliaj asocioj eblas. Do, negrave kiun korelacion vi faras, ĉiam estas bona ideo reprezenti la rilaton inter la variabloj en grafikaĵo.

    Por desegni korelacian grafeon por la rangigitaj datumoj, jen kion vi devas fari:

    1. Kalkulu la rangojn uzante la funkcion RANK.AVG kiel klarigite en ĉi tiu ekzemplo.
    2. Elektu du kolumnojn kun la rangoj.
    3. Enmetu XY-disvast-diagramon. Por tio, alklaku la piktogramon Diskaŝu diagramon sur la langeto Inset , en la grupo Babiloj .
    4. Aldonu tendenca linio al via diagramo. La plej rapida maniero estas alklaki la butonon Graperaj Elementoj > Aldoni Tendencon... .
    5. Montru R-kvadratan valoron sur la diagramo. Duoble alklaku la tendenclinion por malfermi ĝian panelon, ŝanĝu al la langeto Tendline Options kaj elektu la Montri R-kvadratan valoron sur diagramo skatolo.
    6. Montru pli da ciferoj en la R2-valoro por pli bona precizeco.

    Kiel rezulto, vi ricevos vidan reprezenton de la rilato inter la rangoj. Aldone, vi ricevos la Koeficiento de Determino (R2), kies kvadrata radiko estas la korelacia koeficiento de Pearson (r). Sed ĉar vi bildigis la rangigitajn datumojn, ĉi tiu r de Pearson estas nenio alia ol la rho de Spearman.

    Notu. R-kvadrata ĉiam estas pozitiva nombro, tial la deduktita Spearman-ranga korelaciokoeficiento ankaŭ estos ĉiam pozitiva. Por aldoni taŭgan signon, nur rigardu la linion en via korelacia grafiko - suprena deklivo indikas pozitivan korelacion (plus-signo) kaj malsupreniĝan deklivon indikas negativan korelacion (minussigno).

    En nia kazo, R2 egalas 0.5739210285. Uzu la SQRT-funkcion por trovi la kvadratan radikon:

    =SQRT(0.5739210285)

    ...kaj vi ricevos la jam konatan koeficienton de 0,757575758.

    La malsupreniĝa deklivo en la grafikaĵo montras negativan korelacio, do ni aldonas la minus-signon kaj ricevas la ĝustan Spearman-korelacian koeficienton de -0.757575758.

    Tiel vi povas kalkuli la Spearman-rangan korelacian koeficienton en Excel. Por pli detale rigardi la ekzemplojn diskutitajn en ĉi tiu lernilo, vi bonvenas elŝuti nian specimenan laborlibron sube. Mi dankas vin pro legado kaj esperas vidi vin en nia blogo venontsemajne!

    Praktiku laborlibron

    Spearman Rank Correlation en Excel (.xlsx-dosiero)

    Michael Brown estas diligenta teknologia entuziasmulo kun pasio por simpligi kompleksajn procezojn uzante programarajn ilojn. Kun pli ol jardeko da sperto en la teknologia industrio, li perfektigis siajn kapablojn en Microsoft Excel kaj Outlook, same kiel Google Sheets kaj Docs. La blogo de Mikaelo estas dediĉita al kunhavigi siajn sciojn kaj kompetentecon kun aliaj, provizante facilajn sekvajn konsiletojn kaj lernilojn por plibonigi produktivecon kaj efikecon. Ĉu vi estas sperta profesiulo aŭ komencanto, la blogo de Mikaelo ofertas valorajn komprenojn kaj praktikajn konsilojn por eltiri la plej multajn el ĉi tiuj esencaj programaj iloj.