Spearmano rangų koreliacija programoje "Excel": formulė ir grafikas

  • Pasidalinti
Michael Brown

Mokomojoje programoje paprasta kalba paaiškinami Spearmano koreliacijos pagrindai ir parodoma, kaip apskaičiuoti Spearmano ranginės koreliacijos koeficientą "Excel" programoje.

Atlikdami koreliacinę analizę "Excel" programa, daugeliu atvejų turėsite reikalų su Pearsono koreliacija. Tačiau kadangi Pearsono koreliacijos koeficientas matuoja tik tiesinį dviejų kintamųjų ryšį, jis tinka ne visiems duomenų tipams - jūsų kintamieji gali būti stipriai susiję netiesiniu būdu ir vis tiek turėti koeficientą, artimą nuliui. Tokiomis aplinkybėmis galite atlikti Spearmanoranginė koreliacija, o ne Pirsono koreliacija.

    Spearmano koreliacijos pagrindai

    Svetainė Spearmano koreliacija yra neparametrinė Pirsono koreliacijos koeficiento versija, kuria matuojamas dviejų kintamųjų ryšio laipsnis pagal jų rangus.

    Svetainė Pirsono produkto momento koreliacija tikrina linijinis ryšys tarp dviejų tolydžių kintamųjų. tiesinis reiškia ryšį, kai du kintamieji kinta ta pačia kryptimi pastoviu greičiu.

    Spearmano rangų koreliacija įvertina monotoniškas ryšys tarp reitinguojamų reikšmių. Esant monotoniškam ryšiui, kintamieji taip pat turi tendenciją keistis kartu, tačiau nebūtinai pastoviu greičiu.

    Kada atlikti Spearmano koreliaciją

    Spearmano koreliacijos analizė turi būti naudojama bet kuriuo iš toliau nurodytų atvejų, kai nesilaikoma pagrindinių Pearsono koreliacijos prielaidų:

    1. Jei jūsų duomenims būdingas nelinijinis ryšys arba nėra normaliai pasiskirstę.
    2. Jei bent vienas kintamasis yra eilės tvarka Jei jūsų reikšmes galima išdėstyti "pirma, antra, trečia..." tvarka, vadinasi, turite reikalą su ordinaliniais duomenimis.
    3. Jei yra reikšmingų nuokrypiai . skirtingai nei Pearsono koreliacija, Spearmano koreliacija nėra jautri nukrypimams, nes ji atlieka skaičiavimus pagal rangus, todėl skirtumas tarp faktinių reikšmių neturi reikšmės.

    Pavyzdžiui, Spearmano koreliaciją galite naudoti norėdami rasti atsakymus į šiuos klausimus:

    • Ar aukštesnio išsilavinimo žmonės labiau rūpinasi aplinka?
    • Ar simptomų skaičius yra susijęs su paciento noru vartoti vaistus?

    Spearmano koreliacijos koeficientas

    Statistikoje Spearmano koreliacijos koeficientas vaizduojamas arba r s arba graikiška raidė ρ ("rho"), todėl jis dažnai vadinamas Spearmano rho .

    Spearmano rangų koreliacijos koeficientas parodo duomenų rangų ryšio stiprumą ir kryptį. Jis gali būti bet kokia reikšmė nuo -1 iki 1, ir kuo absoliuti koeficiento reikšmė artimesnė 1, tuo stipresnis ryšys:

    • 1 - visiška teigiama koreliacija
    • -1 yra visiškai neigiama koreliacija
    • 0 - nėra koreliacijos

    Spearmano ranginės koreliacijos formulė

    Priklausomai nuo to, ar yra, ar nėra sąsajų (tas pats rangas priskirtas dviem ar daugiau stebėjimų), Spearmano koreliacijos koeficientą galima apskaičiuoti pagal vieną iš šių formulių.

    Jei yra nėra susietų rangų , pakaks paprastesnės formulės:

    Kur:

    • d i yra skirtumas tarp poros rangų
    • n stebėjimų skaičius

    Susidoroti su susietos gretos , reikia naudoti pilną Spearmano koreliacijos formulės versiją, kuri yra šiek tiek modifikuota Pearsono r versija:

    Kur:

    • R(x) ir R(y) - tai rangai x ir y kintamieji
    • R(x) ir R(y) yra vidutiniai rangai

    Kaip apskaičiuoti Spearmano koreliaciją programoje "Excel" naudojant funkciją CORREL

    Deja, "Excel" neturi integruotos funkcijos Spearmano ranginės koreliacijos koeficientui apskaičiuoti. Tačiau tai nereiškia, kad turėsite sukti galvą dėl pirmiau pateiktų formulių. Šiek tiek manipuliuodami "Excel", galime sugalvoti daug paprastesnį būdą Spearmano koreliacijai atlikti.

    Pavyzdžiui, pabandykime išsiaiškinti, ar mūsų fizinis aktyvumas kaip nors susijęs su kraujospūdžiu. B stulpelyje įrašytas minučių, kurias 10 to paties amžiaus vyrų kasdien praleidžia sporto salėje, skaičius, o C stulpelyje - jų sistolinis kraujospūdis.

    Norėdami "Excel" programoje rasti Spearmano koreliacijos koeficientą, atlikite šiuos veiksmus:

    1. Įvertinkite savo duomenis

      Kadangi Spearmano koreliacija vertina dviejų kintamųjų sąsajas pagal jų rangus, reikia suranguoti pradinius duomenis. Tai galima greitai padaryti naudojant "Excel" funkciją RANK.AVG.

      Norėdami įvertinti pirmąjį kintamąjį (fizinį aktyvumą), įveskite toliau pateiktą formulę į D2 ir vilkite ją žemyn į D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Norėdami įvertinti antrąjį kintamąjį (kraujospūdį), į E2 langelį įrašykite šią formulę ir nukopijuokite ją į stulpelį:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Kad formulės veiktų teisingai, įsitikinkite, kad diapazonai užrakinti absoliučiomis ląstelių nuorodomis.

      Šiuo metu jūsų šaltinio duomenys turėtų atrodyti panašiai:

    2. Nustatyti Spearmano koreliacijos koeficientą

      Nustatę rangus, dabar galime naudoti "Excel" funkciją CORREL, kad gautume Spearmano rho:

      =CORREL(D2:D11, E2:E11)

      Pagal formulę gaunamas koeficientas -0,7576 (suapvalintas iki 4 skaitmenų), kuris rodo gana stiprią neigiamą koreliaciją ir leidžia daryti išvadą, kad kuo daugiau žmogus mankštinasi, tuo mažesnis jo kraujospūdis.

      Tos pačios imties Pearsono koreliacijos koeficientas (-0,7445) rodo šiek tiek silpnesnę koreliaciją, tačiau vis tiek statistiškai reikšmingą:

    Šio metodo ypatybė yra ta, kad jis greitas, paprastas ir veikia nepriklausomai nuo to, ar reitinge yra sąsajų, ar ne.

    Apskaičiuokite Spearmano koreliacijos koeficientą "Excel" programoje naudodami tradicinę formulę

    Jei nesate visiškai tikri, kad CORREL funkcija teisingai apskaičiavo Spearmano rho, galite patikrinti rezultatą naudodami tradicinę statistikoje naudojamą formulę:

    1. Raskite skirtumą tarp kiekvienos rangų poros ( d ) atimant vieną rangą iš kito:

      =D2-E2

      Ši formulė perkeliama į F2 ir nukopijuojama į stulpelį.

    2. Kiekvieną rangų skirtumą pakelkite iki dviejų galingumų ( d2 ):

      =F2^2

      Ši formulė įrašoma į G stulpelį.

    3. Susumuokite kvadratinius skirtumus:

      =SUMA(G2:G11)

      Šią formulę galima perkelti į bet kurią tuščią ląstelę, mūsų atveju - G12.

      Iš toliau pateiktos ekrano nuotraukos tikriausiai geriau suprasite duomenų išdėstymą:

    4. Priklausomai nuo to, ar jūsų duomenų rinkinyje yra susietų rangų, ar ne, Spearmano koreliacijos koeficientui apskaičiuoti naudokite vieną iš šių formulių.

    Mūsų pavyzdyje nėra lygiųjų, todėl galime naudoti paprastesnę formulę:

    Su d2 lygus 290, ir n (stebėjimų skaičius) lygus 10, formulė transformuojama taip:

    Rezultatas -0,757575758, kuris visiškai atitinka ankstesniame pavyzdyje apskaičiuotą Spearmano koreliacijos koeficientą.

    "Microsoft Excel" programoje pirmiau minėtus skaičiavimus galima atlikti naudojant šią lygtį:

    =1-(6*G12/(10*(10^2-1)))

    Kur G12 yra rangų skirtumų kvadratų suma (d2).

    Kaip atlikti Spearmano koreliaciją "Excel" programoje naudojant grafiką

    Koreliacijos koeficientai "Excel" programoje matuoja tik tiesinius (Pearson) arba monotoninius (Spearman) ryšius. Tačiau galimi ir kitokie ryšiai. Taigi, nesvarbu, kokią koreliaciją atliksite, visada pravartu kintamųjų ryšį pavaizduoti grafike.

    Norėdami nubraižyti reitinguotų duomenų koreliacijos grafiką, atlikite šiuos veiksmus:

    1. Apskaičiuokite rangus naudodami funkciją RANK.AVG, kaip paaiškinta šiame pavyzdyje.
    2. Pasirinkite du stulpelius su rangais.
    3. Įterpkite XY sklaidos diagramą. Šiuo tikslu spustelėkite Sklaida diagrama piktogramą Įdėklas skirtuke Pokalbiai grupė.
    4. Į diagramą pridėkite tendencijos liniją. Greičiausias būdas - spustelėti Diagramos elementai mygtukas> Pridėti Trendline... .
    5. Diagramoje rodykite R kvadrato vertę. Dukart spustelėkite tendencijos liniją, kad atidarytumėte jos langą, pereikite į Trendline parinktys skirtuką ir pasirinkite Rodyti R kvadrato vertę diagramoje dėžutė.
    6. Kad R2 reikšmė būtų tikslesnė, rodykite daugiau skaitmenų.

    Dėl to gausite vizualiai pavaizduotą ryšį tarp rangų. Be to, gausite Nustatymo koeficientas (R2), kurio kvadratinė šaknis yra Pirsono koreliacijos koeficientas (r). Bet kadangi jūs nubraižėte ranginius duomenis, šis Pirsono r yra ne kas kita, o Spearmano rho.

    Pastaba: R kvadratas visada yra teigiamas skaičius, todėl išvestas Spearmano ranginės koreliacijos koeficientas taip pat visada bus teigiamas. Norėdami pridėti atitinkamą ženklą, tiesiog pažvelkite į liniją savo koreliacijos grafike - didėjantis nuolydis rodo teigiamą koreliaciją (pliuso ženklas), o mažėjantis nuolydis - neigiamą koreliaciją (minuso ženklas).

    Mūsų atveju R2 yra lygus 0,5739210285. Norėdami rasti kvadratinę šaknį, naudokite funkciją SQRT:

    =SQRT(0,5739210285)

    ...ir gausite jau žinomą koeficientą 0,757575758.

    Grafike esantis nuolydis žemyn rodo neigiamą koreliaciją, todėl pridedame minuso ženklą ir gauname teisingą Spearmano koreliacijos koeficientą -0,757575758.

    Štai kaip galite apskaičiuoti Spearmano ranginės koreliacijos koeficientą "Excel" programoje. Norėdami atidžiau susipažinti su šioje pamokoje aptartais pavyzdžiais, galite atsisiųsti toliau pateiktą pavyzdinį sąsiuvinį. Dėkoju, kad perskaitėte, ir tikiuosi, kad kitą savaitę susitiksime mūsų tinklaraštyje!

    Praktikos sąsiuvinis

    Spearmano rangų koreliacija "Excel" programoje (.xlsx failas)

    Michaelas Brownas yra atsidavęs technologijų entuziastas, mėgstantis supaprastinti sudėtingus procesus naudojant programinės įrangos įrankius. Turėdamas daugiau nei dešimtmetį patirtį technologijų pramonėje, jis patobulino savo įgūdžius „Microsoft Excel“ ir „Outlook“, taip pat „Google“ skaičiuoklėse ir dokumentuose. Michaelio tinklaraštis skirtas dalytis savo žiniomis ir patirtimi su kitais, jame pateikiami lengvai įgyvendinami patarimai ir vadovėliai, kaip pagerinti produktyvumą ir efektyvumą. Nesvarbu, ar esate patyręs profesionalas, ar pradedantysis, Michaelo tinklaraštyje rasite vertingų įžvalgų ir praktinių patarimų, kaip išnaudoti visas šių pagrindinių programinės įrangos įrankių galimybes.