Spīrmena ranga korelācija programmā Excel: formula un grafiks

  • Dalīties Ar Šo
Michael Brown

Šajā pamācībā vienkāršā valodā izskaidroti Spīrmena korelācijas pamati un parādīts, kā aprēķināt Spīrmena ranga korelācijas koeficientu programmā Excel.

Veicot korelācijas analīzi programmā Excel, vairumā gadījumu tiek izmantota Pīrsona korelācija. Taču, tā kā Pīrsona korelācijas koeficients mēra tikai lineāru sakarību starp diviem mainīgajiem, tas nedarbojas visiem datu tipiem - jūsu mainīgie var būt cieši saistīti nelineārā veidā, bet koeficients joprojām var būt tuvu nullei. Šādos apstākļos varat izmantot Spearmana korelācijas koeficientu.ranga korelācija Pīrsona korelācijas vietā.

    Spīrmena korelācija - pamati

    Portāls Spīrmena korelācija ir neparametriskā Pīrsona korelācijas koeficienta versija, kas mēra divu mainīgo saistības pakāpi, pamatojoties uz to rangiem.

    Portāls Pīrsona produkta momenta korelācija pārbauda lineārais Attiecība starp diviem nepārtrauktiem mainīgajiem. Lineāra ir attiecība, kad divi mainīgie mainīgie mainās vienā virzienā ar nemainīgu ātrumu.

    Spīrmena ranga korelācija novērtē monotons monotona sakarība starp vērtībām. Monotonas sakarības gadījumā mainīgajiem lielumiem arī ir tendence mainīties kopā, bet ne vienmēr ar konstantu ātrumu.

    Kad veikt Spīrmena korelāciju

    Spīrmena korelācijas analīze jāizmanto jebkurā no turpmāk minētajiem gadījumiem, ja nav izpildīti Pīrsona korelācijas pamatā esošie pieņēmumi:

    1. Ja jūsu dati uzrāda nelineārs attiecības vai nav normāli sadalītas.
    2. Ja vismaz viens mainīgais ir kārtas Ja jūsu vērtības var sakārtot secībā "pirmais, otrais, trešais...", jūs strādājat ar kārtas datiem.
    3. Ja ir ievērojamas novirzes Atšķirībā no Pīrsona korelācijas Spīrmena korelācija nav jutīga pret novirzēm, jo tā veic aprēķinus rangiem, tāpēc faktisko vērtību starpībai nav nozīmes.

    Piemēram, jūs varat izmantot Spīrmena korelāciju, lai atrastu atbildes uz šādiem jautājumiem:

    • Vai cilvēki ar augstāku izglītības līmeni vairāk rūpējas par vidi?
    • Vai pacienta simptomu skaits ir saistīts ar viņa gatavību lietot zāles?

    Spīrmena korelācijas koeficients

    Statistikā Spīrmena korelācijas koeficients ir pārstāvēts ar r s vai grieķu burts ρ ("rho"), tāpēc to bieži sauc par Spīrmena rho .

    Spīrmena rangu korelācijas koeficients mēra gan attiecību starp datu rangiem stiprumu, gan virzienu. Tas var būt jebkura vērtība no -1 līdz 1, un, jo tuvāk koeficienta absolūtā vērtība ir 1, jo stiprāka ir saistība:

    • 1 ir pilnīga pozitīva korelācija
    • -1 ir pilnīga negatīva korelācija
    • 0 - nav korelācijas

    Spīrmena ranga korelācijas formula

    Atkarībā no tā, vai rangā ir vai nav saišu (diviem vai vairākiem novērojumiem piešķirts viens un tas pats rangs), Spīrmena korelācijas koeficientu var aprēķināt pēc vienas no šādām formulām.

    Ja ir nav saistītu rangu , pietiek ar vienkāršāku formulu:

    Kur:

    • d i ir starpība starp rangu pāri
    • n ir novērojumu skaits

    Lai risinātu ar saistītās rindas , jāizmanto pilnā Spīrmena korelācijas formulas versija, kas ir nedaudz pārveidota Pīrsona r versija:

    Kur:

    • R(x) un R(y) ir rangs, ko veido x un y mainīgie
    • R(x) un R(y) ir vidējie rangi

    Kā aprēķināt Spīrmena korelāciju programmā Excel, izmantojot funkciju CORREL

    Diemžēl programmā Excel nav iebūvētas funkcijas Spearman ranga korelācijas koeficienta aprēķināšanai. Tomēr tas nenozīmē, ka jums būs jālauza galva ar iepriekš minētajām formulām. Nedaudz manipulējot ar Excel, mēs varam atrast daudz vienkāršāku veidu, kā aprēķināt Spearman korelāciju.

    Kā piemēru mēģināsim noskaidrot, vai mūsu fiziskajai aktivitātei ir kāda saistība ar asinsspiedienu. B slejā ir norādīts, cik minūtes 10 viena vecuma vīrieši ik dienu pavada sporta zālē, bet C slejā - viņu sistoliskais asinsspiediens.

    Lai programmā Excel atrastu Spīrmena korelācijas koeficientu, veiciet šādas darbības:

    1. Datu klasificēšana

      Tā kā Spīrmena korelācija novērtē saistību starp diviem mainīgajiem lielumiem, pamatojoties uz to rangiem, jums ir jāraksturo savi avota dati. To var ātri izdarīt, izmantojot Excel funkciju RANK.AVG.

      Lai ierindotu pirmo mainīgo lielumu (fiziskā aktivitāte), ievadiet tālāk norādīto formulu D2 un pēc tam velciet to uz leju līdz D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Lai ierindotu otro mainīgo lielumu (asinsspiediens), ievietojiet šādā formulā šūnā E2 un nokopējiet to uz leju pa kolonnu:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Lai formulas darbotos pareizi, pārliecinieties, ka diapazoni ir bloķēti ar absolūtajām šūnu atsaucēm.

      Šobrīd jūsu avota datiem vajadzētu izskatīties līdzīgi:

    2. Atrast Spīrmena korelācijas koeficientu

      Kad rangi ir noteikti, tagad varam izmantot Excel funkciju CORREL, lai iegūtu Spearmana rho:

      =CORREL(D2:D11, E2:E11)

      Pēc formulas iegūtais koeficients ir -0,7576 (noapaļots līdz 4 cipariem), kas liecina par diezgan spēcīgu negatīvu korelāciju un ļauj secināt, ka, jo vairāk cilvēks vingro, jo zemāks ir viņa asinsspiediens.

      Pīrsona korelācijas koeficients tai pašai izlasei (-0,7445) norāda uz mazliet vājāku korelāciju, bet joprojām statistiski nozīmīgu:

    Šīs metodes priekšrocība ir tā, ka tā ir ātra, vienkārša un darbojas neatkarīgi no tā, vai rangā ir vai nav saišu.

    Aprēķiniet Spīrmena korelācijas koeficientu programmā Excel, izmantojot tradicionālo formulu

    Ja neesat pilnīgi pārliecināts, ka CORREL funkcija ir pareizi aprēķinājusi Spearmana rho, varat pārbaudīt rezultātu, izmantojot tradicionālo statistikā izmantoto formulu:

    1. Atrodiet starpību starp katru rangu pāri ( d ), atņemot vienu rangu no otra:

      =D2-E2

      Šī formula nonāk F2 un pēc tam tiek kopēta uz leju pa kolonnu.

    2. Katru rangu starpību paaugstina līdz divu pakāpei ( d2 ):

      =F2^2

      Šī formula tiek ievadīta G slejā.

    3. Saskaitiet kvadrātu starpības:

      =SUM(G2:G11)

      Šo formulu var ievadīt jebkurā tukšā šūnā, mūsu gadījumā G12.

      Iespējams, ka no tālāk redzamā ekrānšāviņa attēla jūs labāk sapratīsiet datu izkārtojumu:

    4. Atkarībā no tā, vai jūsu datu kopā ir vai nav saistītu rangu, izmantojiet kādu no šīm formulām, lai aprēķinātu Spīrmena korelācijas koeficientu.

    Mūsu piemērā nav nekādu saišu, tāpēc varam izmantot vienkāršāku formulu:

    Ar d2 vienāds ar 290 un n (novērojumu skaits) ir vienāds ar 10, formulā notiek šādas transformācijas:

    Rezultātā tiek iegūta vērtība -0,757575758, kas pilnībā atbilst iepriekšējā piemērā aprēķinātajam Spīrmena korelācijas koeficientam.

    Microsoft Excel programmā iepriekš minētos aprēķinus var veikt ar šādu vienādojumu:

    =1-(6*G12/(10*(10^2-1)))

    kur G12 ir ranga starpību kvadrātu summa (d2).

    Kā veikt Spīrmena korelāciju programmā Excel, izmantojot grafiku

    Korelācijas koeficienti programmā Excel mēra tikai lineāras (Pīrsona) vai monotonas (Spīrmena) sakarības. Tomēr ir iespējamas arī citas sakarības. Tāpēc neatkarīgi no tā, kādu korelāciju veicat, vienmēr ir lietderīgi attēlot attiecības starp mainīgajiem lielumiem grafikā.

    Lai sastādītu sakarības grafiku rangētajiem datiem, ir nepieciešams veikt šādus darbības:

    1. Aprēķiniet rangus, izmantojot funkciju RANK.AVG, kā paskaidrots šajā piemērā.
    2. Atlasiet divas kolonnas ar rangiem.
    3. Ievietojiet XY izkliedes diagrammu. Šim nolūkam noklikšķiniet uz pogas Izkliedēt diagramma ikona Ievietotie cilnē Tērzēšanas grupa.
    4. Pievienojiet diagrammai tendenču līniju. Ātrākais veids ir noklikšķināt uz pogas Diagrammas elementi pogu> Pievienot Trendline... .
    5. R-kvadrāta vērtības parādīšana diagrammā. Divreiz noklikšķiniet uz tendences līnijas, lai atvērtu tās logu, pārslēdziet uz diagrammu. Trendline opcijas cilni un atlasiet R-kvadrāta vērtības parādīšana uz diagrammas kaste.
    6. Lai nodrošinātu lielāku precizitāti, R2 vērtībā norādiet vairāk ciparu.

    Rezultātā iegūsiet vizuālu attiecību starp rangiem attēlojumu. Turklāt jūs iegūsiet arī Noteicošais koeficients (R2), kura kvadrātsakne ir Pīrsona korelācijas koeficients (r). Bet, tā kā jūs esat uzzīmējis rangētos datus, šis Pīrsona r nav nekas cits kā Spīrmena rho.

    Piezīme: R kvadrāts vienmēr ir pozitīvs skaitlis, tāpēc arī iegūtais Spearman ranga korelācijas koeficients vienmēr būs pozitīvs. Lai pievienotu atbilstošu zīmi, vienkārši aplūkojiet līniju savā korelācijas grafikā - slīpums uz augšu norāda uz pozitīvu korelāciju (plus zīme), bet slīpums uz leju norāda uz negatīvu korelāciju (mīnus zīme).

    Mūsu gadījumā R2 ir 0,5739210285. Lai atrastu kvadrātsakni, izmantojiet funkciju SQRT:

    =SQRT(0,5739210285)

    ...un iegūsiet jau zināmo koeficientu 0,757575758.

    Grafikā lejupejošais slīpums uzrāda negatīvu korelāciju, tāpēc mēs pievienojam mīnusa zīmi un iegūstam pareizo Spīrmena korelācijas koeficientu -0,757575758.

    Lūk, kā varat aprēķināt Spīrmena ranga korelācijas koeficientu programmā Excel. Lai tuvāk iepazītos ar šajā pamācībā aplūkotajiem piemēriem, aicinām lejupielādēt mūsu parauga darbgrāmatu zemāk. Paldies par izlasīto un ceru, ka nākamnedēļ tiksimies mūsu emuārā!

    Prakses darba burtnīca

    Spīrmena ranga korelācija programmā Excel (.xlsx fails)

    Maikls Brauns ir īpašs tehnoloģiju entuziasts, kura aizraušanās ir sarežģītu procesu vienkāršošana, izmantojot programmatūras rīkus. Ar vairāk nekā desmit gadu pieredzi tehnoloģiju nozarē viņš ir pilnveidojis savas prasmes programmās Microsoft Excel un Outlook, kā arī Google izklājlapās un dokumentos. Maikla emuārs ir veltīts tam, lai dalītos savās zināšanās un pieredzē ar citiem, sniedzot viegli izpildāmus padomus un pamācības produktivitātes un efektivitātes uzlabošanai. Neatkarīgi no tā, vai esat pieredzējis profesionālis vai iesācējs, Maikla emuārs piedāvā vērtīgas atziņas un praktiskus padomus, kā maksimāli izmantot šos būtiskos programmatūras rīkus.