Карэляцыя рангаў Спірмена ў Excel: формула і графік

  • Падзяліцца Гэтым
Michael Brown

Падручнік простай мовай тлумачыць асновы карэляцыі Спірмена і паказвае, як разлічыць рангавы каэфіцыент карэляцыі Спірмена ў Excel.

У большасці выпадкаў пры выкананні карэляцыйнага аналізу ў Excel вы будзеце мець справу з карэляцыяй Пірсана. Але паколькі каэфіцыент карэляцыі Пірсана вымярае толькі лінейную залежнасць паміж дзвюма зменнымі, ён не працуе для ўсіх тыпаў даных - вашы зменныя могуць быць цесна звязаны нелінейным чынам і ўсё роўна мець каэфіцыент, блізкі да нуля. У такіх умовах вы можаце выкарыстоўваць рангавую карэляцыю Спірмена замест карэляцыі Пірсана.

    Карэляцыя Спірмена - асновы

    Карэляцыя Спірмена з'яўляецца непараметрычнай версія каэфіцыента карэляцыі Пірсана, які вымярае ступень сувязі паміж дзвюма зменнымі на аснове іх рангаў.

    Карэляцыя моманту твора Пірсана правярае лінейную залежнасць паміж двума бесперапыннымі зменныя. Лінейная азначае залежнасць, калі дзве зменныя змяняюцца ў адным кірунку з пастаяннай хуткасцю.

    Карэляцыя рангаў Спірмена ацэньвае манатонную залежнасць паміж ранжыраванымі значэннямі. У манатонных адносінах зменныя таксама маюць тэндэнцыю змяняцца разам, але неабавязкова з пастаяннай хуткасцю.

    Калі рабіць карэляцыю Спірмена

    Карэляцыйны аналіз Спірмена трэба выкарыстоўваць у любым з наступныяабставіны, калі асноўныя здагадкі карэляцыі Пірсана не выконваюцца:

    1. Калі вашы даныя дэманструюць нелінейную залежнасць або неразмеркаваны нармальна.
    2. Калі хаця б адна пераменная з'яўляецца парадкавай . Калі вашы значэнні можна размясціць у парадку "першае, другое, трэцяе...", вы маеце справу з парадкавымі дадзенымі.
    3. Калі ёсць значныя выкіды . У адрозненне ад карэляцыі Пірсана, карэляцыя Спірмена не адчувальная да выкідаў, таму што яна выконвае вылічэнні на рангах, таму розніца паміж фактычнымі значэннямі не мае значэння.

    Напрыклад, вы можаце выкарыстоўваць карэляцыю Спірмена каб знайсці адказы на наступныя пытанні:

    • Ці людзі з больш высокім узроўнем адукацыі больш клапоцяцца пра навакольнае асяроддзе?
    • Ці звязана колькасць сімптомаў пацыента з іх гатоўнасцю прымаць лекі?

    Каэфіцыент карэляцыі Спірмена

    У статыстыцы каэфіцыент карэляцыі Спірмена прадстаўлены альбо r s або грэчаская літара ρ ("ро"), таму яе часта называюць ро Спірмена .

    Каэфіцыент рангавай карэляцыі Спірмена вымярае як сіла і кірунак сувязі паміж рангамі даных. Гэта можа быць любое значэнне ад -1 да 1, і чым бліжэй абсалютнае значэнне каэфіцыента да 1, тым мацнейшая сувязь:

    • 1 з'яўляецца ідэальным станоўчымкарэляцыя
    • -1 ідэальная адмоўная карэляцыя
    • 0 карэляцыя адсутнічае

    Формула карэляцыі рангу Спірмена

    У залежнасці ад таго, ёсць ці ёсць няма сувязяў у рэйтынгу (адзін і той жа ранг, прысвоены двум ці больш назіранням), каэфіцыент карэляцыі Спірмена можна вылічыць па адной з наступных формул.

    Калі адсутнічаюць аднолькавыя рангі , падыдзе больш простая формула:

    Дзе:

    • d i гэта розніца паміж парай рангаў
    • n гэта колькасць назіранняў

    Каб мець справу з звязанымі рангамі , поўная версія карэляцыі Спірмена неабходна выкарыстоўваць формулу, якая з'яўляецца крыху мадыфікаванай версіяй r Пірсана:

    Дзе:

    • R(x) і R(y ) з'яўляюцца рангамі зменных x і y
    • R(x) і R(y) з'яўляюцца сярэднімі рангамі

    Як разлічыць карэляцыю Спірмена ў Excel з дапамогай функцыі CORREL

    На жаль, Excel не мае ўбудаванай функцыі для разліку Spea rman рангавы каэфіцыент карэляцыі. Аднак гэта не значыць, што вам прыйдзецца ламаць галаву над прыведзенымі вышэй формуламі. Трохі маніпулюючы Excel, мы можам прыдумаць значна больш просты спосаб выканання карэляцыі Спірмена.

    У якасці прыкладу давайце паспрабуем высветліць, ці мае наша фізічная актыўнасць якое-небудзь дачыненне да нашага крывянага ціску. У слупку B мы маем колькасць хвілін, якія праводзяць 10 мужчын аднаго ўзростуштодня ў трэнажорнай зале, а ў слупку C мы паказваем іх сісталічны артэрыяльны ціск.

    Каб знайсці каэфіцыент карэляцыі Спірмена ў Excel, выканайце наступныя дзеянні:

    1. Ранжыруйце свае даныя

      Паколькі карэляцыя Спірмена ацэньвае сувязі паміж дзвюма зменнымі на аснове іх рангаў, вам трэба ранжыраваць свае зыходныя даныя. Гэта можна хутка зрабіць з дапамогай функцыі Excel RANK.AVG.

      Каб ранжыраваць першую зменную (фізічную актыўнасць), увядзіце наступную формулу ў D2, а затым перацягніце яе ўніз да D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Каб ранжыраваць другую зменную (артэрыяльны ціск), змясціце наступную формулу ў ячэйку E2 і скапіруйце яе ў слупок:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Каб формулы працавалі правільна , не забудзьцеся зафіксаваць дыяпазоны абсалютнымі спасылкамі на ячэйкі.

      На дадзены момант вашы зыходныя даныя павінны выглядаць прыкладна так:

    2. Знайдзіце каэфіцыент карэляцыі Спірмена

      З усталяванымі рангамі мы можам выкарыстоўваць функцыю Excel CORREL, каб атрымаць ро Спірмена:

      =CORREL(D2:D11, E2:E11)

      Формула вяртае каэфіцыент -0,7576 (з акругленнем да 4 лічбаў), што паказвае даволі моцную адмоўную карэляцыю і дазваляе нам зрабіць выснову, што чым больш чалавек займаецца спортам, тым ніжэй яго крывяны ціск.

      Каэфіцыент карэляцыі Пірсана для той жа выбаркі (- 0,7445) паказвае на крыху больш слабую карэляцыю, але ўсё ж статыстыку lly істотна:

    Прыгажосць гэтагаметад заключаецца ў тым, што ён хуткі, лёгкі і працуе незалежна ад таго, ці ёсць сувязі ў рэйтынгу ці не.

    Разлічыце каэфіцыент карэляцыі Спірмена ў Excel з дапамогай традыцыйнай формулы

    Калі вы не зусім упэўнены што функцыя CORREL правільна вылічыла ро Спірмена, вы можаце праверыць вынік з дапамогай традыцыйнай формулы, якая выкарыстоўваецца ў статыстыцы. Вось як:

    1. Знайдзіце розніцу паміж кожнай парай рангаў ( d ), адняўшы адзін ранг ад другога:

      =D2-E2

      Гэта формула у F2, а затым капіюецца ў слупок.

    2. Павялічце кожную розніцу рангаў да ступені два ( d2 ):

      =F2^2

      Гэтая формула пераходзіць у слупок G.

    3. Складзіце розніцы ў квадраце:

      =SUM(G2:G11)

      Гэтая формула можа перайсці ў любую пустую ячэйку, у нашым выпадку G12.

      На наступным скрыншоце вы, верагодна, атрымаеце лепшы вынік. разуменне размяшчэння даных:

    4. У залежнасці ад таго, мае ваш набор даных звязаныя рангі ці не, выкарыстоўвайце адну з гэтых формул для разліку каэфіцыента карэляцыі Спірмена.

    У нашым прыкладзе няма сувязяў, таму мы можам выкарыстоўваць больш простую формулу:

    З d2 роўна да 290 і n (колькасць назіранняў), роўная 10, формула перажывае наступныя пераўтварэнні:

    У выніку атрымліваецца -0,757575758 , што цалкам супадае з каэфіцыентам карэляцыі Спірмена, разлічаным упапярэдні прыклад.

    У Microsoft Excel прыведзеныя вышэй вылічэнні можна выканаць з дапамогай наступнага ўраўнення:

    =1-(6*G12/(10*(10^2-1)))

    Дзе G12 — сума квадратаў рангавых розніц (d2) .

    Як зрабіць карэляцыю Спірмена ў Excel з дапамогай графіка

    Каэфіцыенты карэляцыі ў Excel вымяраюць толькі лінейныя (Пірсан) або манатонныя (Спірман) адносіны. Аднак магчымыя і іншыя асацыяцыі. Такім чынам, незалежна ад таго, якую карэляцыю вы робіце, заўсёды будзе добрай ідэяй адлюстраваць адносіны паміж зменнымі ў графіцы.

    Каб намаляваць карэляцыйны графік для ранжыраваных даных, вам трэба зрабіць вось што:

    1. Вылічыце рангі з дапамогай функцыі RANK.AVG, як апісана ў гэтым прыкладзе.
    2. Выберыце два слупкі з рангамі.
    3. Устаўце кропкавую дыяграму XY. Для гэтага пстрыкніце значок точкавай дыяграмы на ўкладцы ўрэзка ў групе чаты .
    4. дадайце лінію трэнду на ваш графік. Самы хуткі спосаб - націснуць кнопку Элементы дыяграмы > Дадаць лінію трэнду… .
    5. Паказаць значэнне R-квадрат на дыяграме. Двойчы пстрыкніце лінію трэнду, каб адкрыць яе панэль, пераключыцеся на ўкладку Параметры лініі трэнду і абярыце поле Паказаць значэнне R-квадрата на дыяграме .
    6. Паказвайце больш лічбаў у значэнні R2 для лепшай дакладнасці.

    У выніку вы атрымаеце візуальнае адлюстраванне ўзаемасувязі паміж рангамі. Акрамя таго, вы атрымаеце Каэфіцыент дэтэрмінацыі (R2), квадратны корань з якога з'яўляецца каэфіцыентам карэляцыі Пірсана (r). Але паколькі вы нанеслі ранжыраваныя даныя, гэты r Пірсана не што іншае, як rho Спірмена.

    Заўвага. R-квадрат заўсёды з'яўляецца дадатным лікам, такім чынам, выведзены рангавы каэфіцыент карэляцыі Спірмена таксама заўсёды будзе дадатным. Каб дадаць адпаведны знак, проста паглядзіце на лінію ў вашым графіку карэляцыі - нахіл уверх паказвае станоўчую карэляцыю (знак плюс), а нахіл уніз - адмоўную карэляцыю (знак мінус).

    У нашым выпадку R2 роўны 0,5739210285. Выкарыстоўвайце функцыю SQRT, каб знайсці квадратны корань:

    =SQRT(0.5739210285)

    …і вы атрымаеце ўжо знаёмы каэфіцыент 0,757575758.

    Нахіл уніз на графіку паказвае адмоўны карэляцыі, таму мы дадаем знак мінус і атрымліваем правільны каэфіцыент карэляцыі Спірмена -0,757575758.

    Вось як вы можаце разлічыць рангавы каэфіцыент карэляцыі Спірмена ў Excel. Каб больш падрабязна разгледзець прыклады, якія абмяркоўваюцца ў гэтым уроку, вы можаце загрузіць наш узор працоўнага сшытка ніжэй. Я дзякую вам за чытанне і спадзяюся ўбачыць вас у нашым блогу на наступным тыдні!

    Практычны сшытак

    Карэляцыя рангаў Спірмана ў Excel (файл .xlsx)

    Майкл Браўн - адданы энтузіяст тэхналогій, які любіць спрашчэнне складаных працэсаў з дапамогай праграмных інструментаў. Маючы больш чым дзесяцігадовы досвед працы ў індустрыі тэхналогій, ён удасканальваў свае навыкі ў Microsoft Excel і Outlook, а таксама ў Google Sheets і Docs. Блог Майкла прысвечаны таму, каб падзяліцца сваімі ведамі і вопытам з іншымі, даючы простыя ў выкананні парады і падручнікі для павышэння прадукцыйнасці і эфектыўнасці. Незалежна ад таго, з'яўляецеся вы дасведчаным прафесіяналам або пачаткоўцам, блог Майкла прапануе каштоўную інфармацыю і практычныя парады, каб атрымаць максімальную аддачу ад гэтых неабходных праграмных інструментаў.