Содржина
Упатството ги објаснува основите на корелацијата на Спирман на едноставен јазик и покажува како да се пресмета коефициентот на корелација на ранг на Спирман во Excel.
Кога се прави анализа на корелација во Excel, во повеќето случаи ќе се занимавате со Пирсоновата корелација. Но, бидејќи Пирсоновиот коефициент на корелација мери само линеарна врска помеѓу две променливи, тој не работи за сите типови на податоци - вашите променливи може да бидат силно поврзани на нелинеарен начин и сепак да имаат коефициент блиску до нула. Во такви околности, можете да ја направите корелацијата за ранг на Спирман наместо Пирсоновата.
Спирманова корелација - основите
Спирмановата корелација е непараметриска верзија на коефициентот на корелација Пирсон кој го мери степенот на поврзаност помеѓу две променливи врз основа на нивните рангирања.
Корелацијата на моментот на производот на Pearson ја тестира линеарната врската помеѓу две континуирани променливи. Линеарно значи врска кога две променливи се менуваат во иста насока со константна брзина.
Spearman Rank Correlation ја оценува врската монотони помеѓу рангираните вредности. Во монотони односи, променливите, исто така, имаат тенденција да се менуваат заедно, но не нужно со постојана брзина.
Кога да се направи корелација на Спирман
Анализата на корелација на Спирман треба да се користи во која било од следењеоколности кога основните претпоставки на корелацијата Пирсон не се исполнети:
- Ако вашите податоци покажуваат нелинеарна врска или не се нормално дистрибуирани.
- Ако барем една променлива е редна . Ако вашите вредности можат да се постават по редослед „прв, втор, трет…“, се занимавате со редни податоци.
- Ако има значајни оддалечени . За разлика од корелацијата Пирсон, Спирмановата корелација не е чувствителна на оддалеченост бидејќи врши пресметки на ранговите, така што разликата помеѓу вистинските вредности нема значење.
На пример, можете да ја користите корелацијата Спирман да ги најдете одговорите на следниве прашања:
- Дали луѓето со повисоко ниво на образование се позагрижени за животната средина?
- Дали бројот на симптоми што ги има пациентот е поврзан со нивната подготвеност да земам лекови?
Spearman коефициент на корелација
Во статистиката, Spearman коефициентот на корелација е претставен со или r s или грчката буква ρ ("rho"), поради што често се нарекува Spearman's rho .
Спирмановиот коефициент на корелација ги мери и силата и насоката на односот помеѓу редовите на податоците. Може да биде која било вредност од -1 до 1, и колку е поблиска апсолутната вредност на коефициентот до 1, толку е посилна врската:
- 1 е совршен позитивенкорелација
- -1 е совршена негативна корелација
- 0 нема корелација
Формула за корелација за ранг на Спирман
Во зависност од тоа дали има или има нема врски во рангирањето (истиот ранг е доделен на две или повеќе набљудувања), коефициентот на корелација Спирман може да се пресмета со една од следните формули.
Ако нема нема врзани рангирања , поедноставна формула ќе направи:
Каде:
- d i е разликата помеѓу пар рангови
- n е бројот на набљудувања
За да се справиме со врзаните редови , целосната верзија на корелацијата Спирман треба да се користи формулата, која е малку изменета верзија на Pearson-овите r:
Where:
- R(x) и R(y ) се рангови на променливите x и y
- R(x) и R(y) се средните рангирања
Како да се пресмета корелацијата Spearman во Excel со функцијата CORREL
За жал, Excel нема вградена функција за пресметување на Spea rman ранг коефициент на корелација. Сепак, тоа не значи дека ќе морате да го наместите мозокот со горенаведените формули. Со малку манипулирање со Excel, можеме да дојдеме до многу поедноставен начин да ја направиме корелацијата на Спирман.
Како пример, да се обидеме да откриеме дали нашата физичка активност има некаква врска со нашиот крвен притисок. Во колоната Б го имаме бројот на минути што ги поминуваат 10 мажи на иста возрастдневно во теретана, а во колоната В, го имаме нивниот систолен крвен притисок.
За да го пронајдете коефициентот на корелација на Спирман во Excel, направете ги овие чекори:
- Рангирајте ги вашите податоци
Бидејќи корелацијата Spearman ги оценува асоцијациите помеѓу две променливи врз основа на нивните рангови, треба да ги рангирате вашите изворни податоци. Ова може брзо да се направи со користење на функцијата Excel RANK.AVG.
За да ја рангирате првата променлива (физичка активност), внесете ја формулата подолу во D2 и потоа повлечете ја надолу до D11:
=RANK.AVG(B2,$B$2:$B$11,0)
За да ја рангирате втората променлива (крвен притисок), ставете ја следната формула во ќелијата Е2 и копирајте ја во колоната:
=RANK.AVG(C2,$C$2:$C$11,0)
За формулите да работат правилно , не заборавајте да ги заклучите опсезите со апсолутни референци на ќелиите.
Во овој момент, вашите изворни податоци треба да изгледаат слично на ова:
Исто така види: Висина на редот на Excel: како да се промени и AutoFit - Најди го коефициентот на корелација на Спирман
Со воспоставените рангови, сега можеме да ја користиме функцијата Excel CORREL за да го добиеме Spearman's rho:
=CORREL(D2:D11, E2:E11)
Формулата враќа коефициент од -0,7576 (заокружено на 4 цифри), што покажува прилично силна негативна корелација и ни овозможува да заклучиме дека колку повеќе човек вежба, толку е помал неговиот крвен притисок.
Пирсоновиот коефициент на корелација за истиот примерок (- 0,7445) укажува на малку послаба корелација, но сепак статистика lly значајно:
Убавината на оваметодот е дека е брз, лесен и работи без разлика дали има врски во рангирањето или не.
Пресметајте го коефициентот на корелација на Спирман во Excel со традиционалната формула
Ако не сте сосема сигурни дека функцијата CORREL го пресметала точното rho на Spearman, можете да го потврдите резултатот со традиционалната формула што се користи во статистиката. Еве како:
- Најдете ја разликата помеѓу секој пар рангови ( d ) со одземање на еден од другиот ранг:
=D2-E2
Оваа формула оди до F2 и потоа се копира во колоната.
- Подигнете ја секоја разлика во рангот на моќ од два ( d2 ):
=F2^2
Оваа формула оди во колоната G.
- Соберете ги квадратните разлики:
=SUM(G2:G11)
Оваа формула може да оди во која било празна ќелија, G12 во нашиот случај.
Од следнава слика од екранот, веројатно ќе добиете подобри разбирање на распоредот на податоците:
- Во зависност од тоа дали вашиот сет на податоци има врзани рангови или не, користете една од овие формули за да го пресметате коефициентот на корелација на Спирман.
Во нашиот пример, нема врски, така што можеме да одиме со поедноставна формула:
Со d2 еднакво до 290 и n (број на набљудувања) еднаков на 10, формулата ги претрпува следните трансформации:
Како резултат, добивате -0,757575758 , што совршено се согласува со Спирмановиот коефициент на корелација пресметан вопретходен пример.
Во Microsoft Excel, горенаведените пресметки може да се извршат со следнава равенка:
=1-(6*G12/(10*(10^2-1)))
Каде што G12 е збирот на квадратните разлики во рангирањето (d2) .
Како да се направи корелација на Спирман во Excel користејќи графикон
Коефициентите на корелација во Excel мерат само линеарни (Пирсон) или монотони (Спирман) односи. Сепак, можни се и други асоцијации. Значи, без разлика која корелација ја правите, секогаш е добра идеја да ја претставите врската помеѓу променливите во графикот.
За да нацртате графикон за корелација за рангираните податоци, еве што треба да направите:
- Пресметајте ги ранговите користејќи ја функцијата RANK.AVG како што е објаснето во овој пример.
- Изберете две колони со ранговите.
- Вметнете XY дијаграм за расејување. За ова, кликнете на иконата Scatter графикон на картичката Inset , во групата Chats .
- Додадете линија на трендот на вашата табела. Најбрзиот начин е да кликнете на копчето Елементи на графиконот > Додај линија за трендови... .
- Прикажи вредност на квадрат R на графиконот. Кликнете двапати на линијата на тренд за да го отворите нејзиниот панел, префрлете се на јазичето Опции за трендови и изберете го полето Прикажи ја квадратната вредност на R на графиконот .
- Покажете повеќе цифри во вредноста R2 за подобра прецизност.
Како резултат на тоа, ќе добиете визуелна претстава за односот помеѓу рангот. Дополнително, ќе го добиете Коефициент на определување (R2), чиј квадратен корен е Пирсонов коефициент на корелација (r). Но, бидејќи сте ги нацртале рангираните податоци, овој Pearson's r не е ништо друго туку Spearman's rho.
Забелешка. R-квадрат е секогаш позитивен број, па оттука и заклучениот коефициент на корелација на ранг на Спирман, исто така, ќе биде секогаш позитивен. За да додадете соодветен знак, само погледнете ја линијата во графикот на корелација - нагорен наклон означува позитивна корелација (знак плус) и надолна наклон означува негативна корелација (знак минус).
Во нашиот случај, R2 е еднакво на 0,5739210285. Користете ја функцијата SQRT за да го пронајдете квадратниот корен:
=SQRT(0.5739210285)
...и ќе го добиете веќе познатиот коефициент од 0,757575758.
Наклонот надолу во графиконот покажува негативен корелација, па го додаваме знакот минус и го добиваме точниот коефициент на корелација на Спирман од -0,757575758.
Така можете да го пресметате коефициентот на корелација на ранг на Спирман во Excel. За да ги погледнете одблизу примерите дискутирани во ова упатство, добредојдени сте да ја преземете нашата примерок работна книга подолу. Ви благодарам што прочитавте и се надевам дека ќе се видиме на нашиот блог следната недела!
Вежбајте работна тетратка
Спеарман Ранг корелација во Excel (датотека .xlsx)