Excel бағдарламасындағы корреляция: коэффициент, матрица және график

  • Мұны Бөлісіңіз
Michael Brown

Оқулық Excel бағдарламасындағы корреляция негіздерін түсіндіреді, корреляция коэффициентін есептеу, корреляциялық матрицаны құру және нәтижелерді түсіндіру жолын көрсетеді.

Excel бағдарламасында жасауға болатын қарапайым статистикалық есептеулердің бірі - корреляция. Қарапайым болғанымен, ол екі немесе одан да көп айнымалылар арасындағы қатынастарды түсінуде өте пайдалы. Microsoft Excel корреляциялық талдауды орындау үшін барлық қажетті құралдарды ұсынады, тек оларды қалай пайдалану керектігін білу қажет.

    Excel бағдарламасындағы корреляция – негіздері

    Корреляция - екі айнымалы арасындағы байланыстың күші мен бағытын сипаттайтын өлшем. Ол әдетте статистикада, экономикада және әлеуметтік ғылымдарда бюджеттер, бизнес-жоспарлар және т>

    Міне, күшті корреляцияның бірнеше мысалы:

    • Сіз тұтынатын калория саны мен салмағыңыз (оң корреляция)
    • Сырттағы температура және сіздің жылу шығындарыңыз ( теріс корреляция)

    Міне, әлсіз немесе жоқ корреляцияға ие деректер мысалдары:

    • Мысықтың аты және олардың сүйікті тағамы
    • Түс сіздің көзіңіз бен бойыңыз

    Корреляция туралы түсіну қажет маңызды нәрсе - ол тек екі айнымалының қаншалықты тығыз байланысты екенін көрсетеді. Алайда корреляция дегенді білдірмейдікөрсетілген диапазоннан.

  • ROWS және COLUMNS - сәйкесінше диапазондағы жолдар мен бағандардың санын қайтарады. Біздің корреляция формуламызда екеуі де бір мақсатта пайдаланылады - бастапқы ауқымнан ығысу үшін бағандар санын алыңыз. Бұған абсолютті және салыстырмалы сілтемелерді ақылды қолдану арқылы қол жеткізіледі.
  • Логиканы жақсырақ түсіну үшін формула жоғарыдағы скриншотта ерекшеленген коэффициенттерді қалай есептейтінін көрейік.

    Біріншіден, Айлық температура (B2:B13) мен сатылған жылытқыштар (D2:D13) арасындағы корреляцияны табатын B18 формуласын зерттеңіз:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    Бірінші OFFSET функциясында ROWS($1: 1) ROWS($1:3) түріне өзгертілді, себебі екінші координат салыстырмалы, сондықтан ол формула көшірілетін жолдың салыстырмалы орнына қарай өзгереді (2 жол төмен). Осылайша, ROWS() 3 мәнін қайтарады, одан 1-ді алып тастаймыз және бастапқы диапазонның оң жағындағы 2 баған болатын ауқымды аламыз, яғни $D$2:$D$13 (жылытқышты сату).

    екінші OFFSET көрсетілген $B$2:$B$13 (температура) диапазонын өзгертпейді, себебі COLUMNS($A:A)-1 нөлді қайтарады.

    Нәтижесінде біздің ұзын формуламыз қарапайым CORREL() түріне айналады. $D$2:$D$13, $B$2:$B$13) және дәл біз қалаған коэффициентті қайтарады.

    Жарнама құны (C2:C13) және сатылым (C18) үшін корреляция коэффициентін есептейтін формула. D2:D13) ұқсас түрде жұмыс істейді:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))

    Бірінші OFFSET функциясы:жоғарыда сипатталғанмен мүлдем бірдей, $D$2:$D$13 ауқымын қайтарады (жылытқышты сату).

    Екінші ОФСЕТТЕ, COLUMNS($A:A)-1 COLUMNS($A:) мәніне өзгереді. B)-1, себебі біз формула 1 бағанын оң жаққа көшірдік. Демек, OFFSET бастапқы диапазонның оң жағындағы 1 баған болатын ауқымды алады, яғни $C$2:$C$13 (жарнама құны).

    Excel бағдарламасында корреляция графигін салу әдісі

    Excel бағдарламасында корреляцияны орындаған кезде, деректер арасындағы қатынастың көрнекі көрінісін алудың ең жақсы жолы - тренд сызығы бар шашырау сызбасын салу. Мынадай:

    1. Сандық деректері бар екі бағанды, соның ішінде баған тақырыптарын таңдаңыз. Бағандардың реті маңызды: тәуелсіз айнымалы сол жақ бағанда болуы керек, себебі бұл баған x осінде сызылады; тәуелді айнымалы оң жақ бағанда болуы керек, себебі ол y осінде сызылады.
    2. Кірістіру қойындысындағы Чаттар тобында Scatter диаграмма белгішесін басыңыз. Бұл XY шашыраңқы диаграммасын жұмыс парағына бірден кірістіреді.
    3. Диаграммадағы кез келген деректер нүктесін тінтуірдің оң жақ түймешігімен басып, контекстік мәзірден Тренд сызығын қосу... пәрменін таңдаңыз.

    Егжей-тегжейлі қадамдық нұсқауларды қараңыз:

    • Excel бағдарламасында шашырау сызбасын құру
    • Excel диаграммасына тренд сызығын қосу

    Біздің үлгі деректер жиыны үшін корреляциялық графиктер төмендегі суретте көрсетілгендей болады.Сонымен қатар, біз Анықтау коэффициенті деп те аталатын R-квадрат мәнін көрсеттік. Бұл мән тренд сызығының деректерге қаншалықты сәйкес келетінін көрсетеді - R2-ге 1-ге жақын болған сайын, соғұрлым жақсы сәйкес келеді.

    Шашырау диаграммасында көрсетілген R2 мәнінен корреляция коэффициентін оңай есептеуге болады:

    1. Дәлірек болу үшін Excel бағдарламасын R-квадрат мәнінде әдепкіден көбірек сандарды көрсетуін алыңыз.
    2. Диаграммадағы R2 мәнін басып, оны тінтуірдің көмегімен таңдап, Ctrl пернесін басыңыз. Оны көшіру үшін + C.
    3. SQRT функциясын пайдалану арқылы немесе көшірілген R2 мәнін 0,5 дәрежесіне көтеру арқылы R2 квадрат түбірін алыңыз.

    Мысалы, Екінші графиктегі R2 мәні 0,9174339392. Сонымен, Жарнама және Сатылған жылытқыштар үшін корреляция коэффициентін мына формулалардың бірімен таба аласыз:

    =SQRT(0.9174339392)

    =0.9174339392^0.5

    Сіз көз жеткізгендей, осылай есептелген коэффициенттер алдыңғы мысалдардағы корреляция коэффициенттерімен толық сәйкес келеді, белгіден басқа :

    Excel бағдарламасындағы корреляцияға қатысты ықтимал мәселелер

    Пирсон өнімінің моментінің корреляциясы тек екі айнымалы арасындағы сызықтық қатынасты көрсетеді. Мағынасы, айнымалыларыңыз басқа, қисық сызықты түрде қатты байланысты болуы мүмкін және әлі де корреляция коэффициенті нөлге тең немесе жақын болуы мүмкін.

    Пирсон корреляциясы мүмкін емес. тәуелді және тәуелсіз айнымалыларды ажырату. Мысалы, орташа айлық температура мен сатылған жылытқыштар саны арасындағы байланысты табу үшін CORREL функциясын пайдаланған кезде біз -0,97 коэффициентін алдық, бұл жоғары теріс корреляцияны көрсетеді. Дегенмен, айнымалы мәндерді ауыстырып, бірдей нәтиже алуға болады. Сонымен, біреу жылытқыштардың жоғары сатылымы температураның төмендеуіне әкеледі деген қорытындыға келуі мүмкін, бұл анық мағынасы жоқ. Сондықтан, Excel бағдарламасында корреляциялық талдауды орындаған кезде, сіз беріп жатқан деректерден хабардар болыңыз.

    Сонымен қатар, Пирсон корреляциясы шығыс мәндерге өте сезімтал. Егер сізде қалған деректерден айтарлықтай ерекшеленетін бір немесе бірнеше деректер нүктелері болса, айнымалылар арасындағы қатынастың бұрмаланған суретін алуыңыз мүмкін. Бұл жағдайда оның орнына Спирмен дәрежесінің корреляциясын пайдаланған дұрыс болар еді.

    Excel бағдарламасында корреляцияны осылай жасауға болады. Осы оқулықта талқыланған мысалдарды егжей-тегжейлі қарау үшін төмендегі жұмыс кітабының үлгісін жүктеп алуыңызға болады. Оқығаныңыз үшін алғыс айтамын және келесі аптада блогымызда көреміз деп үміттенемін!

    Жаттығу жұмыс кітабы

    Excel бағдарламасында корреляцияны есептеу (.xlsx файлы)

    себептілік. Бір айнымалыдағы өзгерістердің басқа айнымалыдағы өзгерістермен байланысты болуы бір айнымалының екіншісінің өзгеруіне себеп болатынын білдірмейді.

    Егер сізді себептілік байланысын біліп, болжам жасағыңыз келсе, алға қадам жасаңыз. және сызықтық регрессиялық талдауды орындаңыз.

    Excel бағдарламасындағы корреляция коэффициенті - корреляцияны түсіндіру

    Екі үздіксіз айнымалылар арасындағы байланыс дәрежесінің сандық өлшемі корреляция коэффициенті деп аталады ( r).

    Коэффициент мәні әрқашан -1 мен 1 аралығында болады және ол айнымалылар арасындағы сызықтық байланыстың күшін де, бағытын да өлшейді.

    Күш

    Үлкенірек. коэффициенттің абсолютті мәні, соғұрлым күшті байланыс:

    • -1 және 1 экстремалды мәндері барлық деректер нүктелері бір сызыққа түскенде тамаша сызықтық қатынасты көрсетеді. Тәжірибеде оң немесе теріс тамаша корреляция сирек байқалады.
    • 0 коэффициенті айнымалылар арасында сызықтық байланыстың жоқтығын көрсетеді. Бұл кездейсоқ сандардың екі жинағында қол жеткізуге болатын нәрсе.
    • 0 және +1/-1 арасындағы мәндер әлсіз, орташа және күшті қарым-қатынастар шкаласын білдіреді. r -1 немесе 1-ге жақындаған сайын қатынастың күші артады.

    Бағыт

    Коэффициент белгісі (плюс немесе минус) бағытықатынас.

    • Оң коэффициенттері тікелей корреляцияны білдіреді және графикте жоғары еңіс шығарады - бір айнымалы өскен сайын екіншісі де өседі және керісінше.
    • Теріс коэффициенттері кері корреляцияны білдіреді және графикте төмен қарай еңіс жасайды - бір айнымалы өскен сайын, басқа айнымалы азаяды.

    Жақсы түсіну үшін мынаны қараңыз. келесі корреляциялық графиктер:

    • 1 коэффициенті тамаша оң қатынасты білдіреді - бір айнымалы өскен сайын, екіншісі пропорционалды түрде артады.
    • <коэффициенті -1 мінсіз теріс қатынасты білдіреді - бір айнымалы өскен сайын екіншісі пропорционалды түрде азаяды.
    • 0 коэффициенті екі айнымалының арасында байланыс жоқ дегенді білдіреді - деректер нүктелері график бойынша шашыраңқы.

    Пирсон корреляциясы

    Статистикада олар сіз жұмыс істеп жатқан деректер түріне байланысты корреляцияның бірнеше түрін өлшейді. Бұл оқулықта біз ең көп тарағанына тоқталамыз.

    Пирсон корреляциясы , толық аты Пирсон өнімінің моменті корреляциясы (PPMC) үшін пайдаланылады. бір айнымалының өзгеруі басқа айнымалының пропорционалды өзгеруімен байланысты болған кезде деректер арасындағы сызықтық қатынастарды бағалау. Қарапайым тілмен айтқанда, Пирсон корреляциясы сұраққа жауап береді: Деректерді aline?

    Статистикада бұл ең танымал корреляция түрі және егер сіз қосымша біліктіліксіз "корреляция коэффициентімен" айналысатын болсаңыз, ол Пирсон болуы мүмкін.

    Міне, Пирсон корреляция коэффициентін табу үшін ең жиі қолданылатын формула Пирсон R деп те аталады:

    Кейде үлгі корреляция коэффициентін есептеуге арналған басқа екі формуланы кездестіруге болады. (r) және популяциялық корреляция коэффициенті (ρ).

    Excel бағдарламасында Pearson корреляциясын қалай жасауға болады

    Пирсон корреляция коэффициентін қолмен есептеу көп математиканы қажет етеді. . Бақытымызға орай, Microsoft Excel бәрін өте қарапайым етті. Деректер жинағы мен мақсатыңызға байланысты сіз келесі әдістердің бірін пайдалана аласыз:

    • CORREL функциясымен Пирсон корреляция коэффициентін табыңыз.
    • Корреляциялық матрицаны мына арқылы жасаңыз. Деректерді талдауды орындау.
    • Формула арқылы бірнеше корреляция коэффициенттерін табыңыз.
    • Деректердің қатынасының көрнекі көрінісін алу үшін корреляциялық графикті салыңыз.

    Есептеу әдісі Excel бағдарламасындағы корреляция коэффициенті

    Корреляция коэффициентін қолмен есептеу үшін осы ұзақ формуланы пайдалану керек. Excel бағдарламасында корреляция коэффициентін табу үшін CORREL немесе PEARSON функциясын пайдаланыңыз және нәтижені секундтың бір бөлігінде алыңыз.

    Excel CORREL функциясы

    CORREL функциясы қайтарадыЕкі мәндер жиыны үшін Пирсон корреляция коэффициенті. Оның синтаксисі өте оңай және түсінікті:

    CORREL(1-массив,2-массив)

    Мұндағы:

    • Массив1 - мәндердің бірінші диапазоны.
    • 2-массив мәндердің екінші диапазоны.

    Екі массивтің ұзындығы бірдей болуы керек.

    Егер бізде тәуелсіз айнымалылар жиыны бар ( ). x ) B2:B13 және тәуелді айнымалылар (y) C2:C13, біздің корреляция коэффициентінің формуласы келесідей болады:

    =CORREL(B2:B13, C2:C13)

    Немесе, біз ауқымдарды ауыстыра аламыз және әлі де бірдей нәтиже алыңыз:

    =CORREL(C2:C13, B2:B13)

    Қандай жағдайда да формула орташа айлық температура мен сатылған жылытқыштар саны арасындағы күшті теріс корреляцияны (шамамен -0,97) көрсетеді:

    Excel бағдарламасындағы CORREL функциясы туралы білуіңіз керек 3 нәрсе

    Excel бағдарламасындағы корреляция коэффициентін сәтті есептеу үшін мына 3 қарапайым фактіні есте сақтаңыз:

    • Егер бір немесе бірнеше ұяшық болса массивте мәтін, логикалық мәндер немесе бос орындар бар, мұндай ұяшықтар еленбейді; нөлдік мәндері бар ұяшықтар есептеледі.
    • Егер берілген массивтердің ұзындықтары әртүрлі болса, #N/A қатесі қайтарылады.
    • Егер массивтердің біреуі бос болса немесе стандартты ауытқуы олардың мәндері нөлге тең, #DIV/0! қате орын алды.

    Excel PEARSON функциясы

    Excel бағдарламасындағы PEARSON функциясы бірдей әрекетті жасайды - Pearson өнімінің моменті корреляция коэффициентін есептейді.

    PEARSON(1-массив,массив2)

    Мұндағы:

    • Массив1 - тәуелсіз мәндер ауқымы.
    • Массив2 - тәуелді мәндер ауқымы.

    PEARSON және CORREL екеуі де Pearson сызықтық корреляция коэффициентін есептейтіндіктен, олардың нәтижелері сәйкес болуы керек және олар әдетте Excel 2007 және Excel 2019 нұсқасының соңғы нұсқаларында орындалады.

    Excel 2003 және бұрынғы нұсқаларда, алайда, PEARSON функциясы кейбір дөңгелектеу қателерін көрсетуі мүмкін. Сондықтан ескі нұсқаларда PEARSON нұсқасына артықшылық беру үшін CORREL пайдалану ұсынылады.

    Біздің үлгі деректер жинағында екі функция да бірдей нәтижелерді көрсетеді:

    =CORREL(B2:B13, C2:C13)

    =PEARSON(B2:B13, C2:C13)

    Деректерді талдау арқылы Excel бағдарламасында корреляциялық матрицаны қалай жасауға болады

    Екіден көп айнымалылар арасындағы өзара байланысты тексеру қажет болғанда, корреляциялық матрицаны құру мағынасы бар, оны кейде <1 деп те атайды>көп корреляция коэффициенті .

    корреляция матрицасы - сәйкес жолдар мен бағандардың қиылысындағы айнымалылар арасындағы корреляция коэффициенттерін көрсететін кесте.

    Excel бағдарламасындағы корреляция матрицасы Талдау құралдары жинағы қондырмасындағы Корреляция құралы арқылы құрастырылған. Бұл қондырма Excel 2003 және Excel 2019 нұсқасының барлық нұсқаларында қолжетімді, бірақ әдепкі бойынша қосылмаған. Оны әлі белсендірмеген болсаңыз, Excel бағдарламасында Деректерді талдау құралдары пакетін қосу жолы бөлімінде сипатталған қадамдарды орындау арқылы мұны қазір орындаңыз.

    Excel лентасына қосылған Деректерді талдау құралдарымен сіз корреляциялық талдауды орындауға дайынсыз:

    1. Деректер қойындысының жоғарғы оң жақ бұрышында > Талдау тобында Деректерді талдау түймесін басыңыз.
    2. Деректерді талдау диалогтық терезесінде Корреляция параметрін таңдап, OK түймесін басыңыз.
    3. Корреляция жолағында параметрлерді келесідей конфигурациялаңыз:
      • Енгізу диапазоны жолағын басып, диапазонды таңдаңыз. бастапқы деректеріңіз, соның ішінде баған тақырыптары (біздің жағдайда B1:D13).
      • Топталған бөлімінде Бағандар радио жолағы таңдалғанын тексеріңіз (берілген). бастапқы деректеріңіз бағандарға топтастырылған.
      • Таңдалған ауқымда баған тақырыптары болса, Бірінші жолдағы белгілер құсбелгісін қойыңыз.
      • Қажетті шығыс опциясын таңдаңыз. Матрица бір парақта болуы үшін Шығыс диапазоны параметрін таңдап, матрица шығарылатын сол жақ ұяшыққа сілтемені көрсетіңіз (осы мысалдағы A15).

    Дайын болғаннан кейін OK түймесін басыңыз:

    Сіздің корреляция коэффициенттерінің матрицасы орындалды және келесі бөлімде көрсетілгендей болуы керек.

    Корреляциялық талдау нәтижелерін интерпретациялау

    Excel корреляциялық матрицаңызда жолдар мен бағандардың қиылысында коэффициенттерді табуға болады. Баған мен жол координаталары бірдей болса, 1 мәні шығарылады.

    ЖоғарыдаМысалы, біз тәуелді айнымалы (сатылатын жылытқыштар саны) және екі тәуелсіз айнымалы (орташа айлық температура және жарнамалық шығындар) арасындағы корреляцияны білуге ​​мүдделіміз. Сонымен, біз төмендегі скриншотта ерекшеленген осы жолдар мен бағандардың қиылысындағы сандарды ғана қарастырамыз:

    -0,97 теріс коэффициенті (2 ондық таңбаға дейін дөңгелектенеді) арасындағы күшті кері корреляцияны көрсетеді. ай сайынғы температура мен жылытқыштарды сату - температура жоғарылаған сайын жылытқыштар азырақ сатылады.

    Оң коэффициент 0,97 (ондық 2 таңбаға дейін дөңгелектенеді) жарнамалық бюджет пен сату арасындағы күшті тікелей байланысты көрсетеді - соғұрлым көп жарнамаға жұмсаған ақшаңыз соғұрлым жоғары болады.

    Формулалармен Excel бағдарламасында бірнеше корреляциялық талдауды қалай жасауға болады

    Деректерді талдау құралымен корреляция кестесін құру оңай. Дегенмен, бұл матрица статикалық болып табылады, яғни бастапқы деректер өзгерген сайын корреляциялық талдауды жаңадан орындау қажет болады.

    Жақсы жаңалық мынада, ұқсас корреляция кестесін өзіңіз оңай құра аласыз және бұл матрица автоматты түрде жаңартылады. бастапқы мәндердегі әрбір өзгеріспен.

    Оны орындау үшін мына жалпы формуланы пайдаланыңыз:

    CORREL(OFFSET( бірінші_айнымалы_ауқым , 0, ROWS($1:1)-1) , OFFSET( бірінші_айнымалы_ауқым , 0, COLUMNS($A:A)-1))

    Маңызды ескерту! Формула жұмыс істеуі үшін құлыптау керекабсолютті ұяшық сілтемелерін пайдалану арқылы бірінші айнымалы диапазон.

    Біздің жағдайда бірінші айнымалы ауқым $B$2:$B$13 (анықтаманы құлыптайтын $ белгісіне назар аударыңыз) және біздің корреляция формуласы осыны қабылдайды. пішін:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    Формула дайын болғанда корреляциялық матрицаны тұрғызайық:

    1. Матрицаның бірінші жолы мен бірінші бағанында айнымалыларды теріңіз' белгілерді бастапқы кестеде көрсетілген ретпен орналастырыңыз (төмендегі скриншотты қараңыз).
    2. Жоғарыдағы формуланы сол жақ ұяшыққа енгізіңіз (біздің жағдайда B16).
    3. Формуланы сүйреңіз. төмен және оңға қарай жылжытыңыз (біздің мысалдағы 3 жол және 3 баған) қажетінше көп жолдар мен бағандарға көшіру үшін). коэффициенттер. Біздің формула бойынша қайтарылған коэффициенттер алдыңғы мысалдағы Excel шығарғанымен бірдей екенін ескеріңіз (тиістілері бөлектелген):

      Бұл формула қалай жұмыс істейді

      Сіз бұрыннан білетіндей, Excel CORREL функциясы сіз көрсеткен айнымалылардың екі жиыны үшін корреляция коэффициентін қайтарады. Негізгі міндет матрицаның сәйкес ұяшықтарында сәйкес диапазондарды қамтамасыз ету болып табылады. Ол үшін формулаға тек бірінші айнымалы диапазонды енгізесіз және қажетті түзетулерді жасау үшін келесі функцияларды пайдаланасыз:

      • OFFSET - жолдар мен бағандардың берілген саны болып табылатын ауқымды қайтарады.

    Майкл Браун - бағдарламалық құралдарды пайдалана отырып, күрделі процестерді жеңілдетуге құмарлығы бар арнайы технология әуесқойы. Технологиялық индустрияда он жылдан астам тәжірибесі бар ол Microsoft Excel және Outlook, сондай-ақ Google Sheets және Docs бағдарламаларында өз дағдыларын жетілдірді. Майклдың блогы өз білімі мен тәжірибесін басқалармен бөлісуге, өнімділік пен тиімділікті арттыруға арналған оңай орындалатын кеңестер мен оқулықтар беруге арналған. Сіз тәжірибелі кәсіпқой болсаңыз да, жаңадан бастаушы болсаңыз да, Майклдың блогы осы маңызды бағдарламалық құралдарды барынша пайдалану үшін құнды түсініктер мен практикалық кеңестер ұсынады.