Excel бағдарламасындағы сызықтық регрессия талдауы

  • Мұны Бөлісіңіз
Michael Brown

Оқулық регрессиялық талдаудың негіздерін түсіндіреді және Excel бағдарламасында сызықтық регрессияны орындаудың бірнеше түрлі әдістерін көрсетеді.

Оны елестетіп көріңізші: сізге әр түрлі деректер және әртүрлі деректер берілген. Сіздің компанияңыздың келесі жылғы сату сандарын болжау сұралады. Сіз сандарға әсер етуі мүмкін ондаған, тіпті жүздеген факторларды таптыңыз. Бірақ олардың қайсысы маңызды екенін қайдан білуге ​​болады? Excel бағдарламасында регрессия талдауын іске қосыңыз. Ол сізге осы және басқа да көптеген сұрақтарға жауап береді: Қандай факторлар маңызды және қайсысын елемеуге болады? Бұл факторлар бір-бірімен қаншалықты тығыз байланысты? Болжамдарға қаншалықты сенімді бола аласыз?

    Excel бағдарламасындағы регрессиялық талдау - негіздері

    Статистикалық модельдеуде регрессиялық талдау екі немесе одан да көп айнымалылар арасындағы байланысты бағалаңыз:

    Тәуелді айнымалы (aka критерий айнымалы) - сіз түсінуге және болжауға тырысатын негізгі фактор.

    Тәуелсіз айнымалылар (aka түсіндірмелі айнымалылар немесе болжауыштар ) тәуелді айнымалыға әсер етуі мүмкін факторлар болып табылады.

    Регрессиялық талдау сізге көмектеседі. тәуелсіз айнымалылардың бірі өзгергенде тәуелді айнымалының қалай өзгеретінін түсіну және сол айнымалылардың қайсысы шынымен әсер ететінін математикалық анықтауға мүмкіндік береді.

    Техникалық тұрғыдан регрессиялық талдау моделі қосындысына негізделген.

    Осы кезде сіздің диаграммаңыз лайықты регрессия графигі сияқты көрінеді:

    Дегенмен, тағы бірнеше жақсартулар жасағыңыз келуі мүмкін:

    • Теңдеуді өзіңізге лайық деп тапқан жерге сүйреңіз.
    • Біліктердің тақырыптарын қосыңыз ( Диаграмма элементтері түймесі > Остердің тақырыптары ).
    • Егер деректер нүктелері осы мысалдағыдай көлденең және/немесе тік осьтің ортасында басталады, шамадан тыс бос кеңістіктен құтылғыңыз келуі мүмкін. Келесі кеңес мұны қалай жасау керектігін түсіндіреді: Бос орынды азайту үшін диаграмма осьтерін масштабтаңыз.

      Жақсартылған регрессия графигіміз осылай көрінеді:

      Маңызды ескерту! Регрессия графигінде тәуелсіз айнымалы әрқашан Х осінде және тәуелді айнымалы Y осінде болуы керек. Егер график кері ретпен салынған болса, жұмыс парағындағы бағандарды ауыстырып, диаграмманы жаңадан сызыңыз. Егер бастапқы деректерді қайта реттеуге рұқсат етілмесе, X және Y осьтерін тікелей диаграммада ауыстыруға болады.

    Формулаларды пайдаланып Excel бағдарламасында регрессияны қалай жасауға болады

    Microsoft Excel бағдарламасында LINEST, SLOPE, INTERCEPT және CORREL сияқты сызықтық регрессия талдауын жасауға көмектесетін бірнеше статистикалық функциялар бар.

    LINEST функциясы түзулерді есептеу үшін ең кіші квадраттар регрессия әдісін пайдаланады. айнымалылар арасындағы қатынасты жақсы түсіндіретін және сол жолды сипаттайтын массивді қайтаратын жол. егжей-тегжейлі түсіндірмені таба аласызосы оқулықтағы функция синтаксисі. Әзірге үлгі деректер жиыны үшін формуланы ғана жасайық:

    =LINEST(C2:C25, B2:B25)

    LINEST функциясы мәндер жиымын қайтаратындықтан, оны массив формуласы ретінде енгізу керек. Бір қатардағы екі көрші ұяшықты таңдаңыз, біздің жағдайда E2:F2, формуланы теріп, оны аяқтау үшін Ctrl + Shift + Enter пернелерін басыңыз.

    Формула b коэффициентін береді ( E1) және бұрыннан таныс сызықтық регрессия теңдеуі үшін a тұрақтысы (F1):

    y = bx + a

    Жұмыс парақтарында массив формулаларын пайдаланбасаңыз, <есептей аласыз. 1>a және b жеке формулаларымен:

    Y-кесіндісін (a) алыңыз:

    =INTERCEPT(C2:C25, B2:B25)

    Еңістікті алыңыз (b):

    =SLOPE(C2:C25, B2:B25)

    Сонымен қатар, сіз корреляция коэффициентін (регрессиялық талдаудың жиынтық шығысында Көп R ) таба аласыз, ол екі айнымалы бір-бірімен қатты байланысты:

    =CORREL(B2:B25,C2:C25)

    Келесі скриншот барлық осы Excel регрессия формулаларын әрекетте көрсетеді:

    Кеңес. Регрессия талдауы үшін қосымша статистиканы алғыңыз келсе, осы мысалда көрсетілгендей s tats параметрі TRUE мәніне орнатылған LINEST функциясын пайдаланыңыз.

    Сызықтық регрессияны осылай жасайсыз. Excel бағдарламасында. Сонымен, Microsoft Excel статистикалық бағдарлама емес екенін есте сақтаңыз. Кәсіби деңгейде регрессиялық талдауды орындау қажет болса, мақсатты пайдаланғыңыз келуі мүмкінXLSTAT, RegressIt, т.б. сияқты бағдарламалық құрал.

    Осы оқулықта талқыланған сызықтық регрессия формулалары мен басқа әдістерді мұқият қарау үшін төмендегі жұмыс кітабының үлгісін жүктеп алуға болады. Оқығаныңыз үшін рахмет!

    Тәжірибелік жұмыс кітабы

    Excel бағдарламасындағы регрессиялық талдау - мысалдар (.xlsx файлы)

    квадраттар, бұл деректер нүктелерінің дисперсиясын табудың математикалық тәсілі. Модельдің мақсаты – квадраттардың ең аз мүмкін болатын қосындысын алу және деректерге ең жақын сызықты сызу.

    Статистикада олар қарапайым және көп сызықтық регрессияны ажыратады. Қарапайым сызықтық регрессия. тәуелді айнымалы мен бір тәуелсіз айнымалы арасындағы байланысты сызықтық функция арқылы модельдейді. Тәуелді айнымалыны болжау үшін екі немесе одан да көп түсіндірме айнымалыларды пайдалансаңыз, көп сызықтық регрессия мен айналысасыз. Деректер қатынасы түзу сызықты ұстанбағандықтан тәуелді айнымалы сызықты емес функция ретінде модельденсе, оның орнына сызықсыз регрессия пайдаланыңыз. Бұл оқулықтың басты мақсаты қарапайым сызықтық регрессияға арналады.

    Мысалы ретінде соңғы 24 айдағы қолшатырлардың сатылу сандарын алайық және сол кезеңдегі орташа айлық жауын-шашын мөлшерін білейік. Бұл ақпаратты диаграммада орналастырыңыз және регрессия сызығы тәуелсіз айнымалы (жауын-шашын) және тәуелді айнымалы (қолшатыр сатылымдар) арасындағы байланысты көрсетеді:

    Сызықтық регрессия теңдеуі

    Математикалық түрде сызықтық регрессия мына теңдеумен анықталады:

    y = bx + a + ε

    Мұндағы:

    • x тәуелсіз айнымалы.
    • y – тәуелді айнымалы.
    • a Y-кесінді , ол күтілетін орташа мән болып табылады. y барлық x айнымалылар 0-ге тең болғанда. Регрессия графигінде бұл сызықтың Y осін қиып өтетін нүктесі.
    • b - регрессия сызығының көлбеуі , ол y үшін x өзгерген кезде өзгеру жылдамдығы.
    • ε - кездейсоқ қате термин, бұл тәуелді айнымалының нақты мәні мен оның болжанған мәні арасындағы айырмашылық.

    Сызықтық регрессия теңдеуінде әрқашан қателік термин болады, өйткені нақты өмірде болжаушылар ешқашан толық дәл болмайды. Дегенмен, кейбір бағдарламалар, соның ішінде Excel, сахна артында қате терминін есептеуді жасайды. Сонымен, Excel бағдарламасында ең кіші квадраттар әдісін пайдаланып сызықтық регрессия жасайсыз және a және b коэффициенттерін іздейсіз, осылайша:

    y = bx + a

    Мысал үшін сызықтық регрессия теңдеуі келесі пішінді алады:

    Umbrellas sold = b * rainfall + a

    a және b<табудың бірнеше түрлі жолдары бар. 2>. Excel бағдарламасында сызықтық регрессия талдауын орындаудың үш негізгі әдісі мыналар болып табылады:

    • Талдау құралдары пакетіне енгізілген регрессия құралы
    • Тренд сызығы бар шашырау диаграммасы
    • Сызықтық регрессия формуласы

    Төменде әр әдісті қолдану бойынша егжей-тегжейлі нұсқауларды табасыз.

    Excel бағдарламасында талдау құралдарының көмегімен сызықтық регрессияны қалай жасауға болады

    Бұл мысал Excel бағдарламасында регрессияны іске қосу жолын көрсетеді. Analysis ToolPak қондырмасына кіретін арнайы құралды пайдалану арқылы.

    Талдау құралдары жинағы қондырмасын қосыңыз-

    Талдау құралдары жинағы Excel 365-2003 нұсқаларының барлық нұсқаларында қолжетімді, бірақ әдепкі бойынша қосылмаған. Сондықтан оны қолмен қосу керек. Мынадай:

    1. Excel бағдарламасында Файл > Параметрлер түймесін басыңыз.
    2. Excel опциялары тілқатысу терезесінде сол жақ бүйірлік тақтада Қосымшалар таңдаңыз, Басқару жолағында Excel қондырмалары таңдалғанына көз жеткізіңіз және Өту<түймесін басыңыз. 2>.
    3. Қосымшалар тілқатысу терезесінде Талдау құралдар жинағы құсбелгісін қойып, OK түймесін басыңыз:

    Бұл Excel таспасының Деректер қойындысына Деректерді талдау құралдарын қосады.

    Регрессиялық талдауды іске қосу

    Ішінде бұл мысалда біз Excel бағдарламасында қарапайым сызықтық регрессия жасаймыз. Бізде соңғы 24 айдағы орташа айлық жауын-шашынның тізімі В бағанында, ол біздің тәуелсіз айнымалы (болжаушы) және тәуелді айнымалы болып табылатын С бағанында сатылған қолшатырлар саны. Әрине, сатуға әсер ететін көптеген басқа факторлар бар, бірақ біз әзірше тек осы екі айнымалы мәнге назар аударамыз:

    Талдау құралдар жинағы қосылған кезде Excel бағдарламасында регрессия талдауын орындау үшін мына қадамдарды орындаңыз:

    1. Деректер қойындысындағы Талдау тобында Деректерді талдау түймесін басыңыз.
    2. Регрессия тармағын таңдап, Жарайды түймесін басыңыз.
    3. Регрессия диалогтық терезесінде келесі параметрлерді конфигурациялаңыз:
      • Кіріс параметрін таңдаңыз.Y диапазоны , ол сіздің тәуелді айнымалыңыз . Біздің жағдайда, бұл қолшатыр сату (C1:C25).
      • Input X диапазоны таңдаңыз, яғни тәуелсіз айнымалы . Бұл мысалда бұл орташа айлық жауын-шашын мөлшері (B1:B25).

      Бірнеше регрессия үлгісін жасап жатсаңыз, әртүрлі тәуелсіз айнымалылары бар екі немесе одан да көп көрші бағандарды таңдаңыз.

      • X және Y ауқымдарының жоғарғы жағында тақырыптар болса, Жапсырмалар ұяшығын белгілеңіз.
      • Қалаулы Шығару опциясын, жаңа жұмыс парағын таңдаңыз. жағдай.
      • Қосымша болжамды және нақты мәндер арасындағы айырмашылықты алу үшін Қалдықтар құсбелгісін қойыңыз.
    4. OK түймесін басып, Excel бағдарламасы жасаған регрессия талдауының нәтижесін қараңыз.

    Регрессия талдауының нәтижесін интерпретациялау

    Жақында көргеніңіздей, Excel бағдарламасында регрессияны орындау оңай, себебі барлық есептеулер автоматты түрде алдын ала жасалады. Нәтижелерді түсіндіру қиынырақ, өйткені әр санның артында не тұрғанын білу керек. Төменде регрессиялық талдау нәтижесінің 4 негізгі бөлігінің бөлінуін табасыз.

    Регрессия талдауының нәтижесі: Жиынтық нәтиже

    Бұл бөлім есептелген сызықтық регрессия теңдеуінің бастапқы деректеріңізге қаншалықты сәйкес келетінін көрсетеді.

    Мына ақпараттың әрбір бөлігі нені білдіреді:

    Бірнеше R . Күштілігін өлшейтін С орреляция коэффициенті екі айнымалы арасындағы сызықтық қатынас. Корреляция коэффициенті -1 мен 1 аралығындағы кез келген мән болуы мүмкін, ал оның абсолютті мәні қатынас күшін көрсетеді. Абсолюттік мән неғұрлым үлкен болса, соғұрлым күшті болады:

    • 1 күшті оң қатынасты білдіреді
    • -1 күшті теріс қатынасты білдіреді
    • 0 барлығы

    R шаршы . Бұл сәйкестік жақсылығының көрсеткіші ретінде қолданылатын Детерминация коэффициенті . Ол регрессия сызығына қанша нүкте түсетінін көрсетеді. R2 мәні квадраттардың жалпы сомасынан есептеледі, дәлірек айтқанда, бұл бастапқы деректердің орташа мәннен квадраттық ауытқуларының қосындысы.

    Біздің мысалда R2 0,91 (2 цифрға дейін дөңгелектенеді) , бұл өте жақсы. Бұл біздің құндылықтарымыздың 91% регрессиялық талдау үлгісіне сәйкес келетінін білдіреді. Басқаша айтқанда, тәуелді айнымалылардың (y-мәндері) 91% тәуелсіз айнымалылармен (x-мәндері) түсіндіріледі. Әдетте, 95% немесе одан жоғары R квадраты жақсы сәйкестік болып саналады.

    Түзетілген R квадраты . Бұл үлгідегі тәуелсіз айнымалылар санына түзетілген R квадраты . Бірнеше регрессия талдауы үшін R квадраты орнына осы мәнді пайдаланғыңыз келеді.

    Стандартты қате . Бұл сіздің регрессиялық талдауыңыздың дәлдігін көрсететін тағы бір жарамдылық көрсеткіші - сан неғұрлым аз болса, соғұрлым сенімді бола аласыз.сіздің регрессия теңдеуіңіз. R2 модельмен түсіндірілетін тәуелді айнымалылар дисперсиясының пайызын көрсетсе, Стандартты қате деректер нүктелерінің регрессия сызығынан түсетін орташа қашықтықты көрсететін абсолютті көрсеткіш болып табылады.

    Бақылаулар . Бұл жай ғана сіздің үлгіңіздегі бақылаулар саны.

    Регрессиялық талдаудың нәтижесі: ANOVA

    Шығарудың екінші бөлігі дисперсияны талдау (ANOVA):

    Негізінен, ол квадраттардың қосындысын регрессиялық үлгідегі өзгергіштік деңгейлері туралы ақпарат беретін жеке құрамдас бөліктерге бөледі:

    • df - көздермен байланысты еркіндік дәрежелерінің саны дисперсия.
    • SS - квадраттардың қосындысы. Жалпы SS-мен салыстырғанда қалдық СС неғұрлым аз болса, үлгі деректерге соғұрлым жақсы сәйкес келеді.
    • MS - орташа квадрат.
    • F F статистикасы немесе нөлдік гипотеза үшін F-сынағы. Ол модельдің жалпы маңыздылығын тексеру үшін қолданылады.
    • Маңыздылық F - F-ның P-мәні.

    ANOVA бөлігі сирек қолданылады. Excel бағдарламасындағы қарапайым сызықтық регрессия талдауы, бірақ сіз соңғы құрамдасқа мұқият қарауыңыз керек. Маңыздылық F мәні сіздің нәтижелеріңіздің қаншалықты сенімді (статистикалық маңызды) екендігі туралы түсінік береді. Егер маңыздылық F 0,05 (5%) төмен болса, үлгіңіз дұрыс. Егер ол 0,05-тен үлкен болса, сізБасқа тәуелсіз айнымалыны таңдаған дұрыс.

    Регрессиялық талдаудың нәтижесі: коэффициенттер

    Бұл бөлім талдауыңыздың құрамдас бөліктері туралы нақты ақпарат береді:

    Осы бөлімдегі ең пайдалы құрамдас: Коэффициенттер . Ол Excel бағдарламасында сызықтық регрессия теңдеуін құруға мүмкіндік береді:

    y = bx + a

    Біздің деректер жинағы үшін, мұнда y - сатылған қолшатырлар саны және x - орташа айлық жауын-шашын, Біздің сызықтық регрессия формуласы келесідей болады:

    Y = Rainfall Coefficient * x + Intercept

    Үш ондық таңбаға дейін дөңгелектенген a және b мәндерімен жабдықталған, ол келесіге айналады:

    Y=0.45*x-19.074

    Мысалы, орташа айлық жауын-шашын мөлшері 82 мм-ге тең болса, қолшатыр сату көлемі шамамен 17,8 болады:

    0.45*82-19.074=17.8

    Сол сияқты, қанша қолшатыр болатынын білуге ​​болады. сіз көрсеткен кез келген басқа айлық жауын-шашынмен (x айнымалысы) сатылады.

    Регрессиялық талдау нәтижесі: қалдық

    Егер ай сайынғы 82 мм жауын-шашынға сәйкес сатылған қолшатырлардың болжамды және нақты санын салыстырсаңыз, сіз бұл сандар сәл өзгеше екенін көресіз:

    • Болжамды: 17,8 (жоғарыда есептелген)
    • Нақты: 15 (бастапқы деректердің 2-жолы)

    Неліктен айырмашылық бар? Өйткені тәуелсіз айнымалылар ешқашан тәуелді айнымалылардың мінсіз болжаушылары болып табылмайды. Қалдықтар нақты мәндердің болжамды мәндерден қаншалықты алыс екенін түсінуге көмектеседі:

    үшінбірінші деректер нүктесі (жауын-шашын 82 мм), қалдық шамамен -2,8 құрайды. Сонымен, біз бұл санды болжамды мәнге қосамыз және нақты мәнді аламыз: 17,8 - 2,8 = 15.

    Excel-де сызықтық регрессия графигін қалай жасауға болады

    Егер сізге жылдам визуализация қажет болса екі айнымалы арасындағы байланыс, сызықтық регрессия диаграммасын сызыңыз. Бұл өте оңай! Мынадай:

    1. Деректермен, соның ішінде тақырыптармен екі бағанды ​​таңдаңыз.
    2. Кірістіру қойындысындағы Чаттар тобында , Шашырау диаграммасы белгішесін басып, Шашырау нобайын таңдаңыз (бірінші):

      Бұл жұмыс парағыңызда осыған ұқсас шашырау сызбасын кірістіреді. бірі:

    3. Енді бізге ең кіші квадраттардың регрессия сызығын салу керек. Мұны істеу үшін кез келген нүктені тінтуірдің оң жақ түймешігімен басып, контекстік мәзірден Тренд сызығын қосу... пәрменін таңдаңыз.
    4. Оң жақ тақтада Сызықтық тренд сызығының пішінін таңдап, регрессия формуласын алу үшін Диаграммадағы теңдеуді көрсету опциясын белгілеңіз:

      Байқағаныңыздай, Excel бағдарламасы біз үшін жасаған регрессия теңдеуі Коэффиценттер шығысы негізінде құрастырылған сызықтық регрессия формуласымен бірдей.

    5. Толтыру & Line қойындысын ашыңыз және жолды өз қалауыңыз бойынша реттеңіз. Мысалы, сіз басқа сызық түсін таңдай аласыз және үзік сызықтың орнына тұтас сызықты пайдалана аласыз ( Сызық түрі жолағында Қатты сызықты таңдаңыз):

    Майкл Браун - бағдарламалық құралдарды пайдалана отырып, күрделі процестерді жеңілдетуге құмарлығы бар арнайы технология әуесқойы. Технологиялық индустрияда он жылдан астам тәжірибесі бар ол Microsoft Excel және Outlook, сондай-ақ Google Sheets және Docs бағдарламаларында өз дағдыларын жетілдірді. Майклдың блогы өз білімі мен тәжірибесін басқалармен бөлісуге, өнімділік пен тиімділікті арттыруға арналған оңай орындалатын кеңестер мен оқулықтар беруге арналған. Сіз тәжірибелі кәсіпқой болсаңыз да, жаңадан бастаушы болсаңыз да, Майклдың блогы осы маңызды бағдарламалық құралдарды барынша пайдалану үшін құнды түсініктер мен практикалық кеңестер ұсынады.