Анализа линеарне регресије у Екцел-у

  • Деле Ово
Michael Brown

Водич објашњава основе регресионе анализе и показује неколико различитих начина за обављање линеарне регресије у Екцел-у.

Замислите ово: добијате пуно различитих података и од вас се тражи да предвидите бројеве продаје ваше компаније за следећу годину. Открили сте десетине, можда чак и стотине фактора који могу утицати на бројке. Али како знате који су заиста важни? Покрените регресиону анализу у Екцел-у. То ће вам дати одговор на ово и многа друга питања: Који фактори су важни, а који се могу занемарити? Колико су ти фактори блиско повезани једни са другима? И колико можете бити сигурни у предвиђања?

    Регресиона анализа у Екцел-у – основе

    У статистичком моделирању, регресиона анализа се користи за процените односе између две или више променљивих:

    Зависна променљива (ака критеријум променљива) је главни фактор који покушавате да разумете и предвидите.

    Независне варијабле (ака објашњавајуће варијабле или предиктори ) су фактори који могу утицати на зависну променљиву.

    Регресиона анализа вам помаже разумеју како се зависна варијабла мења када се једна од независних варијабли мења и омогућава да се математички одреди која од тих варијабли заиста има утицај.

    Технички, модел регресионе анализе заснива се на збиру

    У овом тренутку, ваш графикон већ изгледа као пристојан графикон регресије:

    Ипак, можда бисте желели да направите још неколико побољшања:

    • Превуците једначину где год желите.
    • Додајте наслове оса ( Елементи графикона дугме &гт; Наслови осе ).
    • Ако тачке података почињу на средини хоризонталне и/или вертикалне осе, као у овом примеру, можда ћете желети да се решите претераног белог простора. Следећи савет објашњава како то да урадите: Скалирајте осе графикона да бисте смањили бели простор.

      А овако изгледа наш побољшани регресијски граф:

      Важна напомена! У графу регресије независна променљива увек треба да буде на Кс оси, а зависна променљива на И оси. Ако је ваш графикон исцртан обрнутим редоследом, замените колоне на радном листу, а затим нацртајте графикон изнова. Ако вам није дозвољено да преуредите изворне податке, можете да промените Кс и И осе директно у графикону.

    Како да урадите регресију у Екцел-у користећи формуле

    Мицрософт Екцел има неколико статистичких функција које вам могу помоћи да урадите анализу линеарне регресије, као што су ЛИНЕСТ, СЛОПЕ, ИНТЕРЦЕПТ и ЦОРРЕЛ.

    Функција ЛИНЕСТ користи метод регресије најмањих квадрата за израчунавање праве линија која најбоље објашњава однос између ваших променљивих и враћа низ који описује ту линију. Можете пронаћи детаљно објашњењесинтаксу функције у овом водичу. За сада, хајде да направимо формулу за наш пример скупа података:

    =LINEST(C2:C25, B2:B25)

    Пошто функција ЛИНЕСТ враћа низ вредности, морате га унети као формулу низа. Изаберите две суседне ћелије у истом реду, у нашем случају Е2:Ф2, откуцајте формулу и притисните Цтрл + Схифт + Ентер да бисте је довршили.

    Формула враћа коефицијент б ( Е1) и а константа (Ф1) за већ познату једначину линеарне регресије:

    y = bx + a

    Ако избегавате да користите формуле низа у својим радним листовима, можете израчунати а и б појединачно са регуларним формулама:

    Набавите пресек И (а):

    =INTERCEPT(C2:C25, B2:B25)

    Набавите нагиб (б):

    =SLOPE(C2:C25, B2:B25)

    Поред тога, можете пронаћи коефицијент корелације ( више Р у резимеу регресионе анализе) који показује како те две варијабле су снажно повезане једна са другом:

    =CORREL(B2:B25,C2:C25)

    Следећи снимак екрана приказује све ове Екцел регресионе формуле у акцији:

    Савет. Ако желите да добијете додатне статистике за вашу регресиону анализу, користите функцију ЛИНЕСТ са параметром с татс постављеним на ТРУЕ као што је приказано у овом примеру.

    Тако радите линеарну регресију у Екцел-у. Уз то, имајте на уму да Мицрософт Екцел није статистички програм. Ако треба да извршите регресијску анализу на професионалном нивоу, можда ћете желети да користите циљанусофтвер као што је КСЛСТАТ, РегрессИт, итд.

    Да бисте ближе погледали наше формуле линеарне регресије и друге технике о којима се говори у овом водичу, можете преузети наш пример радне свеске испод. Хвала вам на читању!

    Радна свеска за вежбање

    Регресиона анализа у Екцел-у – примери (.клск датотека)

    квадрати, што је математички начин да се пронађе дисперзија тачака података. Циљ модела је да добије најмањи могући збир квадрата и нацрта линију која је најближа подацима.

    У статистици, они праве разлику између једноставне и вишеструке линеарне регресије. Једноставна линеарна регресија моделира однос између зависне променљиве и једне независне променљиве користећи линеарну функцију. Ако користите две или више променљивих објашњења да бисте предвидели зависну променљиву, имате посла са вишеструком линеарном регресијом . Ако се зависна променљива моделује као нелинеарна функција јер односи података не прате праву линију, уместо тога користите нелинеарну регресију . Фокус овог туторијала биће на једноставној линеарној регресији.

    Као пример, узмимо бројеве продаје кишобрана за последња 24 месеца и сазнамо просечну месечну количину падавина за исти период. Исцртајте ове информације на графикону и регресиона линија ће показати однос између независне варијабле (киша) и зависне варијабле (кишобран продаје):

    Једначина линеарне регресије

    Математички, линеарна регресија је дефинисана овом једначином:

    и = бк + а + ε

    Где је:

    • к независна променљива.
    • и је зависна променљива.
    • а је И-пресецање , што је очекивана средња вредност и када су све променљиве к једнаке 0. На графику регресије, то је тачка у којој линија прелази И осу.
    • б је нагиб линије регресије, што је стопа промене за и како се мења к .
    • ε је случајна грешка термин, што је разлика између стварне вредности зависне променљиве и њене предвиђене вредности.

    Једначина линеарне регресије увек има термин грешке јер, у стварном животу, предиктори никада нису савршено прецизни. Међутим, неки програми, укључујући Екцел, израчунавају термин грешке иза сцене. Дакле, у Екцел-у радите линеарну регресију користећи метод најмањих квадрата и тражите коефицијенте а и б тако да је:

    и = бк + а

    За наш пример, једначина линеарне регресије има следећи облик:

    Umbrellas sold = b * rainfall + a

    Постоји прегршт различитих начина да се пронађе а и б . Три главне методе за обављање анализе линеарне регресије у Екцел-у су:

    • Алатка за регресију укључена у пакет алата за анализу
    • Сцаттер цхарт са линијом тренда
    • Формула линеарне регресије

    У наставку ћете пронаћи детаљна упутства о коришћењу сваке методе.

    Како да урадите линеарну регресију у Екцел-у помоћу пакета алатки за анализу

    Овај пример показује како да покренете регресију у Екцел-у коришћењем специјалног алата укљученог у додатак за Аналисис ТоолПак.

    Омогућите додатак за Аналисис ТоолПак-ин

    Пакет алатки за анализу је доступан у свим верзијама програма Екцел 365 до 2003, али није подразумевано омогућен. Дакле, морате га ручно укључити. Ево како:

    1. У вашем Екцел-у кликните на Датотека &гт; Опције .
    2. У Екцел опцијама дијалог, изаберите Додаци на левој бочној траци, уверите се да је Екцел додаци изабрано у пољу Управљање и кликните на Иди .
    3. У дијалошком оквиру Додаци означите Пакет алатки за анализу и кликните на ОК :

    Ово ће додати алатке Анализа података на картицу Подаци ваше Екцел траке.

    Покрени регресиону анализу

    У у овом примеру, урадићемо једноставну линеарну регресију у Екцел-у. Оно што имамо је списак просечних месечних падавина за последња 24 месеца у колони Б, која је наша независна варијабла (предиктор), и број продатих кишобрана у колони Ц, која је зависна варијабла. Наравно, постоји много других фактора који могу утицати на продају, али за сада се фокусирамо само на ове две варијабле:

    Са омогућеним пакетом алатки за анализу, извршите ове кораке да бисте извршили регресиону анализу у Екцел-у:

    1. На картици Подаци , у групи Анализа , кликните на дугме Анализа података .
    2. Изаберите Регресија и кликните на ОК .
    3. У дијалогу Регресија , конфигуришите следећа подешавања:
      • Изаберите ИнпутИ Опсег , што је ваша зависна променљива . У нашем случају, то је кровна продаја (Ц1:Ц25).
      • Изаберите Инпут Кс Ранге , тј. вашу независну променљиву . У овом примеру, то је просечна месечна количина падавина (Б1:Б25).

      Ако градите модел вишеструке регресије, изаберите две или више суседних колона са различитим независним варијаблама.

      • Означите поље Ознаке ако постоје заглавља на врху ваших Кс и И опсега.
      • Одаберите жељену опцију Излаз, нови радни лист у нашем случај.
      • Опционално, потврдите избор у пољу за потврду Резидуали да бисте добили разлику између предвиђених и стварних вредности.
    4. Кликните на ОК и посматрајте излаз регресионе анализе креиран у Екцел-у.

    Протумачите излаз регресионе анализе

    Као што сте управо видели, покретање регресије у Екцел-у је лако јер се сви прорачуни изводе аутоматски. Тумачење резултата је мало сложеније јер морате знати шта се крије иза сваког броја. Испод ћете пронаћи рашчлањену 4 главна дела излазне анализе регресионе анализе.

    Излаз регресионе анализе: збирни резултат

    Овај део вам говори колико добро израчуната једначина линеарне регресије одговара вашим изворним подацима.

    Ево шта значи свака информација:

    Вишеструко Р . То је Ц коефицијент релације који мери снагулинеарни однос између две променљиве. Коефицијент корелације може бити било која вредност између -1 и 1, а његова апсолутна вредност указује на јачину везе. Што је већа апсолутна вредност, то је јача веза:

    • 1 значи јаку позитивну везу
    • -1 значи јаку негативну везу
    • 0 значи да нема везе у све

    Р квадрат . То је Коефицијент детерминације , који се користи као индикатор доброте уклапања. Показује колико тачака пада на линију регресије. Вредност Р2 се израчунава из укупног збира квадрата, тачније, то је збир квадрата одступања оригиналних података од средње вредности.

    У нашем примеру, Р2 је 0,91 (заокружено на 2 цифре) , што је бас добро. То значи да 91% наших вредности одговара моделу регресионе анализе. Другим речима, 91% зависних варијабли (и-вредности) је објашњено независним променљивим (к-вредности). Генерално, Р квадрат од 95% или више се сматра добрим.

    Прилагођени Р квадрат . То је Р квадрат прилагођен броју независних променљивих у моделу. Ову вредност ћете желети да користите уместо Р квадрат за анализу вишеструке регресије.

    Стандардна грешка . То је још једна мера добробити која показује прецизност ваше регресионе анализе - што је број мањи, то можете бити сигурнијиваша једначина регресије. Док Р2 представља проценат варијансе зависних варијабли који је објашњен моделом, стандардна грешка је апсолутна мера која показује просечну удаљеност на којој тачке података падају од линије регресије.

    Запажања . То је једноставно број запажања у вашем моделу.

    Излаз регресионе анализе: АНОВА

    Други део резултата је Анализа варијансе (АНОВА):

    У основи, дели збир квадрата на појединачне компоненте које дају информације о нивоима варијабилности унутар вашег регресионог модела:

    • дф је број степени слободе повезаних са изворима варијансе.
    • СС је збир квадрата. Што је резидуални СС мањи у поређењу са укупним СС, то боље ваш модел одговара подацима.
    • МС је средњи квадрат.
    • Ф је Ф статистика, или Ф-тест за нулту хипотезу. Користи се за тестирање укупног значаја модела.
    • Значај Ф је П-вредност за Ф.

    Део АНОВА се ретко користи за једноставна линеарна регресиона анализа у Екцел-у, али свакако би требало да пажљиво погледате последњу компоненту. Вредност Значајност Ф даје представу о томе колико су поуздани (статистички значајни) ваши резултати. Ако је значајност Ф мања од 0,05 (5%), ваш модел је у реду. Ако је већи од 0,05, ви бистевероватно је боље изабрати другу независну променљиву.

    Излаз регресионе анализе: коефицијенти

    Овај одељак пружа специфичне информације о компонентама ваше анализе:

    Најкориснија компонента у овом одељку је Коефицијенти . Омогућава вам да направите једначину линеарне регресије у Екцел-у:

    и = бк + а

    За наш скуп података, где је и број продатих кишобрана, а к просечна месечна количина падавина, наша формула линеарне регресије иде на следећи начин:

    Y = Rainfall Coefficient * x + Intercept

    Опремљена вредностима а и б заокруженим на три децимале, претвара се у:

    Y=0.45*x-19.074

    На пример, са просечном месечном количином падавина од 82 мм, продаја кишобрана би била приближно 17,8:

    0.45*82-19.074=17.8

    На сличан начин можете сазнати колико ће кишобрана бити продато са било којом другом месечном количином падавина (к променљива) коју наведете.

    Излаз регресионе анализе: остаци

    Ако упоредите процењени и стварни број продатих кишобрана који одговарају месечној количини падавина од 82 мм, видећете да се ови бројеви мало разликују:

    • Процењено: 17,8 (израчунато изнад)
    • Стварни: 15 (2. ред изворних података)

    Зашто је разлика? Зато што независне променљиве никада нису савршени предиктори зависних варијабли. А резидуали вам могу помоћи да схватите колико су стварне вредности удаљене од предвиђених вредности:

    Запрва тачка података (падавине од 82 мм), остатак је приближно -2,8. Дакле, додајемо овај број предвиђеној вредности и добијамо стварну вредност: 17,8 - 2,8 = 15.

    Како направити графикон линеарне регресије у Екцел-у

    Ако треба да брзо визуализујете однос између две варијабле, нацртајте графикон линеарне регресије. То је врло лако! Ево како:

    1. Изаберите две колоне са својим подацима, укључујући заглавља.
    2. На картици Инсет , у групи Ћаскања , кликните на икону Сцаттер цхарт и изаберите сличицу Сцаттер (прва):

      Ово ће уметнути дијаграм расипања у ваш радни лист, који ће личити на овај један:

    3. Сада, треба да нацртамо линију регресије најмањих квадрата. Да бисте то урадили, кликните десним тастером миша на било коју тачку и изаберите Додај линију тренда... из контекстног менија.
    4. У десном окну изаберите Линеарни облик линије тренда и, опционо, означите Прикажи једначину на графикону да бисте добили формулу регресије:

      Као што можете приметити, једначина регресије коју је Екцел креирао за нас је иста као и формула линеарне регресије коју смо направили на основу излазних коефицијената.

    5. Пребаците се на Филл &амп; Линија и прилагодите линију по свом укусу. На пример, можете да изаберете другу боју линије и користите пуну линију уместо испрекидане (изаберите Пуна линија у пољу Тип цртице ):

    Мајкл Браун је посвећен технолошки ентузијаста са страшћу за поједностављење сложених процеса помоћу софтверских алата. Са више од деценије искуства у технолошкој индустрији, усавршио је своје вештине у Мицрософт Екцел-у и Оутлоок-у, као и у Гоогле табеле и документима. Мајклов блог посвећен је дељењу свог знања и стручности са другима, пружајући једноставне савете и упутства за побољшање продуктивности и ефикасности. Без обзира да ли сте искусан професионалац или почетник, Мајклов блог нуди вредне увиде и практичне савете како да на најбољи начин искористите ове основне софтверске алате.