Содржина
Упатството ги објаснува основите на регресивната анализа и прикажува неколку различни начини за правење линеарна регресија во Excel.
Замислете го ова: ви се обезбедени многу различни податоци и од нив се бара да ги предвидат бројките за продажба следната година за вашата компанија. Откривте десетици, можеби дури и стотици фактори кои веројатно можат да влијаат на бројките. Но, како да знаете кои се навистина важни? Извршете регресивна анализа во Excel. Ќе ви даде одговор на ова и на многу други прашања: кои фактори се важни, а кои може да се игнорираат? Колку овие фактори се поврзани едни со други? И колку можете да бидете сигурни за предвидувањата?
Регресивна анализа во Excel - основите
Во статистичкото моделирање, регресивната анализа се користи за проценете ги односите помеѓу две или повеќе променливи:
Зависна променлива (позната како критериум променлива) е главниот фактор што се обидувате да го разберете и предвидите.
Независни променливи (наречени објаснувачки променливи, или предвидливи ) се факторите кои можат да влијаат на зависната променлива.
Регресивната анализа ви помага разбере како се менува зависната променлива кога варира една од независните променливи и овозможува математички да се одреди која од тие променливи навистина има влијание.
Технички, моделот за регресивна анализа се заснова на збирот на
Во овој момент, вашиот графикон веќе изгледа како пристоен графикон за регресија:
Сепак, можеби ќе сакате да направите уште неколку подобрувања:
- Повлечете ја равенката каде и да ви одговара.
- Додајте наслови на оските ( Елементи на графиконот копче > Наслови на оските ).
- Ако вашиот точките за податоци започнуваат во средината на хоризонталната и/или вертикалната оска како во овој пример, можеби ќе сакате да се ослободите од прекумерниот бел простор. Следниот совет објаснува како да го направите ова: Сменете ги оските на графиконот за да го намалите белиот простор.
И вака изгледа нашиот подобрен графикон за регресија:
Важна забелешка! Во графикот на регресија, независната променлива секогаш треба да биде на оската X, а зависната променлива на оската Y. Ако вашиот графикон е нацртан во обратен редослед, заменете ги колоните во вашиот работен лист, а потоа нацртајте го графиконот повторно. Ако не ви е дозволено да ги преуредите изворните податоци, тогаш можете директно да ги префрлите оските X и Y во графикон.
Како да направите регресија во Excel користејќи формули
Microsoft Excel има неколку статистички функции кои можат да ви помогнат да направите линеарна регресивна анализа, како што се LINEST, SLOPE, INTERCEPT и CORREL.
Функцијата LINEST користи метод на регресија на најмали квадрати за пресметување на права линија која најдобро ја објаснува врската помеѓу вашите променливи и враќа низа што ја опишува таа линија. Можете да најдете детално објаснување засинтаксата на функцијата во ова упатство. Засега, ајде само да направиме формула за нашата база на податоци:
=LINEST(C2:C25, B2:B25)
Бидејќи функцијата LINEST враќа низа вредности, мора да ја внесете како формула за низа. Изберете две соседни ќелии во истиот ред, E2:F2 во нашиот случај, напишете ја формулата и притиснете Ctrl + Shift + Enter за да ја завршите.
Формулата го враќа коефициентот b ( E1) и константата a (F1) за веќе познатата линеарна регресивна равенка:
y = bx + a
Ако избегнувате да користите формули за низа во вашите работни листови, можете да пресметате a и b поединечно со правилни формули:
Земи го пресекот Y (a):
=INTERCEPT(C2:C25, B2:B25)
Земи го наклонот (б):
=SLOPE(C2:C25, B2:B25)
Дополнително, можете да го најдете коефициентот на корелација ( Повеќекратно R во збирниот излез на регресионата анализа) кој покажува како силно двете променливи се поврзани една со друга:
=CORREL(B2:B25,C2:C25)
Следната слика од екранот ги прикажува сите овие формули за регресија на Excel во акција:
Совет. Ако сакате да добиете дополнителна статистика за вашата регресивна анализа, користете ја функцијата LINEST со параметарот s tats поставен на TRUE како што е прикажано во овој пример.
Така правите линеарна регресија во Excel. Тоа, рече, ве молиме имајте на ум дека Microsoft Excel не е статистичка програма. Ако треба да извршите регресивна анализа на професионално ниво, можеби ќе сакате да користите насоченисофтвер како што се XLSTAT, RegressIt итн.
За да ги погледнете нашите формули за линеарна регресија и другите техники кои се дискутирани во ова упатство, добредојдени сте да ја преземете нашата примерок на работна книга подолу. Ви благодариме што прочитавте!
Вежбајте работна книга
Регресивна анализа во Excel - примери (датотека .xlsx)
квадрати, што е математички начин да се најде дисперзијата на податочните точки. Целта на моделот е да се добие најмалиот можен збир на квадрати и да се повлече линија што е најблиску до податоците.Во статистиката, тие прават разлика помеѓу едноставна и повеќекратна линеарна регресија. Едноставна линеарна регресија ја моделира врската помеѓу зависна променлива и една независна променлива користејќи линеарна функција. Ако користите две или повеќе објаснувачки променливи за да ја предвидите зависната променлива, се занимавате со повеќекратна линеарна регресија . Ако зависната променлива е моделирана како нелинеарна функција бидејќи податочните врски не следат права линија, наместо тоа користете нелинеарна регресија . Фокусот на ова упатство ќе биде на едноставна линеарна регресија.
Како пример, да ги земеме продажните броеви за чадори за последните 24 месеци и да ги дознаеме просечните месечни врнежи за истиот период. Нацртајте ја оваа информација на графикон, а линијата за регресија ќе ја покаже врската помеѓу независната променлива (врнежи) и зависната променлива (продажба на чадор):
Равенка на линеарна регресија
Математички, линеарна регресија се дефинира со оваа равенка:
y = bx + a + εКаде:
- x е независна променлива.
- y е зависна променлива.
- a е Y-пресекот , што е очекуваната средна вредност на y кога сите x променливи се еднакви на 0. На графикот на регресија, тоа е точката каде што линијата ја преминува оската Y.
- b е наклон на регресивна линија, што е стапката на промена за y како што се менува x .
- ε е случајна грешка поим, кој е разликата помеѓу вистинската вредност на зависната променлива и нејзината предвидена вредност.
Линеарната регресивна равенка секогаш има поим за грешка бидејќи, во реалниот живот, предвидувачите никогаш не се совршено прецизни. Сепак, некои програми, вклучувајќи го и Excel, го пресметуваат терминот за грешка зад сцената. Значи, во Excel, правите линеарна регресија користејќи го методот најмали квадрати и барате коефициенти a и b така што:
y = bx + aЗа нашиот пример, линеарната регресивна равенка го има следниов облик:
Umbrellas sold = b * rainfall + a
Постојат неколку различни начини за наоѓање a и b . Трите главни методи за извршување на линеарна регресивна анализа во Excel се:
- Алатка за регресија вклучена со Analysis ToolPak
- Scatter шема со линија на тренд
- Формула за линеарна регресија
Подолу ќе ги најдете деталните упатства за користење на секој метод.
Како да направите линеарна регресија во Excel со Analysis ToolPak
Овој пример покажува како да се изврши регресија во Excel со користење на специјална алатка вклучена со додатокот Analysis ToolPak.
Овозможете го додатокот Analysis ToolPak-во
Analysis ToolPak е достапен во сите верзии на Excel 365 до 2003 година, но не е стандардно овозможен. Значи, треба да го вклучите рачно. Еве како:
- Во вашиот Excel, кликнете Датотека > Опции .
- Во Excel Options дијалог прозорецот, изберете Додатоци на левата странична лента, проверете дали се избрани Додатоци на Excel во полето Управување и кликнете Оди .
- Во полето за дијалог Додатоци , штиклирајте Алатки за анализа и кликнете OK :
Ова ќе ги додаде алатките Анализа на податоци во табулаторот Податоци на вашата лента на Excel.
Изврши регресивна анализа
Во овој пример, ќе направиме едноставна линеарна регресија во Excel. Она што го имаме е список на просечни месечни врнежи за последните 24 месеци во колоната Б, која е нашата независна променлива (предвидлив), и бројот на продадени чадори во колоната В, која е зависна променлива. Се разбира, има многу други фактори кои можат да влијаат на продажбата, но засега се фокусираме само на овие две променливи:
Со овозможено додавање на Analysis Toolpak, извршете ги овие чекори за да извршите регресивна анализа во Excel:
- На картичката Податоци , во групата Анализа , кликнете на копчето Анализа на податоци .
- Изберете Регресија и кликнете OK .
- Во полето за дијалог Регресија , конфигурирајте ги следните поставки:
- Изберете го ВлезY Range , што е ваша зависна променлива . Во нашиот случај, тоа е продажба на чадор (C1:C25).
- Изберете го Влезниот опсег X , т.е. вашата независна променлива . Во овој пример, тоа е просечниот месечен дожд (B1:B25).
Ако градите модел на повеќекратна регресија, изберете две или повеќе соседни колони со различни независни променливи.
Исто така види: Како да се користи IFNA функцијата во Excel со примери- Проверете го полето Етикети ако има заглавија на врвот од опсегот X и Y.
- Изберете ја претпочитаната опција Излез, нов работен лист во нашиот случај.
- Изборно, изберете го полето за избор Остатоци за да ја добиете разликата помеѓу предвидените и вистинските вредности.
- Кликнете OK и набљудувајте го излезот од анализата на регресија создаден од Excel.
Интерпретирај излез од регресивна анализа
Како што штотуку видовте, извршувањето на регресијата во Excel е лесно бидејќи сите пресметки се вршат автоматски. Интерпретацијата на резултатите е малку посложена затоа што треба да знаете што се крие зад секој број. Подолу ќе најдете преглед на 4 главни делови од излезот на регресивна анализа.
Излез од регресивна анализа: Збирен излез
Овој дел ви кажува колку добро пресметаната линеарна регресивна равенка одговара на вашите изворни податоци.
Еве што значи секоја информација:
Multiple R . Тоа е C орелација коефициент што ја мери силата налинеарна врска помеѓу две променливи. Коефициентот на корелација може да биде која било вредност помеѓу -1 и 1, а неговата апсолутна вредност ја покажува јачината на врската. Колку е поголема апсолутната вредност, толку е посилна врската:
- 1 значи силна позитивна врска
- -1 значи силна негативна врска
- 0 значи нема врска во сите
Р плоштад . Тоа е Коефициент на определување , кој се користи како показател за добрината на вклопувањето. Покажува колку точки паѓаат на регресивната линија. Вредноста R2 се пресметува од вкупниот збир на квадрати, поточно, таа е збир на квадратните отстапувања на оригиналните податоци од средната вредност.
Во нашиот пример, R2 е 0,91 (заокружена на 2 цифри) , што е многу добро. Тоа значи дека 91% од нашите вредности одговараат на моделот за регресивна анализа. Со други зборови, 91% од зависните променливи (y-вредности) се објаснети со независните променливи (x-вредности). Општо земено, R Squared од 95% или повеќе се смета за добро одговара.
Прилагоден R Square . Тоа е R квадрат прилагоден за бројот на независни променливи во моделот. Ќе сакате да ја користите оваа вредност наместо R квадрат за анализа на повеќекратна регресија.
Стандардна грешка . Тоа е уште една мерка на доброто место што ја покажува прецизноста на вашата регресивна анализа - колку е помал бројот, толку посигурни можете да бидетевашата регресивна равенка. Додека R2 го претставува процентот на варијансата на зависните променливи што се објаснува со моделот, Стандардна грешка е апсолутна мерка што го покажува просечното растојание што точките на податоци паѓаат од линијата на регресија.
Набљудувања . Тоа е едноставно бројот на набљудувања во вашиот модел.
Излез на регресивна анализа: ANOVA
Вториот дел од излезот е Анализа на варијанса (ANOVA):
Во основа, го дели збирот на квадрати на поединечни компоненти кои даваат информации за нивоата на варијабилност во рамките на вашиот регресивен модел:
- df е бројот на степени на слобода поврзани со изворите на варијанса.
- SS е збир на квадрати. Колку е помал Residual SS во споредба со Total SS, толку подобро вашиот модел одговара на податоците.
- MS е средниот квадрат.
- F е F статистика, или F-тест за нултата хипотеза. Се користи за тестирање на целокупното значење на моделот.
- Значењето F е P-вредноста на F.
Делот ANOVA ретко се користи за едноставна линеарна регресивна анализа во Excel, но дефинитивно треба внимателно да ја погледнете последната компонента. Вредноста Significance F дава идеја за тоа колку се веродостојни (статистички значајни) вашите резултати. Ако Значењето F е помало од 0,05 (5%), вашиот модел е во ред. Ако е поголемо од 0,05, биверојатно е подобро да изберете друга независна променлива.
Излез на регресивна анализа: коефициенти
Овој дел дава конкретни информации за компонентите на вашата анализа:
Најкорисната компонента во овој дел е Коефициенти . Тоа ви овозможува да изградите линеарна регресивна равенка во Excel:
y = bx + aЗа нашиот сет на податоци, каде што y е бројот на продадени чадори и x е просечен месечен врнежи, нашата формула за линеарна регресија оди на следниов начин:
Y = Rainfall Coefficient * x + Intercept
Опремена со a и b вредности заокружени на три децимални места, таа се претвора во:
Y=0.45*x-19.074
На пример, со просечни месечни врнежи еднакви на 82 mm, продажбата на чадори би била приближно 17,8:
0.45*82-19.074=17.8
На сличен начин, можете да дознаете колку чадори ќе бидат се продава со кој било друг месечен дожд (х променлива) што ќе го наведете.
Излез од анализа на регресија: остатоци
Ако го споредите проценетиот и реалниот број на продадени чадори што одговараат на месечните врнежи од 82 mm, ќе видите дека овие бројки се малку различни:
- Проценето: 17,8 (пресметано погоре)
- Вистински: 15 (ред 2 од изворните податоци)
Зошто е разликата? Бидејќи независните променливи никогаш не се совршени предвидувачи на зависните променливи. А остатоците можат да ви помогнат да разберете колку се далеку вистинските вредности од предвидените вредности:
Запрвата податочна точка (врнежи од 82 mm), резидуалот е приближно -2,8. Значи, ја додаваме оваа бројка на предвидената вредност и ја добиваме вистинската вредност: 17,8 - 2,8 = 15.
Како да направите графикон за линеарна регресија во Excel
Ако треба брзо да визуелизирате односот помеѓу двете променливи, нацртајте линеарна регресивна табела. Тоа е многу лесно! Еве како:
- Изберете ги двете колони со вашите податоци, вклучувајќи ги и заглавијата.
- На картичката Внеси , во групата Разговори , кликнете на иконата Scatter chart и изберете ја минијатурата Scatter (првата):
Ова ќе вметне графикон за расфрлање во вашиот работен лист, кој ќе личи на ова еден:
- Сега, треба да ја нацртаме регресионата линија на најмалите квадрати. За да го направите тоа, кликнете со десното копче на која било точка и изберете Додај Trendline... од контекстното мени.
- На десниот панел, изберете ја формата на линијата Линеарна и, по избор, штиклирајте Прикажи равенка на графиконот за да ја добиете формулата за регресија:
Како што можете да забележите, равенката за регресија што ја создаде Excel за нас е иста како формулата за линеарна регресија што ја изградивме врз основа на излезот Коефициенти.
- Префрлете се на Пополнете & засилувач; Линија табот и приспособете ја линијата по ваш вкус. На пример, можете да изберете различна боја на линијата и да користите цврста линија наместо испрекината линија (изберете Цврста линија во полето Тип цртичка ):