Analiza e regresionit linear në Excel

  • Shperndaje Kete
Michael Brown

Tutoriali shpjegon bazat e analizës së regresionit dhe tregon disa mënyra të ndryshme për të bërë regresion linear në Excel.

Imagjinoni këtë: ju ofrohen shumë të dhëna të ndryshme dhe kërkohet të parashikojnë shifrat e shitjeve të vitit të ardhshëm për kompaninë tuaj. Ju keni zbuluar dhjetëra, ndoshta edhe qindra, faktorë që mund të ndikojnë në numrat. Por si e dini se cilat janë me të vërtetë të rëndësishme? Ekzekutoni analizën e regresionit në Excel. Do t'ju japë një përgjigje për këtë dhe shumë pyetje të tjera: cilët faktorë kanë rëndësi dhe cilët mund të shpërfillen? Sa ngushtë janë këta faktorë të lidhur me njëri-tjetrin? Dhe sa i sigurt mund të jeni në lidhje me parashikimet?

    Analiza e regresionit në Excel - bazat

    Në modelimin statistikor, analiza e regresionit përdoret për vlerësoni marrëdhëniet midis dy ose më shumë variablave:

    Ndryshorja e varur (aka ndryshorja e kriterit ) është faktori kryesor që po përpiqeni të kuptoni dhe parashikoni.

    Ndryshoret e pavarura(aka variablat shpjegues, ose parashikuesit ) janë faktorët që mund të ndikojnë në variablin e varur.

    Analiza e regresionit ju ndihmon të kuptojë se si ndryshon ndryshorja e varur kur një nga variablat e pavarur ndryshon dhe lejon të përcaktohet matematikisht se cila prej atyre variablave ka vërtetë një ndikim.

    Teknikisht, një model i analizës së regresionit bazohet në shumën

    Në këtë pikë, grafiku juaj tashmë duket si një grafik regresioni i mirë:

    Megjithatë, mund të dëshironi të bëni disa përmirësime të tjera:

    • Zvarriteni ekuacionin kudo që e shihni të arsyeshme.
    • Shtoni titujt e boshteve (butoni Elementet e grafikut > Titujt e boshteve ).
    • Nëse pikat e të dhënave fillojnë në mes të boshtit horizontal dhe/ose vertikal si në këtë shembull, ju mund të dëshironi të hiqni qafe hapësirën e tepërt të bardhë. Këshilla e mëposhtme shpjegon se si ta bëni këtë: Zmadhoni boshtet e grafikut për të zvogëluar hapësirën e bardhë.

      Dhe kështu duket grafiku ynë i përmirësuar i regresionit:

      Shënim i rëndësishëm! Në grafikun e regresionit, ndryshorja e pavarur duhet të jetë gjithmonë në boshtin X dhe ndryshorja e varur në boshtin Y. Nëse grafiku juaj vizatohet në rend të kundërt, ndërroni kolonat në fletën tuaj të punës dhe më pas vizatoni sërish grafikun. Nëse nuk ju lejohet të riorganizoni të dhënat e burimit, atëherë mund të ndërroni boshtet X dhe Y direkt në një grafik.

    Si të bëni regresion në Excel duke përdorur formulat

    Microsoft Excel ka disa funksione statistikore që mund t'ju ndihmojnë të bëni analizën e regresionit linear si LINEST, SLOPE, INTERCEPT dhe CORREL.

    Funksioni LINEST përdor metodën e regresionit të katrorëve më të vegjël për të llogaritur një regresion të drejtë linjë që shpjegon më së miri marrëdhënien midis variablave tuaj dhe kthen një grup që përshkruan atë linjë. Mund të gjeni shpjegimin e detajuar tësintaksa e funksionit në këtë tutorial. Tani për tani, le të bëjmë vetëm një formulë për grupin tonë të të dhënave të mostrës:

    =LINEST(C2:C25, B2:B25)

    Për shkak se funksioni LINEST kthen një grup vlerash, duhet ta futni atë si një formulë grupi. Zgjidhni dy qeliza ngjitur në të njëjtin rresht, E2:F2 në rastin tonë, shkruani formulën dhe shtypni Ctrl + Shift + Enter për ta përfunduar atë.

    Formula kthen koeficientin b ( E1) dhe konstanta a (F1) për ekuacionin tashmë të njohur të regresionit linear:

    y = bx + a

    Nëse shmangni përdorimin e formulave të grupeve në fletët tuaja të punës, mund të llogarisni a dhe b individualisht me formula të rregullta:

    Merrni ndërprerjen Y (a):

    =INTERCEPT(C2:C25, B2:B25)

    Merrni pjerrësinë (b):

    =SLOPE(C2:C25, B2:B25)

    Për më tepër, mund të gjeni koeficientin e korrelacionit ( R shumëfishta në daljen përmbledhëse të analizës së regresionit) që tregon se si fuqimisht të dy variablat janë të lidhura me njëra-tjetrën:

    =CORREL(B2:B25,C2:C25)

    Pamja e mëposhtme e ekranit tregon të gjitha këto formula të regresionit të Excel në veprim:

    Këshillë. Nëse dëshironi të merrni statistika shtesë për analizën tuaj të regresionit, përdorni funksionin LINEST me parametrin s tats të vendosur në TRUE siç tregohet në këtë shembull.

    Kështu e bëni regresionin linear në Excel. Thënë kështu, ju lutemi mbani në mend se Microsoft Excel nuk është një program statistikor. Nëse keni nevojë të kryeni analizën e regresionit në nivel profesional, mund të dëshironi të përdorni të synuarsoftuer të tillë si XLSTAT, RegressIt, etj.

    Për të parë më nga afër formulat tona të regresionit linear dhe teknikat e tjera të diskutuara në këtë tutorial, jeni të mirëpritur të shkarkoni mostrën e librit tonë të punës më poshtë. Faleminderit që lexuat!

    Praktikoni librin e punës

    Analiza e regresionit në Excel - shembuj (skedari .xlsx)

    katrore , e cila është një mënyrë matematikore për të gjetur shpërndarjen e pikave të të dhënave. Qëllimi i një modeli është të marrë shumën më të vogël të mundshme të katrorëve dhe të vizatojë një vijë që i afrohet më shumë të dhënave.

    Në statistikë, ata bëjnë dallimin midis një regresi linear të thjeshtë dhe të shumëfishtë. Regresioni i thjeshtë linear modelon lidhjen midis një ndryshoreje të varur dhe një ndryshoreje të pavarur duke përdorur një funksion linear. Nëse përdorni dy ose më shumë variabla shpjegues për të parashikuar variablin e varur, ju merreni me regresion linear të shumëfishtë . Nëse ndryshorja e varur është modeluar si një funksion jolinear sepse marrëdhëniet e të dhënave nuk ndjekin një vijë të drejtë, përdorni regresionin jolinear në vend të kësaj. Fokusi i këtij tutoriali do të jetë në një regresion të thjeshtë linear.

    Si shembull, le të marrim numrat e shitjeve për çadrat për 24 muajt e fundit dhe të zbulojmë reshjet mesatare mujore për të njëjtën periudhë. Paraqisni këtë informacion në një grafik dhe vija e regresionit do të demonstrojë marrëdhënien midis ndryshores së pavarur (reshjet) dhe ndryshores së varur (shitje ombrellë):

    Ekuacioni i regresionit linear

    Matematikisht, një regresion linear përcaktohet nga ky ekuacion:

    y = bx + a + ε

    Ku:

    • x është një variabël i pavarur.
    • y është një variabël i varur.
    • a është Y-prerja , që është vlera mesatare e pritur e y kur të gjitha variablat x janë të barabarta me 0. Në një grafik regresioni, është pika ku vija kalon boshtin Y.
    • b është pjerrësia e një linje regresioni, e cila është shkalla e ndryshimit për y ndërsa x ndryshon.
    • ε është gabimi i rastësishëm term, i cili është diferenca midis vlerës aktuale të një ndryshoreje të varur dhe vlerës së parashikuar të saj.

    Ekuacioni i regresionit linear ka gjithmonë një term gabimi sepse, në jetën reale, parashikuesit nuk janë kurrë plotësisht të saktë. Megjithatë, disa programe, duke përfshirë Excel, bëjnë llogaritjen e termit të gabimit në prapaskenë. Pra, në Excel, ju bëni regresion linear duke përdorur metodën katrorët më të vegjël dhe kërkoni koeficientët a dhe b të tillë që:

    y = bx + a

    Për shembullin tonë, ekuacioni i regresionit linear merr formën e mëposhtme:

    Umbrellas sold = b * rainfall + a

    Ka një sërë mënyrash të ndryshme për të gjetur a dhe b . Tre metodat kryesore për të kryer analizën e regresionit linear në Excel janë:

    • Mjeti i regresionit i përfshirë me Analysis ToolPak
    • Grafiku i shpërndarjes me një linjë trendi
    • Formula e regresionit linear

    Më poshtë do të gjeni udhëzimet e detajuara për përdorimin e secilës metodë.

    Si të bëni regresion linear në Excel me Analysis ToolPak

    Ky shembull tregon se si të ekzekutoni regresionin në Excel duke përdorur një mjet të veçantë të përfshirë me shtesën Analysis ToolPak.

    Aktivizo shtesën Analysis ToolPakin

    Analysis ToolPak është i disponueshëm në të gjitha versionet e Excel 365 deri në 2003, por nuk është i aktivizuar si parazgjedhje. Pra, duhet ta ndizni manualisht. Ja se si:

    1. Në Excel-in tuaj, klikoni Skedari > Opsionet .
    2. Opsionet e Excel-it kutia e dialogut, zgjidhni Shtesat në shiritin anësor të majtë, sigurohuni që Shtesat e Excel të jenë zgjedhur në kutinë Menaxho dhe kliko Shko .
    3. Në kutinë e dialogut Shtesa , shënoni Paketa e veglave të analizës dhe kliko OK :

    Kjo do të shtojë veglat Analiza e të dhënave në skedën Të dhënat të shiritit tuaj të Excel.

    Ekzekutoni analizën e regresionit

    Në në këtë shembull, ne do të bëjmë një regresion të thjeshtë linear në Excel. Ajo që kemi është një listë e reshjeve mesatare mujore për 24 muajt e fundit në kolonën B, e cila është variabli ynë i pavarur (parashikues), dhe numri i ombrellave të shitura në kolonën C, që është ndryshorja e varur. Natyrisht, ka shumë faktorë të tjerë që mund të ndikojnë në shitje, por tani për tani ne fokusohemi vetëm në këto dy variabla:

    Me të aktivizuar Analiza Toolpak, kryeni këto hapa për të kryer analizën e regresionit në Excel:

    1. Në skedën Të dhënat , në grupin Analiza , kliko butonin Analiza e të dhënave .
    2. Zgjidhni Regresioni dhe kliko OK .
    3. Në kutinë e dialogut Regresioni , konfiguroni cilësimet e mëposhtme:
      • Zgjidhni hyrjen Gama Y , e cila është ndryshorja juaj e varur . Në rastin tonë, janë shitjet ombrellë (C1:C25).
      • Zgjidhni Input X Range , d.m.th. variablin tuaj të pavarur . Në këtë shembull, është reshjet mesatare mujore (B1:B25).

      Nëse po ndërtoni një model regresioni të shumëfishtë, zgjidhni dy ose më shumë kolona ngjitur me variabla të ndryshëm të pavarur.

      • Kontrollo kutinë Etiketat nëse ka tituj në krye të diapazonit tuaj X dhe Y.
      • Zgjidhni opsionin tuaj të preferuar Output, një fletë pune të re në faqen tonë rast.
      • Me dëshirë, zgjidhni kutinë e zgjedhjes Mbetjet për të marrë diferencën midis vlerave të parashikuara dhe atyre aktuale.
    4. Klikoni OK dhe vëzhgoni daljen e analizës së regresionit të krijuar nga Excel.

    Interpretoni rezultatet e analizës së regresionit

    Siç e keni parë sapo, ekzekutimi i regresionit në Excel është i lehtë sepse të gjitha llogaritjet kryhen automatikisht. Interpretimi i rezultateve është pak më i ndërlikuar sepse ju duhet të dini se çfarë fshihet pas çdo numri. Më poshtë do të gjeni një ndarje të 4 pjesëve kryesore të rezultatit të analizës së regresionit.

    Prodhimi i analizës së regresionit: Produkti përmbledhës

    Kjo pjesë ju tregon se sa mirë i përshtatet ekuacioni i regresionit linear të llogaritur të dhënat tuaja burimore.

    Ja se çfarë do të thotë çdo pjesë e informacionit:

    R shumëfishtë . Është koeficienti C orrelacioni që mat fuqinë enjë marrëdhënie lineare midis dy variablave. Koeficienti i korrelacionit mund të jetë çdo vlerë midis -1 dhe 1, dhe vlera e tij absolute tregon fuqinë e marrëdhënies. Sa më e madhe të jetë vlera absolute, aq më e fortë është marrëdhënia:

    • 1 do të thotë një marrëdhënie e fortë pozitive
    • -1 do të thotë një marrëdhënie e fortë negative
    • 0 do të thotë asnjë lidhje në të gjitha

    R Sheshi . Është Koeficienti i Përcaktimit , i cili përdoret si tregues i mirësisë së përshtatjes. Tregon sa pikë bien në vijën e regresionit. Vlera R2 llogaritet nga shuma totale e katrorëve, më saktë, është shuma e devijimeve në katror të të dhënave origjinale nga mesatarja.

    Në shembullin tonë, R2 është 0,91 (rrumbullakosur në 2 shifra) , e cila është shumë e mirë. Do të thotë se 91% e vlerave tona përshtaten me modelin e analizës së regresionit. Me fjalë të tjera, 91% e variablave të varur (y-values) shpjegohen nga variablat e pavarur (x-values). Në përgjithësi, R katror prej 95% ose më shumë konsiderohet një përshtatje e mirë.

    R katror i rregulluar . Është R katror i rregulluar për numrin e ndryshores së pavarur në model. Ju do të dëshironi të përdorni këtë vlerë në vend të R katror për analizën e regresionit të shumëfishtë.

    Gabim standard . Është një tjetër masë e përshtatshmërisë që tregon saktësinë e analizës suaj të regresionit - sa më i vogël të jetë numri, aq më i sigurt mund të jeni përekuacioni juaj i regresionit. Ndërsa R2 përfaqëson përqindjen e variancës së variablave të varur që shpjegohet nga modeli, Gabimi Standard është një masë absolute që tregon distancën mesatare që pikat e të dhënave bien nga vija e regresionit.

    Vëzhgimet . Është thjesht numri i vëzhgimeve në modelin tuaj.

    Prodhimi i analizës së regresionit: ANOVA

    Pjesa e dytë e rezultatit është Analiza e Variancës (ANOVA):

    Në thelb, ai ndan shumën e katrorëve në komponentë individualë që japin informacion për nivelet e ndryshueshmërisë brenda modelit tuaj të regresionit:

    • df është numri i shkallëve të lirisë që lidhen me burimet e variancës.
    • SS është shuma e katrorëve. Sa më i vogël SS-ja e mbetur në krahasim me SS-në totale, aq më mirë modeli juaj përshtatet me të dhënat.
    • MS është katrori mesatar.
    • F është statistika F, ose F-test për hipotezën zero. Përdoret për të testuar rëndësinë e përgjithshme të modelit.
    • Rëndësia F është vlera P e F.

    Pjesa ANOVA përdoret rrallë për një analizë e thjeshtë e regresionit linear në Excel, por patjetër që duhet të shikoni nga afër komponentin e fundit. Vlera Rëndësia F jep një ide se sa të besueshme (statistikisht të rëndësishme) janë rezultatet tuaja. Nëse Rëndësia F është më e vogël se 0,05 (5%), modeli juaj është në rregull. Nëse është më e madhe se 0.05, do ta bënitndoshta më mirë zgjidhni një variabël tjetër të pavarur.

    Prodhimi i analizës së regresionit: koeficientët

    Ky seksion ofron informacion specifik në lidhje me komponentët e analizës suaj:

    Përbërësi më i dobishëm në këtë seksion është Koeficientët . Kjo ju mundëson të ndërtoni një ekuacion linear regresioni në Excel:

    y = bx + a

    Për grupin tonë të të dhënave, ku y është numri i ombrellave të shitura dhe x është një reshje mesatare mujore, formula jonë e regresionit linear shkon si më poshtë:

    Y = Rainfall Coefficient * x + Intercept

    E pajisur me vlera a dhe b të rrumbullakosura në tre shifra dhjetore, ajo kthehet në:

    Y=0.45*x-19.074

    Për shembull, me reshjet mesatare mujore të barabarta me 82 mm, shitjet e çadrave do të ishin afërsisht 17.8:

    0.45*82-19.074=17.8

    Në mënyrë të ngjashme, mund të zbuloni se sa çadra do të jenë shitet me çdo reshje tjetër mujore (x variabël) që specifikoni.

    Rezultati i analizës së regresionit: mbetjet

    Nëse krahasoni numrin e vlerësuar dhe aktual të ombrellave të shitura që korrespondon me reshjet mujore prej 82 mm, do të shihni që këta numra janë paksa të ndryshëm:

    • Vlerësuar: 17.8 (llogaritur më sipër)
    • Aktual: 15 (rreshti 2 i të dhënave burimore)

    Pse është ndryshimi? Sepse variablat e pavarur nuk janë kurrë parashikues të përsosur të variablave të varur. Dhe mbetjet mund t'ju ndihmojnë të kuptoni se sa larg janë vlerat aktuale nga vlerat e parashikuara:

    Përpika e parë e të dhënave (reshjet prej 82 mm), pjesa e mbetur është afërsisht -2.8. Pra, ne shtojmë këtë numër në vlerën e parashikuar dhe marrim vlerën aktuale: 17.8 - 2.8 = 15.

    Si të bëni një grafik regresioni linear në Excel

    Nëse keni nevojë të vizualizoni shpejt marrëdhëniet midis dy variablave, vizatoni një grafik regresioni linear. Kjo është shumë e lehtë! Ja se si:

    1. Zgjidhni dy kolonat me të dhënat tuaja, duke përfshirë titujt.
    2. Në skedën Inset , në grupin Chats , klikoni ikonën Scatter chart dhe zgjidhni miniaturën Scatter (e para):

      Kjo do të futë një grafik shpërndarjeje në fletën tuaj të punës, e cila do t'i ngjajë këtij një:

    3. Tani, ne duhet të vizatojmë vijën e regresionit të katrorëve më të vegjël. Për ta bërë këtë, klikoni me të djathtën në çdo pikë dhe zgjidhni Shto Trendline... nga menyja e kontekstit.
    4. Në panelin e djathtë, zgjidhni formën e linjës së trendit Linear dhe, sipas dëshirës, ​​kontrolloni Ekuacioni i shfaqjes në grafik për të marrë formulën tuaj të regresionit:

      Siç mund ta vini re, ekuacioni i regresionit që Excel ka krijuar për ne është i njëjtë me formulën e regresionit linear që kemi ndërtuar bazuar në daljen e Koeficientëve.

    5. Kalo te Plotëso & Line dhe personalizoni linjën sipas dëshirës tuaj. Për shembull, mund të zgjidhni një ngjyrë të ndryshme rreshti dhe të përdorni një vijë të fortë në vend të një vije të ndërprerë (zgjidhni vijën e ngurtë në kutinë Lloji i vijës ):

    Michael Brown është një entuziast i përkushtuar i teknologjisë me një pasion për thjeshtimin e proceseve komplekse duke përdorur mjete softuerike. Me më shumë se një dekadë përvojë në industrinë e teknologjisë, ai ka përmirësuar aftësitë e tij në Microsoft Excel dhe Outlook, si dhe Google Sheets dhe Docs. Blogu i Michael është i përkushtuar ndaj ndarjes së njohurive dhe ekspertizës së tij me të tjerët, duke ofruar këshilla dhe mësime të thjeshta për t'u ndjekur për të përmirësuar produktivitetin dhe efikasitetin. Pavarësisht nëse jeni një profesionist me përvojë apo fillestar, blogu i Michael ofron njohuri të vlefshme dhe këshilla praktike për të përfituar sa më shumë nga këto mjete softuerike thelbësore.