Lineara regresa analizo en Excel

  • Kundividu Ĉi Tion
Michael Brown

La lernilo klarigas la bazojn de regresa analizo kaj montras kelkajn malsamajn manierojn fari linearan regreson en Excel.

Imagu ĉi tion: vi ricevas multajn malsamajn datumojn kaj estas petitaj antaŭdiri la venontjarajn vendajn nombrojn por via kompanio. Vi malkovris dekojn, eble eĉ centojn, da faktoroj, kiuj eble povas influi la nombrojn. Sed kiel vi scias, kiuj estas vere gravaj? Rulu regresan analizon en Excel. Ĝi donos al vi respondon al ĉi tiu kaj multaj pliaj demandoj: Kiuj faktoroj gravas kaj kiuj povas esti ignoritaj? Kiom proksime ĉi tiuj faktoroj rilatas unu al la alia? Kaj kiom certa vi povas esti pri la antaŭdiroj?

    Regresanalizo en Excel - la bazaĵoj

    En statistika modelado, regresanalizo estas uzata por taksu la rilatojn inter du aŭ pli da variabloj:

    Dependa variablo (alinome kriterio variablo) estas la ĉefa faktoro, kiun vi provas kompreni kaj antaŭdiri.

    Sendependaj variabloj (alinome klarigeblaj variabloj, aŭ antaŭdiroj ) estas la faktoroj kiuj povus influi la dependan variablon.

    Regresanalizo helpas vin kompreni kiel la dependa variablo ŝanĝiĝas kiam unu el la sendependaj variabloj varias kaj permesas matematike determini kiu el tiuj variabloj vere havas efikon.

    Teknike, regresa analiza modelo baziĝas sur la sumo de

    Je ĉi tiu punkto, via diagramo jam aspektas kiel deca regresa grafikaĵo:

    Tamen, vi eble volas fari kelkajn pliajn plibonigojn:

    • Trenu la ekvacion kien ajn vi konvenas.
    • Aldonu aksajn titolojn ( Chart Elements butono > Aksootitoloj ).
    • Se via datumpunktoj komenciĝas en la mezo de la horizontala kaj/aŭ vertikala akso kiel en ĉi tiu ekzemplo, vi eble volas forigi la troan blankan spacon. La sekva konsileto klarigas kiel fari tion: Skali la diagramaksojn por redukti blankan spacon.

      Kaj jen kiel nia plibonigita regresa grafiko aspektas:

      Grava noto! En la regresa grafeo, la sendependa variablo ĉiam devus esti sur la X-akso kaj la dependa variablo sur la Y-akso. Se via grafikaĵo estas desegnita en la inversa ordo, interŝanĝu la kolumnojn en via laborfolio, kaj poste desegnu la diagramon denove. Se vi ne rajtas rearanĝi la fontajn datumojn, tiam vi povas ŝanĝi la X kaj Y-aksojn rekte en diagramo.

    Kiel fari regreson en Excel uzante formulojn

    Mikrosofto Excel havas kelkajn statistikajn funkciojn kiuj povas helpi vin fari linearan regresan analizon kiel LINEST, SLOPE, INTERCEPTO, kaj CORREL.

    La LINEST-funkcio uzas la malplej kvadratan regresan metodon por kalkuli rektan. linio kiu plej bone klarigas la rilaton inter viaj variabloj kaj resendas tabelon priskribantan tiun linion. Vi povas trovi la detalan klarigon dela sintakso de la funkcio en ĉi tiu lernilo. Nuntempe, ni nur faru formulon por nia ekzempla datumaro:

    =LINEST(C2:C25, B2:B25)

    Ĉar la LINEST-funkcio liveras tabelon da valoroj, vi devas enigi ĝin kiel tabelformulo. Elektu du apudajn ĉelojn en la sama vico, E2:F2 en nia kazo, tajpu la formulon, kaj premu Ctrl + Shift + Enter por kompletigi ĝin.

    La formulo liveras la b koeficienton ( E1) kaj la a konstanto (F1) por la jam konata lineara regresa ekvacio:

    y = bx + a

    Se vi evitas uzi tabelajn formulojn en viaj laborfolioj, vi povas kalkuli a kaj b individue kun regulaj formuloj:

    Ekiru la Y-interkapton (a):

    =INTERCEPT(C2:C25, B2:B25)

    Ekiru la deklivon (b):

    =SLOPE(C2:C25, B2:B25)

    Aldone, vi povas trovi la korelacian koeficienton ( Multobla R en la resuma eligo de regresa analizo), kiu indikas kiel forte la du variabloj rilatas unu al la alia:

    =CORREL(B2:B25,C2:C25)

    La sekva ekrankopio montras ĉiujn ĉi Excel-regresajn formulojn en ago:

    Konsileto. Se vi ŝatus akiri pliajn statistikojn por via regresa analizo, uzu la funkcion LINEST kun la parametro s tats agordita al VERA kiel montrite en ĉi tiu ekzemplo.

    Tiel vi faras linearan regreson. en Excel. Dirite, bonvolu memori, ke Microsoft Excel ne estas statistika programo. Se vi bezonas fari regresan analizon je la profesia nivelo, vi eble volas uzi celitaprogramaro kiel XLSTAT, RegressIt, ktp.

    Por pli detale rigardi niajn linearajn regresajn formulojn kaj aliajn teknikojn diskutitajn en ĉi tiu lernilo, vi bonvenas elŝuti nian specimenan laborlibron sube. Dankon pro legado!

    Praktiku laborlibron

    Regresan analizon en Excel - ekzemploj (.xlsx-dosiero)

    kvadratoj, kiu estas matematika maniero trovi la disvastigon de datenpunktoj. La celo de modelo estas akiri la plej malgrandan eblan sumon de kvadratoj kaj desegni linion kiu plej proksimiĝas al la datenoj.

    En statistiko, ili diferencigas inter simpla kaj multobla lineara regreso. Simpla lineara regreso. modelas la rilaton inter dependa variablo kaj unu sendependa variablo uzante linearan funkcion. Se vi uzas du aŭ pli da klarigaj variabloj por antaŭdiri la dependan variablon, vi traktas multoblan linearan regreson . Se la dependa variablo estas modeligita kiel ne-linia funkcio ĉar la datenrilatoj ne sekvas rektan linion, uzu nelineara regreso anstataŭe. La fokuso de ĉi tiu lernilo estos sur simpla lineara regreso.

    Ekzemple, ni prenu vendajn nombrojn por pluvombreloj dum la lastaj 24 monatoj kaj eksciu la averaĝan monatan pluvon por la sama periodo. Grafiku ĉi tiun informon sur diagramo, kaj la regresa linio montros la rilaton inter la sendependa variablo (pluvo) kaj dependa variablo (ombrelvendo):

    Lineara regresa ekvacio

    Matematike, linia regreso estas difinita per ĉi tiu ekvacio:

    y = bx + a + ε

    Kie:

    • x estas sendependa variablo.
    • y estas dependa variablo.
    • a estas la Y-interkapto , kiu estas la atendata mezvaloro de y kiam ĉiuj x variabloj estas egalaj al 0. Sur regresa grafeo, ĝi estas la punkto kie la linio transiras la Y-akson.
    • b estas la deklivo de regresa linio, kiu estas la indico de ŝanĝo por y kiam x ŝanĝiĝas.
    • ε estas la hazarda eraro termino, kiu estas la diferenco inter la reala valoro de dependa variablo kaj ĝia antaŭdirita valoro.

    La lineara regresa ekvacio ĉiam havas erarterminon ĉar, en la reala vivo, prognoziloj neniam estas perfekte precizaj. Tamen, iuj programoj, inkluzive de Excel, faras la erarterminokalkulon malantaŭ la scenoj. Do, en Excel, vi faras linearan regreson uzante la metodon de malplej kvadrataj kaj serĉas koeficientojn a kaj b tiajn ke:

    y = bx + a

    Por nia ekzemplo, la lineara regresa ekvacio prenas la jenan formon:

    Umbrellas sold = b * rainfall + a

    Ekzistas manpleno da malsamaj manieroj trovi a kaj b . La tri ĉefaj metodoj por fari linearan regresan analizon en Excel estas:

    • Regresa ilo inkluzivita kun Analiza ToolPak
    • Diska diagramo kun tendenclinio
    • Linia regresa formulo

    Malsupre vi trovos la detalajn instrukciojn pri uzado de ĉiu metodo.

    Kiel fari linearan regreson en Excel kun Analiza ToolPak

    Ĉi tiu ekzemplo montras kiel ruli regreson en Excel. uzante specialan ilon inkluzivitan kun la aldonaĵo de Analizo-Pakaĵo.

    Ebligu la aldonaĵon de Analizo-Pakaĵo.in

    Analiza ToolPak estas disponebla en ĉiuj versioj de Excel 365 ĝis 2003 sed ne estas ebligita defaŭlte. Do, vi devas ŝalti ĝin permane. Jen kiel:

    1. En via Excel, alklaku Dosiero > Opcioj .
    2. En la Excel-Agordoj dialogkesto, elektu Aldonaĵoj sur la maldekstra flanka kolumno, certigu, ke Excel-Aldonaĵoj estas elektita en la skatolo Administri , kaj alklaku Iru .
    3. En la dialogkesto Aldonaĵoj , marku Analiza Ilaro , kaj alklaku OK :

    Ĉi tio aldonos la ilojn Analizo de datumoj al la langeto Datumoj de via Excel-rubando.

    Rulu regresan analizon

    En ĉi tiu ekzemplo, ni faros simplan linearan regreson en Excel. Kion ni havas estas listo de averaĝa monata pluvokvanto dum la lastaj 24 monatoj en kolumno B, kiu estas nia sendependa variablo (antaŭdiro), kaj la nombro da pluvombreloj venditaj en kolumno C, kiu estas la dependa variablo. Kompreneble, ekzistas multaj aliaj faktoroj, kiuj povas influi vendojn, sed nuntempe ni koncentriĝas nur pri ĉi tiuj du variabloj:

    Kun Analiza Toolpak aldonita ebligita, faru ĉi tiujn paŝojn por fari regresan analizon en Excel:

    1. En la langeto Datumoj , en la grupo Analizo , alklaku la butonon Datumo-Analizo .
    2. Elektu Regreso kaj alklaku OK .
    3. En la dialogkesto Regreso , agordu la jenajn agordojn:
      • Elektu la EnigoY Range , kiu estas via dependa variablo . En nia kazo, temas pri ombrelvendoj (C1:C25).
      • Elektu la Eniga X-Galon , t.e. via sendependa variablo . En ĉi tiu ekzemplo, ĝi estas la averaĝa monata pluvokvanto (B1:B25).

      Se vi konstruas multoblan regresan modelon, elektu du aŭ pli da apudaj kolumnoj kun malsamaj sendependaj variabloj.

      • Marku la Etikedoj-skatolon se estas kaplinioj ĉe la supro de viaj X kaj Y intervaloj.
      • Elektu vian preferatan Eliga opcion, novan laborfolion en nia kazo.
      • Laŭvole, elektu la markobutonon Restaĵoj por akiri la diferencon inter la antaŭviditaj kaj realaj valoroj.
    4. Alklaku OK kaj observu la regresan analizan eliron kreitan de Excel.

    Interpreti regresan analizon

    Kiel vi ĵus vidis, ruli regreson en Excel estas facila ĉar ĉiuj kalkuloj estas antaŭformataj aŭtomate. La interpreto de la rezultoj estas iom pli malfacila ĉar vi devas scii kio estas malantaŭ ĉiu nombro. Malsupre vi trovos disrompon de 4 ĉefaj partoj de la regresa analiza eligo.

    Regresanaliza eligo: Resuma Eligo

    Ĉi tiu parto diras al vi kiom bone la kalkulita lineara regresa ekvacio konvenas al viaj fontaj datumoj.

    Jen kion signifas ĉiu informo:

    Multobla R . Estas la C orrilata Koeficiento kiu mezuras la forton delinia rilato inter du variabloj. La korelacia koeficiento povas esti ajna valoro inter -1 kaj 1, kaj ĝia absoluta valoro indikas la rilatforton. Ju pli granda la absoluta valoro, des pli forta la rilato:

    • 1 signifas fortan pozitivan rilaton
    • -1 signifas fortan negativan rilaton
    • 0 signifas neniun rilaton ĉe ĉiuj

    R Kvadrato . Ĝi estas la Koeficiento de Determino , kiu estas uzata kiel indikilo de la boneco de taŭgeco. Ĝi montras kiom da punktoj falas sur la regresa linio. La R2-valoro estas kalkulita el la totala sumo de kvadratoj, pli precize, ĝi estas la sumo de la kvadrataj devioj de la originaj datumoj de la meznombro.

    En nia ekzemplo, R2 estas 0,91 (rondita al 2 ciferoj) , kio estas fee bona. Ĝi signifas, ke 91% de niaj valoroj konvenas al la regresa analiza modelo. Alivorte, 91% de la dependaj variabloj (y-valoroj) estas klarigitaj per la sendependaj variabloj (x-valoroj). Ĝenerale, R Kvadrato de 95% aŭ pli estas konsiderata bona taŭga.

    Alĝustigita R Kvadrato . Ĝi estas la R-kvadrato alĝustigita por la nombro da sendependa variablo en la modelo. Vi volas uzi ĉi tiun valoron anstataŭ R-kvadrato por multobla regresa analizo.

    Norma Eraro . Ĝi estas alia mezuro de boneco, kiu montras la precizecon de via regresa analizo - ju pli malgranda la nombro, des pli certa vi povas esti privia regresa ekvacio. Dum R2 reprezentas la procenton de la varianco de dependaj variabloj, kiu estas klarigita de la modelo, Norma Eraro estas absoluta mezuro, kiu montras la mezan distancon, kiun la datenpunktoj falas de la regresa linio.

    Observaĵoj . Ĝi estas simple la nombro da observoj en via modelo.

    Regresa analiza eligo: ANOVA

    La dua parto de la eligo estas Analizo de Varianco (ANOVA):

    Esence, ĝi dividas la sumon de kvadratoj en individuajn komponentojn kiuj donas informojn pri la niveloj de ŝanĝebleco ene de via regresa modelo:

    • df estas la nombro de la gradoj de libereco asociitaj kun la fontoj. de varianco.
    • SS estas la sumo de kvadratoj. Ju pli malgranda la Restaĵo SS kompare kun la Totala SS, des pli bone via modelo konvenas al la datumoj.
    • MS estas la averaĝa kvadrato.
    • F estas la F-statistiko, aŭ F-testo por la nula hipotezo. Ĝi estas uzata por testi la ĝeneralan signifon de la modelo.
    • Signifeco F estas la P-valoro de F.

    La parto ANOVA estas malofte uzata por simpla linia regresa analizo en Excel, sed vi certe devus rigardi detale la lastan komponanton. La Significance F valoro donas ideon pri kiom fidindaj (statistike signifaj) viaj rezultoj estas. Se Signifo F estas malpli ol 0.05 (5%), via modelo estas bona. Se ĝi estas pli granda ol 0,05, vi farusprobable pli bone elektu alian sendependan variablon.

    Regresa analizo eligo: koeficientoj

    Ĉi tiu sekcio provizas specifajn informojn pri la komponantoj de via analizo:

    La plej utila komponanto en ĉi tiu sekcio estas Koeficientoj . Ĝi ebligas al vi konstrui linearan regresan ekvacion en Excel:

    y = bx + a

    Por nia datuma aro, kie y estas la nombro da venditaj pluvombreloj kaj x estas averaĝa monata pluvo, nia lineara regresa formulo iras jene:

    Y = Rainfall Coefficient * x + Intercept

    Ekipitaj per a kaj b valoroj rondigitaj al tri decimalaj lokoj, ĝi fariĝas:

    Y=0.45*x-19.074

    Ekzemple, kun la averaĝa monata pluvokvanto egala al 82 mm, la ombrelvendoj estus proksimume 17,8:

    0.45*82-19.074=17.8

    Simile, vi povas ekscii kiom da pluvombreloj estos. vendite kun iu ajn alia monata pluvo (x-variablo), kiun vi specifigas.

    Regresa analizo eligo: restaĵoj

    Se vi komparas la taksitan kaj efektivan nombron de venditaj pluvombreloj responda al la monata pluvo de 82 mm, vi vidos, ke ĉi tiuj nombroj estas iomete malsamaj:

    • Taksita: 17,8 (supre kalkulita)
    • Fakta: 15 (vico 2 de la fontaj datumoj)

    Kial estas la diferenco? Ĉar sendependaj variabloj neniam estas perfektaj prognoziloj de la dependaj variabloj. Kaj la restaĵoj povas helpi vin kompreni kiom for la realaj valoroj estas de la antaŭviditaj valoroj:

    Porla unua datenpunkto (pluvo de 82 mm), la restaĵo estas proksimume -2,8. Do, ni aldonas ĉi tiun nombron al la antaŭvidita valoro, kaj ricevas la realan valoron: 17,8 - 2,8 = 15.

    Kiel fari linearan regresan grafeon en Excel

    Se vi bezonas rapide bildigi la rilato inter la du variabloj, desegnu linearan regresan diagramon. Tio estas tre facila! Jen kiel:

    1. Elektu la du kolumnojn kun viaj datumoj, inkluzive de kaplinioj.
    2. Sur la langeto Enmeti , en la grupo Babiloj , alklaku la piktogramon Diskatiga diagramo kaj elektu la bildeton Diskaŝu (la unua):

      Ĉi tio enigos disvastigon en vian laborfolion, kiu similos ĉi tion. unu:

    3. Nun, ni devas desegni la malplej kvadratan regresan linion. Por fari ĝin, dekstre alklaku iun punkton kaj elektu Aldoni Tendencon... el la kunteksta menuo.
    4. Sur la dekstra panelo, elektu la Linian tendencan formon kaj, laŭvole, kontrolu Vidigi ekvacion sur Diagramo por akiri vian regresan formulon:

      Kiel vi povas rimarki, la regresa ekvacio, kiun Excel kreis por ni, estas la sama kiel la lineara regresa formulo, kiun ni konstruis surbaze de la eligo de Koeficientoj.

    5. Almu al la Plenigi & Linio langeto kaj agordu la linion laŭplaĉe. Ekzemple, vi povas elekti malsaman linikoloron kaj uzi solidan linion anstataŭ streketan linion (elektu Solidan linion en la skatolo Paŭzostreko ):

    Michael Brown estas diligenta teknologia entuziasmulo kun pasio por simpligi kompleksajn procezojn uzante programarajn ilojn. Kun pli ol jardeko da sperto en la teknologia industrio, li perfektigis siajn kapablojn en Microsoft Excel kaj Outlook, same kiel Google Sheets kaj Docs. La blogo de Mikaelo estas dediĉita al kunhavigi siajn sciojn kaj kompetentecon kun aliaj, provizante facilajn sekvajn konsiletojn kaj lernilojn por plibonigi produktivecon kaj efikecon. Ĉu vi estas sperta profesiulo aŭ komencanto, la blogo de Mikaelo ofertas valorajn komprenojn kaj praktikajn konsilojn por eltiri la plej multajn el ĉi tiuj esencaj programaj iloj.