"Excel" LINEST funkcija su formulės pavyzdžiais

  • Pasidalinti
Michael Brown

Šioje pamokoje paaiškinama funkcijos LINEST sintaksė ir parodoma, kaip ja naudotis atliekant tiesinę regresinę analizę "Excel" programoje.

"Microsoft Excel" nėra statistinė programa, tačiau joje yra nemažai statistinių funkcijų. Viena iš tokių funkcijų yra LINEST, kuri skirta tiesinei regresinei analizei atlikti ir su ja susijusiems statistiniams duomenims grąžinti. Šioje pamokoje pradedantiesiems tik šiek tiek paliesime teoriją ir pagrindinius skaičiavimus. Daugiausia dėmesio skirsime tam, kad pateiktume jums formulę, kuri paprasčiausiai veikia irgalima lengvai pritaikyti jūsų duomenims.

    "Excel" funkcija LINEST - sintaksė ir pagrindiniai naudojimo būdai

    Funkcija LINEST apskaičiuoja tiesės, paaiškinančios nepriklausomo kintamojo ir vieno ar daugiau priklausomų kintamųjų ryšį, statistiką ir grąžina tiesę apibūdinantį masyvą. mažiausių kvadratų metodą, kad surastumėte geriausiai atitinkančią jūsų duomenis. Linijos lygtis yra tokia.

    Paprastosios tiesinės regresijos lygtis:

    y = bx + a

    Daugialypės regresijos lygtis:

    y = b 1 x 1 + b 2 x 2 + ... + b n x n + a

    Kur:

    • y - priklausomą kintamąjį, kurį bandote prognozuoti.
    • x - nepriklausomą kintamąjį, kurį naudojate prognozei atlikti. y .
    • a - sankirta (nurodo, kur linija kerta Y ašį).
    • b - nuolydis (rodo regresijos tiesės statumą, t. y. y kitimo greitį kintant x).

    Pagrindinė funkcijos LINEST forma - tai regresijos lygties interceptas (a) ir nuolydis (b). Pasirinktinai ji gali grąžinti papildomus regresijos analizės statistinius duomenis, kaip parodyta šiame pavyzdyje.

    LINEST funkcijos sintaksė

    "Excel" funkcijos LINEST sintaksė yra tokia:

    LINEST(known_y's, [known_x's], [const], [stats])

    Kur:

    • known_y's (privalomas) yra priklausomo rodiklio intervalas y -paprastai tai būna vienas stulpelis arba viena eilutė.
    • known_x's (neprivaloma) yra nepriklausomų x reikšmių intervalas. Jei jis praleidžiamas, laikoma, kad tai yra masyvas {1,2,3,...}, kurio dydis yra toks pat kaip known_y's .
    • const (neprivaloma) - loginė reikšmė, nustatanti, kaip interceptas (konstanta) a ) turėtų būti gydomi:
      • Jei TRUE arba praleista, konstanta a apskaičiuojamas įprastai.
      • Jei FALSE, konstanta a yra priverstinai lygus 0, o nuolydis ( b koeficientas) apskaičiuojamas, kad atitiktų y=bx.
    • statistika (neprivaloma) yra loginė reikšmė, kuri nustato, ar išvesti papildomą statistiką, ar ne:
      • Jei TRUE, funkcija LINEST grąžina masyvą su papildoma regresijos statistika.
      • Jei FALSE arba praleista, LINEST grąžina tik intercepcijos konstantą ir nuolydžio koeficientą (-us).

    Pastaba. Kadangi LINEST grąžina reikšmių masyvą, ją reikia įvesti kaip masyvo formulę, paspaudus spartųjį klavišą Ctrl + Shift + Enter. Jei ji įvedama kaip įprasta formulė, grąžinamas tik pirmasis nuolydžio koeficientas.

    Papildomi statistiniai duomenys, kuriuos pateikia LINEST

    Svetainė statistika argumentas TRUE nurodo LINEST funkcijai grąžinti šiuos regresinės analizės statistinius duomenis:

    Statistika Aprašymas
    Nuolydžio koeficientas b reikšmė y = bx + a
    Intercepcijos konstanta reikšmė y = bx + a
    Standartinė nuolydžio paklaida b koeficiento (-ų) standartinės paklaidos vertė (-ys).
    Standartinė intercepcijos paklaida Konstantos standartinės paklaidos vertė a .
    Determinacijos koeficientas (R2) Rodo, kaip gerai regresijos lygtis paaiškina ryšį tarp kintamųjų.
    Y įverčio standartinė paklaida Parodo regresinės analizės tikslumą.
    F statistika, arba F stebimoji vertė Jis naudojamas nulinės hipotezės F-testui atlikti, siekiant nustatyti bendrą modelio tinkamumą.
    Laisvės laipsniai (df) Laisvės laipsnių skaičius.
    Regresijos kvadratų suma Rodo, kokią priklausomo kintamojo variacijos dalį paaiškina modelis.
    Likutinė kvadratų suma Nustatomas priklausomo kintamojo dispersijos dydis, kurio nepaaiškina jūsų regresijos modelis.

    Toliau pateiktame žemėlapyje parodyta tvarka, kuria LINEST grąžina statistinių duomenų masyvą:

    Paskutinėse trijose eilutėse trečiame ir vėlesniuose stulpeliuose, kurie nėra užpildyti duomenimis, bus rodomos klaidos #N/A. Tai numatytoji funkcijos LINEST elgsena, tačiau jei norite paslėpti klaidų užrašus, savo LINEST formulę įveskite į IFERROR, kaip parodyta šiame pavyzdyje.

    Kaip naudoti LINEST programoje "Excel" - formulių pavyzdžiai

    Naudotis LINEST funkcija gali būti sudėtinga, ypač naujokams, nes reikia ne tik teisingai sudaryti formulę, bet ir tinkamai interpretuoti jos išvestį. Toliau rasite keletą LINEST formulių naudojimo "Excel" programoje pavyzdžių, kurie, tikiuosi, padės įsisavinti teorines žinias :)

    Paprasta tiesinė regresija: apskaičiuokite nuolydį ir intercepciją

    Norėdami gauti regresijos tiesės interceptą ir nuolydį, naudokite paprasčiausią funkciją LINEST: pateikite priklausomų reikšmių intervalą known_y's argumentas ir nepriklausomų verčių intervalas known_x's Paskutiniai du argumentai gali būti nustatyti kaip TRUE arba praleisti.

    Pavyzdžiui, su y reikšmes (pardavimų skaičius) C2:C13 ir x reikšmes (reklamos išlaidos) B2:B13, mūsų tiesinės regresijos formulė yra tokia paprasta:

    =LINEST(C2:C13,B2:B13)

    Norėdami teisingai įvesti formulę darbalapyje, pasirinkite du gretimus tos pačios eilutės langelius (šiame pavyzdyje E2:F2), įveskite formulę ir paspauskite Ctrl + Shift + Enter, kad ją užbaigtumėte.

    Pagal formulę pirmajame langelyje (E2) bus pateiktas nuolydžio koeficientas, o antrajame langelyje (F2) - intercepcijos konstanta:

    Svetainė nuolydis yra apytiksliai 0,52 (suapvalinta iki dviejų skaičių po kablelio). Tai reiškia, kad kai x padidėja 1, y padidėja 0,52.

    Svetainė Y intercepcija yra neigiama -4,99. Tai yra tikėtina vertė y kai x=0. Jei ji pavaizduota grafike, tai vertė, kuriai esant regresijos tiesė kerta y ašį.

    Į paprastą tiesinės regresijos lygtį įtraukite pirmiau nurodytas vertes ir gausite tokią formulę pardavimų skaičiui prognozuoti pagal reklamos sąnaudas:

    y = 0,52*x - 4,99

    Pavyzdžiui, jei reklamai išleidžiate 50 JAV dolerių, tikimasi parduoti 21 skėtį:

    0.52*50 - 4.99 = 21.01

    Nuolydžio ir intercepto vertes taip pat galima gauti atskirai, naudojant atitinkamą funkciją arba įterpiant LINEST formulę į INDEX:

    Nuolydis

    =SLOPE(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),1)

    Perėmimas

    =INTERCEPT(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),2)

    Kaip parodyta toliau pateiktoje ekrano kopijoje, visų trijų formulių rezultatai yra vienodi:

    Daugialypė tiesinė regresija: nuolydis ir intercepcija

    Jei turite du ar daugiau nepriklausomų kintamųjų, būtinai įveskite juos gretimuose stulpeliuose ir visą šį diapazoną pateikite known_x's argumentas.

    Pavyzdžiui, naudojant pardavimo numerius ( y reikšmės) D2:D13, reklamos išlaidos (vienas x reikšmių rinkinys) B2:B13 ir vidutinis mėnesio kritulių kiekis (kitas x reikšmių rinkinys) B2:B13. x vertės) C2:C13, naudokite šią formulę:

    =LINEST(D2:D13,B2:C13)

    Kadangi formulė grąžins 3 reikšmių masyvą (2 nuolydžio koeficientai ir intercepcijos konstanta), pasirenkame tris gretimus tos pačios eilutės langelius, įrašome formulę ir spaudžiame spartųjį klavišą Ctrl + Shift + Enter.

    Atkreipkite dėmesį, kad daugialypės regresijos formulė grąžina nuolydžio koeficientai į atvirkštine tvarka nepriklausomų kintamųjų (iš dešinės į kairę), t. y. b n , b n-1 , ..., b 2 , b 1 :

    Norėdami prognozuoti pardavimų skaičių, į daugialypės regresijos lygtį įtraukiame LINEST formulės gautas reikšmes:

    y = 0,3*x 2 + 0.19*x 1 - 10.74

    Pavyzdžiui, jei reklamai išleisite 50 JAV dolerių, o vidutinis mėnesio kritulių kiekis bus 100 mm, tikimasi parduoti maždaug 23 skėčius:

    0.3*50 + 0.19*100 - 10.74 = 23.26

    Paprastoji tiesinė regresija: prognozuokite priklausomą kintamąjį

    Be skaičiavimo a ir b reikšmes regresijos lygčiai, "Excel" funkcija LINEST taip pat gali įvertinti priklausomą kintamąjį (y) pagal žinomą nepriklausomą kintamąjį (x). Tam naudojama funkcija LINEST kartu su funkcija SUM arba SUMPRODUCT.

    Pavyzdžiui, štai kaip galite apskaičiuoti kito mėnesio, tarkime, spalio mėnesio, skėčių pardavimų skaičių, remdamiesi ankstesnių mėnesių pardavimais ir spalio mėnesio reklamos biudžetu - 50 JAV dolerių:

    =SUM(LINEST(C2:C10, B2:B10)*{50,1})

    Užuot kodavus x reikšmę formulėje, galite ją pateikti kaip ląstelės nuorodą. Šiuo atveju į kurią nors ląstelę taip pat reikia įvesti konstantą 1, nes masyvų konstantoje negalima maišyti nuorodų ir reikšmių.

    Su x vertę E2 ir konstantą 1 F2, tiks bet kuri iš toliau pateiktų formulių:

    Įprasta formulė (įvedama paspaudus Enter ):

    =SUMPRODUKTAS(LINEST(C2:C10, B2:B10)*(E2:F2))

    masyvo formulė (įvedama paspaudus Ctrl + Shift + Enter ):

    =SUM(LINEST(C2:C10, B2:B10)*(E2:F2))

    Norėdami patikrinti rezultatą, galite gauti tų pačių duomenų intercepciją ir nuolydį, o tada pagal tiesinės regresijos formulę apskaičiuoti y :

    =E2*G2+F2

    Kur E2 yra nuolydis, G2 yra x reikšmė, o F2 - intercepcija:

    Daugialypė regresija: numatyti priklausomą kintamąjį

    Jei susiduriate su keliais prediktoriais, t. y. keliais skirtingais rinkiniais. x reikšmes, į masyvą įtraukite visus šiuos prediktorius kaip konstantą. Pavyzdžiui, kai reklamos biudžetas yra 50 JAV dolerių (x 2 ) ir vidutinis mėnesio kritulių kiekis - 100 mm (x 1 ), formulė yra tokia:

    =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

    Kur D2:D10 yra žinomi y vertės, o B2:C10 yra du rinkiniai x vertės:

    Atkreipkite dėmesį į eiliškumą x masyvų reikšmės yra pastovios. Kaip nurodyta anksčiau, kai daugialypei regresijai atlikti naudojama Excel LINEST funkcija, ji grąžina nuolydžio koeficientus iš dešinės į kairę. Mūsų pavyzdyje Reklama pirmiausia grąžinamas koeficientas, o tada Lietaus krituliai Norint teisingai apskaičiuoti prognozuojamą pardavimų skaičių, reikia padauginti koeficientus iš atitinkamo x reikšmes, todėl masyvo konstantos elementus išdėstykite tokia tvarka: {50,100,1}. Paskutinis elementas yra 1, nes paskutinė reikšmė, kurią grąžina LINEST, yra perėmimas, kurio nereikėtų keisti, todėl ją tiesiog padauginkite iš 1.

    Užuot naudoję masyvo konstantą, galite įvesti visus kintamuosius x į tam tikrus langelius ir pateikti nuorodą į tuos langelius formulėje, kaip tai darėme ankstesniame pavyzdyje.

    Įprasta formulė:

    =SUMPRODUKTAS(LINEST(D2:D10, B2:C10)*(F2:H2))

    Masyvo formulė:

    =SUM(LINEST(D2:D10, B2:C10)*(F2:H2))

    Kai F2 ir G2 yra x vertės, o H2 yra 1:

    LINEST formulė: papildoma regresijos statistika

    Kaip pamenate, norėdami gauti daugiau statistinių duomenų regresinei analizei, į paskutinį funkcijos LINEST argumentą įrašykite TRUE. Pritaikius mūsų pavyzdžio duomenims, formulė įgauna tokią formą:

    =LINEST(D2:D13, B2:C13, TRUE, TRUE)

    Kadangi B ir C stulpeliuose turime 2 nepriklausomus kintamuosius, pasirenkame šėlsmą, sudarytą iš 3 eilučių (dvi x reikšmės + intercepcija) ir 5 stulpelių, įrašome pirmiau nurodytą formulę, spaudžiame Ctrl + Shift + Enter , ir gauname šį rezultatą:

    Norėdami atsikratyti #N/A klaidų, galite įterpti LINEST į IFERROR taip:

    =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

    Toliau pateiktoje ekrano nuotraukoje parodytas rezultatas ir paaiškinta, ką reiškia kiekvienas skaičius:

    Ankstesniuose pavyzdžiuose buvo paaiškinti nuolydžio koeficientai ir Y intercepcija, todėl trumpai apžvelkime kitus statistinius duomenis.

    Determinacijos koeficientas (R2). R2 reikšmė - tai rezultatas, gautas regresijos kvadratų sumą padalijus iš bendros kvadratų sumos. Ji parodo, kiek y reikšmes paaiškina x Tai gali būti bet koks skaičius nuo 0 iki 1, t. y. nuo 0 % iki 100 %. Šiame pavyzdyje R2 yra maždaug 0,97, o tai reiškia, kad 97 % mūsų priklausomų kintamųjų (skėčių pardavimai) paaiškina nepriklausomi kintamieji (reklama + vidutinis mėnesio kritulių kiekis), o tai yra puikus atitikimas!

    Standartinės paklaidos . Paprastai šios reikšmės parodo regresinės analizės tikslumą. Kuo mažesni skaičiai, tuo labiau galite būti tikri dėl savo regresijos modelio.

    F statistika F statistiką naudojate nulinei hipotezei patvirtinti arba atmesti. Sprendžiant, ar bendri rezultatai yra reikšmingi, rekomenduojama F statistiką naudoti kartu su P reikšme.

    Laisvės laipsniai (df). "Excel" funkcija LINEST grąžina liekamieji laisvės laipsniai , kuris yra iš viso df atėmus regresijos df Laisvės laipsnius galite naudoti F kritinėms reikšmėms statistinėje lentelėje gauti, o paskui palyginti F kritines reikšmes su F statistika, kad nustatytumėte savo modelio patikimumo lygį.

    Regresijos kvadratų suma (dar žinomas kaip paaiškinta kvadratų suma , arba modelio kvadratų suma ). tai prognozuojamų y reikšmių ir y vidurkio kvadratinių skirtumų suma, apskaičiuojama pagal šią formulę: =∑(ŷ - ȳ)2. Ji parodo, kokią priklausomo kintamojo variacijos dalį paaiškina jūsų regresijos modelis.

    Likutinė kvadratų suma Tai kvadratinių skirtumų tarp faktinių y reikšmių ir prognozuotų y reikšmių suma. Ji rodo, kiek priklausomo kintamojo variacijos jūsų modelis nepaaiškina. Kuo mažesnė liekanų kvadratų suma, palyginti su bendra kvadratų suma, tuo geriau jūsų regresijos modelis atitinka jūsų duomenis.

    5 dalykai, kuriuos turėtumėte žinoti apie LINEST funkciją

    Norėdami efektyviai naudoti LINEST formules darbalapiuose, galbūt norėsite šiek tiek daugiau sužinoti apie funkcijos "vidinę mechaniką":

    1. Known_y's ir known_x's . Paprastame tiesinės regresijos modelyje, kuriame yra tik vienas x kintamųjų rinkinys, known_y's ir known_x's gali būti bet kokios formos intervalai, jei jie turi tą patį eilučių ir stulpelių skaičių. x kintamieji, known_y's turi būti vektorius, t. y. vienos eilutės arba vieno stulpelio intervalas.
    2. Priverstinis konstantos prilyginimas nuliui . Kai const argumentas yra TRUE arba yra praleistas, tai a apskaičiuojama konstanta (interceptas) ir įtraukiama į lygtį: y=bx + a. Jei const yra FALSE, laikoma, kad interceptas yra lygus 0 ir į regresijos lygtį neįtraukiamas: y=bx.

      Statistikoje jau dešimtmečius diskutuojama, ar prasminga priverstinai nustatyti intercepto konstantą lygią 0, ar ne. Daugelis patikimų regresinės analizės specialistų mano, kad jei intercepto nustatymas lygus nuliui (const=FALSE) atrodo naudingas, tai pati tiesinė regresija yra netinkamas duomenų aibės modelis. Kiti mano, kad tam tikrais atvejais konstantą galima priverstinai nustatyti lygią nuliui, pvz,Apskritai daugeliu atvejų rekomenduojama naudoti numatytąją const=TRUE arba jos nenaudoti.

    3. Tikslumas . funkcijos LINEST apskaičiuotos regresijos lygties tikslumas priklauso nuo jūsų duomenų taškų sklaidos. Kuo duomenys tiesiškesni, tuo tikslesni LINEST formulės rezultatai.
    4. Perteklinės x reikšmės Kai kuriais atvejais vienas ar daugiau nepriklausomų x kintamieji gali neturėti jokios papildomos prognozavimo vertės, o tokių kintamųjų pašalinimas iš regresijos modelio neturi įtakos prognozuojamų y reikšmių tikslumui. Šis reiškinys vadinamas "kolinearumu". Excel LINEST funkcija tikrina, ar nėra kolinearumo, ir praleidžia visus nereikalingus kintamuosius. x kintamuosius, kuriuos jis identifikuoja modelyje. Praleisti kintamieji x kintamuosius galima atpažinti pagal 0 koeficientų ir 0 standartinių paklaidų verčių.
    5. LINEST vs. SLOPE ir INTERCEPT . Pagrindinis funkcijos LINEST algoritmas skiriasi nuo algoritmo, naudojamo funkcijose SLOPE ir INTERCEPT. Todėl, kai pradiniai duomenys yra neapibrėžti arba kolinearūs, šios funkcijos gali duoti skirtingus rezultatus.

    Neveikia "Excel LINEST" funkcija

    Jei jūsų LINEST formulė meta klaidą arba pateikia neteisingą išvestį, tikėtina, kad taip atsitiko dėl vienos iš toliau nurodytų priežasčių:

    1. Jei funkcija LINEST grąžina tik vieną skaičių (nuolydžio koeficientą), greičiausiai ją įvedėte kaip įprastą formulę, o ne kaip matricos formulę. Kad teisingai užbaigtumėte formulę, būtinai paspauskite Ctrl + Shift + Enter. Kai tai padarysite, formulė bus uždaryta į {skliaustelius}, kurie matomi formulių juostoje.
    2. #REF! klaida. Pasitaiko, jei known_x's ir known_y's diapazonai turi skirtingus matmenis.
    3. #VALUE! klaida. Atsiranda, jei known_x's arba known_y's yra bent vienas tuščias langelis, tekstinė reikšmė arba skaičiaus, kurio "Excel" neatpažįsta kaip skaitinės reikšmės, tekstinis atvaizdavimas. const arba statistika argumentas negali būti vertinamas kaip TRUE arba FALSE.

    Štai kaip "Excel" programoje naudojate LINEST paprastai ir daugialypei tiesinei regresinei analizei atlikti. Jei norite atidžiau susipažinti su šioje pamokoje aptartomis formulėmis, kviečiame atsisiųsti mūsų pavyzdinį sąsiuvinį. Dėkoju, kad perskaitėte, ir tikiuosi, kad kitą savaitę susitiksime mūsų tinklaraštyje!

    Atsisiųsti praktikos sąsiuvinį

    "Excel LINEST" funkcijų pavyzdžiai (.xlsx failas)

    Michaelas Brownas yra atsidavęs technologijų entuziastas, mėgstantis supaprastinti sudėtingus procesus naudojant programinės įrangos įrankius. Turėdamas daugiau nei dešimtmetį patirtį technologijų pramonėje, jis patobulino savo įgūdžius „Microsoft Excel“ ir „Outlook“, taip pat „Google“ skaičiuoklėse ir dokumentuose. Michaelio tinklaraštis skirtas dalytis savo žiniomis ir patirtimi su kitais, jame pateikiami lengvai įgyvendinami patarimai ir vadovėliai, kaip pagerinti produktyvumą ir efektyvumą. Nesvarbu, ar esate patyręs profesionalas, ar pradedantysis, Michaelo tinklaraštyje rasite vertingų įžvalgų ir praktinių patarimų, kaip išnaudoti visas šių pagrindinių programinės įrangos įrankių galimybes.