Satura rādītājs
Šajā pamācībā ir izskaidrota funkcijas LINEST sintakse un parādīts, kā to izmantot, lai veiktu lineāro regresijas analīzi programmā Excel.
Microsoft Excel nav statistikas programma, tomēr tajā ir vairākas statistikas funkcijas. Viena no šādām funkcijām ir LINEST, kas ir paredzēta lineārās regresijas analīzes veikšanai un ar to saistītās statistikas atgriešanai. Šajā pamācībā iesācējiem mēs tikai nedaudz pieskarsimies teorijai un pamatā esošajiem aprēķiniem. Mūsu galvenā uzmanība tiks pievērsta tam, lai sniegtu jums formulu, kas vienkārši darbojas un.var viegli pielāgot jūsu datiem.
Excel LINEST funkcija - sintakse un galvenie lietojumi
LINEST funkcija aprēķina statistiku taisnai līnijai, kas izskaidro sakarību starp neatkarīgo mainīgo un vienu vai vairākiem atkarīgajiem mainīgajiem, un atgriež masīvu, kas apraksta šo līniju. vismazākie kvadrāti metode, lai atrastu vislabāko piemērotību jūsu datiem. Līnijas vienādojums ir šāds.
Vienkāršās lineārās regresijas vienādojums:
y = bx + aDaudzkārtējas regresijas vienādojums:
y = b 1 x 1 + b 2 x 2 + ... + b n x n + aKur:
- y - atkarīgais mainīgais lielums, kuru mēģināt prognozēt.
- x - neatkarīgais mainīgais lielums, ko izmantojat, lai prognozētu. y .
- a - krustpunkts (norāda, kur līnija šķērso Y asi).
- b - slīpums (norāda regresijas līnijas stāvumu, t. i., y izmaiņu ātrumu, mainoties x).
Savā pamatformā LINEST funkcija atgriež regresijas vienādojuma intercepciju (a) un slīpumu (b). Pēc izvēles tā var atgriezt arī regresijas analīzes papildu statistiku, kā parādīts šajā piemērā.
LINEST funkciju sintakse
Excel LINEST funkcijas sintakse ir šāda:
LINEST(known_y's, [known_x's], [const], [stats])Kur:
- known_y's (obligāts) ir atkarīgās vērtības diapazons y -vērtības regresijas vienādojumā. Parasti tā ir viena sleja vai viena rinda.
- known_x's (nav obligāts) ir neatkarīgo x vērtību diapazons. Ja tas nav norādīts, tiek pieņemts, ka tas ir tāda paša lieluma masīvs {1,2,3,...} kā known_y's .
- const (nav obligāts) - loģiska vērtība, kas nosaka, kā intercepcija (konstante) a ) būtu jāapstrādā:
- Ja TRUE vai izlaists, konstante a tiek aprēķināts normāli.
- Ja FALSE, konstante a ir piespiedu kārtā vienāds ar 0, un slīpums ( b koeficients) tiek aprēķināts, lai atbilstu y=bx.
- statistika (nav obligāts) ir loģiska vērtība, kas nosaka, vai izvadīt papildu statistiku:
- Ja TRUE, LINEST funkcija atgriež masīvu ar papildu regresijas statistiku.
- Ja FALSE vai netiek izmantots, LINEST atgriež tikai intercepcijas konstantu un slīpuma koeficientu(-us).
Piezīme. Tā kā LINEST atgriež vērtību masīvu, tas ir jāievada kā masīva formula, nospiežot īsceļu Ctrl + Shift + Enter. Ja tas tiek ievadīts kā parasta formula, tiek atgriezts tikai pirmais slīpuma koeficients.
LINEST sniegtā papildu statistika
Portāls statistika arguments, kas iestatīts uz TRUE, uzdod LINEST funkcijai atgriezt šādu statistiku regresijas analīzei:
Statistika | Apraksts |
Nogāzes slīpuma koeficients | b vērtība y = bx + a |
Pārtveršanas konstante | vērtība y = bx + a |
Slīpuma standartkļūda | Koeficienta(-u) b standartkļūdas(-u) vērtība(-as). |
Pārtveršanas standartkļūda | Standarta kļūdas vērtība konstantai a . |
Determinācijas koeficients (R2) | Norāda, cik labi regresijas vienādojums izskaidro mainīgo savstarpējo saistību. |
Standartkļūda Y novērtējumam | Rāda regresijas analīzes precizitāti. |
F statistika jeb F-novērotā vērtība | To izmanto, lai veiktu nulles hipotēzes F-testu, lai noteiktu modeļa vispārējo piemērotību. |
Brīvības pakāpes (df) | Brīvības pakāpju skaits. |
Regresijas kvadrātu summa | Norāda, cik lielu atkarīgā mainīgā variāciju izskaidro modelis. |
Atlikušo kvadrātu summa | Mēra atkarīgā mainīgā variācijas apjomu, ko regresijas modelis nav izskaidrojis. |
Zemāk redzamajā kartē parādīta secība, kādā LINEST atgriež statistikas masīvu:
Pēdējās trijās rindās trešajā un turpmākajās slejās, kas nav aizpildītas ar datiem, parādīsies #N/A kļūdas. Tā ir LINEST funkcijas noklusējuma uzvedība, bet, ja vēlaties paslēpt kļūdu pierakstus, ietiniet LINEST formulu IFERROR, kā parādīts šajā piemērā.
Kā lietot LINEST programmā Excel - formulu piemēri
LINEST funkcijas lietošana var būt sarežģīta, īpaši iesācējiem, jo jums ne tikai pareizi jāveido formula, bet arī pareizi jāinterpretē tās izvads. Zemāk atradīsiet dažus LINEST formulu lietošanas piemērus programmā Excel, kas, cerams, palīdzēs apgūt teorētiskās zināšanas :)
Vienkāršā lineārā regresija: slīpuma un pārtveres aprēķināšana
Lai iegūtu regresijas līnijas pārtveršanas punktu un slīpumu, izmantojiet LINEST funkciju tās vienkāršākajā formā: norādiet atkarīgo vērtību diapazonu, lai known_y's argumentu un neatkarīgo vērtību diapazonu. known_x's Pēdējos divus argumentus var iestatīt uz TRUE vai izlaist.
Piemēram, ar y vērtības (pārdošanas rādītāji) C2:C13 un x vērtības (reklāmas izmaksas) B2:B13, mūsu lineārās regresijas formula ir vienkārša:
=LINEST(C2:C13,B2:B13)
Lai to pareizi ievadītu darblapā, atlasiet divas blakus esošas šūnas vienā rindā, šajā piemērā E2:F2, ievadiet formulu un nospiediet Ctrl + Shift + Enter, lai to pabeigtu.
Formula pirmajā šūnā (E2) parādīs slīpuma koeficientu, bet otrajā šūnā (F2) - intercepcijas konstanti:
Portāls slīpums ir aptuveni 0,52 (noapaļots līdz diviem cipariem aiz komata). Tas nozīmē, ka, kad x palielinās par 1, y palielinās par 0,52.
Portāls Y-intercepcija ir negatīvs -4,99. Tā ir sagaidāmā vērtība no y ja x=0. Ja to attēlo grafikā, tad tā ir vērtība, pie kuras regresijas līnija šķērso y asi.
Ievietojiet iepriekšminētās vērtības vienkāršā lineārās regresijas vienādojumā, un iegūsiet šādu formulu, lai prognozētu pārdošanas apjomu, pamatojoties uz reklāmas izmaksām:
y = 0,52*x - 4,99
Piemēram, ja reklāmai tērējat 50 ASV dolārus, sagaidāms, ka pārdosiet 21 lietussargu:
0.52*50 - 4.99 = 21.01
Slīpuma un pārtveres vērtības var iegūt arī atsevišķi, izmantojot attiecīgo funkciju vai LINEST formulu ievietojot INDEX:
Slīpums
=SLOPE(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),1)
Pārtveršana
=INTERCEPT(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),2)
Kā redzams zemāk redzamajā ekrāna attēlā, visas trīs formulas dod vienādus rezultātus:
Vairākkārtēja lineārā regresija: slīpums un pārtveršana
Ja jums ir divi vai vairāki neatkarīgie mainīgie, noteikti ievadiet tos blakus slejās un sniedziet visu šo diapazonu programmai. known_x's arguments.
Piemēram, ar pārdošanas skaitļiem ( y vērtības) D2:D13, reklāmas izmaksas (viena x vērtību kopa) B2:B13 un mēneša vidējais nokrišņu daudzums (otra x vērtību kopa) B2:B13 un vidējais mēneša nokrišņu daudzums (otra x vērtību kopa) B2:B13. x vērtības) C2:C13, izmantojiet šo formulu:
=LINEST(D2:D13,B2:C13)
Tā kā formula atgriezīs 3 vērtību masīvu (2 slīpuma koeficienti un intercepcijas konstante), izvēlamies trīs blakus esošas šūnas vienā rindā, ievadām formulu un nospiežam taustiņu kombināciju Ctrl + Shift + Enter.
Lūdzu, ņemiet vērā, ka daudzkārtējās regresijas formula atgriež slīpuma koeficienti in the apgrieztā secībā neatkarīgo mainīgo (no labās puses uz kreiso), t. i., b n , b n-1 , ..., b 2 , b 1 :
Lai prognozētu pārdošanas rādītāju, daudzkārtējās regresijas vienādojumam tiek pievienotas LINEST formulas iegūtās vērtības:
y = 0,3*x 2 + 0.19*x 1 - 10.74
Piemēram, ja reklāmai tiek iztērēti 50 ASV dolāri un mēneša vidējais nokrišņu daudzums ir 100 mm, jūs varētu pārdot aptuveni 23 lietussargus:
0.3*50 + 0.19*100 - 10.74 = 23.26
Vienkāršā lineārā regresija: prognozē atkarīgo mainīgo
Papildus aprēķiniem a un b vērtības regresijas vienādojumam, Excel LINEST funkcija var arī novērtēt atkarīgo mainīgo (y), pamatojoties uz zināmu neatkarīgo mainīgo (x). Šim nolūkam LINEST tiek izmantota kopā ar SUM vai SUMPRODUCT funkciju.
Piemēram, piemēram, varat aprēķināt lietussargu pārdošanas apjomu nākamajam mēnesim, piemēram, oktobrim, pamatojoties uz pārdošanas apjomu iepriekšējos mēnešos un oktobra reklāmas budžetu 50 ASV dolāru apmērā:
=SUM(LINEST(C2:C10, B2:B10)*{50,1})
Tā vietā, lai kodētu x vērtību formulā, varat to norādīt kā šūnu atsauci. Šajā gadījumā arī konstante 1 ir jāievada kādā šūnā, jo masīva konstantē nevar sajaukt atsauces un vērtības.
Ar x vērtība E2 un konstante 1 F2, jebkura no turpmāk minētajām formulām būs piemērota:
Parastā formula (ievadīta, nospiežot Enter ):
=SUMPRODUKTS(LINEST(C2:C10, B2:B10)*(E2:F2))
masīva formula (ievadīta, nospiežot Ctrl + Shift + Enter ):
=SUM(LINEST(C2:C10, B2:B10)*(E2:F2))
Lai pārliecinātos par rezultātu, varat iegūt intercepciju un slīpumu tiem pašiem datiem un pēc tam izmantot lineārās regresijas formulu, lai aprēķinātu. y :
=E2*G2+F2
kur E2 ir slīpums, G2 ir slīpums, G2 ir slīpums. x vērtība, un F2 ir intercepcija:
Daudzkārtēja regresija: prognozēt atkarīgo mainīgo
Gadījumā, ja tiek izmantoti vairāki prediktori, t.i., vairāki dažādi komplekti. x vērtības, iekļaujiet visus šos prognozētājus masīva konstantā. Piemēram, ja reklāmas budžets ir 50 dolāru (x 2 ) un mēneša vidējais nokrišņu daudzums 100 mm (x 1 ) formula ir šāda:
=SUM(LINEST(D2:D10, B2:C10)*{50,100,1})
kur D2:D10 ir zināmie y vērtības un B2:C10 ir divas kopas x vērtības:
Lūdzu, pievērsiet uzmanību secībai. x Kā norādīts iepriekš, ja Excel LINEST funkciju izmanto daudzkārtējai regresijai, tā atgriež slīpuma koeficientus no labās puses uz kreiso. Mūsu piemērā Reklāma koeficients tiek atgriezts pirmais, un pēc tam tiek atgriezts koeficients Nokrišņu daudzums Lai pareizi aprēķinātu prognozēto pārdošanas apjomu, koeficienti jāreizina ar atbilstošo koeficientu. x vērtības, tāpēc masīva konstantes elementus sakārtojiet šādā secībā: {50,100,1}. Pēdējais elements ir 1, jo pēdējā LINEST atgrieztā vērtība ir pārtveršana, kuru nedrīkst mainīt, tāpēc to vienkārši reiziniet ar 1.
Tā vietā, lai izmantotu masīva konstantu, varat ievadīt visus x mainīgos dažās šūnās un atsaukties uz šīm šūnām savā formulā, kā tas bija iepriekšējā piemērā.
Parastā formula:
=SUMPRODUKTS(LINEST(D2:D10, B2:C10)*(F2:H2))
Masīva formula:
=SUM(LINEST(D2:D10, B2:C10)*(F2:H2))
kur F2 un G2 ir x vērtības un H2 ir 1:
LINEST formula: papildu regresijas statistika
Kā jūs, iespējams, atceraties, lai regresijas analīzei iegūtu vairāk statistikas, LINEST funkcijas pēdējā argumentā ierakstiet TRUE. Piemērojot mūsu parauga datiem, formula iegūst šādu formuli:
=LINEST(D2:D13, B2:C13, TRUE, TRUE)
Tā kā B un C slejās ir 2 neatkarīgie mainīgie, izvēlamies rēgu, kas sastāv no 3 rindām (divas x vērtības + intercepcija) un 5 slejām, ievadām iepriekš minēto formulu, nospiežam Ctrl + Shift + Enter un iegūstam šo rezultātu:
Lai atbrīvotos no #N/A kļūdām, LINEST var ievietot IFERROR šādā veidā:
=IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")
Tālāk redzamajā ekrānšāviņā ir parādīts rezultāts un paskaidrots, ko nozīmē katrs skaitlis:
Iepriekšējos piemēros tika izskaidroti slīpuma koeficienti un Y-intercepts, tāpēc aplūkosim pārējo statistiku.
Determinācijas koeficients (R2). R2 vērtība ir rezultāts, ko iegūst, regresijas kvadrātu summu dalot ar kopējo kvadrātu summu. Tā norāda, cik daudz kvadrātu summa ir vienāda ar kopējo kvadrātu summu. y vērtības ir izskaidrojamas ar x Tas var būt jebkurš skaitlis no 0 līdz 1, t. i., no 0 % līdz 100 %. Šajā piemērā R2 ir aptuveni 0,97, kas nozīmē, ka 97 % no mūsu atkarīgajiem mainīgajiem (lietussargu pārdošana) ir izskaidrojami ar neatkarīgajiem mainīgajiem (reklāma + vidējais mēneša nokrišņu daudzums), un tas ir lielisks rezultāts!
Standarta kļūdas Parasti šīs vērtības parāda regresijas analīzes precizitāti. Jo mazāki skaitļi, jo lielāka pārliecība par regresijas modeli.
F statistika Lai apstiprinātu vai noraidītu nulles hipotēzi, jūs izmantojat F statistiku. Lemjot, vai kopējie rezultāti ir nozīmīgi, ieteicams izmantot F statistiku kopā ar P vērtību.
Brīvības pakāpes (df). LINEST funkcija programmā Excel atgriež atlikušās brīvības pakāpes , kas ir kopējais df mīnus regresijas df Jūs varat izmantot brīvības pakāpes, lai statistiskajā tabulā iegūtu F-kritiskās vērtības, un pēc tam salīdzināt F-kritiskās vērtības ar F statistiku, lai noteiktu ticamības līmeni savam modelim.
Regresijas kvadrātu summa (pazīstams arī kā izskaidrotā kvadrātu summa vai modeļa kvadrātu summa ) Tā ir prognozēto y vērtību un y vidējās vērtības kvadrātu starpību summa, ko aprēķina pēc šādas formulas: =∑(ŷ - ȳ)2. Tā norāda, cik lielu atkarīgā mainīgā variāciju izskaidro jūsu regresijas modelis.
Atlikušo kvadrātu summa Tā ir kvadrātu starpību summa starp faktiskajām y vērtībām un prognozētajām y vērtībām. Tā norāda, cik lielu atkarīgā mainīgā variāciju jūsu modelis neizskaidro. Jo mazāka ir atlikušo kvadrātu summa salīdzinājumā ar kopējo kvadrātu summu, jo labāk regresijas modelis atbilst jūsu datiem.
5 lietas, kas jāzina par LINEST funkciju
Lai efektīvi izmantotu LINEST formulas savās darblapās, iespējams, vēlaties uzzināt nedaudz vairāk par funkcijas "iekšējo mehāniku":
- Known_y's un known_x's Vienkāršā lineārās regresijas modelī, kurā ir tikai viens x mainīgo kopums, known_y's un known_x's var būt jebkuras formas diapazoni, ja vien tiem ir vienāds rindu un kolonnu skaits. Ja veicat daudzkārtēju regresijas analīzi ar vairāk nekā vienu neatkarīgo datu kopu, tad, ja x mainīgie lielumi, known_y's jābūt vektoram, t. i., vienas rindas vai vienas kolonnas diapazonam.
- Konstantas piespiedu iestatīšana uz nulli . Kad const arguments ir TRUE vai ir izlaists, tad a konstante (intercepcija) tiek aprēķināta un iekļauta vienādojumā: y=bx + a. Ja const ir FALSE, tiek uzskatīts, ka intercepcija ir vienāda ar 0, un tā netiek iekļauta regresijas vienādojumā: y=bx.
Statistikā jau gadu desmitiem tiek diskutēts par to, vai ir jēga intercepcijas konstanti piespiedu kārtā iestatīt uz 0 vai nē. Daudzi uzticami regresijas analīzes praktiķi uzskata, ka, ja intercepcijas iestatīšana uz nulli (const=FALSE) šķiet lietderīga, tad lineārā regresija pati par sevi ir nepareizs modelis datu kopai. Citi uzskata, ka dažās situācijās konstanti var piespiedu kārtā iestatīt uz nulli, piem,regresijas pārrāvuma konstrukciju kontekstā. Kopumā vairumā gadījumu ieteicams izmantot noklusējuma const=TRUE vai izlaist.
- Precizitāte . ar LINEST funkciju aprēķinātā regresijas vienādojuma precizitāte ir atkarīga no jūsu datu punktu izkliedes. Jo lineārāki ir dati, jo precīzāki ir LINEST formulas rezultāti.
- Pārpalikušās x vērtības Dažās situācijās viens vai vairāki neatkarīgi x mainīgajiem var nebūt papildu prognozēšanas vērtības, un šādu mainīgo izslēgšana no regresijas modeļa neietekmē prognozēto y vērtību precizitāti. Šo parādību sauc par "kolinearitāti". Excel LINEST funkcija pārbauda kolinearitāti un izlaiž visus liekos mainīgos. x mainīgie, ko tā identificē no modeļa. Izlaistie mainīgie x mainīgos var atpazīt pēc 0 koeficientiem un 0 standarta kļūdas vērtībām.
- LINEST pret SLOPE un INTERCEPT LINEST funkcijas pamatā esošais algoritms atšķiras no SLOPE un INTERCEPT funkcijās izmantotā algoritma. Tāpēc, ja avota dati ir nenoteikti vai kolineāri, šīs funkcijas var dot atšķirīgus rezultātus.
Excel LINEST funkcija nedarbojas
Ja jūsu LINEST formulā tiek pieļauta kļūda vai tiek iegūts nepareizs izvads, iespējams, ka iemesls ir kāds no šiem iemesliem:
- Ja LINEST funkcija atgriež tikai vienu skaitli (slīpuma koeficientu), visticamāk, tā ir ievadīta kā parasta formula, nevis kā masīva formula. Noteikti nospiediet Ctrl + Shift + Enter, lai pareizi pabeigtu formulu. Kad to izdarīsiet, formula tiks ietverta {vītņiekavās}, kas ir redzamas formulas joslā.
- #REF! kļūda. Kļūda rodas, ja known_x's un known_y's diapazoniem ir dažādi izmēri.
- #VALUE! kļūda. Iestājas, ja known_x's vai known_y's ir vismaz viena tukša šūna, teksta vērtība vai skaitļa teksta attēlojums, ko Excel neatzīst par skaitlisko vērtību. Kļūda #VALUE rodas arī tad, ja const vai statistika argumentu nevar novērtēt kā TRUE vai FALSE.
Lūk, kā jūs izmantojat LINEST programmā Excel, lai veiktu vienkāršu un daudzkārtēju lineāro regresijas analīzi. Lai tuvāk iepazītos ar šajā pamācībā aplūkotajām formulām, aicinām lejupielādēt mūsu parauga darbgrāmatu zemāk. Paldies, ka izlasījāt, un ceru, ka nākamnedēļ tiksimies mūsu blogā!
Prakses darba burtnīca lejupielādei
Excel LINEST funkciju piemēri (.xlsx fails)