Funcția Excel LINEST cu exemple de formule

  • Imparte Asta
Michael Brown

Acest tutorial explică sintaxa funcției LINEST și arată cum să o utilizați pentru a efectua o analiză de regresie liniară în Excel.

Microsoft Excel nu este un program statistic, însă dispune de o serie de funcții statistice. Una dintre aceste funcții este LINEST, care este concepută pentru a efectua analiza de regresie liniară și a returna statisticile aferente. În acest tutorial pentru începători, vom atinge doar ușor teoria și calculele de bază. Principalul nostru obiectiv va fi să vă oferim o formulă care funcționează simplu șipoate fi ușor de personalizat pentru datele dumneavoastră.

    Funcția Excel LINEST - sintaxă și utilizări de bază

    Funcția LINEST calculează statisticile pentru o linie dreaptă care explică relația dintre variabila independentă și una sau mai multe variabile dependente și returnează un tablou care descrie linia. Funcția utilizează cele mai mici pătrate pentru a găsi cea mai bună potrivire pentru datele dvs. Ecuația liniei este următoarea.

    Ecuația de regresie liniară simplă:

    y = bx + a

    Ecuația de regresie multiplă:

    y = b 1 x 1 + b 2 x 2 + ... + b n x n + a

    Unde:

    • y - variabila dependentă pe care încercați să o preziceți.
    • x - variabila independentă pe care o utilizați pentru a prezice y .
    • a - intercepția (indică locul în care linia intersectează axa Y).
    • b - panta (indică abruptul liniei de regresie, adică rata de variație a lui y în funcție de variația lui x).

    În forma sa de bază, funcția LINEST returnează intercepția (a) și panta (b) pentru ecuația de regresie. Opțional, poate returna, de asemenea, statistici suplimentare pentru analiza de regresie, așa cum se arată în acest exemplu.

    Sintaxa funcției LINEST

    Sintaxa funcției Excel LINEST este următoarea:

    LINEST(known_y's, [known_x's], [const], [stats])

    Unde:

    • a lui known_y (necesar) este un interval al dependenței y -De obicei, este vorba de o singură coloană sau de un singur rând.
    • cunoscut_x's (opțional) este un interval de valori x independente. Dacă se omite, se presupune că este vorba de matricea {1,2,3,...} de aceeași dimensiune ca și a lui known_y .
    • const (opțional) - o valoare logică care determină modul în care se va realiza interceptarea (constantă a ) ar trebui să fie tratate:
      • Dacă este TRUE sau omisă, constanta a se calculează în mod normal.
      • Dacă este FALSE, constanta a este forțată la 0, iar panta ( b coeficientul) se calculează pentru a se potrivi y=bx.
    • statistici (opțional) este o valoare logică care determină dacă se vor emite sau nu statistici suplimentare:
      • Dacă este TRUE, funcția LINEST returnează o matrice cu statistici de regresie suplimentare.
      • Dacă este FALSE sau omis, LINEST returnează doar constanta de interceptare și coeficientul (coeficienții) de pantă.

    Notă: Deoarece LINEST returnează un tablou de valori, trebuie introdusă ca o formulă de tablou prin apăsarea combinației de taste Ctrl + Shift + Enter. Dacă este introdusă ca o formulă obișnuită, se returnează doar primul coeficient de pantă.

    Statistici suplimentare furnizate de LINEST

    The statistici setat la valoarea TRUE instruiește funcția LINEST să returneze următoarele statistici pentru analiza de regresie:

    Statistică Descriere
    Coeficientul de pantă b valoare în y = bx + a
    Constanta de interceptare o valoare în y = bx + a
    Eroarea standard a pantei Valoarea (valorile) erorii standard pentru coeficientul (coeficienții) b.
    Eroarea standard a interceptului Valoarea erorii standard pentru constanta a .
    Coeficientul de determinare (R2) Indică cât de bine explică ecuația de regresie relația dintre variabile.
    Eroarea standard pentru estimarea Y Arată precizia analizei de regresie.
    statistica F sau valoarea F-observată Se utilizează pentru a efectua testul F pentru ipoteza nulă pentru a determina gradul general de adecvare a modelului.
    Gradele de libertate (df) Numărul de grade de libertate.
    Suma pătratelor de regresie Indică cât de mult din variația variabilei dependente este explicată de model.
    Suma pătratelor reziduale Măsoară cantitatea de variație din variabila dependentă care nu este explicată de modelul de regresie.

    Harta de mai jos arată ordinea în care LINEST returnează un array de statistici:

    În ultimele trei rânduri, erorile #N/A vor apărea în a treia și următoarele coloane care nu sunt completate cu date. Acesta este comportamentul implicit al funcției LINEST, dar dacă doriți să ascundeți notele de eroare, transformați formula LINEST în IFERROR, așa cum se arată în acest exemplu.

    Cum se utilizează LINEST în Excel - exemple de formule

    Funcția LINEST ar putea fi dificil de utilizat, mai ales pentru începători, deoarece nu trebuie doar să construiți corect o formulă, ci și să interpretați corect rezultatul acesteia. Mai jos, veți găsi câteva exemple de utilizare a formulelor LINEST în Excel, care sperăm că vă vor ajuta să asimilați cunoștințele teoretice :)

    Regresie liniară simplă: calculați panta și intercepția

    Pentru a obține intercepția și panta unei drepte de regresie, utilizați funcția LINEST în forma sa cea mai simplă: furnizați un interval de valori dependente pentru a lui known_y și un interval de valori independente pentru cunoscut_x's Ultimele două argumente pot fi setate la TRUE sau pot fi omise.

    De exemplu, cu y (cifrele de vânzări) în C2:C13 și valorile x (costul publicității) în B2:B13, formula noastră de regresie liniară este foarte simplă:

    =LINEST(C2:C13,B2:B13)

    Pentru a o introduce corect în foaia de calcul, selectați două celule adiacente din același rând, E2:F2 în acest exemplu, introduceți formula și apăsați Ctrl + Shift + Enter pentru a o completa.

    Formula va returna coeficientul de pantă în prima celulă (E2) și constanta de interceptare în cea de-a doua celulă (F2):

    The pantă este de aproximativ 0,52 (rotunjit la două zecimale), ceea ce înseamnă că atunci când x crește cu 1, y crește cu 0,52.

    The Y-intercept este negativă -4,99. Este valoarea așteptată a y atunci când x=0. Dacă este reprezentată pe un grafic, este valoarea la care linia de regresie intersectează axa y.

    Introduceți valorile de mai sus într-o ecuație de regresie liniară simplă și veți obține următoarea formulă pentru a prezice numărul de vânzări pe baza costului de publicitate:

    y = 0.52*x - 4.99

    De exemplu, dacă cheltuiți 50 de dolari pe publicitate, se așteaptă să vindeți 21 de umbrele:

    0.52*50 - 4.99 = 21.01

    Valorile pantei și ale intercepției pot fi, de asemenea, obținute separat prin utilizarea funcției corespunzătoare sau prin înglobarea formulei LINEST în INDEX:

    Panta

    =SLOPE(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),1)

    Interceptare

    =INTERCEPT(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),2)

    După cum se arată în captura de ecran de mai jos, toate cele trei formule dau aceleași rezultate:

    Regresie liniară multiplă: pantă și intercepție

    În cazul în care aveți două sau mai multe variabile independente, asigurați-vă că le introduceți în coloane alăturate și furnizați întregul interval de variabile în cadrul aplicației cunoscut_x's argument.

    De exemplu, în cazul numerelor de vânzări ( y valori) în D2:D13, costul publicității (un set de valori x) în B2:B13 și media lunară a precipitațiilor (un alt set de valori x) în B2:B13 și media lunară a precipitațiilor (un alt set de valori x) în D2:D13. x valori) în C2:C13, se folosește această formulă:

    =LINEST(D2:D13,B2:C13)

    Deoarece formula va returna o matrice de 3 valori (2 coeficienți de pantă și constanta de interceptare), selectăm trei celule contigue din același rând, introducem formula și apăsăm combinația de taste Ctrl + Shift + Enter.

    Vă rugăm să rețineți că formula de regresie multiplă returnează valoarea coeficienți de pantă în ordine inversă a variabilelor independente (de la dreapta la stânga), adică b n , b n-1 , ..., b 2 , b 1 :

    Pentru a prezice numărul de vânzări, furnizăm valorile returnate de formula LINEST în ecuația de regresie multiplă:

    y = 0.3*x 2 + 0.19*x 1 - 10.74

    De exemplu, cu 50 de dolari cheltuiți pe publicitate și o medie lunară de precipitații de 100 mm, se așteaptă să vindeți aproximativ 23 de umbrele:

    0.3*50 + 0.19*100 - 10.74 = 23.26

    Regresie liniară simplă: preziceți variabila dependentă

    În afară de calcularea a și b pentru ecuația de regresie, funcția Excel LINEST poate estima, de asemenea, variabila dependentă (y) pe baza variabilei independente cunoscute (x). Pentru aceasta, se utilizează LINEST în combinație cu funcția SUM sau SUMPRODUCT.

    De exemplu, iată cum puteți calcula numărul de vânzări de umbrele pentru luna următoare, să zicem octombrie, pe baza vânzărilor din lunile anterioare și a bugetului de publicitate pentru luna octombrie de 50 de dolari:

    =SUM(LINEST(C2:C10, B2:B10)*{50,1})

    În loc de a codifica în mod greoi x În acest caz, trebuie să introduceți și constanta 1 într-o celulă, deoarece nu puteți amesteca referințe și valori într-o constantă de matrice.

    Cu ajutorul x în E2 și constanta 1 în F2, oricare dintre formulele de mai jos va funcționa de minune:

    Formulă obișnuită (introdusă prin apăsarea tastei Enter ):

    =SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))

    Formula de matrice (introdusă prin apăsarea Ctrl + Shift + Enter ):

    =SUMA(LINEST(C2:C10, B2:B10)*(E2:F2))

    Pentru a verifica rezultatul, puteți obține intercepția și panta pentru aceleași date și apoi puteți folosi formula de regresie liniară pentru a calcula y :

    =E2*G2+F2

    În cazul în care E2 este panta, G2 este valoarea x iar F2 este valoarea de interceptare:

    Regresie multiplă: preziceți variabila dependentă

    În cazul în care aveți de-a face cu mai mulți predictori, adică câteva seturi diferite de x includeți toți acești predictori în matricea constantă. De exemplu, cu un buget de publicitate de 50 de dolari (x 2 ) și o medie lunară a precipitațiilor de 100 mm (x 1 ), formula este următoarea:

    =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

    Unde D2:D10 sunt valorile cunoscute y și B2:C10 sunt două seturi de valori de x valori:

    Vă rugăm să fiți atenți la ordinea x din matricea constantă. Așa cum am arătat mai devreme, atunci când funcția Excel LINEST este utilizată pentru a face o regresie multiplă, aceasta returnează coeficienții pantei de la dreapta la stânga. În exemplul nostru, coeficienții Publicitate este returnat mai întâi, iar apoi coeficientul Precipitații Pentru a calcula corect cifra de vânzări previzionată, trebuie să înmulțiți coeficienții cu coeficientul corespunzător. x deci puneți elementele constantei de matrice în această ordine: {50,100,1}. Ultimul element este 1, deoarece ultima valoare returnată de LINEST este interceptul care nu trebuie modificat, așa că pur și simplu o înmulțiți cu 1.

    În loc să folosiți o constantă de matrice, puteți introduce toate variabilele x în anumite celule și să faceți referire la acele celule în formula dumneavoastră, așa cum am făcut în exemplul anterior.

    Formulă obișnuită:

    =SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))

    Formula de matrice:

    =SUMA(LINEST(D2:D10, B2:C10)*(F2:H2))

    Unde F2 și G2 sunt x iar H2 este 1:

    Formula LINEST: statistici suplimentare de regresie

    După cum probabil vă amintiți, pentru a obține mai multe statistici pentru analiza de regresie, puneți TRUE în ultimul argument al funcției LINEST. Aplicată la datele din eșantionul nostru, formula are următoarea formă:

    =LINEST(D2:D13, B2:C13, TRUE, TRUE)

    Deoarece avem 2 variabile independente în coloanele B și C, selectăm o furie compusă din 3 rânduri (două valori x + intercepția) și 5 coloane, introducem formula de mai sus, apăsăm Ctrl + Shift + Enter , și obținem acest rezultat:

    Pentru a scăpa de erorile #N/A, puteți anina LINEST în IFERROR astfel:

    =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

    Captura de ecran de mai jos prezintă rezultatul și explică ce înseamnă fiecare număr:

    Coeficienții pantei și intercepția Y au fost explicați în exemplele anterioare, așa că haideți să aruncăm o privire rapidă asupra celorlalte statistici.

    Coeficientul de determinare (R2). Valoarea lui R2 este rezultatul împărțirii sumei pătratelor de regresie la suma totală a pătratelor. Aceasta vă spune câte y sunt explicate prin x Acesta poate fi orice număr de la 0 la 1, adică de la 0% la 100%. În acest exemplu, R2 este de aproximativ 0,97, ceea ce înseamnă că 97% din variabilele dependente (vânzările de umbrele) sunt explicate de variabilele independente (publicitate + precipitații medii lunare), ceea ce reprezintă o potrivire excelentă!

    Erori standard În general, aceste valori arată precizia analizei de regresie. Cu cât sunt mai mici aceste numere, cu atât mai sigur puteți fi de modelul de regresie.

    Statistica F Utilizați statistica F pentru a susține sau respinge ipoteza nulă. Se recomandă utilizarea statisticii F în combinație cu valoarea P atunci când decideți dacă rezultatele globale sunt semnificative.

    Gradele de libertate (df). Funcția LINEST din Excel returnează valoarea grade de libertate reziduale , care este df total minus df de regresie Puteți utiliza gradele de libertate pentru a obține valorile critice F într-un tabel statistic, apoi puteți compara valorile critice F cu statistica F pentru a determina un nivel de încredere pentru modelul dumneavoastră.

    Suma pătratelor de regresie (alias suma pătratelor explicată , sau suma pătratelor modelului ). Este suma diferențelor pătratice dintre valorile y prezise și media lui y, calculată cu formula: =∑(ŷ - ȳ)2. Indică cât de mult din variația variabilei dependente explică modelul de regresie.

    Suma pătratelor reziduale Este suma diferențelor la pătrat dintre valorile y reale și valorile y prezise. Indică cât de mult din variația variabilei dependente nu explică modelul dvs. Cu cât suma reziduală a pătratelor este mai mică în comparație cu suma totală a pătratelor, cu atât modelul dvs. de regresie se potrivește mai bine datelor.

    5 lucruri pe care trebuie să le știți despre funcția LINEST

    Pentru a utiliza eficient formulele LINEST în foile de calcul, este posibil să doriți să cunoașteți mai multe despre "mecanica internă" a funcției:

    1. Known_y's și cunoscut_x's Într-un model de regresie liniară simplă cu un singur set de variabile x, a lui known_y și cunoscut_x's pot fi intervale de orice formă atâta timp cât au același număr de rânduri și coloane. Dacă efectuați o analiză de regresie multiplă cu mai multe seturi de variabile independente x variabile, a lui known_y trebuie să fie un vector, adică un interval de un rând sau o coloană.
    2. Forțarea constantei la zero . atunci când const este TRUE sau este omis, se va aplica a constantă (interceptare) este calculată și inclusă în ecuația: y=bx + a. Dacă const este setat la FALSE, se consideră că intercepția este egală cu 0 și este omisă din ecuația de regresie: y=bx.

      În statistică, s-a dezbătut timp de decenii dacă are sens sau nu să se forțeze constanta de interceptare la 0. Mulți practicieni credibili ai analizei de regresie consideră că, dacă setarea interceptului la zero (const=FALSE) pare a fi utilă, atunci regresia liniară în sine este un model greșit pentru setul de date. Alții presupun că constanta poate fi forțată la zero în anumite situații, de exemplu,în contextul modelelor de discontinuitate a regresiei. În general, se recomandă să se utilizeze const=TRUE sau să se omită în majoritatea cazurilor.

    3. Precizie Precizia ecuației de regresie calculată de funcția LINEST depinde de dispersia punctelor de date. Cu cât datele sunt mai lineare, cu atât mai precise sunt rezultatele formulei LINEST.
    4. Valori x redundante În unele situații, unul sau mai mulți agenți independenți. x variabilele ar putea să nu aibă nicio valoare predictivă suplimentară, iar eliminarea acestor variabile din modelul de regresie nu afectează acuratețea valorilor y prezise. Acest fenomen este cunoscut sub numele de "coliniaritate". Funcția Excel LINEST verifică coliniaritatea și omite orice variabile redundante x variabilele pe care le identifică din model. Variabilele omise x variabilele pot fi recunoscute prin coeficienți 0 și valori ale erorilor standard 0.
    5. LINIE vs. PÂNDURĂ și INTERCEPTARE Algoritmul care stă la baza funcției LINEST diferă de algoritmul utilizat în funcțiile SLOPE și INTERCEPT. Prin urmare, în cazul în care datele sursă sunt nedeterminate sau coliniare, aceste funcții pot da rezultate diferite.

    Funcția Excel LINEST nu funcționează

    Dacă formula LINEST dă o eroare sau produce un rezultat greșit, există șanse ca aceasta să se datoreze unuia dintre următoarele motive:

    1. Dacă funcția LINEST returnează doar un singur număr (coeficientul de pantă), cel mai probabil ați introdus-o ca o formulă obișnuită, nu ca o formulă de matrice. Asigurați-vă că apăsați Ctrl + Shift + Enter pentru a completa corect formula. Când faceți acest lucru, formula este inclusă în {închise între paranteze curbe} care sunt vizibile în bara de formule.
    2. Eroare #REF! Apare dacă se produce o eroare de tip cunoscut_x's și a lui known_y au dimensiuni diferite.
    3. Eroare #VALUE! eroare. Se produce dacă cunoscut_x's sau a lui known_y conține cel puțin o celulă goală, o valoare de text sau o reprezentare text a unui număr pe care Excel nu îl recunoaște ca valoare numerică. De asemenea, eroarea #VALUE apare în cazul în care const sau statistici nu poate fi evaluat la TRUE sau FALSE.

    Iată cum se utilizează LINEST în Excel pentru o analiză de regresie liniară simplă și multiplă. Pentru a vedea mai îndeaproape formulele discutate în acest tutorial, vă invităm să descărcați exemplul nostru de registru de lucru de mai jos. Vă mulțumesc pentru lectură și sper să ne vedem pe blogul nostru săptămâna viitoare!

    Caietul de practică pentru descărcare

    Exemple de funcții Excel LINEST (fișier .xlsx)

    Michael Brown este un pasionat de tehnologie dedicat, cu o pasiune pentru simplificarea proceselor complexe folosind instrumente software. Cu mai mult de un deceniu de experiență în industria tehnologiei, el și-a perfecționat abilitățile în Microsoft Excel și Outlook, precum și în Google Sheets și Docs. Blogul lui Michael este dedicat împărtășirii cunoștințelor și experienței sale cu alții, oferind sfaturi și tutoriale ușor de urmat pentru îmbunătățirea productivității și eficienței. Indiferent dacă sunteți un profesionist experimentat sau un începător, blogul lui Michael oferă informații valoroase și sfaturi practice pentru a profita la maximum de aceste instrumente software esențiale.