Taula de continguts
Aquest tutorial explica la sintaxi de la funció LINEST i mostra com utilitzar-la per fer anàlisis de regressió lineal a Excel.
Microsoft Excel no és un programa estadístic, però sí tenen una sèrie de funcions estadístiques. Una d'aquestes funcions és LINEST, que està dissenyada per realitzar anàlisis de regressió lineal i retornar estadístiques relacionades. En aquest tutorial per a principiants, només tocarem lleugerament la teoria i els càlculs subjacents. El nostre objectiu principal serà oferir-vos una fórmula que funcioni senzillament i que es pugui personalitzar fàcilment per a les vostres dades.
Funció LINEST d'Excel: sintaxi i usos bàsics
El La funció LINEST calcula les estadístiques d'una línia recta que explica la relació entre la variable independent i una o més variables dependents, i retorna una matriu que descriu la línia. La funció utilitza el mètode mínims quadrats per trobar el millor ajust per a les vostres dades. L'equació de la recta és la següent.
Equació de regressió lineal simple:
y = bx + aEquació de regressió múltiple:
y = b 1x 1+ b 2x 2+ … + b nx n+ aOn:
- y : la variable dependent que esteu intentant predir.
- x : la variable independent que feu servir per predir y .
- a - la intercepció (indica on la línia talla l'eix Y).
- b - el pendentsignificatiu.
Graus de llibertat (df). La funció LINEST d'Excel retorna els graus de llibertat residuals , que és el df total menys la regressió df . Podeu utilitzar els graus de llibertat per obtenir valors crítics F en una taula estadística i, a continuació, comparar els valors crítics F amb l'estadística F per determinar un nivell de confiança per al vostre model.
Suma de regressió. de quadrats (també conegut com la suma explicada de quadrats o model de la suma de quadrats ). És la suma de les diferències al quadrat entre els valors y predits i la mitjana de y, calculada amb aquesta fórmula: =∑(ŷ - ȳ)2. Indica quina part de la variació de la variable dependent explica el vostre model de regressió.
Suma residual de quadrats . És la suma de les diferències al quadrat entre els valors y reals i els valors y predits. Indica quina part de la variació de la variable dependent no explica el vostre model. Com més petita sigui la suma residual de quadrats en comparació amb la suma total de quadrats, millor s'adaptarà el vostre model de regressió a les vostres dades.
5 coses que hauríeu de saber sobre la funció LINEST
Per utilitzar de manera eficient les fórmules LINEST a als vostres fulls de treball, potser voldreu saber una mica més sobre la "mecànica interna" de la funció:
- Known_y's i known_x's . En un model de regressió lineal simple amb només un conjunt de variables x, conegudes_y iLes conegudes_x poden ser intervals de qualsevol forma sempre que tinguin el mateix nombre de files i columnes. Si feu una anàlisi de regressió múltiple amb més d'un conjunt de variables x independents, conegudes_y ha de ser un vector, és a dir, un rang d'una fila o una columna.
- Forçant la constant a zero . Quan l'argument const és CERT o s'omet, la constant a (intercepció) es calcula i s'inclou a l'equació: y=bx + a. Si const s'estableix a FALSE, es considera que la intercepció és igual a 0 i s'omet de l'equació de regressió: y=bx.
En les estadístiques, fa dècades que s'ha debatut si té sentit forçar la constant d'intercepció a 0 o no. Molts professionals de l'anàlisi de regressió creïbles creuen que si la configuració de l'intercepció a zero (const=FALSE) sembla útil, la regressió lineal en si és un model incorrecte per al conjunt de dades. Altres suposen que la constant es pot forçar a zero en determinades situacions, per exemple, en el context de dissenys de discontinuïtat de regressió. En general, es recomana anar amb el valor predeterminat const=TRUE o omès en la majoria dels casos.
- Precisió . La precisió de l'equació de regressió calculada per la funció LINEST depèn de la dispersió dels vostres punts de dades. Com més lineals siguin les dades, més precisos són els resultats de la fórmula LINEST.
- Valors x redundants . En algunes situacions,És possible que una o més variables independents x no tinguin cap valor predictiu addicional, i l'eliminació d'aquestes variables del model de regressió no afecta la precisió dels valors y predits. Aquest fenomen es coneix com a "colinearietat". La funció LINEST d'Excel comprova la colinealitat i omet qualsevol variable x redundant que identifiqui del model. Les variables x omeses es poden reconèixer per 0 coeficients i 0 valors d'error estàndard.
- LINEST vs. SOPE i INTERCEPT . L'algoritme subjacent de la funció LINEST difereix de l'algoritme utilitzat a les funcions SOPE i INTERCEPT. Per tant, quan les dades d'origen són indeterminades o colineals, aquestes funcions poden retornar resultats diferents.
La funció LINEST d'Excel no funciona
Si la fórmula LINEST genera un error o produeix una sortida incorrecta , és probable que sigui per un dels motius següents:
- Si la funció LINEST només retorna un número (coeficient de pendent), és probable que l'hagueu introduït com a fórmula normal, no com a fórmula matricial. Assegureu-vos de prémer Ctrl + Maj + Retorn per completar la fórmula correctament. Quan feu això, la fórmula es tanca entre els {parèntesis} que són visibles a la barra de fórmules.
- #REF! error. Es produeix si els intervals coneguts_x i coneguts_y tenen dimensions diferents.
- #VALUE! error. Es produeix si coneguda_x o known_y's conté almenys una cel·la en blanc, un valor de text o una representació de text d'un nombre que Excel no reconeix com a valor numèric. A més, l'error #VALUE es produeix si l'argument const o stats no es pot avaluar com a TRUE o FALSE.
Així és com s'utilitza LINEST a Excel per a una anàlisi de regressió lineal simple i múltiple. Per veure amb més detall les fórmules que es discuteixen en aquest tutorial, us convidem a descarregar el nostre quadern de treball de mostra a continuació. Us agraeixo la lectura i esperem veure-us al nostre blog la setmana vinent!
Quader de pràctiques per descarregar
Excels de funcions LINEST d'Excel (fitxer .xlsx)
(indica la inclinació de la recta de regressió, és a dir, la taxa de canvi de y quan canvia x).
En la seva forma bàsica, la funció LINEST retorna la intercepció (a) i el pendent (b) per a l'equació de regressió. Opcionalment, també pot retornar estadístiques addicionals per a l'anàlisi de regressió, tal com es mostra en aquest exemple.
Sintaxi de la funció LINEST
La sintaxi de la funció LINEST d'Excel és la següent:
LINEST(conegudes_y , [x_conegudes], [const], [estadístiques])On:
- y_coneguda (obligatori) és un interval de la y dependent -valors en l'equació de regressió. Normalment, és una sola columna o una sola fila.
- x_coneguda (opcional) és un rang de valors de x independents. Si s'omet, se suposa que és la matriu {1,2,3,...} de la mateixa mida que known_y's .
- const (opcional) - un valor lògic que determina com s'ha de tractar la intercepció (constant a ):
- Si s'omet o VERTADERA, la constant a es calcula normalment.
- Si és FAL, la constant a es força a 0 i el pendent (coeficient b ) es calcula per ajustar-se a y=bx.
- stats (opcional) és un valor lògic que determina si s'han de generar estadístiques addicionals o no:
- Si és TRUE, la funció LINEST retorna una matriu amb estadístiques de regressió addicionals.
- Si s'omet FALS o s'omet, LINEST només retorna la constant d'intercepció i el pendentcoeficient(s).
Nota. Com que LINEST retorna una matriu de valors, s'ha d'introduir com a fórmula de matriu prement la drecera Ctrl + Maj + Intro. Si s'introdueix com a fórmula regular, només es retorna el primer coeficient de pendent.
Estadístiques addicionals retornades per LINEST
L'argument stats establert en TRUE indica a la funció LINEST que retorni les estadístiques següents per a la vostra anàlisi de regressió:
Estadístic | Descripció |
Coeficient de pendent | Valor b en y = bx + a |
Constante d'intercepció | un valor en y = bx + a |
Error estàndard de pendent | El(s) valor(s) d'error estàndard per al b coeficient(s). |
Error estàndard d'intercepció | El valor d'error estàndard per a la constant a . |
Coeficient de determinació (R2) | Indica fins a quin punt l'equació de regressió explica la relació entre les variables. |
Error estàndard per a l'estimació Y | Mostra la precisió de l'anàlisi de regressió. |
Estadística F, o el valor observat F | S'utilitza per fer la prova F per al hipòtesi nul·la per determinar la bondat general d'ajust del model. |
Graus de fr eedom (df) | El nombre de graus de llibertat. |
Suma de regressió de quadrats | Indica quina part de la variació de laLa variable dependent s'explica pel model. |
Suma residual de quadrats | Mesura la quantitat de variància de la variable dependent que no s'explica pel vostre model de regressió. |
El mapa següent mostra l'ordre en què LINEST retorna una matriu d'estadístiques:
A les tres últimes files, el Els errors #N/A apareixeran a la tercera columna i a les següents que no s'omplen amb dades. És el comportament predeterminat de la funció LINEST, però si voleu amagar les anotacions d'error, embolcalleu la vostra fórmula LINEST a IFERROR tal com es mostra en aquest exemple.
Com utilitzar LINEST a Excel - exemples de fórmules
La funció LINEST pot ser difícil d'utilitzar, especialment per als novells, perquè no només hauríeu de construir una fórmula correctament, sinó també interpretar correctament la seva sortida. A continuació, trobareu uns quants exemples d'ús de fórmules LINEST a Excel que esperem ajudaran a enfonsar el coneixement teòric en :)
Regressió lineal senzilla: calculeu el pendent i la intersecció
Per obtenir la intercepció i el pendent d'una línia de regressió, utilitzeu la funció LINEST en la seva forma més senzilla: proporcioneu un rang de valors dependents per a l'argument known_y's i un rang de valors independents per a known_x's argument. Els dos darrers arguments es poden establir en TRUE o ometre's.
Per exemple, amb valors y (números de vendes) a C2:C13 i valors x(cost de publicitat) a B2:B13, la nostra fórmula de regressió lineal és tan senzilla com:
=LINEST(C2:C13,B2:B13)
Per introduir-la correctament al vostre full de treball, seleccioneu dues cel·les adjacents a la mateixa fila, E2: F2 en aquest exemple, escriviu la fórmula i premeu Ctrl + Maj + Intro per completar-la.
La fórmula retornarà el coeficient de pendent a la primera cel·la (E2) i la constant d'intercepció a la segona cel·la (F2). ):
El pendent és aproximadament 0,52 (arrodonit a dos decimals). Vol dir que quan x augmenta un 1, y augmenta un 0,52.
La intercepció Y és negativa -4,99. És el valor esperat de y quan x=0. Si es representa en un gràfic, és el valor en què la línia de regressió creua l'eix y.
Suministreu els valors anteriors a una equació de regressió lineal simple i obtindreu la fórmula següent per predir el nombre de vendes. en funció del cost de la publicitat:
y = 0.52*x - 4.99
Per exemple, si gastes 50 $ en publicitat, s'espera que venguis 21 paraigües:
0.52*50 - 4.99 = 21.01
Els valors de pendent i intercepció també es poden obtenir per separat utilitzant la funció corresponent o anidant la fórmula LINEST a INDEX:
Pendent
=SLOPE(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),1)
Intercepció
=INTERCEPT(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),2)
Com es mostra a la captura de pantalla següent, les tres fórmules donen els mateixos resultats:
Regressió lineal múltiple: pendent i intercepció
En cas de tenirdues o més variables independents, assegureu-vos d'introduir-les a les columnes adjacents i proporcionar tot l'interval a l'argument coneguda_x .
Per exemple, amb números de vendes ( y valors) a D2:D13, cost de publicitat (un conjunt de valors x) a B2:B13 i precipitació mensual mitjana (un altre conjunt de valors x ) a C2:C13, feu servir aquesta fórmula:
=LINEST(D2:D13,B2:C13)
Com que la fórmula retornarà una matriu de 3 valors (2 coeficients de pendent i la constant d'intercepció), seleccionem tres cel·les contigües a la mateixa fila, introduïm la fórmula i premem Ctrl + Drecera Maj + Intro.
Tingueu en compte que la fórmula de regressió múltiple retorna els coeficients de pendent en l' ordre invers de les variables independents (de dreta a esquerra), que és b n , b n-1 , …, b 2 , b 1 :
Per predir el nombre de vendes, proporcionem els valors retornats per la fórmula LINEST a l'equació de regressió múltiple:
y = 0,3*x 2 + 0,19*x 1 - 10,74
Per ex ampli, amb 50 dòlars gastats en publicitat i una precipitació mitjana mensual de 100 mm, s'espera que vengueu aproximadament 23 paraigües:
0.3*50 + 0.19*100 - 10.74 = 23.26
Regressió lineal simple: prediu la variable dependent
A més de calcular els valors a i b per a l'equació de regressió, la funció LINEST d'Excel també pot estimar la variable dependent (y) a partir de l'independent conegutvariable (x). Per a això, utilitzeu LINEST en combinació amb la funció SUMA o SUMPRODUCT.
Per exemple, a continuació us expliquem com podeu calcular el nombre de vendes de paraigües per al mes següent, per exemple octubre, en funció de les vendes dels mesos anteriors i Pressupost publicitari d'octubre de 50 $:
=SUM(LINEST(C2:C10, B2:B10)*{50,1})
En lloc de codificar el valor x a la fórmula, podeu proporcionar-lo com a referència de cel·la. En aquest cas, també heu d'introduir la constant 1 en alguna cel·la perquè no podeu barrejar referències i valors en una constant de matriu.
Amb el valor x a E2 i la constant 1 a F2, qualsevol de les fórmules següents funcionarà com una delícia:
Fórmula normal (introduïda prement Retorn ):
=SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))
Fórmula matricial (introduïda prement Ctrl + Maj + Introduïu ):
=SUM(LINEST(C2:C10, B2:B10)*(E2:F2))
Per verificar el resultat, podeu obtenir la intercepció i el pendent de les mateixes dades i, a continuació, utilitzar la fórmula de regressió lineal per calcula y :
=E2*G2+F2
On E2 és el pendent, G2 és el valor x i F2 és la intercepció:
Regressió múltiple: prediu la variable dependent
En cas que esteu tractant amb diversos predictors, és a dir, uns quants conjunts diferents de valors x , inclou tots aquells predictors de la constant matriu. Per exemple, amb un pressupost publicitari de 50 $ (x 2 ) i una pluja mitjana mensual de 100 mm (x 1 ), la fórmula és la següent:següent:
=SUM(LINEST(D2:D10, B2:C10)*{50,100,1})
On D2:D10 són els valors y coneguts i B2:C10 són dos conjunts de valors x :
Si us plau, pareu atenció a l'ordre dels valors x a la constant de matriu. Com s'ha assenyalat anteriorment, quan s'utilitza la funció LINEST d'Excel per fer regressió múltiple, retorna els coeficients de pendent de dreta a esquerra. Al nostre exemple, primer es retorna el coeficient Publicitat i després el coeficient Pluvia . Per calcular correctament el nombre de vendes previst, heu de multiplicar els coeficients pels valors x corresponents, de manera que poseu els elements de la constant de la matriu en aquest ordre: {50,100,1}. L'últim element és 1, perquè l'últim valor retornat per LINEST és la intercepció que no s'ha de canviar, de manera que simplement el multipliqueu per 1.
En lloc d'utilitzar una constant de matriu, podeu introduir totes les variables x en algunes cel·les i feu referència a aquestes cel·les a la vostra fórmula com vam fer a l'exemple anterior.
Fórmula normal:
=SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))
Fórmula matricial:
=SUM(LINEST(D2:D10, B2:C10)*(F2:H2))
On F2 i G2 són els valors x i H2 és 1:
Fórmula LINEST: estadístiques de regressió addicionals
Com recordareu, per obtenir més estadístiques per a la vostra anàlisi de regressió, poseu TRUE a l'últim argument de la funció LINEST. Aplicada a les nostres dades de mostra, la fórmula pren la forma següent:
=LINEST(D2:D13, B2:C13, TRUE, TRUE)
Com que tenim 2 independentsvariables a les columnes B i C, seleccionem una ràbia que consta de 3 files (dos x valors + intercepció) i 5 columnes, introduïm la fórmula anterior, premem Ctrl + Maj + Enter i obtenim aquest resultat:
Per desfer-se dels errors #N/A, podeu niuar LINEST a IFERROR d'aquesta manera:
=IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")
La captura de pantalla següent mostra el resultat i explica què cada nombre significa:
Els coeficients de pendent i la intercepció Y es van explicar als exemples anteriors, així que fem una ullada ràpida a les altres estadístiques.
Coeficient de determinació (R2). El valor de R2 és el resultat de dividir la suma de quadrats de regressió per la suma total de quadrats. Us indica quants valors y s'expliquen per variables x . Pot ser qualsevol nombre del 0 al 1, és a dir, del 0% al 100%. En aquest exemple, R2 és aproximadament 0,97, el que significa que el 97% de les nostres variables dependents (vendes de paraigües) s'expliquen per les variables independents (publicitat + precipitació mitjana mensual), la qual cosa és un ajust excel·lent!
Errors estàndard . En general, aquests valors mostren la precisió de l'anàlisi de regressió. Com més petits siguin els números, més segur estareu del vostre model de regressió.
Estadística F . Utilitzeu l'estadística F per donar suport o rebutjar la hipòtesi nul·la. Es recomana utilitzar l'estadística F en combinació amb el valor P per decidir si els resultats globals són