Táboa de contidos
Este titorial explica a sintaxe da función LINEST e mostra como usala para facer análise de regresión lineal en Excel.
Microsoft Excel non é un programa estatístico, pero si teñen unha serie de funcións estatísticas. Unha destas funcións é LINEST, que está deseñada para realizar análises de regresión lineal e devolver estatísticas relacionadas. Neste tutorial para principiantes, tocaremos só lixeiramente a teoría e os cálculos subxacentes. O noso foco principal será proporcionarche unha fórmula que funcione sinxelamente e que se poida personalizar facilmente para os teus datos.
Función LINEST de Excel: sintaxe e usos básicos
O A función LINEST calcula as estatísticas dunha liña recta que explica a relación entre a variable independente e unha ou máis variables dependentes e devolve unha matriz que describe a liña. A función usa o método de mínimos cadrados para atopar a mellor opción para os teus datos. A ecuación para a recta é a seguinte.
Ecuación de regresión lineal simple:
y = bx + aEcuación de regresión múltiple:
y = b 1x 1+ b 2x 2+ … + b nx n+ aOnde:
- y - a variable dependente que está a tentar predicir.
- x - a variable independente que está a usar para predicir y .
- a - a intersección (indica onde a liña corta co eixe Y).
- b - a pendentesignificativo.
Graos de liberdade (df). A función LINEST en Excel devolve os graos de liberdade residuais , que é o df total menos a regresión df . Podes usar os graos de liberdade para obter valores F-críticos nunha táboa estatística e, a continuación, comparar os valores F-críticos coa estatística F para determinar un nivel de confianza para o teu modelo.
Suma de regresión. de cadrados (tamén coñecido como suma explicada de cadrados ou modelo de suma de cadrados ). É a suma das diferenzas cadradas entre os valores de y previstos e a media de y, calculada coa seguinte fórmula: =∑(ŷ - ȳ)2. Indica canto da variación da variable dependente explica o seu modelo de regresión.
Suma residual de cadrados . É a suma das diferenzas cadradas entre os valores y reais e os valores y previstos. Indica canto da variación na variable dependente non explica o seu modelo. Canto menor sexa a suma residual de cadrados en comparación coa suma total de cadrados, mellor se axustará o modelo de regresión aos teus datos.
5 cousas que debes saber sobre a función LINEST
Para usar eficazmente as fórmulas LINEST en as súas follas de traballo, pode querer saber un pouco máis sobre a "mecánica interna" da función:
- Known_y's e known_x's . Nun modelo de regresión lineal simple cun só conxunto de variables x, coñecido_y eOs coñecidos_x poden ser intervalos de calquera forma sempre que teñan o mesmo número de filas e columnas. Se realiza unha análise de regresión múltiple con máis dun conxunto de variables x independentes, os y_coñecidos deben ser un vector, é dicir, un intervalo dunha fila ou dunha columna.
- Forzando a constante a cero . Cando o argumento const é VERDADEIRO ou se omite, a constante a (intersección) calcúlase e inclúese na ecuación: y=bx + a. Se const se define como FALSO, a intersección considérase igual a 0 e omítese na ecuación de regresión: y=bx.
En estatísticas, hai décadas que se debate sobre se ten sentido forzar a constante de interceptación a 0 ou non. Moitos profesionais de análises de regresión creíbles cren que se establecer a intercepción en cero (const=FALSE) parece ser útil, entón a propia regresión lineal é un modelo incorrecto para o conxunto de datos. Outros supoñen que a constante pode ser forzada a cero en determinadas situacións, por exemplo, no contexto de deseños de discontinuidade de regresión. En xeral, recoméndase ir co valor predeterminado const=TRUE ou omitido na maioría dos casos.
- Precisión . A precisión da ecuación de regresión calculada pola función LINEST depende da dispersión dos seus puntos de datos. Canto máis lineais sexan os datos, máis precisos serán os resultados da fórmula LINEST.
- Valores x redundantes . Nalgunhas situacións,É posible que unha ou máis variables independentes x non teñan valor preditivo adicional, e eliminar tales variables do modelo de regresión non afecta a precisión dos valores de y previstos. Este fenómeno coñécese como "colinealidade". A función LINEAST de Excel verifica a colinealidade e omite todas as variables x redundantes que identifique no modelo. As variables x omitidas pódense recoñecer por 0 coeficientes e 0 valores de erro estándar.
- LIÑA vs. PENDIENTE e INTERCEPT . O algoritmo subxacente da función LINEST difire do algoritmo usado nas funcións SLOPE e INTERCEPT. Polo tanto, cando os datos de orixe non están determinados ou son colineais, estas funcións poden devolver resultados diferentes.
A función LINEST de Excel non funciona
Se a súa fórmula LINEST produce un erro ou produce unha saída incorrecta , é probable que sexa por algún dos seguintes motivos:
- Se a función LINEAST devolve só un número (coeficiente de pendente), o máis probable é que o introduza como fórmula normal, non como fórmula matricial. Asegúrate de premer Ctrl + Maiús + Intro para completar a fórmula correctamente. Cando fas isto, a fórmula encóntrase entre os {corchetes} que están visibles na barra de fórmulas.
- #REF! erro. Ocorre se os intervalos coñecidos_x e coñecidos_y teñen dimensións diferentes.
- #VALUE! erro. Ocorre se x_coñecidos ou known_y contén polo menos unha cela en branco, un valor de texto ou unha representación de texto dun número que Excel non recoñece como valor numérico. Ademais, o erro #VALUE ocorre se o argumento const ou stats non se pode avaliar como VERDADEIRO ou FALSO.
Así se usa LINEST en Excel para unha análise de regresión lineal simple e múltiple. Para ollar máis de cerca as fórmulas que se comentan neste tutorial, podes descargar o noso libro de exemplo a continuación. Grazas por ler e espero verte no noso blogue a vindeira semana!
Practica para descargar
Exemplos de funcións de Excel (ficheiro .xlsx)
(indica a inclinación da recta de regresión, é dicir, a taxa de cambio para y cando x cambia).
Na súa forma básica, a función LINEST devolve a intersección (a) e a pendente (b) para a ecuación de regresión. Opcionalmente, tamén pode devolver estatísticas adicionais para a análise de regresión como se mostra neste exemplo.
Sintaxe da función LINEST
A sintaxe da función LINEST de Excel é a seguinte:
LINEST(coñecido_y). , [known_x's], [const], [stats])Onde:
- known_y's (obrigatorio) é un intervalo do dependente y -valores na ecuación de regresión. Normalmente, trátase dunha soa columna ou dunha soa fila.
- coñecido_x (opcional) é un intervalo de valores de x independentes. Se se omite, suponse que é a matriz {1,2,3,...} do mesmo tamaño que known_y's .
- const (opcional) - un valor lóxico que determina como se debe tratar a intersección (constante a ):
- Se é VERDADEIRO ou se omite, a constante a calcúlase normalmente.
- Se é FALSO, a constante a é forzada a 0 e calcúlase a pendente (coeficiente b ) para axustar y=bx.
- stats (opcional) é un valor lóxico que determina se hai que emitir estatísticas adicionais ou non:
- Se é VERDADEIRO, a función LINEST devolve unha matriz con estatísticas de regresión adicionais.
- Se é FALSO ou se omite, LINEST só devolve a constante de intersección e a pendentecoeficiente(s).
Nota. Dado que LINEST devolve unha matriz de valores, debe introducirse como unha fórmula matricial premendo o atallo Ctrl + Maiús + Intro. Se se introduce como fórmula regular, só se devolve o primeiro coeficiente de pendente.
Estatísticas adicionais devoltas por LINEST
O argumento stats definido como TRUE indícalle á función LINEST que devolva as seguintes estatísticas para a súa análise de regresión:
Estadístico | Descrición |
Coeficiente de pendente | Valor b en y = bx + a |
Constante de intersección | un valor en y = bx + a |
Erro estándar de pendente | O valor(s) de erro estándar para o b coeficiente(s). |
Erro estándar de intersección | O valor de erro estándar para a constante a . |
Coeficiente de determinación (R2) | Indica o ben que a ecuación de regresión explica a relación entre as variables. |
Erro estándar para a estimación Y | Mostra a precisión da análise de regresión. |
Estatístico F, ou o valor observado F | Úsase para facer a proba F para o hipótese nula para determinar a bondade global de axuste do modelo. |
Graos de fr eedom (df) | O número de graos de liberdade. |
Suma de regresión de cadrados | Indica canto da variación noa variable dependente explícase polo modelo. |
Suma residual de cadrados | Mide a cantidade de varianza da variable dependente que non se explica polo seu modelo de regresión. |
O mapa de abaixo mostra a orde na que LINEST devolve unha matriz de estatísticas:
Nas tres últimas filas, o Os erros #N/A aparecerán na terceira columna e nas seguintes columnas que non estean cubertas con datos. É o comportamento predeterminado da función LINEST, pero se desexa ocultar as notacións de erro, envolve a súa fórmula LINEST en IFERROR como se mostra neste exemplo.
Como usar LINEST en Excel - exemplos de fórmulas
A función LINEST pode ser complicada de usar, especialmente para os novatos, porque non só debes construír unha fórmula correctamente, senón tamén interpretar correctamente a súa saída. A continuación, atoparás algúns exemplos de uso de fórmulas LINEST en Excel que esperamos que axuden a afondar os coñecementos teóricos en :)
Regresión lineal sinxela: calcula a pendente e o intercepto
Para obter a intercepción e a pendente dunha recta de regresión, usa a función LINEST na súa forma máis sinxela: proporciona un intervalo de valores dependentes para o argumento known_y e un intervalo de valores independentes para o known_x argumento. Os dous últimos argumentos pódense establecer como VERDADEIRO ou omitirse.
Por exemplo, con valores y (números de vendas) en C2:C13 e valores x(custo de publicidade) en B2:B13, a nosa fórmula de regresión lineal é tan sinxela como:
=LINEST(C2:C13,B2:B13)
Para introducila correctamente na túa folla de traballo, selecciona dúas celas adxacentes na mesma fila, E2: F2 neste exemplo, escriba a fórmula e prema Ctrl + Maiús + Intro para completala.
A fórmula devolverá o coeficiente de pendente na primeira cela (E2) e a constante de intersección na segunda cela (F2). ):
A pendente é de aproximadamente 0,52 (redondeada a dous decimais). Significa que cando x aumenta en 1, y aumenta en 0,52.
A intersección Y é negativa -4,99. É o valor esperado de y cando x=0. Se se representa nun gráfico, é o valor no que a recta de regresión cruza o eixe y.
Suministre os valores anteriores a unha ecuación de regresión lineal sinxela e obterá a seguinte fórmula para predicir o número de vendas en función do custo da publicidade:
y = 0.52*x - 4.99
Por exemplo, se gastas 50 USD en publicidade, espérase que vendas 21 paraugas:
0.52*50 - 4.99 = 21.01
Os valores de pendente e intersección tamén se poden obter por separado utilizando a función correspondente ou aniñando a fórmula LINEST en INDEX:
Pendente
=SLOPE(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),1)
Interceptar
=INTERCEPT(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),2)
Como se mostra na seguinte captura de pantalla, as tres fórmulas dan os mesmos resultados:
Regresión lineal múltiple: pendente e intersección
No caso de que teñadúas ou máis variables independentes, asegúrese de introducilas nas columnas adxacentes e de proporcionar ese intervalo completo ao argumento known_x .
Por exemplo, con números de vendas ( y valores) en D2:D13, custo de publicidade (un conxunto de valores x) en B2:B13 e precipitación media mensual (outro conxunto de valores x ) en C2:C13, utiliza esta fórmula:
=LINEST(D2:D13,B2:C13)
Como a fórmula vai devolver unha matriz de 3 valores (2 coeficientes de pendente e a constante de intersección), seleccionamos tres celas contiguas na mesma fila, introducimos a fórmula e prememos Ctrl + Maiús + Intro atallo.
Ten en conta que a fórmula de regresión múltiple devolve os coeficientes de pendente na orde inversa das variables independentes (de dereita a esquerda), que é b n , b n-1 , …, b 2 , b 1 :
Para predicir o número de vendas, proporcionamos os valores devoltos pola fórmula LINEST á ecuación de regresión múltiple:
y = 0,3*x 2 + 0,19*x 1 - 10,74
Por ex amplo, con 50 dólares gastados en publicidade e unha precipitación media mensual de 100 mm, espérase que venda aproximadamente 23 paraugas:
0.3*50 + 0.19*100 - 10.74 = 23.26
Regresión lineal sinxela: prever variable dependente
Ademais de calcular os valores a e b para a ecuación de regresión, a función LINEST de Excel tamén pode estimar a variable dependente (y) baseándose na independente coñecida.variable (x). Para iso, utiliza LINEST en combinación coa función SUMA ou SUMAPRODUTO.
Por exemplo, vexa como pode calcular o número de vendas de paraugas para o próximo mes, por exemplo outubro, en función das vendas dos meses anteriores e Orzamento publicitario de 50 USD de outubro:
=SUM(LINEST(C2:C10, B2:B10)*{50,1})
En lugar de codificar o valor de x na fórmula, pode fornecelo como un referencia de cela. Neste caso, tamén cómpre introducir a constante 1 nalgunha cela porque non pode mesturar referencias e valores nunha constante de matriz.
Co valor x en E2 e a constante 1 en F2, calquera das seguintes fórmulas funcionará como un deleite:
Fórmula regular (introducida premendo Intro ):
=SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))
Fórmula matricial (introducida premendo Ctrl + Maiús + Introduza ):
=SUM(LINEST(C2:C10, B2:B10)*(E2:F2))
Para verificar o resultado, pode obter a intersección e a pendente dos mesmos datos e, a continuación, utilizar a fórmula de regresión lineal para calcula y :
=E2*G2+F2
Onde E2 é a pendente, G2 é o valor x e F2 é a intersección:
Regresión múltiple: predicir variable dependente
No caso de que se trate con varios preditores, é dicir, algúns conxuntos diferentes de valores x , inclúa todos aqueles predictores na constante matricial. Por exemplo, cun orzamento de publicidade de 50 $ (x 2 ) e unha precipitación media mensual de 100 mm (x 1 ), a fórmula é:segue:
=SUM(LINEST(D2:D10, B2:C10)*{50,100,1})
Onde D2:D10 son os valores y coñecidos e B2:C10 son dous conxuntos de valores x :
Preste atención á orde dos valores x na constante da matriz. Como se indicou anteriormente, cando se usa a función LINEAST de Excel para facer regresión múltiple, devolve os coeficientes de pendente de dereita a esquerda. No noso exemplo, primeiro devólvese o coeficiente Publicidade e despois o coeficiente Precipitación . Para calcular correctamente o número de vendas previsto, cómpre multiplicar os coeficientes polos valores x correspondentes, polo que coloque os elementos da constante da matriz nesta orde: {50,100,1}. O último elemento é 1, porque o último valor devolto por LINEST é a intersección que non se debe cambiar, polo que simplemente o multiplica por 1.
En lugar de usar unha constante matricial, pode introducir todas as variables x nalgunhas celas e fai referencia a esas celas na túa fórmula como fixemos no exemplo anterior.
Fórmula regular:
=SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))
Fórmula matricial:
=SUM(LINEST(D2:D10, B2:C10)*(F2:H2))
Onde F2 e G2 son os valores x e H2 é 1:
Fórmula LINEST: estatísticas de regresión adicionais
Como recordarás, para obter máis estatísticas para a túa análise de regresión, pon VERDADEIRO no último argumento da función LINEAST. Aplicada aos nosos datos de mostra, a fórmula toma a seguinte forma:
=LINEST(D2:D13, B2:C13, TRUE, TRUE)
Como temos 2 independentesvariables nas columnas B e C, seleccionamos unha rabia formada por 3 filas (dous valores x + intercepto) e 5 columnas, introducimos a fórmula anterior, prememos Ctrl + Maiús + Intro e obtemos este resultado:
Para desfacerse dos erros #N/A, pode aniñar LINEST en IFERROR deste xeito:
=IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")
A seguinte captura de pantalla mostra o resultado e explica o que cada número significa:
Os coeficientes de pendente e a intersección en Y explicáronse nos exemplos anteriores, así que imos botar unha ollada rápida ás outras estatísticas.
Coeficiente de determinación (R2). O valor de R2 é o resultado de dividir a suma de cadrados de regresión entre a suma total de cadrados. Indica cantos valores y se explican mediante variables x . Pode ser calquera número do 0 ao 1, é dicir, do 0% ao 100%. Neste exemplo, R2 é de aproximadamente 0,97, o que significa que o 97% das nosas variables dependentes (vendas de paraugas) explícanse polas variables independentes (publicidade + precipitación media mensual), o que é unha excelente opción!
Erros estándar . Xeralmente, estes valores mostran a precisión da análise de regresión. Canto máis pequenos sexan os números, máis seguro podes estar sobre o teu modelo de regresión.
Estatística F . Usa a estatística F para apoiar ou rexeitar a hipótese nula. Recoméndase utilizar a estatística F en combinación co valor P á hora de decidir se os resultados globais son