Tabla de contenido
Este tutorial explica la sintaxis de la función LINEST y muestra cómo utilizarla para realizar análisis de regresión lineal en Excel.
Microsoft Excel no es un programa estadístico, sin embargo, tiene una serie de funciones estadísticas. Una de esas funciones es LINEST, que está diseñado para realizar análisis de regresión lineal y devolver estadísticas relacionadas. En este tutorial para principiantes, vamos a tocar sólo ligeramente en la teoría y los cálculos subyacentes. Nuestro objetivo principal será proporcionarle una fórmula que simplemente funciona ypuede adaptarse fácilmente a sus datos.
Función LINEST de Excel - sintaxis y usos básicos
La función LINEST calcula los estadísticos de una línea recta que explica la relación entre la variable independiente y una o más variables dependientes, y devuelve una matriz que describe la línea. La función utiliza la función mínimos cuadrados La ecuación de la recta es la siguiente.
Ecuación de regresión lineal simple:
y = bx + aEcuación de regresión múltiple:
y = b 1 x 1 + b 2 x 2 + ... + b n x n + aDónde:
- y - la variable dependiente que se intenta predecir.
- x - la variable independiente que se utiliza para predecir y .
- a - la intercepción (indica dónde la línea interseca el eje Y).
- b - la pendiente (indica la inclinación de la línea de regresión, es decir, la tasa de cambio de y a medida que cambia x).
En su forma básica, la función LINEST devuelve el intercepto (a) y la pendiente (b) para la ecuación de regresión. Opcionalmente, también puede devolver estadísticas adicionales para el análisis de regresión como se muestra en este ejemplo.
Sintaxis de la función LINEST
La sintaxis de la función LINEST de Excel es la siguiente:
LINEST(y_conocidos, [x_conocidos], [const], [estadísticas])Dónde:
- conocido_y's (requerida) es un rango de la dependiente y -Por lo general, se trata de una sola columna o una sola fila.
- known_x's (opcional) es un rango de los valores x independientes. Si se omite, se asume que es la matriz {1,2,3,...} del mismo tamaño que conocido_y's .
- const (opcional) - un valor lógico que determina cómo el intercepto (constante a ):
- Si es TRUE o se omite, la constante a se calcula normalmente.
- Si es FALSE, la constante a se fuerza a 0 y la pendiente ( b ) para ajustar y=bx.
- Estadísticas (opcional) es un valor lógico que determina si se emiten estadísticas adicionales o no:
- Si es TRUE, la función LINEST devuelve una matriz con estadísticas de regresión adicionales.
- Si es FALSE o se omite, LINEST sólo devuelve la constante de intercepción y el coeficiente o coeficientes de pendiente.
Nota: Puesto que LINEST devuelve una matriz de valores, debe introducirse como una fórmula de matriz pulsando la combinación de teclas Ctrl + Mayús + Intro. Si se introduce como una fórmula normal, sólo se devuelve el coeficiente de la primera pendiente.
Estadísticas adicionales devueltas por LINEST
En Estadísticas ajustado a TRUE indica a la función LINEST que devuelva las siguientes estadísticas para su análisis de regresión:
Estadística | Descripción |
Coeficiente de pendiente | valor b en y = bx + a |
Constante de intercepción | un valor en y = bx + a |
Error estándar de la pendiente | El valor o los valores del error estándar para el coeficiente o los coeficientes b. |
Error estándar del intercepto | El valor del error típico de la constante a . |
Coeficiente de determinación (R2) | Indica lo bien que la ecuación de regresión explica la relación entre las variables. |
Error típico de la estimación de Y | Muestra la precisión del análisis de regresión. |
Estadístico F, o valor F-observado | Se utiliza para realizar la prueba F de la hipótesis nula y determinar la bondad general del ajuste del modelo. |
Grados de libertad (df) | El número de grados de libertad. |
Suma de cuadrados de la regresión | Indica qué parte de la variación de la variable dependiente explica el modelo. |
Suma residual de cuadrados | Mide la cantidad de varianza de la variable dependiente que no explica el modelo de regresión. |
El siguiente mapa muestra el orden en que LINEST devuelve una matriz de estadísticas:
En las tres últimas filas, los errores #N/A aparecerán en la tercera y siguientes columnas que no estén llenas de datos. Es el comportamiento por defecto de la función LINEST, pero si desea ocultar las anotaciones de error, envuelva su fórmula LINEST en IFERROR como se muestra en este ejemplo.
Cómo utilizar LINEST en Excel - ejemplos de fórmulas
La función LINEST puede resultar complicada de utilizar, sobre todo para los principiantes, ya que no sólo hay que construir una fórmula correctamente, sino también interpretar adecuadamente su resultado. A continuación, encontrará algunos ejemplos de utilización de fórmulas LINEST en Excel que, con un poco de suerte, le ayudarán a asimilar los conocimientos teóricos :)
Regresión lineal simple: calcular la pendiente y el intercepto
Para obtener el intercepto y la pendiente de una recta de regresión, utilice la función LINEST en su forma más simple: proporcione un intervalo de valores dependientes para la variable conocido_y's y un rango de valores independientes para el argumento known_x's Los dos últimos argumentos pueden definirse como TRUE u omitirse.
Por ejemplo, con y valores (cifras de ventas) en C2:C13 y valores x (coste de publicidad) en B2:B13, nuestra fórmula de regresión lineal es tan sencilla como
=LINEST(C2:C13,B2:B13)
Para introducirla correctamente en tu hoja de cálculo, selecciona dos celdas adyacentes de la misma fila, E2:F2 en este ejemplo, escribe la fórmula y pulsa Ctrl + Mayús + Intro para completarla.
La fórmula devolverá el coeficiente de pendiente en la primera celda (E2) y la constante de intercepción en la segunda celda (F2):
En pendiente es aproximadamente 0,52 (redondeado a dos decimales). Esto significa que cuando x aumenta en 1, y aumenta en 0,52.
En Intercepto Y es negativo -4,99. Es el valor esperado de y cuando x=0. Si se representa en un gráfico, es el valor en el que la línea de regresión cruza el eje y.
Introduzca los valores anteriores en una ecuación de regresión lineal simple y obtendrá la siguiente fórmula para predecir el número de ventas en función del coste publicitario:
y = 0,52*x - 4,99
Por ejemplo, si gasta 50 dólares en publicidad, se espera que venda 21 paraguas:
0.52*50 - 4.99 = 21.01
Los valores de pendiente e intercepto también pueden obtenerse por separado utilizando la función correspondiente o anidando la fórmula LINEST en INDEX:
Pendiente
=SLOPE(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),1)
Interceptar
=INTERCEPTO(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),2)
Como se muestra en la siguiente captura de pantalla, las tres fórmulas arrojan los mismos resultados:
Regresión lineal múltiple: pendiente e intercepto
En caso de que tenga dos o más variables independientes, asegúrese de introducirlas en columnas adyacentes, y suministre todo ese rango a la función known_x's argumento.
Por ejemplo, con los números de venta ( y en D2:D13, el coste de la publicidad (un conjunto de valores x) en B2:B13 y la precipitación media mensual (otro conjunto de valores x) en D2:D13. x valores) en C2:C13, se utiliza esta fórmula:
=LINEST(D2:D13,B2:C13)
Como la fórmula va a devolver una matriz de 3 valores (2 coeficientes de pendiente y la constante de intercepción), seleccionamos tres celdas contiguas en la misma fila, introducimos la fórmula y pulsamos el atajo de teclado Ctrl + Mayús + Intro.
Tenga en cuenta que la fórmula de regresión múltiple devuelve el coeficientes de pendiente en el orden inverso de las variables independientes (de derecha a izquierda), es decir b n , b n-1 , ..., b 2 , b 1 :
Para predecir el número de ventas, suministramos los valores devueltos por la fórmula LINEST a la ecuación de regresión múltiple:
y = 0,3*x 2 + 0.19*x 1 - 10.74
Por ejemplo, con 50 dólares gastados en publicidad y una precipitación media mensual de 100 mm, se espera vender aproximadamente 23 paraguas:
0.3*50 + 0.19*100 - 10.74 = 23.26
Regresión lineal simple: predecir la variable dependiente
Además de calcular el a y b para la ecuación de regresión, la función LINEST de Excel también puede estimar la variable dependiente (y) basándose en la variable independiente conocida (x). Para ello, se utiliza LINEST en combinación con la función SUM o SUMPRODUCT.
Por ejemplo, así es como puede calcular el número de ventas de paraguas para el próximo mes, digamos octubre, basándose en las ventas de los meses anteriores y el presupuesto publicitario de octubre de 50 $:
=SUM(LINEST(C2:C10, B2:B10)*{50,1})
En lugar de codificar el x en la fórmula, puede proporcionarla como una referencia de celda. En este caso, necesita introducir la constante 1 en alguna celda también porque no puede mezclar referencias y valores en una constante de matriz.
Con el x en E2 y la constante 1 en F2, cualquiera de las siguientes fórmulas funcionará a la perfección:
Fórmula normal (se introduce pulsando Intro ):
=SUMPRODUCTO(LINEST(C2:C10, B2:B10)*(E2:F2))
Fórmula de matriz (se introduce pulsando Ctrl + Mayús + Intro ):
=SUMA(LINEST(C2:C10, B2:B10)*(E2:F2))
Para verificar el resultado, puede obtener el intercepto y la pendiente para los mismos datos y, a continuación, utilizar la fórmula de regresión lineal para calcular y :
=E2*G2+F2
Donde E2 es la pendiente, G2 es el x y F2 es el intercepto:
Regresión múltiple: predecir la variable dependiente
En caso de que se trate de varios predictores, es decir, varios conjuntos diferentes de x incluya todos esos predictores en la matriz constante. Por ejemplo, con un presupuesto publicitario de 50 dólares (x 2 ) y una precipitación media mensual de 100 mm (x 1 ), la fórmula es la siguiente:
=SUM(LINEST(D2:D10, B2:C10)*{50,100,1})
Donde D2:D10 son los valores y y B2:C10 son dos conjuntos de x valores:
Preste atención al orden de los x en la matriz constante. Como se ha señalado anteriormente, cuando se utiliza la función LINEST de Excel para realizar una regresión múltiple, devuelve los coeficientes de las pendientes de derecha a izquierda. En nuestro ejemplo, la función Publicidad y, a continuación, se devuelve el coeficiente Precipitaciones Para calcular correctamente la cifra de ventas prevista, hay que multiplicar los coeficientes por el coeficiente correspondiente. x por lo que se colocan los elementos de la constante del array en este orden: {50,100,1}. El último elemento es 1, porque el último valor devuelto por LINEST es la intercepción que no debe cambiarse, por lo que simplemente se multiplica por 1.
En lugar de utilizar una constante de matriz, puede introducir todas las variables x en algunas celdas, y hacer referencia a esas celdas en su fórmula como hicimos en el ejemplo anterior.
Fórmula normal:
=SUMPRODUCTO(LINEST(D2:D10, B2:C10)*(F2:H2))
Fórmula de matriz:
=SUMA(LINEST(D2:D10, B2:C10)*(F2:H2))
Donde F2 y G2 son los x y H2 es 1:
Fórmula LINEST: estadísticas de regresión adicionales
Como recordarás, para obtener más estadísticas para tu análisis de regresión, debes poner TRUE en el último argumento de la función LINEST. Aplicada a nuestros datos de muestra, la fórmula adopta la siguiente forma:
=LINEST(D2:D13, B2:C13, TRUE, TRUE)
Como tenemos 2 variables independientes en las columnas B y C, seleccionamos una rabia formada por 3 filas (dos valores x + intercepto) y 5 columnas, introducimos la fórmula anterior, pulsamos Ctrl + Mayús + Intro , y obtenemos este resultado:
Para deshacerse de los errores #N/A, puede anidar LINEST en IFERROR de la siguiente manera:
=IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")
La siguiente captura de pantalla muestra el resultado y explica qué significa cada número:
Los coeficientes de pendiente y la intersección Y se explicaron en los ejemplos anteriores, así que echemos un vistazo rápido a los demás estadísticos.
Coeficiente de determinación (R2). El valor de R2 es el resultado de dividir la suma de cuadrados de la regresión entre la suma total de cuadrados. Indica cuántos y se explican por x Puede ser cualquier número de 0 a 1, es decir, de 0% a 100%. En este ejemplo, R2 es aproximadamente 0,97, lo que significa que el 97% de nuestras variables dependientes (ventas de paraguas) se explican por las variables independientes (publicidad + precipitaciones medias mensuales), ¡lo que supone un ajuste excelente!
Errores estándar En general, estos valores muestran la precisión del análisis de regresión. Cuanto más pequeños sean los números, más seguro puede estar de su modelo de regresión.
Estadística F Se utiliza el estadístico F para apoyar o rechazar la hipótesis nula. Se recomienda utilizar el estadístico F en combinación con el valor P para decidir si los resultados globales son significativos.
Grados de libertad (df). La función LINEST de Excel devuelve el grados de libertad residuales que es el df total menos el df de regresión Puede utilizar los grados de libertad para obtener valores críticos de F en una tabla estadística y, a continuación, comparar los valores críticos de F con el estadístico F para determinar un nivel de confianza para su modelo.
Suma de cuadrados de la regresión (también conocido como suma de cuadrados explicada o modelo suma de cuadrados Es la suma de las diferencias al cuadrado entre los valores predichos de y y la media de y, calculada con esta fórmula: =∑(ŷ - ȳ)2. Indica qué parte de la variación de la variable dependiente explica su modelo de regresión.
Suma residual de cuadrados Es la suma de las diferencias al cuadrado entre los valores y reales y los valores y predichos. Indica qué parte de la variación de la variable dependiente no explica el modelo. Cuanto menor sea la suma de cuadrados residuales en comparación con la suma total de cuadrados, mejor se ajustará el modelo de regresión a los datos.
5 cosas que debe saber sobre la función LINEST
Para utilizar eficazmente las fórmulas LINEST en sus hojas de cálculo, es posible que desee saber un poco más sobre la "mecánica interna" de la función:
- Known_y's y known_x's En un modelo de regresión lineal simple con un único conjunto de variables x, conocido_y's y known_x's pueden ser rangos de cualquier forma siempre que tengan el mismo número de filas y columnas. Si realiza un análisis de regresión múltiple con más de un conjunto de independientes x variables, conocido_y's debe ser un vector, es decir, un rango de una fila o una columna.
- Forzar la constante a cero Cuando el const es TRUE o se omite, el parámetro a constante (intercepto) se calcula y se incluye en la ecuación: y=bx + a. Si const se establece en FALSE, el intercepto se considera igual a 0 y se omite de la ecuación de regresión: y=bx.
En estadística, se ha debatido durante décadas si tiene sentido forzar la constante de intercepción a 0 o no. Muchos profesionales creíbles del análisis de regresión creen que si fijar la intercepción a cero (const=FALSE) parece útil, entonces la regresión lineal en sí es un modelo erróneo para el conjunto de datos. Otros suponen que la constante puede forzarse a cero en determinadas situaciones, por ejemplo,En general, se recomienda utilizar const=TRUE por defecto u omitirlo en la mayoría de los casos.
- Precisión La precisión de la ecuación de regresión calculada por la función LINEST depende de la dispersión de los puntos de datos. Cuanto más lineales sean los datos, más precisos serán los resultados de la fórmula LINEST.
- Valores x redundantes En algunas situaciones, uno o varios x variables pueden no tener ningún valor predictivo adicional, y la eliminación de dichas variables del modelo de regresión no afecta a la precisión de los valores y predichos. Este fenómeno se conoce como "colinealidad". La función LINEST de Excel comprueba si existe colinealidad y omite cualquier variable redundante. x variables que identifica del modelo. Las variables omitidas x las variables pueden reconocerse por 0 coeficientes y 0 valores de error estándar.
- LÍNEA vs. PENDIENTE e INTERCEPTO El algoritmo subyacente de la función LINEST difiere del algoritmo utilizado en las funciones SLOPE e INTERCEPT. Por lo tanto, cuando los datos de origen son indeterminados o colineales, estas funciones pueden devolver resultados diferentes.
La función LINEST de Excel no funciona
Si su fórmula LINEST arroja un error o produce un resultado erróneo, lo más probable es que se deba a una de las siguientes razones:
- Si la función LINEST sólo devuelve un número (coeficiente de pendiente), lo más probable es que la hayas introducido como una fórmula normal, no como una fórmula de matriz. Asegúrate de pulsar Ctrl + Mayús + Intro para completar la fórmula correctamente. Al hacerlo, la fórmula queda encerrada entre los {corchetes} visibles en la barra de fórmulas.
- Error #REF! Ocurre si el known_x's y conocido_y's tienen dimensiones diferentes.
- #¡VALOR! error. Ocurre si known_x's o conocido_y's contiene al menos una celda en blanco, un valor de texto o una representación de texto de un número que Excel no reconoce como valor numérico. Además, el error #VALUE se produce si la celda const o Estadísticas no puede ser evaluado como TRUE o FALSE.
Así es como se utiliza LINEST en Excel para un análisis de regresión lineal simple y múltiple. Para ver más de cerca las fórmulas tratadas en este tutorial, puede descargarse nuestro libro de trabajo de ejemplo. Le agradezco su lectura y espero verle en nuestro blog la semana que viene.
Cuaderno de prácticas para descargar
Ejemplos de funciones LINEST de Excel (archivo .xlsx)