Funzione LINEST di Excel con esempi di formule

  • Condividi Questo
Michael Brown

Questa esercitazione spiega la sintassi della funzione LINEST e mostra come utilizzarla per eseguire l'analisi di regressione lineare in Excel.

Microsoft Excel non è un programma statistico, tuttavia dispone di una serie di funzioni statistiche. Una di queste funzioni è LINEST, progettata per eseguire l'analisi di regressione lineare e restituire le relative statistiche. In questo tutorial per principianti, toccheremo solo leggermente la teoria e i calcoli sottostanti. Il nostro obiettivo principale sarà quello di fornirvi una formula che funziona semplicemente epuò essere facilmente personalizzato per i vostri dati.

    Funzione LINEST di Excel: sintassi e usi di base

    La funzione LINEST calcola le statistiche di una retta che spiega la relazione tra la variabile indipendente e una o più variabili dipendenti e restituisce una matrice che descrive la retta. La funzione utilizza la funzione minimi quadrati per trovare il miglior adattamento ai dati. L'equazione della retta è la seguente.

    Equazione di regressione lineare semplice:

    y = bx + a

    Equazione di regressione multipla:

    y = b 1 x 1 + b 2 x 2 + ... + b n x n + a

    Dove:

    • y - la variabile dipendente che si sta cercando di prevedere.
    • x - la variabile indipendente che si utilizza per prevedere y .
    • a - l'intercetta (indica il punto in cui la retta interseca l'asse Y).
    • b - la pendenza (indica la ripidità della retta di regressione, ossia il tasso di variazione di y al variare di x).

    Nella sua forma di base, la funzione LINEST restituisce l'intercetta (a) e la pendenza (b) dell'equazione di regressione. Opzionalmente, può anche restituire statistiche aggiuntive per l'analisi di regressione, come mostrato in questo esempio.

    Sintassi della funzione LINEST

    La sintassi della funzione LINEST di Excel è la seguente:

    LINEST(note_y's, [note_x's], [const], [stats])

    Dove:

    • conosciuto_y (richiesto) è un intervallo della dipendenza y -Valori nell'equazione di regressione. Di solito, si tratta di una singola colonna o di una singola riga.
    • noto_x (opzionale) è un intervallo di valori x indipendenti. Se omesso, si assume che sia la matrice {1,2,3,...} della stessa dimensione di conosciuto_y .
    • costitutivo (facoltativo) - un valore logico che determina il modo in cui l'intercetta (costante a ) devono essere trattati:
      • Se VERO o omesso, la costante a è calcolato normalmente.
      • Se FALSO, la costante a è forzato a 0 e la pendenza ( b ) viene calcolato per adattarsi a y=bx.
    • statistiche (opzionale) è un valore logico che determina se emettere o meno statistiche aggiuntive:
      • Se VERO, la funzione LINEST restituisce un array con statistiche di regressione aggiuntive.
      • Se FALSO o omesso, LINEST restituisce solo la costante di intercetta e i coefficienti di pendenza.

    Nota: poiché LINEST restituisce una matrice di valori, deve essere inserito come formula di matrice premendo la scorciatoia Ctrl + Maiusc + Invio. Se viene inserito come formula normale, viene restituito solo il primo coefficiente di pendenza.

    Statistiche aggiuntive restituite da LINEST

    Il statistiche impostato su VERO, indica alla funzione LINEST di restituire le seguenti statistiche per l'analisi di regressione:

    Statistica Descrizione
    Coefficiente di pendenza Valore b in y = bx + a
    Costante di intercetta un valore in y = bx + a
    Errore standard della pendenza Il/i valore/i dell'errore standard per il/i coefficiente/i b.
    Errore standard dell'intercetta Il valore dell'errore standard per la costante a .
    Coefficiente di determinazione (R2) Indica quanto bene l'equazione di regressione spiega la relazione tra le variabili.
    Errore standard per la stima di Y Mostra la precisione dell'analisi di regressione.
    Statistica F, o valore osservato F Viene utilizzato per eseguire il test F per l'ipotesi nulla e determinare la bontà complessiva del modello.
    Gradi di libertà (df) Il numero di gradi di libertà.
    Somma dei quadrati di regressione Indica quanta parte della variazione della variabile dipendente è spiegata dal modello.
    Somma dei quadrati residui Misura la quantità di varianza della variabile dipendente non spiegata dal modello di regressione.

    La mappa seguente mostra l'ordine in cui LINEST restituisce un array di statistiche:

    Nelle ultime tre righe, gli errori #N/A appariranno nella terza e nelle successive colonne non riempite di dati. È il comportamento predefinito della funzione LINEST, ma se si desidera nascondere le notazioni di errore, avvolgere la formula LINEST in IFERROR come mostrato in questo esempio.

    Come utilizzare LINEST in Excel - esempi di formule

    La funzione LINEST può essere difficile da usare, soprattutto per i principianti, perché non solo si deve costruire una formula in modo corretto, ma anche interpretare correttamente il suo risultato. Di seguito, troverete alcuni esempi di utilizzo di formule LINEST in Excel che spero vi aiuteranno ad affondare le conoscenze teoriche :)

    Regressione lineare semplice: calcolare pendenza e intercetta

    Per ottenere l'intercetta e la pendenza di una retta di regressione, si usa la funzione LINEST nella sua forma più semplice: si fornisce un intervallo di valori dipendenti per il parametro conosciuto_y e un intervallo di valori indipendenti per l'argomento noto_x Gli ultimi due argomenti possono essere impostati su VERO o omessi.

    Ad esempio, con y valori (numeri di vendita) in C2:C13 e valori x (costi di pubblicità) in B2:B13, la nostra formula di regressione lineare è semplice:

    =LINEST(C2:C13,B2:B13)

    Per inserirla correttamente nel foglio di lavoro, selezionate due celle adiacenti nella stessa riga, E2:F2 in questo esempio, digitate la formula e premete Ctrl + Maiusc + Invio per completarla.

    La formula restituirà il coefficiente di pendenza nella prima cella (E2) e la costante di intercetta nella seconda cella (F2):

    Il pendenza è circa 0,52 (arrotondato a due cifre decimali). Ciò significa che quando x aumenta di 1, y aumenta di 0,52.

    Il Intercetta Y è negativo -4,99. È il valore atteso di y quando x=0. Se tracciato su un grafico, è il valore in cui la retta di regressione incrocia l'asse delle ordinate.

    Fornendo i valori di cui sopra a una semplice equazione di regressione lineare, si otterrà la seguente formula per prevedere il numero di vendite in base al costo della pubblicità:

    y = 0,52*x - 4,99

    Ad esempio, se si spendono 50 dollari in pubblicità, si prevede di vendere 21 ombrelli:

    0.52*50 - 4.99 = 21.01

    I valori di pendenza e intercetta possono essere ottenuti anche separatamente, utilizzando la funzione corrispondente o annidando la formula LINEST in INDEX:

    Pendenza

    =SLOPE(C2:C13,B2:B13)

    =INDICE(LINEST(C2:C13,B2:B13),1)

    Intercettazione

    =INTERCETTA(C2:C13,B2:B13)

    =INDICE(LINEST(C2:C13,B2:B13),2)

    Come mostrato nella schermata seguente, tutte e tre le formule danno gli stessi risultati:

    Regressione lineare multipla: pendenza e intercetta

    Nel caso in cui si abbiano due o più variabili indipendenti, assicurarsi di inserirle in colonne adiacenti e fornire l'intero intervallo al metodo noto_x argomento.

    Ad esempio, con i numeri di vendita ( y D2:D13, costo della pubblicità (una serie di valori x) in B2:B13 e precipitazioni medie mensili (un'altra serie di valori x) in B2:B13. x ) in C2:C13, si utilizza questa formula:

    =LINEST(D2:D13,B2:C13)

    Poiché la formula deve restituire una serie di 3 valori (2 coefficienti di pendenza e la costante di intercetta), selezioniamo tre celle contigue nella stessa riga, inseriamo la formula e premiamo la scorciatoia Ctrl + Shift + Invio.

    Si noti che la formula di regressione multipla restituisce il valore di coefficienti di pendenza nel ordine inverso delle variabili indipendenti (da destra a sinistra), cioè b n , b n-1 , ..., b 2 , b 1 :

    Per prevedere il numero di vendite, forniamo i valori restituiti dalla formula LINEST all'equazione di regressione multipla:

    y = 0,3*x 2 + 0.19*x 1 - 10.74

    Ad esempio, con 50 dollari spesi in pubblicità e una piovosità media mensile di 100 mm, si prevede di vendere circa 23 ombrelli:

    0.3*50 + 0.19*100 - 10.74 = 23.26

    Regressione lineare semplice: prevedere la variabile dipendente

    Oltre a calcolare il a e b La funzione LINEST di Excel può anche stimare la variabile dipendente (y) in base alla variabile indipendente nota (x). A tale scopo, si utilizza LINEST in combinazione con la funzione SUM o SUMPRODUCT.

    Ad esempio, ecco come calcolare il numero di vendite di ombrelli per il mese successivo, ad esempio ottobre, in base alle vendite dei mesi precedenti e al budget pubblicitario di ottobre di 50 dollari:

    =SUM(LINEST(C2:C10, B2:B10)*{50,1})

    Invece di codificare in modo rigido il parametro x In questo caso, è necessario inserire anche la costante 1 in qualche cella, perché non è possibile mescolare riferimenti e valori in una costante di matrice.

    Con il x in E2 e la costante 1 in F2, una delle due formule seguenti funzionerà a meraviglia:

    Formula regolare (inserita premendo Invio):

    =SUMPRODOTTO(LINEST(C2:C10, B2:B10)*(E2:F2))

    Formula della matrice (inserita premendo Ctrl + Maiusc + Invio):

    =SOMMA(LINEST(C2:C10, B2:B10)*(E2:F2))

    Per verificare il risultato, è possibile ottenere l'intercetta e la pendenza per gli stessi dati, e quindi utilizzare la formula di regressione lineare per calcolare y :

    =E2*G2+F2

    Dove E2 è la pendenza, G2 è il valore di x e F2 è l'intercetta:

    Regressione multipla: prevedere la variabile dipendente

    Nel caso in cui si abbia a che fare con più predittori, cioè con diversi insiemi di x includere tutti i predittori nella matrice costante. Ad esempio, con un budget pubblicitario di 50 dollari (x 2 ) e una piovosità media mensile di 100 mm (x 1 ), la formula è la seguente:

    =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

    Dove D2:D10 sono i valori noti y e B2:C10 sono due serie di valori di x valori:

    Prestare attenzione all'ordine delle x nell'array costante. Come sottolineato in precedenza, quando la funzione LINEST di Excel viene utilizzata per effettuare una regressione multipla, restituisce i coefficienti di pendenza da destra a sinistra. Nel nostro esempio, il coefficiente Pubblicità viene restituito prima il coefficiente Precipitazioni Per calcolare correttamente il numero di vendite previsto, è necessario moltiplicare i coefficienti per il corrispondente coefficiente di vendita. x quindi si mettono gli elementi della costante dell'array in quest'ordine: {50,100,1}. L'ultimo elemento è 1, perché l'ultimo valore restituito da LINEST è l'intercetta che non deve essere cambiata, quindi si moltiplica semplicemente per 1.

    Invece di utilizzare una costante di matrice, è possibile inserire tutte le variabili x in alcune celle e fare riferimento a tali celle nella formula, come abbiamo fatto nell'esempio precedente.

    Formula regolare:

    =SUMPRODOTTO(LINEST(D2:D10, B2:C10)*(F2:H2))

    Formula della matrice:

    =SOMMA(LINEST(D2:D10, B2:C10)*(F2:H2))

    Dove F2 e G2 sono le x e H2 è 1:

    Formula LINEST: statistiche di regressione aggiuntive

    Come ricorderete, per ottenere più statistiche per l'analisi di regressione, si mette VERO nell'ultimo argomento della funzione LINEST. Applicata ai nostri dati di esempio, la formula assume la forma seguente:

    =LINEST(D2:D13, B2:C13, TRUE, TRUE)

    Poiché abbiamo 2 variabili indipendenti nelle colonne B e C, selezioniamo una matrice composta da 3 righe (due valori x + intercetta) e 5 colonne, inseriamo la formula precedente, premiamo Ctrl + Shift + Invio e otteniamo questo risultato:

    Per eliminare gli errori #N/A, è possibile annidare LINEST in IFERROR in questo modo:

    =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

    La schermata seguente mostra il risultato e spiega il significato di ciascun numero:

    I coefficienti di pendenza e l'intercetta Y sono stati spiegati negli esempi precedenti, quindi diamo una rapida occhiata alle altre statistiche.

    Coefficiente di determinazione (R2). Il valore di R2 è il risultato della divisione della somma dei quadrati della regressione per la somma totale dei quadrati, e indica quanti sono i valori di R2 che si ottengono. y i valori sono spiegati da x Può essere un numero qualsiasi da 0 a 1, cioè da 0% a 100%. In questo esempio, R2 è circa 0,97, il che significa che il 97% delle nostre variabili dipendenti (vendite di ombrelli) sono spiegate dalle variabili indipendenti (pubblicità + precipitazioni medie mensili), il che è un ottimo risultato!

    Errori standard In generale, questi valori mostrano la precisione dell'analisi di regressione: più piccoli sono i numeri, più si può essere certi del modello di regressione.

    Statistica F Si usa la statistica F per sostenere o rifiutare l'ipotesi nulla. Si raccomanda di usare la statistica F in combinazione con il valore P per decidere se i risultati complessivi sono significativi.

    Gradi di libertà (df). La funzione LINEST di Excel restituisce i valori di gradi di libertà residui , che è il totale df meno il regressione df È possibile utilizzare i gradi di libertà per ottenere i valori critici F in una tabella statistica e quindi confrontare i valori critici F con la statistica F per determinare il livello di confidenza del modello.

    Somma dei quadrati di regressione (alias il somma dei quadrati spiegati , o modello somma dei quadrati ). È la somma delle differenze al quadrato tra i valori y previsti e la media di y, calcolata con la seguente formula: =∑(ŷ - ȳ)2. Indica quanta parte della variazione della variabile dipendente è spiegata dal modello di regressione.

    Somma dei quadrati residui È la somma delle differenze al quadrato tra i valori effettivi delle y e i valori previsti delle y. Indica quanta parte della variazione della variabile dipendente non viene spiegata dal modello. Quanto più piccola è la somma dei quadrati residui rispetto alla somma totale dei quadrati, tanto meglio il modello di regressione si adatta ai dati.

    5 cose da sapere sulla funzione LINEST

    Per utilizzare in modo efficiente le formule LINEST nei fogli di lavoro, è necessario conoscere meglio la "meccanica interna" della funzione:

    1. Conosciuto_y e noto_x In un modello di regressione lineare semplice con una sola serie di variabili x, conosciuto_y e noto_x possono essere intervalli di qualsiasi forma, purché abbiano lo stesso numero di righe e di colonne. Se si esegue un'analisi di regressione multipla con più di un insieme di dati indipendenti x variabili, conosciuto_y deve essere un vettore, cioè un intervallo di una riga o di una colonna.
    2. Forzare la costante a zero . quando il costitutivo è VERO o viene omesso, l'argomento a (intercetta) viene calcolata e inserita nell'equazione: y=bx + a. Se costitutivo è impostato su FALSO, l'intercetta viene considerata uguale a 0 e omessa dall'equazione di regressione: y=bx.

      In statistica si discute da decenni se sia sensato o meno forzare la costante dell'intercetta a 0. Molti professionisti credibili dell'analisi di regressione ritengono che se l'impostazione dell'intercetta a zero (const=FALSE) sembra essere utile, allora la regressione lineare stessa è un modello sbagliato per il set di dati. Altri suppongono che la costante possa essere forzata a zero in determinate situazioni, ad esempio,nel contesto dei disegni a discontinuità di regressione. In generale, nella maggior parte dei casi si raccomanda di utilizzare il valore predefinito const=TRUE o di ometterlo.

    3. Precisione L'accuratezza dell'equazione di regressione calcolata dalla funzione LINEST dipende dalla dispersione dei punti di dati: più i dati sono lineari, più i risultati della formula LINEST sono accurati.
    4. Valori x ridondanti In alcune situazioni, uno o più soggetti indipendenti x Le variabili potrebbero non avere alcun valore predittivo aggiuntivo e l'eliminazione di tali variabili dal modello di regressione non influisce sull'accuratezza dei valori y previsti. Questo fenomeno è noto come "collinearità". La funzione LINEST di Excel verifica la presenza di collinearità e omette qualsiasi variabile ridondante. x Le variabili omesse che identifica nel modello. x Le variabili possono essere riconosciute da 0 coefficienti e 0 valori di errore standard.
    5. LINEST vs. SLOPE e INTERCEPT L'algoritmo di base della funzione LINEST differisce dall'algoritmo utilizzato nelle funzioni SLOPE e INTERCEPT. Pertanto, quando i dati di origine sono indeterminati o collineari, queste funzioni possono fornire risultati diversi.

    La funzione LINEST di Excel non funziona

    Se la formula LINEST lancia un errore o produce un risultato sbagliato, è probabile che sia dovuto a uno dei seguenti motivi:

    1. Se la funzione LINEST restituisce un solo numero (coefficiente di pendenza), molto probabilmente è stata inserita come formula normale, non come formula di matrice. Per completare correttamente la formula, premere Ctrl + Maiusc + Invio. In questo modo, la formula viene racchiusa tra le parentesi graffe visibili nella barra della formula.
    2. Errore #REF! Si verifica se l'opzione noto_x e conosciuto_y Le gamme hanno dimensioni diverse.
    3. Errore #VALORE! Si verifica se noto_x o conosciuto_y contiene almeno una cella vuota, un valore di testo o la rappresentazione testuale di un numero che Excel non riconosce come valore numerico. Inoltre, l'errore #VALORE si verifica se il campo costitutivo o statistiche non può essere valutato come VERO o FALSO.

    Ecco come utilizzare LINEST in Excel per un'analisi di regressione lineare semplice e multipla. Per dare un'occhiata più da vicino alle formule discusse in questo tutorial, potete scaricare la nostra cartella di lavoro di esempio qui sotto. Vi ringrazio per la lettura e spero di vedervi sul nostro blog la prossima settimana!

    Eserciziario da scaricare

    Esempi di funzioni LINEST di Excel (file .xlsx)

    Michael Brown è un appassionato di tecnologia dedicato con una passione per la semplificazione di processi complessi utilizzando strumenti software. Con oltre un decennio di esperienza nel settore tecnologico, ha affinato le sue competenze in Microsoft Excel e Outlook, nonché in Fogli Google e Documenti. Il blog di Michael è dedicato alla condivisione delle sue conoscenze e competenze con gli altri, fornendo suggerimenti e tutorial facili da seguire per migliorare la produttività e l'efficienza. Che tu sia un professionista esperto o un principiante, il blog di Michael offre spunti preziosi e consigli pratici per ottenere il massimo da questi strumenti software essenziali.