Excel-Funktion LINEST mit Formelbeispielen

  • Teile Das
Michael Brown

In diesem Lernprogramm wird die Syntax der Funktion LINEST erklärt und gezeigt, wie man sie zur Durchführung einer linearen Regressionsanalyse in Excel verwendet.

Microsoft Excel ist zwar kein Statistikprogramm, verfügt aber über eine Reihe von Statistikfunktionen. Eine dieser Funktionen ist LINEST, mit der lineare Regressionsanalysen durchgeführt und entsprechende Statistiken erstellt werden können. In diesem Tutorial für Anfänger werden wir nur kurz auf die Theorie und die zugrundeliegenden Berechnungen eingehen. Unser Hauptaugenmerk wird darauf liegen, Ihnen eine Formel zu liefern, die einfach funktioniert undkann leicht für Ihre Daten angepasst werden.

    Excel-Funktion LINEST - Syntax und grundlegende Anwendungen

    Die Funktion LINEST berechnet die Statistik für eine gerade Linie, die die Beziehung zwischen der unabhängigen Variable und einer oder mehreren abhängigen Variablen erklärt, und gibt ein Array zurück, das die Linie beschreibt. Die Funktion verwendet die kleinste Quadrate Methode, um die beste Anpassung für Ihre Daten zu finden. Die Gleichung für die Linie lautet wie folgt.

    Einfache lineare Regressionsgleichung:

    y = bx + a

    Multiple Regressionsgleichung:

    y = b 1 x 1 + b 2 x 2 + ... + b n x n + a

    Wo:

    • y - die abhängige Variable, die Sie vorherzusagen versuchen.
    • x - die unabhängige Variable, die Sie zur Vorhersage verwenden y .
    • a - der Schnittpunkt (gibt an, wo die Linie die Y-Achse schneidet).
    • b - die Steigung (gibt die Steilheit der Regressionslinie an, d. h. die Änderungsrate von y bei Änderung von x).

    In ihrer Grundform gibt die Funktion LINEST den Achsenabschnitt (a) und die Steigung (b) für die Regressionsgleichung zurück. Optional kann sie auch zusätzliche Statistiken für die Regressionsanalyse zurückgeben, wie in diesem Beispiel gezeigt.

    LINEST-Funktionssyntax

    Die Syntax der Excel-Funktion LINEST lautet wie folgt:

    LINEST(bekannt_y's, [bekannt_x's], [const], [stats])

    Wo:

    • bekannt_y's (erforderlich) ist ein Bereich der abhängigen y -Werte in der Regressionsgleichung. In der Regel handelt es sich um eine einzelne Spalte oder eine einzelne Zeile.
    • bekannt_x's (optional) ist ein Bereich der unabhängigen x-Werte. Wird er weggelassen, wird angenommen, dass es sich um das Array {1,2,3,...} mit der gleichen Größe wie bekannt_y's .
    • const (optional) - ein logischer Wert, der bestimmt, wie der Achsenabschnitt (Konstante a ) behandelt werden sollten:
      • Wenn TRUE oder nicht angegeben, wird die Konstante a wird normal berechnet.
      • Wenn FALSE, wird die Konstante a wird auf 0 gesetzt und die Steigung ( b Koeffizient) wird zur Anpassung von y=bx berechnet.
    • Statistiken (optional) ist ein logischer Wert, der bestimmt, ob zusätzliche Statistiken ausgegeben werden sollen oder nicht:
      • Wenn TRUE, gibt die Funktion LINEST ein Array mit zusätzlichen Regressionsstatistiken zurück.
      • Wenn FALSE oder nicht angegeben, gibt LINEST nur die Achsenabschnittskonstante und den/die Steigungskoeffizienten zurück.

    Hinweis: Da LINEST ein Array von Werten zurückgibt, muss es als Array-Formel eingegeben werden, indem die Tastenkombination Strg + Umschalt + Eingabe gedrückt wird. Wird es als normale Formel eingegeben, wird nur der erste Steigungskoeffizient zurückgegeben.

    Zusätzliche von LINEST zurückgegebene Statistiken

    Die Statistiken auf TRUE gesetzt, weist die Funktion LINEST an, die folgenden Statistiken für Ihre Regressionsanalyse zu liefern:

    Statistik Beschreibung
    Neigungskoeffizient b Wert in y = bx + a
    Abschnittskonstante ein Wert in y = bx + a
    Standardfehler der Steigung Der/die Standardfehlerwert(e) für den/die b-Koeffizienten.
    Standardfehler des Abschnitts Der Standardfehlerwert für die Konstante a .
    Bestimmungskoeffizient (R2) Gibt an, wie gut die Regressionsgleichung die Beziehung zwischen den Variablen erklärt.
    Standardfehler für die Y-Schätzung Zeigt die Genauigkeit der Regressionsanalyse an.
    F-Statistik, oder der F-Beobachtungswert Es wird verwendet, um den F-Test für die Nullhypothese durchzuführen, um die allgemeine Anpassungsgüte des Modells zu bestimmen.
    Anzahl der Freiheitsgrade (df) Die Anzahl der Freiheitsgrade.
    Summe der Regressionsquadrate Gibt an, wie viel von der Variation der abhängigen Variable durch das Modell erklärt wird.
    Residuale Summe der Quadrate Misst den Anteil der Varianz in der abhängigen Variable, der nicht durch Ihr Regressionsmodell erklärt wird.

    Die folgende Karte zeigt die Reihenfolge, in der LINEST ein Array von Statistiken zurückgibt:

    In den letzten drei Zeilen erscheinen die #N/A-Fehler in der dritten und den folgenden Spalten, die nicht mit Daten gefüllt sind. Dies ist das Standardverhalten der Funktion LINEST, aber wenn Sie die Fehlernotationen ausblenden möchten, wandeln Sie Ihre LINEST-Formel in IFERROR um, wie in diesem Beispiel gezeigt.

    Wie man LINEST in Excel verwendet - Formelbeispiele

    Die Verwendung der LINEST-Funktion kann schwierig sein, vor allem für Anfänger, da man nicht nur eine Formel richtig aufbauen, sondern auch ihre Ausgabe richtig interpretieren muss. Im Folgenden finden Sie einige Beispiele für die Verwendung von LINEST-Formeln in Excel, die hoffentlich helfen, das theoretische Wissen zu vertiefen :)

    Einfache lineare Regression: Berechnung von Steigung und Achsenabschnitt

    Um den Achsenabschnitt und die Steigung einer Regressionsgeraden zu ermitteln, verwenden Sie die Funktion LINEST in ihrer einfachsten Form: Geben Sie einen Bereich der abhängigen Werte für die bekannt_y's und einen Bereich der unabhängigen Werte für die bekannt_x's Die letzten beiden Argumente können auf TRUE gesetzt oder weggelassen werden.

    Zum Beispiel, mit y Werte (Verkaufszahlen) in C2:C13 und x-Werte (Werbekosten) in B2:B13, ist unsere lineare Regressionsformel so einfach wie:

    =LINEST(C2:C13,B2:B13)

    Um die Formel korrekt in Ihr Arbeitsblatt einzugeben, markieren Sie zwei benachbarte Zellen in derselben Zeile (in diesem Beispiel E2:F2), geben die Formel ein und drücken Strg + Umschalt + Eingabe, um sie abzuschließen.

    Die Formel gibt den Steigungskoeffizienten in der ersten Zelle (E2) und die Achsenabschnittskonstante in der zweiten Zelle (F2) zurück:

    Die Piste beträgt etwa 0,52 (auf zwei Dezimalstellen gerundet), d. h., wenn x erhöht sich um 1, y steigt um 0,52.

    Die Y-Achsenabschnitt ist negativ -4,99. Es ist der erwartete Wert von y Bei einer grafischen Darstellung ist dies der Wert, bei dem die Regressionslinie die y-Achse kreuzt.

    Setzen Sie die oben genannten Werte in eine einfache lineare Regressionsgleichung ein, und Sie erhalten die folgende Formel zur Vorhersage der Verkaufszahlen auf der Grundlage der Werbekosten:

    y = 0,52*x - 4,99

    Wenn Sie zum Beispiel 50 Dollar für Werbung ausgeben, müssen Sie 21 Regenschirme verkaufen:

    0.52*50 - 4.99 = 21.01

    Die Werte für Steigung und Achsenabschnitt können auch separat ermittelt werden, indem man die entsprechende Funktion verwendet oder die LINEST-Formel in INDEX schachtelt:

    Neigung

    =SLOPE(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),1)

    Abfangen

    =ABSCHNITT(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),2)

    Wie in der nachstehenden Abbildung zu sehen ist, führen alle drei Formeln zu denselben Ergebnissen:

    Multiple lineare Regression: Steigung und Achsenabschnitt

    Falls Sie zwei oder mehr unabhängige Variablen haben, müssen Sie diese in benachbarte Spalten eingeben und den gesamten Bereich an die bekannt_x's Argument.

    Zum Beispiel mit Verkaufszahlen ( y Werte) in D2:D13, Werbekosten (ein Satz von x-Werten) in B2:B13 und durchschnittliche monatliche Niederschlagsmenge (ein weiterer Satz von x Werte) in C2:C13, verwenden Sie diese Formel:

    =LINEST(D2:D13,B2:C13)

    Da die Formel eine Reihe von 3 Werten (2 Steigungskoeffizienten und die Achsenabschnittskonstante) zurückgeben soll, wählen wir drei zusammenhängende Zellen in derselben Zeile aus, geben die Formel ein und drücken die Tastenkombination Strg + Umschalt + Eingabe.

    Bitte beachten Sie, dass die Formel für die multiple Regression den Steigungskoeffizienten im umgekehrte Reihenfolge der unabhängigen Variablen (von rechts nach links), d. h. b n , b n-1 , ..., b 2 , b 1 :

    Zur Vorhersage der Verkaufszahlen werden die von der LINEST-Formel gelieferten Werte in die Gleichung für die multiple Regression eingesetzt:

    y = 0,3*x 2 + 0.19*x 1 - 10.74

    Wenn Sie zum Beispiel 50 Dollar für Werbung ausgeben und eine durchschnittliche monatliche Niederschlagsmenge von 100 mm haben, werden Sie voraussichtlich 23 Regenschirme verkaufen:

    0.3*50 + 0.19*100 - 10.74 = 23.26

    Einfache lineare Regression: Vorhersage der abhängigen Variable

    Neben der Berechnung der a und b Werten für die Regressionsgleichung kann die Excel-Funktion LINEST auch die abhängige Variable (y) auf der Grundlage der bekannten unabhängigen Variable (x) schätzen. Dazu verwenden Sie LINEST in Kombination mit der Funktion SUMME oder SUMPRODUCT.

    So können Sie z. B. die Anzahl der Schirmverkäufe für den nächsten Monat, z. B. Oktober, auf der Grundlage der Verkäufe der Vormonate und des Werbebudgets von 50 $ für Oktober berechnen:

    =SUM(LINEST(C2:C10, B2:B10)*{50,1})

    Anstelle der Hardcodierung der x In diesem Fall müssen Sie die Konstante 1 ebenfalls in eine Zelle eingeben, da Sie in einer Array-Konstante keine Referenzen und Werte mischen können.

    Mit dem x Wert in E2 und die Konstante 1 in F2, funktioniert jede der folgenden Formeln:

    Reguläre Formel (Eingabe durch Drücken der Eingabetaste):

    =SUMMENPRODUKT(LINEST(C2:C10, B2:B10)*(E2:F2))

    Array-Formel (Eingabe durch Drücken von Strg + Umschalt + Enter ):

    =SUM(LINEST(C2:C10, B2:B10)*(E2:F2))

    Um das Ergebnis zu überprüfen, können Sie den Achsenabschnitt und die Steigung für dieselben Daten ermitteln und dann die lineare Regressionsformel zur Berechnung verwenden y :

    =E2*G2+F2

    Dabei ist E2 die Steigung, G2 ist die x Wert, und F2 ist der Achsenabschnitt:

    Multiple Regression: Vorhersage der abhängigen Variable

    Falls Sie es mit mehreren Prädiktoren zu tun haben, d. h. mit mehreren verschiedenen Sätzen von x Werte, schließen Sie alle diese Prädiktoren in das Array konstant ein. z.B. mit dem Werbebudget von $50 (x 2 ) und eine durchschnittliche monatliche Niederschlagsmenge von 100 mm (x 1 ), lautet die Formel wie folgt:

    =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

    Dabei sind D2:D10 die bekannten y Werte und B2:C10 sind zwei Sätze von x Werte:

    Achten Sie bitte auf die Reihenfolge der x Wie bereits erwähnt, gibt die Excel-Funktion LINEST bei der Durchführung einer multiplen Regression die Steigungskoeffizienten von rechts nach links zurück. In unserem Beispiel ist die Werbung Koeffizient wird zuerst zurückgegeben, und dann der Niederschlag Um die voraussichtliche Verkaufszahl korrekt zu berechnen, müssen Sie die Koeffizienten mit dem entsprechenden Wert multiplizieren. x Das letzte Element ist 1, denn der letzte von LINEST zurückgegebene Wert ist der Abfangwert, der nicht verändert werden soll, also wird er einfach mit 1 multipliziert.

    Anstatt eine Array-Konstante zu verwenden, können Sie alle x-Variablen in einige Zellen eingeben und auf diese Zellen in Ihrer Formel verweisen, wie wir es im vorherigen Beispiel getan haben.

    Normale Formel:

    =SUMMENPRODUKT(LINEST(D2:D10, B2:C10)*(F2:H2))

    Array-Formel:

    =SUM(LINEST(D2:D10, B2:C10)*(F2:H2))

    Dabei sind F2 und G2 die x Werte und H2 ist 1:

    LINEST-Formel: zusätzliche Regressionsstatistiken

    Wie Sie sich vielleicht erinnern, setzen Sie TRUE in das letzte Argument der Funktion LINEST, um mehr Statistiken für Ihre Regressionsanalyse zu erhalten. Auf unsere Beispieldaten angewandt, sieht die Formel wie folgt aus:

    =LINEST(D2:D13, B2:C13, TRUE, TRUE)

    Da wir 2 unabhängige Variablen in den Spalten B und C haben, wählen wir einen Bereich, der aus 3 Zeilen (zwei x-Werte + Achsenabschnitt) und 5 Spalten besteht, geben die obige Formel ein, drücken Strg + Umschalt + Enter und erhalten dieses Ergebnis:

    Um die #N/A-Fehler loszuwerden, können Sie LINEST wie folgt in IFERROR verschachteln:

    =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

    Die folgende Abbildung zeigt das Ergebnis und erklärt, was die einzelnen Zahlen bedeuten:

    Die Steigungskoeffizienten und der Y-Achsenabschnitt wurden in den vorangegangenen Beispielen erläutert, also werfen wir einen kurzen Blick auf die anderen Statistiken.

    Bestimmungskoeffizient (R2). Der Wert von R2 ist das Ergebnis der Division der Summe der Regressionsquadrate durch die Summe der Quadrate. Er gibt an, wie viele y Werte werden erklärt durch x Er kann eine beliebige Zahl zwischen 0 und 1 sein, d. h. 0 % bis 100 %. In diesem Beispiel beträgt R2 etwa 0,97, was bedeutet, dass 97 % unserer abhängigen Variablen (Regenschirmverkäufe) durch die unabhängigen Variablen (Werbung + durchschnittliche monatliche Niederschlagsmenge) erklärt werden, was eine hervorragende Übereinstimmung darstellt!

    Standardfehler Diese Werte zeigen im Allgemeinen die Genauigkeit der Regressionsanalyse an. Je kleiner die Zahlen sind, desto sicherer können Sie sich über Ihr Regressionsmodell sein.

    F-Statistik Sie verwenden die F-Statistik, um die Nullhypothese zu bestätigen oder zu verwerfen. Es wird empfohlen, die F-Statistik in Kombination mit dem P-Wert zu verwenden, um zu entscheiden, ob die Gesamtergebnisse signifikant sind.

    Grad der Freiheit (df) Die Funktion LINEST in Excel liefert die Restfreiheitsgrade das ist die Gesamt-DF abzüglich der Regressionsdf Sie können die Freiheitsgrade verwenden, um F-kritische Werte in einer statistischen Tabelle zu erhalten, und dann die F-kritischen Werte mit der F-Statistik vergleichen, um ein Konfidenzniveau für Ihr Modell zu bestimmen.

    Summe der Regressionsquadrate (alias die erklärte Summe der Quadrate , oder Modell Summe der Quadrate Sie ist die Summe der quadrierten Differenzen zwischen den vorhergesagten y-Werten und dem Mittelwert von y und wird nach folgender Formel berechnet: =∑(ŷ - ȳ)2. Sie gibt an, wie viel der Variation der abhängigen Variable Ihr Regressionsmodell erklärt.

    Residuale Summe der Quadrate Sie ist die Summe der quadrierten Differenzen zwischen den tatsächlichen y-Werten und den vorhergesagten y-Werten. Sie gibt an, wie viel der Variation in der abhängigen Variable Ihr Modell nicht erklärt. Je kleiner die Residualquadratsumme im Vergleich zur Gesamtquadratsumme ist, desto besser passt Ihr Regressionsmodell zu Ihren Daten.

    5 Dinge, die Sie über die LINEST-Funktion wissen sollten

    Um LINEST-Formeln effizient in Ihren Arbeitsblättern zu verwenden, sollten Sie etwas mehr über die "innere Mechanik" der Funktion wissen:

    1. Bekannte_y's und bekannt_x's In einem einfachen linearen Regressionsmodell mit nur einem Satz von x-Variablen, bekannt_y's und bekannt_x's können Bereiche beliebiger Form sein, solange sie die gleiche Anzahl von Zeilen und Spalten haben. Wenn Sie eine multiple Regressionsanalyse mit mehr als einem Satz von unabhängigen x Variablen, bekannt_y's muss ein Vektor sein, d. h. ein Bereich von einer Zeile oder einer Spalte.
    2. Erzwingen der Konstante auf Null Wenn die const TRUE ist oder weggelassen wird, wird die a Konstante (Achsenabschnitt) berechnet und in die Gleichung y=bx + a eingesetzt. Wenn const auf FALSE gesetzt wird, wird der Achsenabschnitt als gleich 0 betrachtet und in der Regressionsgleichung y=bx weggelassen.

      In der Statistik wird seit Jahrzehnten darüber debattiert, ob es sinnvoll ist, die Achsenabschnittskonstante auf 0 zu setzen oder nicht. Viele seriöse Regressionsanalytiker sind der Meinung, dass die lineare Regression selbst ein falsches Modell für den Datensatz ist, wenn das Setzen der Achsenabschnittskonstante auf Null (const=FALSE) sinnvoll erscheint. Andere nehmen an, dass die Konstante in bestimmten Situationen beispielsweise auf Null gesetzt werden kann,Im Allgemeinen wird empfohlen, die Standardeinstellung const=TRUE zu verwenden oder sie in den meisten Fällen wegzulassen.

    3. Genauigkeit Die Genauigkeit der mit der Funktion LINEST berechneten Regressionsgleichung hängt von der Streuung Ihrer Datenpunkte ab. Je linearer die Daten sind, desto genauer sind die Ergebnisse der LINEST-Formel.
    4. Redundante x-Werte In manchen Situationen können ein oder mehrere unabhängige x Variablen haben möglicherweise keinen zusätzlichen Vorhersagewert, und das Entfernen solcher Variablen aus dem Regressionsmodell wirkt sich nicht auf die Genauigkeit der vorhergesagten y-Werte aus. Dieses Phänomen ist als "Kollinearität" bekannt. Die Excel-Funktion LINEST prüft auf Kollinearität und lässt alle redundanten x Variablen, die es aus dem Modell identifiziert. Die ausgelassenen x Variablen sind an 0 Koeffizienten und 0 Standardfehlerwerten zu erkennen.
    5. LINEST vs. SLOPE und INTERCEPT Der der Funktion LINEST zugrunde liegende Algorithmus unterscheidet sich von dem in den Funktionen SLOPE und INTERCEPT verwendeten Algorithmus. Wenn die Quelldaten unbestimmt oder kollinear sind, können diese Funktionen daher unterschiedliche Ergebnisse liefern.

    Excel-Funktion LINEST funktioniert nicht

    Wenn Ihre LINEST-Formel einen Fehler auslöst oder ein falsches Ergebnis liefert, liegt das wahrscheinlich an einem der folgenden Gründe:

    1. Wenn die Funktion LINEST nur eine Zahl (Steigungskoeffizient) zurückgibt, haben Sie sie wahrscheinlich als reguläre Formel und nicht als Array-Formel eingegeben. Achten Sie darauf, dass Sie Strg + Umschalt + Eingabe drücken, um die Formel korrekt zu vervollständigen. Wenn Sie dies tun, wird die Formel in die {geschweiften Klammern} eingeschlossen, die in der Formelleiste sichtbar sind.
    2. #REF!-Fehler: Tritt auf, wenn die bekannt_x's und bekannt_y's Bereiche haben unterschiedliche Dimensionen.
    3. #VALUE! error: Tritt auf, wenn bekannt_x's oder bekannt_y's mindestens eine leere Zelle, einen Textwert oder eine Textdarstellung einer Zahl enthält, die Excel nicht als numerischen Wert erkennt. Der Fehler #VALUE tritt auch auf, wenn die const oder Statistiken Argument kann nicht zu TRUE oder FALSE ausgewertet werden.

    So verwenden Sie LINEST in Excel für eine einfache und multiple lineare Regressionsanalyse. Wenn Sie sich die in diesem Tutorial besprochenen Formeln genauer ansehen möchten, können Sie gerne unsere Beispiel-Arbeitsmappe herunterladen. Ich danke Ihnen für die Lektüre und hoffe, Sie nächste Woche in unserem Blog begrüßen zu dürfen!

    Übungsheft zum Herunterladen

    Excel LINEST Funktionsbeispiele (.xlsx Datei)

    Michael Brown ist ein begeisterter Technologie-Enthusiast mit einer Leidenschaft für die Vereinfachung komplexer Prozesse mithilfe von Softwaretools. Mit mehr als einem Jahrzehnt Erfahrung in der Technologiebranche hat er seine Fähigkeiten in Microsoft Excel und Outlook sowie Google Sheets und Docs verfeinert. Michaels Blog widmet sich dem Teilen seines Wissens und seiner Expertise mit anderen und bietet leicht verständliche Tipps und Tutorials zur Verbesserung von Produktivität und Effizienz. Egal, ob Sie ein erfahrener Profi oder ein Anfänger sind, Michaels Blog bietet wertvolle Einblicke und praktische Ratschläge, wie Sie diese wichtigen Softwaretools optimal nutzen können.