Hàm LINEST trong Excel với các ví dụ về công thức

  • Chia Sẻ Cái Này
Michael Brown

Hướng dẫn này giải thích cú pháp của hàm LINEST và chỉ ra cách sử dụng hàm này để thực hiện phân tích hồi quy tuyến tính trong Excel.

Tuy nhiên, Microsoft Excel không phải là một chương trình thống kê có một số chức năng thống kê. Một trong những hàm như vậy là LINEST, được thiết kế để thực hiện phân tích hồi quy tuyến tính và trả về các số liệu thống kê liên quan. Trong hướng dẫn dành cho người mới bắt đầu này, chúng ta sẽ chỉ chạm nhẹ vào lý thuyết và các tính toán cơ bản. Trọng tâm chính của chúng tôi là cung cấp cho bạn một công thức hoạt động đơn giản và có thể dễ dàng tùy chỉnh cho dữ liệu của bạn.

    Hàm LINEST của Excel - cú pháp và cách sử dụng cơ bản

    Hàm Hàm LINEST tính toán số liệu thống kê cho một đường thẳng giải thích mối quan hệ giữa biến độc lập và một hoặc nhiều biến phụ thuộc, đồng thời trả về một mảng mô tả đường thẳng đó. Hàm này sử dụng phương pháp bình phương nhỏ nhất để tìm giá trị phù hợp nhất cho dữ liệu của bạn. Phương trình của đường thẳng như sau.

    Phương trình hồi quy tuyến tính đơn giản:

    y = bx + a

    Phương trình hồi quy bội:

    y = b 1x 1+ b 2x 2+ … + b nx n+ a

    Ở đâu:

    • y - biến phụ thuộc mà bạn đang cố gắng dự đoán.
    • x - biến độc lập mà bạn đang sử dụng để dự đoán y .
    • a - giao điểm (cho biết vị trí đường thẳng cắt trục Y).
    • b - hệ số gócđáng kể.

      Bậc tự do (df). Hàm LINEST trong Excel trả về bậc tự do dư , là tổng df trừ đi df hồi quy . Bạn có thể sử dụng bậc tự do để lấy các giá trị tới hạn F trong bảng thống kê, sau đó so sánh các giá trị tới hạn F với thống kê F để xác định mức độ tin cậy cho mô hình của bạn.

      Tổng hồi quy tổng bình phương (còn gọi là tổng bình phương được giải thích hoặc tổng bình phương mô hình ). Nó là tổng của các bình phương chênh lệch giữa giá trị y dự đoán và giá trị trung bình của y, được tính theo công thức sau: =∑(ŷ - ȳ)2. Nó cho biết mức độ thay đổi của biến phụ thuộc mà mô hình hồi quy của bạn giải thích được.

      Tổng bình phương thặng dư . Nó là tổng bình phương của sự khác biệt giữa giá trị y thực tế và giá trị y dự đoán. Nó cho biết mức độ thay đổi của biến phụ thuộc mà mô hình của bạn không giải thích được. Tổng bình phương còn lại càng nhỏ so với tổng bình phương thì mô hình hồi quy của bạn càng phù hợp với dữ liệu của bạn.

      5 điều bạn nên biết về hàm LINEST

      Để sử dụng hiệu quả các công thức LINEST trong bảng tính của mình, bạn có thể muốn biết thêm một chút về "cơ chế bên trong" của hàm:

      1. Known_y's known_x's . Trong mô hình hồi quy tuyến tính đơn giản chỉ có một bộ biến x, known_y's known_x's có thể là các phạm vi có hình dạng bất kỳ miễn là chúng có cùng số lượng hàng và cột. Nếu bạn thực hiện phân tích hồi quy bội với nhiều bộ biến x độc lập, thì known_y's phải là một vectơ, tức là một phạm vi gồm một hàng hoặc một cột.
      2. Buộc hằng số về 0 . Khi đối số const là TRUE hoặc bị bỏ qua, thì hằng số a (giá trị chặn) được tính toán và đưa vào phương trình: y=bx + a. Nếu const được đặt thành FALSE, phần chặn được coi là bằng 0 và bị loại khỏi phương trình hồi quy: y=bx.

        Trong thống kê, người ta đã tranh luận trong nhiều thập kỷ về việc có nên buộc hằng số chặn bằng 0 hay không. Nhiều nhà thực hành phân tích hồi quy đáng tin cậy tin rằng nếu đặt hệ số chặn thành 0 (const=FALSE) có vẻ hữu ích, thì bản thân hồi quy tuyến tính là một mô hình sai cho tập dữ liệu. Những người khác cho rằng hằng số có thể bị buộc về 0 trong một số tình huống nhất định, chẳng hạn như trong bối cảnh thiết kế gián đoạn hồi quy. Nói chung, bạn nên sử dụng const=TRUE mặc định hoặc bỏ qua trong hầu hết các trường hợp.

      3. Độ chính xác . Độ chính xác của phương trình hồi quy do hàm LINEST tính toán phụ thuộc vào độ phân tán của các điểm dữ liệu của bạn. Dữ liệu càng tuyến tính thì kết quả của công thức LINEST càng chính xác.
      4. Các giá trị x dư thừa . Trong vài trường hợp,một hoặc nhiều biến x độc lập có thể không có giá trị dự đoán bổ sung và việc loại bỏ các biến đó khỏi mô hình hồi quy không ảnh hưởng đến độ chính xác của các giá trị y được dự đoán. Hiện tượng này được gọi là "cộng tuyến". Hàm LINEST của Excel kiểm tra tính cộng tuyến và bỏ qua mọi biến x dư thừa mà nó xác định từ mô hình. Các biến x bị bỏ qua có thể được nhận dạng bằng 0 hệ số và 0 giá trị sai số chuẩn.
      5. LINEST so với SLOPE và INTERCEPT . Thuật toán cơ bản của hàm LINEST khác với thuật toán được sử dụng trong các hàm SLOPE và INTERCEPT. Do đó, khi dữ liệu nguồn không xác định hoặc thẳng hàng, các hàm này có thể trả về các kết quả khác nhau.

      Hàm LINEST của Excel không hoạt động

      Nếu công thức LINEST của bạn báo lỗi hoặc tạo ra kết quả sai , rất có thể là do một trong những lý do sau:

      1. Nếu hàm LINEST chỉ trả về một số (hệ số góc), rất có thể bạn đã nhập số đó dưới dạng công thức thông thường, không phải công thức mảng. Đảm bảo nhấn Ctrl + Shift + Enter để hoàn thành công thức một cách chính xác. Khi bạn thực hiện việc này, công thức sẽ được đặt trong {dấu ngoặc nhọn} hiển thị trên thanh công thức.
      2. #REF! lỗi. Xảy ra nếu phạm vi known_x's known_y's có các thứ nguyên khác nhau.
      3. #VALUE! lỗi. Xảy ra nếu known_x's hoặc known_y's chứa ít nhất một ô trống, giá trị văn bản hoặc biểu thị văn bản của một số mà Excel không nhận dạng được dưới dạng giá trị số. Ngoài ra, lỗi #VALUE xảy ra nếu đối số const hoặc stats không thể được đánh giá là TRUE hoặc FALSE.

      Đó là cách bạn sử dụng LINEST trong Excel cho một phân tích hồi quy tuyến tính đơn giản và nhiều. Để xem kỹ hơn các công thức được thảo luận trong hướng dẫn này, bạn có thể tải xuống sổ làm việc mẫu của chúng tôi bên dưới. Tôi cảm ơn bạn đã đọc và hy vọng sẽ gặp bạn trên blog của chúng tôi vào tuần tới!

      Sách bài tập thực hành để tải xuống

      Các ví dụ về hàm LINEST trong Excel (tệp .xlsx)

      (biểu thị độ dốc của đường hồi quy, tức là tốc độ thay đổi của y khi x thay đổi).

    Ở dạng cơ bản, hàm LINEST trả về giao điểm (a) và độ dốc (b) cho phương trình hồi quy. Theo tùy chọn, nó cũng có thể trả về số liệu thống kê bổ sung cho phân tích hồi quy như được hiển thị trong ví dụ này.

    Cú pháp hàm LINEST

    Cú pháp của hàm LINEST trong Excel như sau:

    LINEST(known_y's , [known_x's], [const], [stats])

    Trong đó:

    • known_y's (bắt buộc) là một phạm vi phụ thuộc y -giá trị trong phương trình hồi quy. Thông thường, đó là một cột hoặc một hàng.
    • known_x's (tùy chọn) là một dải giá trị x độc lập. Nếu bị bỏ qua, nó được coi là mảng {1,2,3,...} có cùng kích thước với known_y's .
    • const (tùy chọn) - một giá trị logic xác định cách xử lý phần chặn (hằng số a ):
      • Nếu TRUE hoặc bị bỏ qua, thì hằng số a được tính bình thường.
      • Nếu FALSE, hằng số a buộc phải bằng 0 và độ dốc (hệ số b ) được tính toán để khớp với y=bx.
    • số liệu thống kê (tùy chọn) là một giá trị logic xác định có xuất số liệu thống kê bổ sung hay không:
      • Nếu TRUE, hàm LINEST trả về một mảng có số liệu thống kê hồi quy bổ sung.
      • Nếu FALSE hoặc bị bỏ qua, LINEST chỉ trả về hằng số chặn và độ dốc(các) hệ số.

    Lưu ý. Vì LINEST trả về một mảng các giá trị nên nó phải được nhập dưới dạng công thức mảng bằng cách nhấn phím tắt Ctrl + Shift + Enter. Nếu nó được nhập dưới dạng công thức thông thường, chỉ hệ số góc đầu tiên được trả về.

    Thống kê bổ sung do LINEST trả về

    Đối số stats được đặt thành TRUE hướng dẫn hàm LINEST trả về thống kê sau cho phân tích hồi quy của bạn:

    Thống kê Mô tả
    Hệ số góc giá trị b trong y = bx + a
    Hằng số chặn một giá trị trong y = bx + a
    Sai số chuẩn của độ dốc (Các) giá trị sai số chuẩn cho b hệ số.
    Sai số chuẩn của hệ số chặn Giá trị sai số chuẩn cho hằng số a .
    Hệ số xác định (R2) Cho biết mức độ hiệu quả của phương trình hồi quy giải thích mối quan hệ giữa các biến.
    Sai số chuẩn cho ước tính Y Hiển thị độ chính xác của phân tích hồi quy.
    Thống kê F hoặc giá trị quan sát được của F Nó được sử dụng để thực hiện kiểm tra F cho giả thuyết khống để xác định mức độ phù hợp tổng thể của mô hình.
    Bậc độ của fr eedom (df) Số bậc tự do.
    Tổng bình phương hồi quy Cho biết mức độ thay đổi củabiến phụ thuộc được mô hình giải thích.
    Tổng bình phương phần dư Đo mức độ phương sai của biến phụ thuộc mà mô hình hồi quy của bạn không giải thích được.

    Bản đồ bên dưới hiển thị thứ tự mà LINEST trả về một mảng thống kê:

    Trong ba hàng cuối cùng, Lỗi #N/A sẽ xuất hiện trong cột thứ ba và các cột tiếp theo không được điền dữ liệu. Đó là hành vi mặc định của hàm LINEST, nhưng nếu bạn muốn ẩn các ký hiệu lỗi, hãy bọc công thức LINEST của bạn thành IFERROR như trong ví dụ này.

    Cách sử dụng LINEST trong Excel - ví dụ về công thức

    Hàm LINEST có thể khó sử dụng, đặc biệt đối với người mới, bởi vì bạn không chỉ phải xây dựng công thức một cách chính xác mà còn diễn giải kết quả của nó một cách chính xác. Dưới đây, bạn sẽ tìm thấy một số ví dụ về cách sử dụng công thức LINEST trong Excel, hy vọng sẽ giúp bạn nắm vững kiến ​​thức lý thuyết :)

    Hồi quy tuyến tính đơn giản: tính hệ số góc và tung độ gốc

    Để lấy tung độ gốc và độ dốc của đường hồi quy, bạn sử dụng hàm LINEST ở dạng đơn giản nhất: cung cấp một dải giá trị phụ thuộc cho đối số known_y's và một dải giá trị độc lập cho known_x's lập luận. Hai đối số cuối cùng có thể được đặt thành TRUE hoặc bỏ qua.

    Ví dụ: với giá trị y (số lượng bán hàng) trong C2:C13 và giá trị x(chi phí quảng cáo) ở B2:B13, công thức hồi quy tuyến tính của chúng tôi đơn giản như sau:

    =LINEST(C2:C13,B2:B13)

    Để nhập chính xác giá trị này vào trang tính của bạn, hãy chọn hai ô liền kề trong cùng một hàng, E2: F2 trong ví dụ này, hãy nhập công thức rồi nhấn Ctrl + Shift + Enter để hoàn thành.

    Công thức sẽ trả về hệ số góc trong ô đầu tiên (E2) và hằng số chặn trong ô thứ hai (F2 ):

    Độ dốc xấp xỉ 0,52 (làm tròn đến hai chữ số thập phân). Điều đó có nghĩa là khi x tăng thêm 1 thì y tăng thêm 0,52.

    Giá trị chặn của Y là âm -4,99. Đó là giá trị kỳ vọng của y khi x=0. Nếu được vẽ trên biểu đồ, thì đó là giá trị mà tại đó đường hồi quy cắt trục y.

    Cung cấp các giá trị trên cho một phương trình hồi quy tuyến tính đơn giản và bạn sẽ nhận được công thức sau để dự đoán doanh số bán hàng dựa trên chi phí quảng cáo:

    y = 0.52*x - 4.99

    Ví dụ: nếu bạn chi 50 đô la cho quảng cáo, bạn sẽ bán được 21 chiếc ô:

    0.52*50 - 4.99 = 21.01

    Bạn cũng có thể nhận được các giá trị độ dốc và phần chặn một cách riêng biệt bằng cách sử dụng hàm tương ứng hoặc bằng cách lồng công thức LINEST vào INDEX:

    Độ dốc

    =SLOPE(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),1)

    Đánh chặn

    =INTERCEPT(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),2)

    Như minh họa trong ảnh chụp màn hình bên dưới, cả ba công thức đều cho kết quả như nhau:

    Hồi quy tuyến tính bội: hệ số góc và hệ số chặn

    Trong trường hợp bạn cóhai hoặc nhiều biến độc lập, hãy đảm bảo nhập chúng vào các cột liền kề và cung cấp toàn bộ phạm vi đó cho đối số known_x's .

    Ví dụ: với số lượng bán hàng ( y giá trị) trong D2:D13, chi phí quảng cáo (một bộ giá trị x) trong B2:B13 và lượng mưa trung bình hàng tháng (một bộ giá trị x khác) trong C2:C13, bạn sử dụng công thức sau:

    =LINEST(D2:D13,B2:C13)

    Vì công thức sẽ trả về một mảng gồm 3 giá trị (2 hệ số góc và hằng số chặn), chúng ta chọn ba ô liền kề trong cùng một hàng, nhập công thức và nhấn Ctrl + Phím tắt Shift + Enter.

    Xin lưu ý rằng công thức hồi quy bội trả về hệ số góc theo thứ tự đảo ngược của các biến độc lập (từ phải sang trái), tức là là b n , b n-1 , …, b 2 , b 1 :

    Để dự đoán doanh số bán hàng, chúng tôi cung cấp các giá trị do công thức LINEST trả về cho phương trình hồi quy bội:

    y = 0,3*x 2 + 0,19*x 1 - 10,74

    Đối với người yêu cũ dồi dào, với $50 chi cho quảng cáo và lượng mưa trung bình hàng tháng là 100 mm, dự kiến ​​bạn sẽ bán được khoảng 23 chiếc ô:

    0.3*50 + 0.19*100 - 10.74 = 23.26

    Hồi quy tuyến tính đơn giản: dự đoán biến phụ thuộc

    Ngoài việc tính toán các giá trị a b cho phương trình hồi quy, hàm LINEST của Excel còn có thể ước tính biến phụ thuộc (y) dựa trên biến độc lập đã biếtbiến (x). Đối với điều này, bạn sử dụng LINEST kết hợp với hàm SUM hoặc TÓM TẮT.

    Ví dụ: đây là cách bạn có thể tính số lượng bán ô dù cho tháng tiếp theo, chẳng hạn như tháng 10, dựa trên doanh số bán hàng trong các tháng trước và Ngân sách quảng cáo của tháng 10 là $50:

    =SUM(LINEST(C2:C10, B2:B10)*{50,1})

    Thay vì mã hóa cố định giá trị x trong công thức, bạn có thể cung cấp giá trị đó dưới dạng tham chiếu ô. Trong trường hợp này, bạn cũng cần nhập hằng số 1 vào một số ô vì bạn không thể trộn lẫn tham chiếu và giá trị trong hằng số mảng.

    Với giá trị x trong E2 và hằng số 1 trong F2, một trong hai công thức dưới đây sẽ có tác dụng:

    Công thức thông thường (được nhập bằng cách nhấn Enter ):

    =SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))

    Công thức mảng (được nhập bằng cách nhấn Ctrl + Shift + Enter ):

    =SUM(LINEST(C2:C10, B2:B10)*(E2:F2))

    Để xác minh kết quả, bạn có thể lấy hệ số chặn và hệ số góc cho cùng một dữ liệu, sau đó sử dụng công thức hồi quy tuyến tính để tính toán y :

    =E2*G2+F2

    Trong đó E2 là hệ số góc, G2 là giá trị x và F2 là giao điểm:

    Hồi quy bội: dự đoán biến phụ thuộc

    Trong trường hợp bạn đang xử lý một số yếu tố dự đoán, tức là một vài bộ giá trị x khác nhau, hãy bao gồm tất cả các yếu tố đó dự đoán trong hằng số mảng. Ví dụ: với ngân sách quảng cáo là $50 (x 2 ) và lượng mưa trung bình hàng tháng là 100 mm (x 1 ), công thức sẽ như sausau:

    =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

    Trong đó D2:D10 là các giá trị y đã biết và B2:C10 là hai bộ giá trị x :

    Hãy chú ý đến thứ tự của các giá trị x trong hằng số mảng. Như đã chỉ ra trước đó, khi hàm LINEST trong Excel được sử dụng để thực hiện hồi quy bội, nó sẽ trả về các hệ số góc từ phải sang trái. Trong ví dụ của chúng tôi, hệ số Quảng cáo được trả về trước, sau đó là hệ số Lượng mưa . Để tính toán doanh số bán hàng dự đoán một cách chính xác, bạn cần nhân các hệ số với các giá trị x tương ứng, do đó, bạn đặt các phần tử của hằng số mảng theo thứ tự sau: {50,100,1}. Phần tử cuối cùng là 1, vì giá trị cuối cùng do LINEST trả về là phần chặn không nên thay đổi, vì vậy bạn chỉ cần nhân nó với 1.

    Thay vì sử dụng hằng số mảng, bạn có thể nhập tất cả các biến x trong một số ô và tham chiếu các ô đó trong công thức của bạn giống như chúng ta đã làm trong ví dụ trước.

    Công thức thông thường:

    =SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))

    Công thức mảng:

    =SUM(LINEST(D2:D10, B2:C10)*(F2:H2))

    Trong đó F2 và G2 là các giá trị x và H2 là 1:

    Công thức LINEST: thống kê hồi quy bổ sung

    Có thể bạn còn nhớ, để có thêm số liệu thống kê cho phân tích hồi quy của mình, bạn đặt TRUE vào đối số cuối cùng của hàm LINEST. Áp dụng cho dữ liệu mẫu của chúng tôi, công thức có dạng sau:

    =LINEST(D2:D13, B2:C13, TRUE, TRUE)

    Vì chúng tôi có 2 độc lậpcác biến ở cột B và C, ta chọn một cơn thịnh nộ gồm 3 hàng (hai giá trị x + chặn) và 5 cột, nhập công thức trên, nhấn Ctrl + Shift + Enter và được kết quả như sau:

    Để loại bỏ lỗi #N/A, bạn có thể lồng LINEST vào IFERROR như sau:

    =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

    Ảnh chụp màn hình bên dưới minh họa kết quả và giải thích điều gì mỗi số có nghĩa là:

    Các hệ số góc và tung độ gốc Y đã được giải thích trong các ví dụ trước, vì vậy chúng ta hãy xem nhanh các số liệu thống kê khác.

    Hệ số xác định (R2). Giá trị của R2 là kết quả của việc chia tổng bình phương hồi quy cho tổng bình phương. Nó cho bạn biết có bao nhiêu giá trị y được giải thích bởi các biến x . Nó có thể là bất kỳ số nào từ 0 đến 1, nghĩa là từ 0% đến 100%. Trong ví dụ này, R2 xấp xỉ 0,97, nghĩa là 97% biến phụ thuộc của chúng tôi (doanh số bán ô dù) được giải thích bằng các biến độc lập (quảng cáo + lượng mưa trung bình hàng tháng), đây là một sự phù hợp tuyệt vời!

    Sai số chuẩn . Nói chung, các giá trị này cho thấy độ chính xác của phân tích hồi quy. Con số càng nhỏ thì bạn càng chắc chắn về mô hình hồi quy của mình.

    Thống kê F . Bạn sử dụng thống kê F để ủng hộ hoặc bác bỏ giả thuyết không. Nên sử dụng thống kê F kết hợp với giá trị P khi quyết định xem kết quả tổng thể có

    Michael Brown là một người đam mê công nghệ chuyên dụng với niềm đam mê đơn giản hóa các quy trình phức tạp bằng các công cụ phần mềm. Với hơn một thập kỷ kinh nghiệm trong ngành công nghệ, anh ấy đã trau dồi kỹ năng của mình trong Microsoft Excel và Outlook, cũng như Google Trang tính và Tài liệu. Blog của Michael dành để chia sẻ kiến ​​thức và chuyên môn của anh ấy với những người khác, cung cấp các mẹo và hướng dẫn dễ thực hiện để cải thiện năng suất và hiệu quả. Cho dù bạn là một chuyên gia dày dạn kinh nghiệm hay người mới bắt đầu, blog của Michael đều cung cấp những hiểu biết có giá trị và lời khuyên thiết thực để tận dụng tối đa những công cụ phần mềm thiết yếu này.