تابع Excel LINEST با مثال های فرمول

  • این را به اشتراک بگذارید
Michael Brown

این آموزش نحو تابع LINEST را توضیح می‌دهد و نحوه استفاده از آن برای انجام تحلیل رگرسیون خطی در اکسل را نشان می‌دهد.

Microsoft Excel یک برنامه آماری نیست، اما این کار را انجام می‌دهد. تعدادی توابع آماری دارند. یکی از این توابع LINEST است که برای انجام تحلیل رگرسیون خطی و آمار مربوط به بازگشت طراحی شده است. در این آموزش برای مبتدیان، ما فقط به تئوری و محاسبات اساسی اشاره خواهیم کرد. تمرکز اصلی ما بر روی ارائه فرمولی به شما خواهد بود که به سادگی کار می کند و می تواند به راحتی برای داده های شما سفارشی شود.

    عملکرد Excel LINEST - نحو و کاربردهای اساسی

    تابع LINEST آمار یک خط مستقیم را محاسبه می کند که رابطه بین متغیر مستقل و یک یا چند متغیر وابسته را توضیح می دهد و آرایه ای را که خط را توصیف می کند برمی گرداند. این تابع از روش حداقل مربع برای یافتن بهترین مناسب برای داده های شما استفاده می کند. معادله خط به شرح زیر است.

    معادله رگرسیون خطی ساده:

    y = bx + a

    معادله رگرسیون چندگانه:

    y = b 1x 1+ b 2x 2+ … + b nx n+ a

    کجا:

    • y - متغیر وابسته ای که می خواهید پیش بینی کنید.
    • x - متغیر مستقلی که برای پیش بینی استفاده می کنید. y .
    • a - نقطه قطع (نشان می دهد که در کجا خط محور Y را قطع می کند).
    • b - شیبقابل توجه است.

      درجات آزادی (df). تابع LINEST در اکسل درجات آزادی باقیمانده را برمی گرداند که df کل منهای رگرسیون df است. شما می توانید از درجات آزادی برای بدست آوردن مقادیر بحرانی F در یک جدول آماری استفاده کنید و سپس مقادیر بحرانی F را با آماره F مقایسه کنید تا سطح اطمینان مدل خود را تعیین کنید.

      مجموع رگرسیون از مربع ها (معروف به مجموع توضیح داده شده مربع ها ، یا مجموع مدل مربع ها ). مجموع اختلاف مجذور بین مقادیر y پیش بینی شده و میانگین y است که با این فرمول محاسبه می شود: =∑(ŷ - ȳ)2. این نشان می دهد که مدل رگرسیون شما چه مقدار از تغییرات متغیر وابسته را توضیح می دهد.

      مجموع باقیمانده مربع ها . این مجموع اختلاف مجذور بین مقادیر y واقعی و مقادیر y پیش بینی شده است. این نشان می دهد که مدل شما چه مقدار از تغییرات متغیر وابسته را توضیح نمی دهد. هر چه مجموع باقیمانده مربع ها در مقایسه با مجموع مجموع مربع ها کوچکتر باشد، مدل رگرسیون شما بهتر با داده های شما مطابقت دارد.

      5 نکته که باید در مورد تابع LINEST بدانید

      برای استفاده موثر از فرمول های LINEST در کاربرگ های خود، ممکن است بخواهید کمی بیشتر در مورد "مکانیک درونی" تابع بدانید:

      1. Known_y's و known_x's . در یک مدل رگرسیون خطی ساده با تنها یک مجموعه از متغیرهای x، known_y's و known_x's می‌تواند محدوده‌ای با هر شکلی باشد تا زمانی که تعداد سطرها و ستون‌ها یکسان باشد. اگر تجزیه و تحلیل رگرسیون چندگانه را با بیش از یک مجموعه از متغیرهای مستقل x انجام دهید، known_y's باید یک بردار باشد، یعنی محدوده ای از یک سطر یا یک ستون.
      2. اجبار کردن ثابت به صفر . وقتی آرگومان const TRUE باشد یا حذف شود، ثابت a (برق) محاسبه شده و در معادله گنجانده می شود: y=bx + a. اگر const روی FALSE تنظیم شود، وقفه برابر با 0 در نظر گرفته می شود و از معادله رگرسیون حذف می شود: y=bx.

        در آمار، چندین دهه است که بحث شده است که آیا منطقی است که ثابت رهگیری را به 0 وادار کنیم یا خیر. بسیاری از دست اندرکاران تحلیل رگرسیون معتبر بر این باورند که اگر تنظیم فاصله بر روی صفر (const=FALSE) مفید به نظر برسد، پس رگرسیون خطی خود یک مدل اشتباه برای مجموعه داده است. برخی دیگر تصور می کنند که ثابت می تواند در شرایط خاصی به صفر برسد، برای مثال، در زمینه طرح های ناپیوستگی رگرسیون. به طور کلی، توصیه می‌شود که با پیش‌فرض const=TRUE یا در اکثر موارد حذف شده است.

      3. Accuracy . دقت معادله رگرسیون محاسبه شده توسط تابع LINEST به پراکندگی نقاط داده شما بستگی دارد. هرچه داده ها خطی تر باشند، نتایج فرمول LINEST دقیق تر است.
      4. مقادیر x اضافی . در برخی شرایط،یک یا چند متغیر x مستقل ممکن است ارزش پیش‌بینی اضافی نداشته باشند، و حذف چنین متغیرهایی از مدل رگرسیونی بر دقت مقادیر y پیش‌بینی‌شده تأثیری ندارد. این پدیده به «هم خطی» معروف است. تابع Excel LINEST همخطی بودن را بررسی می کند و هر متغیر اضافی x را که از مدل شناسایی می کند حذف می کند. متغیرهای حذف شده x را می توان با 0 ضریب و 0 مقدار خطای استاندارد تشخیص داد.
      5. LINEST در مقابل SLOPE و INTERCEPT . الگوریتم زیربنایی تابع LINEST با الگوریتم مورد استفاده در توابع SLOPE و INTERCEPT متفاوت است. بنابراین، زمانی که داده‌های مبدأ مشخص نشده باشند یا خطی باشند، این توابع ممکن است نتایج متفاوتی را نشان دهند.

      عملکرد Excel LINEST کار نمی‌کند

      اگر فرمول LINEST شما خطایی ایجاد کند یا خروجی اشتباهی تولید کند. ، به احتمال زیاد به دلیل یکی از دلایل زیر است:

      1. اگر تابع LINEST فقط یک عدد (ضریب شیب) را برمی گرداند، به احتمال زیاد شما آن را به عنوان یک فرمول معمولی وارد کرده اید، نه یک فرمول آرایه. حتما Ctrl + Shift + Enter را فشار دهید تا فرمول به درستی تکمیل شود. هنگامی که این کار را انجام می دهید، فرمول در {پرانتزهای فرفری} که در نوار فرمول قابل مشاهده است محصور می شود.
      2. #REF! خطا در صورتی رخ می دهد که محدوده های known_x و known_y ابعاد متفاوتی داشته باشند.
      3. #VALUE! خطا اگر known_x's یا known_y's حاوی حداقل یک سلول خالی، مقدار متن یا نمایش متنی از عددی است که اکسل آن را به عنوان مقدار عددی تشخیص نمی‌دهد. همچنین، اگر آرگومان const یا stats را نتوان به TRUE یا FALSE ارزیابی کرد، خطای #VALUE رخ می دهد.

      این روشی است که شما از LINEST در اکسل برای یک تحلیل رگرسیون خطی ساده و چندگانه برای مشاهده دقیق فرمول های مورد بحث در این آموزش، می توانید نمونه کار ما را در زیر دانلود کنید. از شما سپاسگزارم که خواندید و امیدوارم هفته آینده شما را در وبلاگ خود ببینیم!

      کتاب کار را برای دانلود تمرین کنید

      نمونه های تابع Excel LINEST (فایل xlsx.)

      (نشان دهنده شیب خط رگرسیون است، یعنی نرخ تغییر y با تغییر x) برای معادله رگرسیون به صورت اختیاری، همچنین می‌تواند آمار اضافی را برای تحلیل رگرسیون که در این مثال نشان داده شده است، برگرداند.

      Syntax تابع LINEST

      Syntax تابع Excel LINEST به شرح زیر است:

      LINEST(known_y's , [known_x's], [const], [stats])

      که در آن:

      • known_y's (الزامی) محدوده ای از وابسته y است - مقادیر در معادله رگرسیون. معمولاً یک ستون یا یک ردیف است.
      • known_x's (اختیاری) محدوده ای از مقادیر x مستقل است. اگر حذف شود، فرض می شود که آرایه {1،2،3،...} به اندازه known_y's باشد.
      • const (اختیاری) - یک مقدار منطقی که تعیین می‌کند چگونه وقفه (ثابت a ) باید درمان شود:
        • اگر درست یا حذف شود، ثابت a به طور معمول محاسبه می‌شود.
        • اگر FALSE، ثابت a مجبور به 0 می شود و شیب (ضریب b ) برای برازش y=bx محاسبه می شود.
      • stats (اختیاری) یک مقدار منطقی است که تعیین می‌کند آیا آمار اضافی خروجی داده شود یا خیر:
        • اگر درست است، تابع LINEST آرایه‌ای را با آمار رگرسیون اضافی برمی‌گرداند.
        • اگر FALSE یا حذف شود، LINEST فقط ثابت رهگیری و شیب را برمی گرداند.ضریب(های)

      توجه. از آنجایی که LINEST آرایه ای از مقادیر را برمی گرداند، باید با فشار دادن میانبر Ctrl + Shift + Enter، آن را به عنوان یک فرمول آرایه وارد کنید. اگر به صورت یک فرمول معمولی وارد شود، فقط اولین ضریب شیب برگردانده می شود.

      آمار اضافی برگردانده شده توسط LINEST

      آگومان stats که روی TRUE تنظیم شده است به تابع LINEST دستور می دهد تا آمار زیر را برای تجزیه و تحلیل رگرسیون شما برگرداند:

      آمار شرح
      ضریب شیب b مقدار در y = bx + a
      ثابت قطع یک مقدار در y = bx + a
      خطای استاندارد شیب مقدار(های) خطای استاندارد برای ضریب (های) b 17> ضریب تعیین (R2) نشان می دهد که چگونه معادله رگرسیون رابطه بین متغیرها را توضیح می دهد.
      خطای استاندارد برای برآورد Y دقت تحلیل رگرسیون را نشان می دهد.
      آمار F یا مقدار مشاهده شده F برای انجام آزمون F برای فرضیه صفر برای تعیین خوب بودن برازش کلی مدل.
      درجات fr eedom (df) تعداد درجات آزادی.
      مجموع رگرسیون مربع ها نشان می دهد که چه مقدار از تغییرات درمتغیر وابسته توسط مدل توضیح داده می شود.
      مجموع باقیمانده مربع ها میزان واریانس متغیر وابسته را که با مدل رگرسیون شما توضیح داده نمی شود، اندازه گیری می کند.

      نقشه زیر ترتیبی را نشان می دهد که LINEST آرایه ای از آمار را برمی گرداند:

      در سه ردیف آخر، خطاهای #N/A در ستون های سوم و بعدی که با داده ها پر نشده اند ظاهر می شود. این رفتار پیش‌فرض تابع LINEST است، اما اگر می‌خواهید نمادهای خطا را پنهان کنید، فرمول LINEST خود را همانطور که در این مثال نشان داده شده است در IFERROR بپیچید.

      نحوه استفاده از LINEST در اکسل - مثال‌های فرمول

      استفاده از تابع LINEST، مخصوصاً برای تازه کارها، ممکن است دشوار باشد، زیرا نه تنها باید یک فرمول را به درستی بسازید، بلکه باید خروجی آن را نیز به درستی تفسیر کنید. در زیر، چند نمونه از استفاده از فرمول های LINEST در اکسل را مشاهده خواهید کرد که امیدواریم به کاهش دانش نظری در اکسل کمک کند :)

      رگرسیون خطی ساده: محاسبه شیب و فاصله

      برای بدست آوردن فاصله و شیب یک خط رگرسیون، شما از تابع LINEST در ساده ترین شکل آن استفاده می کنید: محدوده ای از مقادیر وابسته را برای آرگومان known_y's و محدوده ای از مقادیر مستقل را برای known_x's<2 ارائه کنید> استدلال دو آرگومان آخر را می توان روی TRUE تنظیم کرد یا حذف کرد.

      به عنوان مثال، با مقادیر y (اعداد فروش) در مقادیر C2:C13 و x(هزینه تبلیغات) در B2:B13، فرمول رگرسیون خطی ما به این سادگی است:

      =LINEST(C2:C13,B2:B13)

      برای وارد کردن صحیح آن در کاربرگ خود، دو سلول مجاور در همان ردیف، E2 را انتخاب کنید: F2 در این مثال، فرمول را تایپ کنید و Ctrl + Shift + Enter را فشار دهید تا آن را کامل کنید.

      فرمول ضریب شیب را در سلول اول (E2) و ثابت قطع را در سلول دوم (F2) برمی گرداند. ):

      شیب تقریباً 0.52 است (به دو رقم اعشار گرد شده است). به این معنی که وقتی x 1 افزایش می یابد، y 0.52 افزایش می یابد.

      Y-intercept منفی 4.99 است. زمانی که x=0 مقدار مورد انتظار y است. اگر بر روی یک نمودار رسم شود، مقداری است که خط رگرسیون در آن از محور y عبور می کند.

      مقادیر بالا را به یک معادله رگرسیون خطی ساده وارد کنید و فرمول زیر را برای پیش بینی عدد فروش دریافت خواهید کرد. بر اساس هزینه تبلیغات:

      y = 0.52*x - 4.99

      به عنوان مثال، اگر 50 دلار برای تبلیغات خرج کنید، انتظار می رود که 21 چتر بفروشید:

      0.52*50 - 4.99 = 21.01

      مقادیر شیب و فاصله را نیز می توان به طور جداگانه با استفاده از تابع مربوطه یا با قرار دادن فرمول LINEST در INDEX بدست آورد:

      Slope

      =SLOPE(C2:C13,B2:B13)

      =INDEX(LINEST(C2:C13,B2:B13),1)

      Intercept

      =INTERCEPT(C2:C13,B2:B13)

      =INDEX(LINEST(C2:C13,B2:B13),2)

      همانطور که در تصویر زیر نشان داده شده است، هر سه فرمول نتایج یکسانی دارند:

      رگرسیون خطی چندگانه: شیب و قطع

      در صورت وجوددو یا چند متغیر مستقل، مطمئن شوید که آنها را در ستون‌های مجاور وارد کرده و کل محدوده را به آرگومان known_x وارد کنید.

      به عنوان مثال، با اعداد فروش ( y<2)> مقادیر) در D2:D13، هزینه تبلیغات (یک مجموعه از مقادیر x) در B2:B13 و میانگین بارندگی ماهانه (مجموعه دیگری از مقادیر x ) در C2:C13، از این فرمول استفاده می کنید:

      =LINEST(D2:D13,B2:C13)

      از آنجایی که فرمول قرار است آرایه ای از 3 مقدار را برگرداند (2 ضریب شیب و ثابت قطع)، سه سلول به هم پیوسته را در همان ردیف انتخاب می کنیم، فرمول را وارد می کنیم و Ctrl + را فشار می دهیم. میانبر Shift + Enter.

      لطفاً توجه داشته باشید که فرمول رگرسیون چندگانه ضرایب شیب را در ترتیب معکوس متغیرهای مستقل (از راست به چپ) برمی‌گرداند. b n ، b n-1 ، …، b 2 ، b 1 :

      است

      برای پیش‌بینی عدد فروش، مقادیر بازگشتی با فرمول LINEST را به معادله رگرسیون چندگانه ارائه می‌کنیم:

      y = 0.3*x 2 + 0.19*x 1 - 10.74

      برای مثال با صرف 50 دلار برای تبلیغات و میانگین بارندگی ماهانه 100 میلی متر، انتظار می رود تقریباً 23 چتر بفروشید:

      0.3*50 + 0.19*100 - 10.74 = 23.26

      رگرسیون خطی ساده: متغیر وابسته را پیش بینی کنید

      جدا از محاسبه مقادیر a و b برای معادله رگرسیون، تابع Excel LINEST همچنین می تواند متغیر وابسته (y) را بر اساس مستقل شناخته شده تخمین بزند.متغیر (x). برای این کار، از LINEST در ترکیب با تابع SUM یا SUMPRODUCT استفاده می کنید.

      به عنوان مثال، در اینجا نحوه محاسبه تعداد فروش چتر برای ماه آینده، مثلاً اکتبر، بر اساس فروش در ماه های قبل آمده است. بودجه تبلیغاتی اکتبر 50 دلار:

      =SUM(LINEST(C2:C10, B2:B10)*{50,1})

      به جای اینکه مقدار x را در فرمول کدگذاری کنید، می توانید آن را به عنوان یک مرجع سلول در این مورد، باید ثابت 1 را در برخی از سلول ها نیز وارد کنید، زیرا نمی توانید مراجع و مقادیر را در یک ثابت آرایه ترکیب کنید.

      با مقدار x در E2 و ثابت 1 اینچ F2، هر یک از فرمول های زیر به خوبی کار می کند:

      فرمول معمولی (با فشار دادن Enter وارد می شود):

      =SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))

      فرمول آرایه (با فشار دادن Ctrl + Shift + وارد می شود را وارد کنید ):

      =SUM(LINEST(C2:C10, B2:B10)*(E2:F2))

      برای تأیید نتیجه، می‌توانید فاصله و شیب را برای همان داده‌ها دریافت کنید و سپس از فرمول رگرسیون خطی استفاده کنید. محاسبه y :

      =E2*G2+F2

      که در آن E2 شیب است، G2 مقدار x ، و F2 فاصله است:

      <. پیش بینی کننده های ثابت آرایه برای مثال، با بودجه تبلیغاتی 50 دلار (x 2 ) و میانگین بارندگی ماهانه 100 میلی متر (x 1 )، فرمول به شرح زیر است.به شرح زیر است:

      =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

      که در آن D2:D10 مقادیر شناخته شده y هستند و B2:C10 دو مجموعه از مقادیر x هستند:

      لطفاً به ترتیب مقادیر x در ثابت آرایه توجه کنید. همانطور که قبلاً اشاره شد، وقتی از تابع Excel LINEST برای انجام رگرسیون چندگانه استفاده می شود، ضرایب شیب را از راست به چپ برمی گرداند. در مثال ما ابتدا ضریب تبلیغات و سپس ضریب باران برگردانده می شود. برای محاسبه صحیح عدد فروش پیش بینی شده، باید ضرایب را در مقادیر x مربوط ضرب کنید، بنابراین عناصر ثابت آرایه را به این ترتیب قرار دهید: {50,100,1}. آخرین عنصر 1 است، زیرا آخرین مقداری که توسط LINEST برگردانده می شود، فاصله ای است که نباید تغییر کند، بنابراین شما به سادگی آن را در 1 ضرب کنید.

      به جای استفاده از یک آرایه ثابت، می توانید تمام متغیرهای x را وارد کنید. در برخی از سلول ها، و مانند مثال قبلی به آن سلول ها در فرمول خود ارجاع دهید.

      فرمول معمولی:

      =SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))

      فرمول آرایه:

      =SUM(LINEST(D2:D10, B2:C10)*(F2:H2))

      که در آن F2 و G2 مقادیر x و H2 1 است:

      فرمول LINEST: آمار رگرسیون اضافی

      همانطور که ممکن است به خاطر داشته باشید، برای بدست آوردن آمار بیشتر برای تحلیل رگرسیون خود، TRUE را در آخرین آرگومان تابع LINEST قرار می دهید. با استفاده از داده های نمونه ما، فرمول به شکل زیر است:

      =LINEST(D2:D13, B2:C13, TRUE, TRUE)

      همانطور که ما 2 مستقل داریممتغیرهای ستون B و C، یک خشم شامل 3 ردیف (دو مقدار x + intercept) و 5 ستون را انتخاب می کنیم، فرمول بالا را وارد می کنیم، Ctrl + Shift + Enter را فشار می دهیم و این نتیجه را می گیریم:

      برای خلاص شدن از شر خطاهای #N/A، می‌توانید LINEST را در IFERROR به این شکل قرار دهید:

      =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

      تصویر صفحه زیر نتیجه را نشان می‌دهد و توضیح می‌دهد که چه چیزی هر عدد به این معنی است:

      ضرایب شیب و مقطع Y در مثال های قبلی توضیح داده شد، بنابراین اجازه دهید نگاهی گذرا به آمارهای دیگر داشته باشیم.

      ضریب تعیین (R2). مقدار R2 حاصل تقسیم مجموع رگرسیون مربع ها بر مجموع مجموع مربعات است. به شما می گوید که چه تعداد y با متغیرهای x توضیح داده شده است. این می تواند هر عددی از 0 تا 1 باشد، یعنی 0٪ تا 100٪. در این مثال، R2 تقریباً 0.97 است، به این معنی که 97٪ از متغیرهای وابسته ما (فروش چتر) توسط متغیرهای مستقل (تبلیغات + میانگین بارندگی ماهانه) توضیح داده شده است که یک تناسب عالی است!

      خطاهای استاندارد . به طور کلی، این مقادیر دقت تحلیل رگرسیون را نشان می دهد. هر چه اعداد کوچکتر باشند، می توانید در مورد مدل رگرسیون خود مطمئن تر باشید.

      آمار F . شما از آماره F برای تایید یا رد فرضیه صفر استفاده می کنید. هنگام تصمیم گیری در مورد اینکه آیا نتایج کلی هستند، توصیه می شود از آماره F در ترکیب با مقدار P استفاده کنید

    مایکل براون یک علاقه‌مند به فناوری است که علاقه زیادی به ساده‌سازی فرآیندهای پیچیده با استفاده از ابزارهای نرم‌افزاری دارد. او با بیش از یک دهه تجربه در صنعت فناوری، مهارت های خود را در Microsoft Excel و Outlook و همچنین Google Sheets و Docs تقویت کرده است. وبلاگ مایکل اختصاص داده شده است تا دانش و تخصص خود را با دیگران به اشتراک بگذارد و نکات و آموزش هایی را برای بهبود بهره وری و کارایی ارائه دهد. چه یک حرفه ای با تجربه باشید و چه مبتدی، وبلاگ مایکل، بینش های ارزشمند و توصیه های عملی را برای استفاده حداکثری از این ابزارهای نرم افزاری ضروری ارائه می دهد.