همبستگی در اکسل: ضریب، ماتریس و نمودار

  • این را به اشتراک بگذارید
Michael Brown

این آموزش اصول همبستگی را در اکسل توضیح می دهد، نحوه محاسبه ضریب همبستگی، ساخت ماتریس همبستگی و تفسیر نتایج را نشان می دهد.

یکی از ساده ترین محاسبات آماری که می توانید در اکسل انجام دهید همبستگی است. اگرچه ساده است، اما در درک روابط بین دو یا چند متغیر بسیار مفید است. مایکروسافت اکسل تمام ابزارهای لازم برای اجرای تجزیه و تحلیل همبستگی را فراهم می کند، فقط باید بدانید که چگونه از آنها استفاده کنید.

    همبستگی در اکسل - اصول اولیه

    همبستگی معیاری است که قدرت و جهت رابطه بین دو متغیر را توصیف می کند. معمولاً در آمار، اقتصاد و علوم اجتماعی برای بودجه، طرح‌های تجاری و موارد مشابه استفاده می‌شود.

    روش مورد استفاده برای بررسی میزان ارتباط نزدیک متغیرها تحلیل همبستگی نامیده می‌شود.

    در اینجا چند نمونه از همبستگی قوی آورده شده است:

    • تعداد کالری که می خورید و وزن شما (همبستگی مثبت)
    • دمای بیرون و صورت حساب گرمایشی شما ( همبستگی منفی)

    و در اینجا نمونه هایی از داده هایی که همبستگی ضعیف یا بدون همبستگی دارند:

    • نام گربه شما و غذای مورد علاقه آنها
    • رنگ گربه چشمان و قد شما

    یک چیز ضروری برای درک همبستگی این است که فقط نشان می دهد که دو متغیر چقدر به هم نزدیک هستند. با این حال، همبستگی دلالت ندارداز یک محدوده مشخص.

  • ROWS و COLUMNS - به ترتیب تعداد سطرها و ستون ها در یک محدوده را برمی گرداند. در فرمول همبستگی ما، هر دو با یک هدف مورد استفاده قرار می‌گیرند - تعداد ستون‌هایی را که باید از محدوده شروع جابه‌جا شوند، دریافت کنید. و این با استفاده هوشمندانه از مراجع مطلق و نسبی به دست می آید.
  • برای درک بهتر منطق، بیایید ببینیم که چگونه فرمول ضرایب برجسته شده در تصویر بالا را محاسبه می کند.

    ابتدا، اجازه دهید فرمول B18 را بررسی کنید، که همبستگی بین دمای ماهانه (B2:B13) و بخاری های فروخته شده (D2:D13) را پیدا می کند:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    در اولین تابع OFFSET، ROWS($1: 1) به ROWS ($1:3) تبدیل شده است زیرا مختصات دوم نسبی است، بنابراین بر اساس موقعیت نسبی ردیفی که فرمول در آن کپی می شود (2 ردیف پایین) تغییر می کند. بنابراین، ROWS() 3 را برمی‌گرداند، که از آن 1 کم می‌کنیم، و محدوده‌ای به دست می‌آوریم که 2 ستون در سمت راست محدوده منبع است، یعنی $D$2:$D$13 (فروش بخاری).

    OFFSET دوم محدوده مشخص شده $B$2:$B$13 (دما) را تغییر نمی دهد زیرا COLUMNS($A:A)-1 صفر را برمی گرداند.

    در نتیجه، فرمول طولانی ما به یک CORREL ساده تبدیل می شود( $D$2:$D$13, $B$2:$B$13) و دقیقاً ضریب مورد نظر ما را برمی‌گرداند.

    فرمول موجود در C18 که ضریب همبستگی را برای هزینه تبلیغات (C2:C13) و فروش (C2:C13) محاسبه می‌کند. D2:D13) به روشی مشابه کار می کند:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))

    اولین تابع OFFSETکاملاً مشابه آنچه در بالا توضیح داده شد، بازگرداندن محدوده $D$2:$D$13 (فروش بخاری).

    در OFFSET دوم، COLUMNS($A:A)-1 به COLUMNS($A: B)-1 زیرا ما ستون فرمول 1 را در سمت راست کپی کرده ایم. در نتیجه، OFFSET محدوده‌ای را دریافت می‌کند که 1 ستون در سمت راست محدوده منبع است، یعنی $C$2:$C$13 (هزینه تبلیغات).

    نحوه ترسیم نمودار همبستگی در Excel

    هنگام انجام همبستگی در اکسل، بهترین راه برای به دست آوردن یک نمایش بصری از روابط بین داده های خود، ترسیم طرح پراکندگی با Trendline است. به این صورت است:

    1. دو ستون با داده های عددی، از جمله سرصفحه ستون ها را انتخاب کنید. ترتیب ستون ها مهم است: متغیر مستقل باید در ستون سمت چپ باشد زیرا این ستون باید بر روی محور x رسم شود. متغیر وابسته باید در ستون سمت راست باشد زیرا در محور y رسم می شود.
    2. در تب Inset ، در Chats گروه، روی نماد نمودار Scatter کلیک کنید. با این کار بلافاصله یک نمودار پراکندگی XY در کاربرگ شما وارد می شود.
    3. هر نقطه داده در نمودار کلیک راست کرده و Add Trendline… را از منوی زمینه انتخاب کنید.

    برای دستورالعمل های گام به گام دقیق، لطفاً ببینید:

    • نحوه ایجاد نمودار پراکندگی در اکسل
    • نحوه افزودن خط روند به نمودار اکسل

    برای مجموعه داده های نمونه ما، نمودارهای همبستگی مانند تصویر زیر هستند.علاوه بر این، مقدار R-squared را نمایش می‌دهیم که ضریب تعیین نیز نامیده می‌شود. این مقدار نشان می‌دهد که خط روند چقدر با داده‌ها مطابقت دارد - هر چه R2 به 1 نزدیک‌تر باشد، تناسب بهتری دارد.

    از مقدار R2 که در نمودار پراکندگی شما نمایش داده می‌شود، می‌توانید به راحتی ضریب همبستگی را محاسبه کنید:

    20>

  • برای دقت بهتر، اکسل را دریافت کنید تا ارقام بیشتری را در مقدار R-squared نسبت به حالت پیش فرض نشان دهد.
  • روی مقدار R2 در نمودار کلیک کنید، با استفاده از ماوس آن را انتخاب کنید و Ctrl را فشار دهید. + C برای کپی کردن آن.
  • با استفاده از تابع SQRT یا با افزایش مقدار R2 کپی شده به توان 0.5، یک جذر R2 به دست آورید.
  • به عنوان مثال، مقدار R2 در نمودار دوم 0.9174339392 است. بنابراین، می توانید ضریب همبستگی تبلیغات و هیترهای فروخته شده را با یکی از این فرمولها پیدا کنید:

    =SQRT(0.9174339392)

    =0.9174339392^0.5

    همانطور که می توانید مطمئن شوید، ضرایب محاسبه شده به این روش کاملاً با ضرایب همبستگی موجود در مثال های قبلی مطابقت دارد، به جز علامت :

    مشکلات احتمالی همبستگی در اکسل

    همبستگی لحظه محصول پیرسون فقط یک رابطه خطی بین دو متغیر را آشکار می کند. به این معنی که متغیرهای شما ممکن است به شکلی دیگر، منحنی خطی، به شدت مرتبط باشند و همچنان ضریب همبستگی آنها برابر یا نزدیک به صفر باشد.

    همبستگی پیرسون قادر به این نیست.متغیرهای وابسته و مستقل را تشخیص دهید. به عنوان مثال، هنگام استفاده از تابع CORREL برای یافتن ارتباط بین میانگین دمای ماهانه و تعداد بخاری های فروخته شده، ضریب 0.97- را دریافت کردیم که نشان دهنده همبستگی منفی بالا است. با این حال، می توانید متغیرها را تغییر دهید و همان نتیجه را بگیرید. بنابراین، ممکن است کسی به این نتیجه برسد که فروش بیشتر بخاری باعث کاهش دما می شود، که بدیهی است که منطقی نیست. بنابراین، هنگام اجرای تجزیه و تحلیل همبستگی در اکسل، از داده هایی که ارائه می کنید آگاه باشید.

    علاوه بر این، همبستگی پیرسون به پرت بسیار حساس است. اگر یک یا چند نقطه داده دارید که تفاوت زیادی با بقیه داده ها دارد، ممکن است تصویری تحریف شده از رابطه بین متغیرها دریافت کنید. در این مورد، عاقلانه است که به جای آن از همبستگی رتبه اسپیرمن استفاده کنید.

    این نحوه انجام همبستگی در اکسل است. برای مشاهده دقیق‌تر نمونه‌های مورد بحث در این آموزش، می‌توانید نمونه کار ما را در زیر دانلود کنید. از خواندن شما سپاسگزارم و امیدوارم هفته آینده شما را در وبلاگ خود ببینم!

    کتاب کار تمرین

    محاسبه همبستگی در اکسل (فایل xlsx.)

    <3علیت این واقعیت که تغییرات در یک متغیر با تغییرات متغیر دیگر همراه است به این معنی نیست که یک متغیر در واقع باعث تغییر دیگری می شود.

    اگر علاقه مند به یادگیری علیت و پیش بینی هستید، یک قدم به جلو بردارید. و تحلیل رگرسیون خطی انجام دهید.

    ضریب همبستگی در اکسل - تفسیر همبستگی

    معیار عددی میزان ارتباط بین دو متغیر پیوسته ضریب همبستگی نامیده می شود. r).

    مقدار ضریب همیشه بین 1- و 1 است و قدرت و جهت رابطه خطی بین متغیرها را اندازه گیری می کند.

    قدرت

    بزرگتر قدر مطلق ضریب، رابطه قوی تر است:

    • مقادیر شدید 1- و 1 نشان دهنده یک رابطه خطی کامل زمانی است که تمام نقاط داده روی یک خط قرار می گیرند. در عمل، یک همبستگی کامل، مثبت یا منفی، به ندرت مشاهده می شود.
    • ضریب 0 نشان دهنده عدم وجود رابطه خطی بین متغیرها است. این چیزی است که احتمالاً با دو مجموعه از اعداد تصادفی به دست می آورید.
    • مقادیر بین 0 و 1/-1 مقیاسی از روابط ضعیف، متوسط ​​و قوی را نشان می دهد. هر چه r به 1- یا 1 نزدیک تر می شود، قدرت رابطه افزایش می یابد.

    جهت

    علامت ضریب (به علاوه یا منفی) نشان دهنده جهت ازرابطه.

    • مثبت ضرایب نشان دهنده همبستگی مستقیم است و شیب رو به بالا روی نمودار ایجاد می کند - با افزایش یک متغیر متغیر دیگر افزایش می یابد و بالعکس.
    • ضرایب منفی نشان دهنده همبستگی معکوس هستند و یک شیب رو به پایین در نمودار ایجاد می کنند - با افزایش یک متغیر، متغیر دیگر تمایل به کاهش دارد.

    برای درک بهتر، لطفاً نگاهی به نمودارهای همبستگی زیر:

    • ضریب 1 به معنای یک رابطه مثبت کامل است - با افزایش یک متغیر، متغیر دیگر به نسبت افزایش می یابد.
    • ضریب -1 به معنی یک رابطه منفی کامل است - با افزایش یک متغیر، متغیر دیگر به نسبت کاهش می یابد.
    • ضریب 0 به معنای عدم رابطه بین دو متغیر است - نقاط داده عبارتند از در سراسر نمودار پراکنده شده است.

    همبستگی پیرسون

    در آمار، بسته به نوع داده ای که با آنها کار می کنید، انواع مختلفی از همبستگی را اندازه گیری می کنند. در این آموزش، ما بر روی رایج ترین آنها تمرکز خواهیم کرد.

    Pearson Correlation ، نام کامل آن Pearson Product Moment Correlation (PPMC) است، برای روابط خطی بین داده ها را زمانی ارزیابی کنید که تغییر در یک متغیر با تغییر متناسب در متغیر دیگر همراه باشد. به زبان ساده، همبستگی پیرسون به این سوال پاسخ می‌دهد: آیا داده‌ها را می‌توان در a نشان داد؟خط؟

    در آمار، این محبوب ترین نوع همبستگی است، و اگر با یک "ضریب همبستگی" بدون شرایط بیشتر سر و کار دارید، به احتمال زیاد پیرسون است.

    در اینجا ضریب همبستگی است. رایج ترین فرمول مورد استفاده برای یافتن ضریب همبستگی پیرسون که Pearson's R نیز نامیده می شود:

    گاهی ممکن است با دو فرمول دیگر برای محاسبه ضریب همبستگی نمونه روبرو شوید. (r) و ضریب همبستگی جمعیت (ρ).

    نحوه انجام همبستگی پیرسون در اکسل

    محاسبه ضریب همبستگی پیرسون با دست به ریاضیات بسیار زیادی نیاز دارد. . خوشبختانه، مایکروسافت اکسل همه چیز را بسیار ساده کرده است. بسته به مجموعه داده‌ها و هدفتان، می‌توانید از یکی از تکنیک‌های زیر استفاده کنید:

    • ضریب همبستگی پیرسون را با تابع CORREL بیابید.
    • یک ماتریس همبستگی ایجاد کنید. انجام تجزیه و تحلیل داده ها.
    • ضرایب همبستگی چندگانه را با یک فرمول پیدا کنید.
    • یک نمودار همبستگی ترسیم کنید تا نمایش بصری رابطه داده ها را بدست آورید.

    چگونه محاسبه کنیم ضریب همبستگی در اکسل

    برای محاسبه ضریب همبستگی با دست، باید از این فرمول طولانی استفاده کنید. برای یافتن ضریب همبستگی در اکسل، از تابع CORREL یا PEARSON استفاده کنید و نتیجه را در کسری از ثانیه بدست آورید.

    تابع CORREL اکسل

    تابع CORREL مقدار را برمی گرداند.ضریب همبستگی پیرسون برای دو مجموعه از مقادیر. نحو آن بسیار آسان و ساده است:

    CORREL(array1, array2)

    Where:

    • Array1 اولین محدوده مقادیر است.
    • Array2 دومین محدوده مقادیر است.

    دو آرایه باید طول مساوی داشته باشند.

    با فرض اینکه مجموعه ای از متغیرهای مستقل داشته باشیم ( x ) در B2:B13 و متغیرهای وابسته (y) در C2:C13، فرمول ضریب همبستگی ما به شرح زیر است:

    =CORREL(B2:B13, C2:C13)

    یا، می‌توانیم محدوده‌ها را عوض کنیم و همچنان همین نتیجه را دریافت کنید:

    =CORREL(C2:C13, B2:B13)

    در هر صورت، فرمول یک همبستگی منفی قوی (حدود 0.97-) بین میانگین دمای ماهانه و تعداد بخاری های فروخته شده را نشان می دهد:

    3 نکته که باید در مورد تابع CORREL در اکسل بدانید

    برای محاسبه موفقیت آمیز ضریب همبستگی در اکسل، لطفاً این 3 واقعیت ساده را در نظر داشته باشید:

    • اگر یک یا چند سلول در یک آرایه حاوی متن، مقادیر منطقی یا خالی است، چنین سلول هایی نادیده گرفته می شوند. سلول‌های با مقادیر صفر محاسبه می‌شوند.
    • اگر آرایه‌های ارائه‌شده طول‌های متفاوتی داشته باشند، یک خطای #N/A برگردانده می‌شود.
    • اگر هر یک از آرایه‌ها خالی باشد یا انحراف استاندارد مقادیر آنها برابر با صفر است، یک #DIV/0! خطا رخ می دهد.

    عملکرد Excel PEARSON

    عملکرد PEARSON در اکسل همین کار را می کند - ضریب همبستگی لحظه محصول پیرسون را محاسبه می کند.

    PEARSON(array1,array2)

    Where:

    • Array1 محدوده‌ای از مقادیر مستقل است.
    • Array2 محدوده‌ای از مقادیر وابسته است.

    از آنجایی که PEARSON و CORREL هر دو ضریب همبستگی خطی پیرسون را محاسبه می‌کنند، نتایج آنها باید مطابقت داشته باشد و معمولاً در نسخه‌های اخیر Excel 2007 تا Excel 2019 این کار را انجام می‌دهند.

    در Excel 2003 و با این حال، در نسخه های قبلی، عملکرد PEARSON ممکن است برخی از خطاهای گرد کردن را نشان دهد. بنابراین، در نسخه‌های قدیمی‌تر، توصیه می‌شود از CORREL در اولویت به PEARSON استفاده شود.

    در مجموعه داده‌های نمونه ما، هر دو تابع نتایج یکسانی را نشان می‌دهند:

    =CORREL(B2:B13, C2:C13)

    =PEARSON(B2:B13, C2:C13)

    نحوه ایجاد یک ماتریس همبستگی در اکسل با تجزیه و تحلیل داده ها

    زمانی که شما نیاز به آزمایش روابط متقابل بین بیش از دو متغیر دارید، منطقی است که یک ماتریس همبستگی بسازید که گاهی اوقات <1 نامیده می شود>ضریب همبستگی چندگانه .

    ماتریس همبستگی جدولی است که ضرایب همبستگی بین متغیرها را در محل تقاطع سطرها و ستون های مربوطه نشان می دهد.

    ماتریس همبستگی در اکسل با استفاده از ابزار Correlation از افزونه Analysis ToolPak ساخته شده است. این افزونه در تمام نسخه های اکسل 2003 تا اکسل 2019 موجود است، اما به طور پیش فرض فعال نیست. اگر هنوز آن را فعال نکرده اید، لطفاً با دنبال کردن مراحل توضیح داده شده در نحوه فعال کردن بسته ابزار تجزیه و تحلیل داده در اکسل، این کار را اکنون انجام دهید.

    باابزارهای تجزیه و تحلیل داده‌ها که به نوار اکسل شما اضافه شده است، آماده هستید تا تجزیه و تحلیل همبستگی را اجرا کنید:

    1. در گوشه سمت راست بالای برگه داده > Analysis گروه، روی دکمه تجزیه و تحلیل داده ها کلیک کنید.
    2. در کادر محاوره ای تجزیه و تحلیل داده ، Correlation را انتخاب کرده و OK را کلیک کنید.
    3. در کادر همبستگی ، پارامترها را به این صورت پیکربندی کنید:
      • در کادر Input Range کلیک کنید و محدوده را با داده‌های منبع شما، از جمله سرصفحه‌های ستون (در مورد ما B1:D13).
      • در بخش گروه‌بندی شده بر اساس ، مطمئن شوید که کادر رادیویی ستون‌ها انتخاب شده است (داده شده است). که داده‌های منبع شما در ستون‌ها گروه‌بندی می‌شوند).
      • اگر محدوده انتخاب‌شده حاوی سرصفحه‌های ستون است، کادر برچسب‌های ردیف اول را انتخاب کنید.
      • گزینه خروجی مورد نظر را انتخاب کنید. برای داشتن ماتریس در همان صفحه، Output Range را انتخاب کنید و مرجع به سمت چپ ترین سلولی که ماتریس باید در آن خروجی قرار گیرد را مشخص کنید (A15 در این مثال).

    پس از اتمام، روی دکمه OK کلیک کنید:

    ماتریس ضرایب همبستگی شما تمام شده است و باید چیزی شبیه به نشان داده شده در بخش بعدی باشد.

    تفسیر نتایج تحلیل همبستگی

    در ماتریس همبستگی اکسل خود، می توانید ضرایب را در محل تلاقی سطرها و ستون ها پیدا کنید. اگر مختصات ستون و ردیف یکسان باشد، مقدار 1 خروجی می شود.

    در بالابه عنوان مثال، ما علاقه مندیم که همبستگی بین متغیر وابسته (تعداد بخاری های فروخته شده) و دو متغیر مستقل (میانگین دمای ماهانه و هزینه تبلیغات) را بدانیم. بنابراین، ما فقط به اعداد در تقاطع این سطرها و ستون‌ها نگاه می‌کنیم که در تصویر زیر مشخص شده‌اند:

    ضریب منفی 0.97- (به 2 رقم اعشار گرد شده) یک همبستگی معکوس قوی بین دمای ماهانه و فروش بخاری - با افزایش دما، بخاری های کمتری فروخته می شود.

    ضریب مثبت 0.97 (به 2 رقم اعشار گرد شده) نشان دهنده ارتباط مستقیم قوی بین بودجه تبلیغات و فروش است - بیشتر پولی که برای تبلیغات خرج می کنید، فروش بالاتری خواهید داشت.

    نحوه انجام تجزیه و تحلیل همبستگی چندگانه در اکسل با فرمول ها

    ساخت جدول همبستگی با ابزار تجزیه و تحلیل داده ها آسان است. با این حال، آن ماتریس ثابت است، به این معنی که شما باید هر بار که داده های منبع تغییر می کند، تجزیه و تحلیل همبستگی را دوباره اجرا کنید.

    خبر خوب این است که شما به راحتی می توانید یک جدول همبستگی مشابه را خودتان بسازید و آن ماتریس به طور خودکار به روز می شود. با هر تغییر در مقادیر منبع.

    برای انجام آن، از این فرمول عمومی استفاده کنید:

    CORREL(OFFSET( first_variable_range , 0, ROWS($1:1)-1) , OFFSET( first_variable_range , 0, COLUMNS($A:A)-1))

    نکته مهم! برای اینکه فرمول کار کند، باید قفل کنیداولین محدوده متغیر با استفاده از مراجع سلول مطلق.

    در مورد ما، اولین محدوده متغیر $B$2:$B$13 است (لطفاً به علامت $ توجه کنید که مرجع را قفل می کند)، و فرمول همبستگی ما این را می گیرد. shape:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    با فرمول آماده، بیایید یک ماتریس همبستگی بسازیم:

    1. در اولین سطر و ستون اول ماتریس، متغیرها را تایپ کنید. برچسب‌ها به همان ترتیبی که در جدول منبع شما ظاهر می‌شوند (لطفاً به تصویر زیر مراجعه کنید).
    2. فرمول بالا را در سمت چپ ترین سلول (در مورد ما B16) وارد کنید.
    3. فرمول را بکشید. پایین و به سمت راست برای کپی کردن آن به تعداد سطر و ستون مورد نیاز (3 سطر و 3 ستون در مثال ما).

    در نتیجه، ماتریس زیر را با همبستگی چندگانه داریم. ضرایب لطفاً توجه داشته باشید که ضرایب برگردانده شده توسط فرمول ما دقیقاً مشابه خروجی اکسل در مثال قبلی است (ضرایب مربوطه برجسته شده اند):

    این فرمول چگونه کار می کند

    همانطور که قبلاً می دانید، تابع اکسل CORREL ضریب همبستگی را برای دو مجموعه از متغیرهایی که شما مشخص کرده اید برمی گرداند. چالش اصلی تامین محدوده های مناسب در سلول های مربوطه ماتریس است. برای این، شما فقط اولین محدوده متغیر را در فرمول وارد می‌کنید و از توابع زیر برای انجام تنظیمات لازم استفاده می‌کنید:

    • OFFSET - محدوده‌ای را برمی‌گرداند که تعداد مشخصی از ردیف‌ها و ستون‌ها باشد.

    مایکل براون یک علاقه‌مند به فناوری است که علاقه زیادی به ساده‌سازی فرآیندهای پیچیده با استفاده از ابزارهای نرم‌افزاری دارد. او با بیش از یک دهه تجربه در صنعت فناوری، مهارت های خود را در Microsoft Excel و Outlook و همچنین Google Sheets و Docs تقویت کرده است. وبلاگ مایکل اختصاص داده شده است تا دانش و تخصص خود را با دیگران به اشتراک بگذارد و نکات و آموزش هایی را برای بهبود بهره وری و کارایی ارائه دهد. چه یک حرفه ای با تجربه باشید و چه مبتدی، وبلاگ مایکل، بینش های ارزشمند و توصیه های عملی را برای استفاده حداکثری از این ابزارهای نرم افزاری ضروری ارائه می دهد.