فهرست مطالب
این آموزش اصول همبستگی را در اکسل توضیح می دهد، نحوه محاسبه ضریب همبستگی، ساخت ماتریس همبستگی و تفسیر نتایج را نشان می دهد.
یکی از ساده ترین محاسبات آماری که می توانید در اکسل انجام دهید همبستگی است. اگرچه ساده است، اما در درک روابط بین دو یا چند متغیر بسیار مفید است. مایکروسافت اکسل تمام ابزارهای لازم برای اجرای تجزیه و تحلیل همبستگی را فراهم می کند، فقط باید بدانید که چگونه از آنها استفاده کنید.
همبستگی در اکسل - اصول اولیه
همبستگی معیاری است که قدرت و جهت رابطه بین دو متغیر را توصیف می کند. معمولاً در آمار، اقتصاد و علوم اجتماعی برای بودجه، طرحهای تجاری و موارد مشابه استفاده میشود.
روش مورد استفاده برای بررسی میزان ارتباط نزدیک متغیرها تحلیل همبستگی نامیده میشود.
در اینجا چند نمونه از همبستگی قوی آورده شده است:
- تعداد کالری که می خورید و وزن شما (همبستگی مثبت)
- دمای بیرون و صورت حساب گرمایشی شما ( همبستگی منفی)
و در اینجا نمونه هایی از داده هایی که همبستگی ضعیف یا بدون همبستگی دارند:
- نام گربه شما و غذای مورد علاقه آنها
- رنگ گربه چشمان و قد شما
یک چیز ضروری برای درک همبستگی این است که فقط نشان می دهد که دو متغیر چقدر به هم نزدیک هستند. با این حال، همبستگی دلالت ندارداز یک محدوده مشخص.
برای درک بهتر منطق، بیایید ببینیم که چگونه فرمول ضرایب برجسته شده در تصویر بالا را محاسبه می کند.
ابتدا، اجازه دهید فرمول B18 را بررسی کنید، که همبستگی بین دمای ماهانه (B2:B13) و بخاری های فروخته شده (D2:D13) را پیدا می کند:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))
در اولین تابع OFFSET، ROWS($1: 1) به ROWS ($1:3) تبدیل شده است زیرا مختصات دوم نسبی است، بنابراین بر اساس موقعیت نسبی ردیفی که فرمول در آن کپی می شود (2 ردیف پایین) تغییر می کند. بنابراین، ROWS() 3 را برمیگرداند، که از آن 1 کم میکنیم، و محدودهای به دست میآوریم که 2 ستون در سمت راست محدوده منبع است، یعنی $D$2:$D$13 (فروش بخاری).
OFFSET دوم محدوده مشخص شده $B$2:$B$13 (دما) را تغییر نمی دهد زیرا COLUMNS($A:A)-1 صفر را برمی گرداند.
در نتیجه، فرمول طولانی ما به یک CORREL ساده تبدیل می شود( $D$2:$D$13, $B$2:$B$13) و دقیقاً ضریب مورد نظر ما را برمیگرداند.
فرمول موجود در C18 که ضریب همبستگی را برای هزینه تبلیغات (C2:C13) و فروش (C2:C13) محاسبه میکند. D2:D13) به روشی مشابه کار می کند:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))
اولین تابع OFFSETکاملاً مشابه آنچه در بالا توضیح داده شد، بازگرداندن محدوده $D$2:$D$13 (فروش بخاری).
در OFFSET دوم، COLUMNS($A:A)-1 به COLUMNS($A: B)-1 زیرا ما ستون فرمول 1 را در سمت راست کپی کرده ایم. در نتیجه، OFFSET محدودهای را دریافت میکند که 1 ستون در سمت راست محدوده منبع است، یعنی $C$2:$C$13 (هزینه تبلیغات).
نحوه ترسیم نمودار همبستگی در Excel
هنگام انجام همبستگی در اکسل، بهترین راه برای به دست آوردن یک نمایش بصری از روابط بین داده های خود، ترسیم طرح پراکندگی با Trendline است. به این صورت است:
- دو ستون با داده های عددی، از جمله سرصفحه ستون ها را انتخاب کنید. ترتیب ستون ها مهم است: متغیر مستقل باید در ستون سمت چپ باشد زیرا این ستون باید بر روی محور x رسم شود. متغیر وابسته باید در ستون سمت راست باشد زیرا در محور y رسم می شود.
- در تب Inset ، در Chats گروه، روی نماد نمودار Scatter کلیک کنید. با این کار بلافاصله یک نمودار پراکندگی XY در کاربرگ شما وارد می شود.
- هر نقطه داده در نمودار کلیک راست کرده و Add Trendline… را از منوی زمینه انتخاب کنید.
برای دستورالعمل های گام به گام دقیق، لطفاً ببینید:
- نحوه ایجاد نمودار پراکندگی در اکسل
- نحوه افزودن خط روند به نمودار اکسل
برای مجموعه داده های نمونه ما، نمودارهای همبستگی مانند تصویر زیر هستند.علاوه بر این، مقدار R-squared را نمایش میدهیم که ضریب تعیین نیز نامیده میشود. این مقدار نشان میدهد که خط روند چقدر با دادهها مطابقت دارد - هر چه R2 به 1 نزدیکتر باشد، تناسب بهتری دارد.
از مقدار R2 که در نمودار پراکندگی شما نمایش داده میشود، میتوانید به راحتی ضریب همبستگی را محاسبه کنید:
20>
به عنوان مثال، مقدار R2 در نمودار دوم 0.9174339392 است. بنابراین، می توانید ضریب همبستگی تبلیغات و هیترهای فروخته شده را با یکی از این فرمولها پیدا کنید:
=SQRT(0.9174339392)
=0.9174339392^0.5
همانطور که می توانید مطمئن شوید، ضرایب محاسبه شده به این روش کاملاً با ضرایب همبستگی موجود در مثال های قبلی مطابقت دارد، به جز علامت :
مشکلات احتمالی همبستگی در اکسل
همبستگی لحظه محصول پیرسون فقط یک رابطه خطی بین دو متغیر را آشکار می کند. به این معنی که متغیرهای شما ممکن است به شکلی دیگر، منحنی خطی، به شدت مرتبط باشند و همچنان ضریب همبستگی آنها برابر یا نزدیک به صفر باشد.
همبستگی پیرسون قادر به این نیست.متغیرهای وابسته و مستقل را تشخیص دهید. به عنوان مثال، هنگام استفاده از تابع CORREL برای یافتن ارتباط بین میانگین دمای ماهانه و تعداد بخاری های فروخته شده، ضریب 0.97- را دریافت کردیم که نشان دهنده همبستگی منفی بالا است. با این حال، می توانید متغیرها را تغییر دهید و همان نتیجه را بگیرید. بنابراین، ممکن است کسی به این نتیجه برسد که فروش بیشتر بخاری باعث کاهش دما می شود، که بدیهی است که منطقی نیست. بنابراین، هنگام اجرای تجزیه و تحلیل همبستگی در اکسل، از داده هایی که ارائه می کنید آگاه باشید.
علاوه بر این، همبستگی پیرسون به پرت بسیار حساس است. اگر یک یا چند نقطه داده دارید که تفاوت زیادی با بقیه داده ها دارد، ممکن است تصویری تحریف شده از رابطه بین متغیرها دریافت کنید. در این مورد، عاقلانه است که به جای آن از همبستگی رتبه اسپیرمن استفاده کنید.
این نحوه انجام همبستگی در اکسل است. برای مشاهده دقیقتر نمونههای مورد بحث در این آموزش، میتوانید نمونه کار ما را در زیر دانلود کنید. از خواندن شما سپاسگزارم و امیدوارم هفته آینده شما را در وبلاگ خود ببینم!
کتاب کار تمرین
محاسبه همبستگی در اکسل (فایل xlsx.)
<3علیت این واقعیت که تغییرات در یک متغیر با تغییرات متغیر دیگر همراه است به این معنی نیست که یک متغیر در واقع باعث تغییر دیگری می شود.اگر علاقه مند به یادگیری علیت و پیش بینی هستید، یک قدم به جلو بردارید. و تحلیل رگرسیون خطی انجام دهید.
ضریب همبستگی در اکسل - تفسیر همبستگی
معیار عددی میزان ارتباط بین دو متغیر پیوسته ضریب همبستگی نامیده می شود. r).
مقدار ضریب همیشه بین 1- و 1 است و قدرت و جهت رابطه خطی بین متغیرها را اندازه گیری می کند.
قدرت
بزرگتر قدر مطلق ضریب، رابطه قوی تر است:
- مقادیر شدید 1- و 1 نشان دهنده یک رابطه خطی کامل زمانی است که تمام نقاط داده روی یک خط قرار می گیرند. در عمل، یک همبستگی کامل، مثبت یا منفی، به ندرت مشاهده می شود.
- ضریب 0 نشان دهنده عدم وجود رابطه خطی بین متغیرها است. این چیزی است که احتمالاً با دو مجموعه از اعداد تصادفی به دست می آورید.
- مقادیر بین 0 و 1/-1 مقیاسی از روابط ضعیف، متوسط و قوی را نشان می دهد. هر چه r به 1- یا 1 نزدیک تر می شود، قدرت رابطه افزایش می یابد.
جهت
علامت ضریب (به علاوه یا منفی) نشان دهنده جهت ازرابطه.
- مثبت ضرایب نشان دهنده همبستگی مستقیم است و شیب رو به بالا روی نمودار ایجاد می کند - با افزایش یک متغیر متغیر دیگر افزایش می یابد و بالعکس.
- ضرایب منفی نشان دهنده همبستگی معکوس هستند و یک شیب رو به پایین در نمودار ایجاد می کنند - با افزایش یک متغیر، متغیر دیگر تمایل به کاهش دارد.
برای درک بهتر، لطفاً نگاهی به نمودارهای همبستگی زیر:
- ضریب 1 به معنای یک رابطه مثبت کامل است - با افزایش یک متغیر، متغیر دیگر به نسبت افزایش می یابد.
- ضریب -1 به معنی یک رابطه منفی کامل است - با افزایش یک متغیر، متغیر دیگر به نسبت کاهش می یابد.
- ضریب 0 به معنای عدم رابطه بین دو متغیر است - نقاط داده عبارتند از در سراسر نمودار پراکنده شده است.
همبستگی پیرسون
در آمار، بسته به نوع داده ای که با آنها کار می کنید، انواع مختلفی از همبستگی را اندازه گیری می کنند. در این آموزش، ما بر روی رایج ترین آنها تمرکز خواهیم کرد.
Pearson Correlation ، نام کامل آن Pearson Product Moment Correlation (PPMC) است، برای روابط خطی بین داده ها را زمانی ارزیابی کنید که تغییر در یک متغیر با تغییر متناسب در متغیر دیگر همراه باشد. به زبان ساده، همبستگی پیرسون به این سوال پاسخ میدهد: آیا دادهها را میتوان در a نشان داد؟خط؟
در آمار، این محبوب ترین نوع همبستگی است، و اگر با یک "ضریب همبستگی" بدون شرایط بیشتر سر و کار دارید، به احتمال زیاد پیرسون است.
در اینجا ضریب همبستگی است. رایج ترین فرمول مورد استفاده برای یافتن ضریب همبستگی پیرسون که Pearson's R نیز نامیده می شود:
گاهی ممکن است با دو فرمول دیگر برای محاسبه ضریب همبستگی نمونه روبرو شوید. (r) و ضریب همبستگی جمعیت (ρ).
نحوه انجام همبستگی پیرسون در اکسل
محاسبه ضریب همبستگی پیرسون با دست به ریاضیات بسیار زیادی نیاز دارد. . خوشبختانه، مایکروسافت اکسل همه چیز را بسیار ساده کرده است. بسته به مجموعه دادهها و هدفتان، میتوانید از یکی از تکنیکهای زیر استفاده کنید:
- ضریب همبستگی پیرسون را با تابع CORREL بیابید.
- یک ماتریس همبستگی ایجاد کنید. انجام تجزیه و تحلیل داده ها.
- ضرایب همبستگی چندگانه را با یک فرمول پیدا کنید.
- یک نمودار همبستگی ترسیم کنید تا نمایش بصری رابطه داده ها را بدست آورید.
چگونه محاسبه کنیم ضریب همبستگی در اکسل
برای محاسبه ضریب همبستگی با دست، باید از این فرمول طولانی استفاده کنید. برای یافتن ضریب همبستگی در اکسل، از تابع CORREL یا PEARSON استفاده کنید و نتیجه را در کسری از ثانیه بدست آورید.
تابع CORREL اکسل
تابع CORREL مقدار را برمی گرداند.ضریب همبستگی پیرسون برای دو مجموعه از مقادیر. نحو آن بسیار آسان و ساده است:
CORREL(array1, array2)Where:
- Array1 اولین محدوده مقادیر است.
- Array2 دومین محدوده مقادیر است.
دو آرایه باید طول مساوی داشته باشند.
با فرض اینکه مجموعه ای از متغیرهای مستقل داشته باشیم ( x ) در B2:B13 و متغیرهای وابسته (y) در C2:C13، فرمول ضریب همبستگی ما به شرح زیر است:
=CORREL(B2:B13, C2:C13)
یا، میتوانیم محدودهها را عوض کنیم و همچنان همین نتیجه را دریافت کنید:
=CORREL(C2:C13, B2:B13)
در هر صورت، فرمول یک همبستگی منفی قوی (حدود 0.97-) بین میانگین دمای ماهانه و تعداد بخاری های فروخته شده را نشان می دهد:
3 نکته که باید در مورد تابع CORREL در اکسل بدانید
برای محاسبه موفقیت آمیز ضریب همبستگی در اکسل، لطفاً این 3 واقعیت ساده را در نظر داشته باشید:
- اگر یک یا چند سلول در یک آرایه حاوی متن، مقادیر منطقی یا خالی است، چنین سلول هایی نادیده گرفته می شوند. سلولهای با مقادیر صفر محاسبه میشوند.
- اگر آرایههای ارائهشده طولهای متفاوتی داشته باشند، یک خطای #N/A برگردانده میشود.
- اگر هر یک از آرایهها خالی باشد یا انحراف استاندارد مقادیر آنها برابر با صفر است، یک #DIV/0! خطا رخ می دهد.
عملکرد Excel PEARSON
عملکرد PEARSON در اکسل همین کار را می کند - ضریب همبستگی لحظه محصول پیرسون را محاسبه می کند.
PEARSON(array1,array2)Where:
- Array1 محدودهای از مقادیر مستقل است.
- Array2 محدودهای از مقادیر وابسته است.
از آنجایی که PEARSON و CORREL هر دو ضریب همبستگی خطی پیرسون را محاسبه میکنند، نتایج آنها باید مطابقت داشته باشد و معمولاً در نسخههای اخیر Excel 2007 تا Excel 2019 این کار را انجام میدهند.
در Excel 2003 و با این حال، در نسخه های قبلی، عملکرد PEARSON ممکن است برخی از خطاهای گرد کردن را نشان دهد. بنابراین، در نسخههای قدیمیتر، توصیه میشود از CORREL در اولویت به PEARSON استفاده شود.
در مجموعه دادههای نمونه ما، هر دو تابع نتایج یکسانی را نشان میدهند:
=CORREL(B2:B13, C2:C13)
=PEARSON(B2:B13, C2:C13)
نحوه ایجاد یک ماتریس همبستگی در اکسل با تجزیه و تحلیل داده ها
زمانی که شما نیاز به آزمایش روابط متقابل بین بیش از دو متغیر دارید، منطقی است که یک ماتریس همبستگی بسازید که گاهی اوقات <1 نامیده می شود>ضریب همبستگی چندگانه .
ماتریس همبستگی جدولی است که ضرایب همبستگی بین متغیرها را در محل تقاطع سطرها و ستون های مربوطه نشان می دهد.
ماتریس همبستگی در اکسل با استفاده از ابزار Correlation از افزونه Analysis ToolPak ساخته شده است. این افزونه در تمام نسخه های اکسل 2003 تا اکسل 2019 موجود است، اما به طور پیش فرض فعال نیست. اگر هنوز آن را فعال نکرده اید، لطفاً با دنبال کردن مراحل توضیح داده شده در نحوه فعال کردن بسته ابزار تجزیه و تحلیل داده در اکسل، این کار را اکنون انجام دهید.
باابزارهای تجزیه و تحلیل دادهها که به نوار اکسل شما اضافه شده است، آماده هستید تا تجزیه و تحلیل همبستگی را اجرا کنید:
- در گوشه سمت راست بالای برگه داده > Analysis گروه، روی دکمه تجزیه و تحلیل داده ها کلیک کنید.
- در کادر محاوره ای تجزیه و تحلیل داده ، Correlation را انتخاب کرده و OK را کلیک کنید.
- در کادر همبستگی ، پارامترها را به این صورت پیکربندی کنید:
- در کادر Input Range کلیک کنید و محدوده را با دادههای منبع شما، از جمله سرصفحههای ستون (در مورد ما B1:D13).
- در بخش گروهبندی شده بر اساس ، مطمئن شوید که کادر رادیویی ستونها انتخاب شده است (داده شده است). که دادههای منبع شما در ستونها گروهبندی میشوند).
- اگر محدوده انتخابشده حاوی سرصفحههای ستون است، کادر برچسبهای ردیف اول را انتخاب کنید.
- گزینه خروجی مورد نظر را انتخاب کنید. برای داشتن ماتریس در همان صفحه، Output Range را انتخاب کنید و مرجع به سمت چپ ترین سلولی که ماتریس باید در آن خروجی قرار گیرد را مشخص کنید (A15 در این مثال).
پس از اتمام، روی دکمه OK کلیک کنید:
ماتریس ضرایب همبستگی شما تمام شده است و باید چیزی شبیه به نشان داده شده در بخش بعدی باشد.
تفسیر نتایج تحلیل همبستگی
در ماتریس همبستگی اکسل خود، می توانید ضرایب را در محل تلاقی سطرها و ستون ها پیدا کنید. اگر مختصات ستون و ردیف یکسان باشد، مقدار 1 خروجی می شود.
در بالابه عنوان مثال، ما علاقه مندیم که همبستگی بین متغیر وابسته (تعداد بخاری های فروخته شده) و دو متغیر مستقل (میانگین دمای ماهانه و هزینه تبلیغات) را بدانیم. بنابراین، ما فقط به اعداد در تقاطع این سطرها و ستونها نگاه میکنیم که در تصویر زیر مشخص شدهاند:
ضریب منفی 0.97- (به 2 رقم اعشار گرد شده) یک همبستگی معکوس قوی بین دمای ماهانه و فروش بخاری - با افزایش دما، بخاری های کمتری فروخته می شود.
ضریب مثبت 0.97 (به 2 رقم اعشار گرد شده) نشان دهنده ارتباط مستقیم قوی بین بودجه تبلیغات و فروش است - بیشتر پولی که برای تبلیغات خرج می کنید، فروش بالاتری خواهید داشت.
نحوه انجام تجزیه و تحلیل همبستگی چندگانه در اکسل با فرمول ها
ساخت جدول همبستگی با ابزار تجزیه و تحلیل داده ها آسان است. با این حال، آن ماتریس ثابت است، به این معنی که شما باید هر بار که داده های منبع تغییر می کند، تجزیه و تحلیل همبستگی را دوباره اجرا کنید.
خبر خوب این است که شما به راحتی می توانید یک جدول همبستگی مشابه را خودتان بسازید و آن ماتریس به طور خودکار به روز می شود. با هر تغییر در مقادیر منبع.
برای انجام آن، از این فرمول عمومی استفاده کنید:
CORREL(OFFSET( first_variable_range , 0, ROWS($1:1)-1) , OFFSET( first_variable_range , 0, COLUMNS($A:A)-1))نکته مهم! برای اینکه فرمول کار کند، باید قفل کنیداولین محدوده متغیر با استفاده از مراجع سلول مطلق.
در مورد ما، اولین محدوده متغیر $B$2:$B$13 است (لطفاً به علامت $ توجه کنید که مرجع را قفل می کند)، و فرمول همبستگی ما این را می گیرد. shape:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))
با فرمول آماده، بیایید یک ماتریس همبستگی بسازیم:
- در اولین سطر و ستون اول ماتریس، متغیرها را تایپ کنید. برچسبها به همان ترتیبی که در جدول منبع شما ظاهر میشوند (لطفاً به تصویر زیر مراجعه کنید).
- فرمول بالا را در سمت چپ ترین سلول (در مورد ما B16) وارد کنید.
- فرمول را بکشید. پایین و به سمت راست برای کپی کردن آن به تعداد سطر و ستون مورد نیاز (3 سطر و 3 ستون در مثال ما).
در نتیجه، ماتریس زیر را با همبستگی چندگانه داریم. ضرایب لطفاً توجه داشته باشید که ضرایب برگردانده شده توسط فرمول ما دقیقاً مشابه خروجی اکسل در مثال قبلی است (ضرایب مربوطه برجسته شده اند):
این فرمول چگونه کار می کند
همانطور که قبلاً می دانید، تابع اکسل CORREL ضریب همبستگی را برای دو مجموعه از متغیرهایی که شما مشخص کرده اید برمی گرداند. چالش اصلی تامین محدوده های مناسب در سلول های مربوطه ماتریس است. برای این، شما فقط اولین محدوده متغیر را در فرمول وارد میکنید و از توابع زیر برای انجام تنظیمات لازم استفاده میکنید:
- OFFSET - محدودهای را برمیگرداند که تعداد مشخصی از ردیفها و ستونها باشد.