جدول المحتويات
يشرح البرنامج التعليمي أساسيات الارتباط في Excel ، ويوضح كيفية حساب معامل الارتباط ، وبناء مصفوفة الارتباط وتفسير النتائج.
الارتباط هو أحد أبسط العمليات الحسابية الإحصائية التي يمكنك إجراؤها في Excel. على الرغم من بساطتها ، إلا أنها مفيدة جدًا في فهم العلاقات بين متغيرين أو أكثر. يوفر Microsoft Excel جميع الأدوات اللازمة لتشغيل تحليل الارتباط ، ما عليك سوى معرفة كيفية استخدامها.
الارتباط في Excel - الأساسيات
الارتباط هو مقياس يصف قوة واتجاه العلاقة بين متغيرين. يستخدم بشكل شائع في الإحصاء والاقتصاد والعلوم الاجتماعية للميزانيات وخطط الأعمال وما شابه.
تسمى الطريقة المستخدمة لدراسة مدى ارتباط المتغيرات تحليل الارتباط .
فيما يلي بعض الأمثلة على الارتباط القوي:
- عدد السعرات الحرارية التي تتناولها ووزنك (ارتباط إيجابي)
- درجة الحرارة في الخارج وفواتير التدفئة ( ارتباط سلبي)
وهنا أمثلة البيانات التي لها ارتباط ضعيف أو ليس لها ارتباط:
- اسم قطتك وطعامها المفضل
- لون عينيك وطولك
من الأمور الأساسية التي يجب فهمها حول الارتباط أنه يظهر فقط مدى ارتباط متغيرين. الارتباط ، ومع ذلك ، لا يعنيمن نطاق محدد.
لفهم المنطق بشكل أفضل ، دعنا نرى كيف تحسب الصيغة المعاملات الموضحة في لقطة الشاشة أعلاه.
أولاً ، دعنا افحص الصيغة في B18 ، والتي تجد الارتباط بين درجة الحرارة الشهرية (B2: B13) والسخانات المباعة (D2: D13):
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))
في أول دالة OFFSET ، ROWS ($ 1: 1) إلى ROWS ($ 1: 3) لأن الإحداثي الثاني نسبي ، لذلك يتغير بناءً على الموضع النسبي للصف حيث يتم نسخ الصيغة (صفان لأسفل). وبالتالي ، تُرجع ROWS () 3 ، والتي نطرح منها 1 ، ونحصل على نطاق يتكون من عمودين إلى يمين نطاق المصدر ، أي $ D $ 2: $ D $ 13 (مبيعات المدفأة).
لا يغير OFFSET الثاني النطاق المحدد $ B $ 2: $ B $ 13 (درجة الحرارة) لأن COLUMNS ($ A: A) -1 تُرجع صفرًا.
نتيجة لذلك ، تتحول صيغتنا الطويلة إلى CORREL بسيط ( $ D $ 2: $ D $ 13، $ B $ 2: $ B $ 13) وإرجاع المعامل الذي نريده بالضبط.
الصيغة في C18 التي تحسب معامل الارتباط لتكلفة الإعلان (C2: C13) والمبيعات ( D2: D13) يعمل بطريقة مماثلة:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))
أول دالة OFFSET هيتمامًا كما هو موضح أعلاه ، يتم إرجاع النطاق $ D $ 2: $ D $ 13 (مبيعات السخان).
في OFFSET الثاني ، الأعمدة ($ A: A) -1 يتغير إلى الأعمدة ($ A: ب) -1 لأننا قمنا بنسخ عمود الصيغة 1 إلى اليمين. وبالتالي ، يحصل OFFSET على نطاق يتكون من عمود واحد إلى يمين النطاق المصدر ، أي $ C $ 2: $ C $ 13 (تكلفة الإعلان).
كيفية رسم رسم بياني للارتباط في Excel
عند إجراء الارتباط في Excel ، فإن أفضل طريقة للحصول على تمثيل مرئي للعلاقات بين بياناتك هي رسم مخطط مبعثر بخط اتجاه . وإليك الطريقة:
- حدد عمودين ببيانات رقمية ، بما في ذلك رؤوس الأعمدة. ترتيب الأعمدة مهم: يجب أن يكون المتغير المستقل في العمود الأيسر حيث سيتم رسم هذا العمود على المحور x ؛ يجب أن يكون المتغير التابع في العمود الأيمن حيث سيتم رسمه على المحور y.
- في علامة التبويب Inset ، في الدردشات المجموعة ، انقر فوق رمز الرسم البياني مبعثر . سيؤدي هذا على الفور إلى إدراج مخطط XY المبعثر في ورقة العمل الخاصة بك.
- انقر بزر الماوس الأيمن فوق أي نقطة بيانات في المخطط واختر إضافة خط اتجاه ... من قائمة السياق.
للحصول على إرشادات مفصلة خطوة بخطوة ، يرجى الاطلاع على:
- كيفية إنشاء مخطط مبعثر في Excel
- كيفية إضافة خط اتجاه إلى مخطط Excel
بالنسبة لمجموعة البيانات النموذجية الخاصة بنا ، تبدو الرسوم البيانية للارتباط كما هو موضح في الصورة أدناه.بالإضافة إلى ذلك ، عرضنا قيمة R التربيعية ، وتسمى أيضًا معامل التحديد . تشير هذه القيمة إلى مدى توافق خط الاتجاه مع البيانات - كلما اقتربنا من R2 إلى 1 ، كان الملاءمة أفضل.
من قيمة R2 المعروضة في مخطط التشتت ، يمكنك بسهولة حساب معامل الارتباط:
- للحصول على دقة أفضل ، اجعل Excel يعرض عددًا أكبر من الأرقام في قيمة R-squared أكثر مما يفعل افتراضيًا.
- انقر فوق قيمة R2 على الرسم البياني ، وحددها باستخدام الماوس ، واضغط على Ctrl + C لنسخه.
- احصل على الجذر التربيعي لـ R2 إما باستخدام وظيفة SQRT أو عن طريق رفع قيمة R2 المنسوخة إلى قوة 0.5.
على سبيل المثال ، قيمة R2 في الرسم البياني الثاني هي 0.9174339392. لذلك ، يمكنك العثور على معامل الارتباط لـ الإعلان و السخانات المباعة بإحدى هذه الصيغ:
=SQRT(0.9174339392)
=0.9174339392^0.5
كما يمكنك التأكد ، فإن المعاملات المحسوبة بهذه الطريقة تتماشى تمامًا مع معاملات الارتباط الموجودة في الأمثلة السابقة ، باستثناء العلامة :
المشكلات المحتملة في الارتباط في Excel
ارتباط Pearson Product Moment يكشف فقط عن علاقة خطية بين المتغيرين. بمعنى ، قد تكون متغيراتك مرتبطة بقوة بطريقة أخرى ، منحنية الخطوط ، ولا يزال معامل الارتباط يساوي الصفر أو قريبًا منه.
ارتباط بيرسون غير قادر علىتمييز المتغيرات المستقلة التابعة و المستقلة . على سبيل المثال ، عند استخدام دالة CORREL للعثور على الارتباط بين متوسط درجة الحرارة الشهرية وعدد السخانات المباعة ، حصلنا على معامل -0.97 ، مما يشير إلى وجود ارتباط سلبي كبير. ومع ذلك ، يمكنك التبديل بين المتغيرات والحصول على نفس النتيجة. لذلك ، قد يستنتج شخص ما أن ارتفاع مبيعات السخان يؤدي إلى انخفاض درجة الحرارة ، وهو أمر لا معنى له بوضوح. لذلك ، عند تشغيل تحليل الارتباط في Excel ، كن على دراية بالبيانات التي توفرها.
علاوة على ذلك ، فإن ارتباط Pearson حساس جدًا لـ القيم المتطرفة . إذا كانت لديك نقطة بيانات واحدة أو أكثر تختلف اختلافًا كبيرًا عن باقي البيانات ، فقد تحصل على صورة مشوهة للعلاقة بين المتغيرات. في هذه الحالة ، سيكون من الحكمة استخدام ارتباط رتبة سبيرمان بدلاً من ذلك.
هذه هي طريقة عمل الارتباط في Excel. لإلقاء نظرة فاحصة على الأمثلة التي تمت مناقشتها في هذا البرنامج التعليمي ، يمكنك تنزيل نموذج المصنف أدناه. أشكركم على القراءة وآمل أن أراكم على مدونتنا الأسبوع المقبل!
التمرين التدريبي
حساب الارتباط في Excel (ملف .xlsx)
التسبب بالشىء. حقيقة أن التغييرات في أحد المتغيرات مرتبطة بالتغييرات في المتغير الآخر لا تعني أن أحد المتغيرات يتسبب في الواقع في تغيير الآخر.إذا كنت مهتمًا بمعرفة السببية وإجراء التنبؤات ، فقم باتخاذ خطوة للأمام وأداء تحليل الانحدار الخطي.
معامل الارتباط في Excel - تفسير الارتباط
يسمى المقياس العددي لدرجة الارتباط بين متغيرين مستمرين معامل الارتباط ( r).
قيمة المعامل تكون دائمًا بين -1 و 1 وهي تقيس كلاً من قوة واتجاه العلاقة الخطية بين المتغيرات.
القوة
الأكبر القيمة المطلقة للمعامل ، أقوى العلاقة:
- تشير القيم القصوى لـ -1 و 1 إلى علاقة خطية مثالية عندما تقع جميع نقاط البيانات على خط. من الناحية العملية ، نادراً ما يتم ملاحظة الارتباط التام ، سواء كان موجباً أو سلبياً.
- يشير المعامل 0 إلى عدم وجود علاقة خطية بين المتغيرات. هذا ما من المحتمل أن تحصل عليه بمجموعتين من الأرقام العشوائية.
- تمثل القيم بين 0 و + 1 / -1 مقياسًا للعلاقات الضعيفة والمتوسطة والقوية. كلما اقترب r من -1 أو 1 ، تزداد قوة العلاقة.
الاتجاه
تشير علامة المعامل (زائد أو ناقص) إلى اتجاهالعلاقة.
- المعاملات الموجبة تمثل ارتباطًا مباشرًا وتنتج ميلًا صاعدًا على الرسم البياني - حيث يزيد أحد المتغيرات وكذلك الآخر ، والعكس صحيح.
- تمثل المعاملات السلبية ارتباطًا عكسيًا وتنتج منحدرًا هبوطيًا على الرسم البياني - مع زيادة متغير واحد ، يميل المتغير الآخر إلى الانخفاض.
لفهم أفضل ، يرجى إلقاء نظرة على الرسوم البيانية للارتباط التالية:
- المعامل 1 يعني علاقة إيجابية مثالية - كلما زاد أحد المتغيرات ، زاد الآخر بشكل متناسب.
- معامل من -1 تعني علاقة سلبية كاملة - كلما زاد أحد المتغيرات ، يتناقص الآخر بشكل متناسب.
- يعني المعامل 0 عدم وجود علاقة بين متغيرين - نقاط البيانات هي متناثرة في جميع أنحاء الرسم البياني.
ارتباط بيرسون
في الإحصائيات ، يقيسون عدة أنواع من الارتباط اعتمادًا على نوع البيانات التي تعمل بها. في هذا البرنامج التعليمي ، سنركز على الأكثر شيوعًا.
ارتباط بيرسون ، الاسم الكامل هو ارتباط لحظة منتج بيرسون (PPMC) ، يستخدم في تقييم العلاقات الخطية بين البيانات عندما يرتبط تغيير في أحد المتغيرات بتغير نسبي في المتغير الآخر. بعبارات بسيطة ، يجيب ارتباط بيرسون على السؤال التالي: هل يمكن تمثيل البيانات في ملفالخط؟
في الإحصاء ، هو أكثر أنواع الارتباط شيوعًا ، وإذا كنت تتعامل مع "معامل الارتباط" دون مزيد من التأهيل ، فمن المرجح أن يكون بيرسون.
إليك الصيغة الأكثر شيوعًا للعثور على معامل ارتباط بيرسون ، وتسمى أيضًا Pearson R :
في بعض الأحيان ، قد تصادف صيغتين أخريين لحساب معامل ارتباط العينة (r) ومعامل ارتباط السكان (ρ).
كيفية عمل ارتباط Pearson في Excel
يتضمن حساب معامل ارتباط Pearson يدويًا قدرًا كبيرًا من الرياضيات . لحسن الحظ ، جعل Microsoft Excel الأمور بسيطة للغاية. اعتمادًا على مجموعة البيانات الخاصة بك وهدفك ، يمكنك استخدام إحدى الأساليب التالية:
- ابحث عن معامل ارتباط بيرسون مع دالة CORREL.
- أنشئ مصفوفة ارتباط بواسطة إجراء تحليل البيانات.
- البحث عن معاملات ارتباط متعددة باستخدام صيغة.
- ارسم مخطط ارتباط للحصول على التمثيل المرئي لعلاقة البيانات.
كيفية حساب معامل الارتباط في Excel
لحساب معامل الارتباط يدويًا ، يجب عليك استخدام هذه الصيغة المطولة. للعثور على معامل الارتباط في Excel ، استفد من دالة CORREL أو PEARSON واحصل على النتيجة في جزء من الثانية.
دالة Excel CORREL
ترجع الدالة CORRELمعامل ارتباط بيرسون لمجموعتين من القيم. تركيبها سهل ومباشر للغاية:
CORREL (array1، array2)حيث:
- Array1 هو النطاق الأول من القيم.
- Array2 هو النطاق الثاني للقيم.
يجب أن يكون للمصفوفتين طول متساوٍ.
بافتراض أن لدينا مجموعة من المتغيرات المستقلة ( x ) في B2: B13 والمتغيرات التابعة (y) في C2: C13 ، صيغة معامل الارتباط لدينا هي كما يلي:
=CORREL(B2:B13, C2:C13)
أو يمكننا تبديل النطاقات وما زلنا احصل على نفس النتيجة:
=CORREL(C2:C13, B2:B13)
في كلتا الحالتين ، تُظهر الصيغة ارتباطًا سلبيًا قويًا (حوالي -0.97) بين متوسط درجة الحرارة الشهرية وعدد السخانات المباعة:
3 أشياء يجب أن تعرفها عن وظيفة CORREL في Excel
لحساب معامل الارتباط في Excel بنجاح ، يرجى مراعاة هذه الحقائق الثلاث البسيطة:
- إذا كانت خلية واحدة أو أكثر في مصفوفة تحتوي على نص أو قيم منطقية أو فراغات ، يتم تجاهل هذه الخلايا ؛ يتم حساب الخلايا ذات القيم الصفرية.
- إذا كانت المصفوفات المتوفرة ذات أطوال مختلفة ، فسيتم إرجاع الخطأ # N / A.
- إذا كان أي من المصفوفتين فارغًا أو إذا كان الانحراف المعياري لـ قيمها تساوي الصفر ، # DIV / 0! حدث خطأ.
وظيفة Excel PEARSON
تقوم وظيفة PEARSON في Excel بنفس الشيء - تحسب معامل ارتباط Pearson Product Moment.
PEARSON (array1،array2)حيث:
- Array1 هو نطاق من القيم المستقلة.
- Array2 هو نطاق من القيم التابعة.
نظرًا لأن كل من PEARSON و CORREL يحسبان معامل الارتباط الخطي لبيرسون ، يجب أن تتفق نتائجهما ، ويتم ذلك عمومًا في الإصدارات الأخيرة من Excel 2007 حتى Excel 2019.
في Excel 2003 و الإصدارات السابقة ، ومع ذلك ، قد تعرض الدالة PEARSON بعض أخطاء التقريب. لذلك ، في الإصدارات القديمة ، يوصى باستخدام CORREL في التفضيل على PEARSON.
في مجموعة البيانات النموذجية لدينا ، تعرض كلتا الوظيفتين نفس النتائج:
=CORREL(B2:B13, C2:C13)
=PEARSON(B2:B13, C2:C13)
كيفية إنشاء مصفوفة ارتباط في Excel باستخدام تحليل البيانات
عندما تحتاج إلى اختبار العلاقات المتبادلة بين أكثر من متغيرين ، فمن المنطقي إنشاء مصفوفة ارتباط ، والتي تسمى أحيانًا معامل الارتباط المتعدد .
مصفوفة الارتباط هي جدول يوضح معاملات الارتباط بين المتغيرات عند تقاطع الصفوف والأعمدة المقابلة.
تم إنشاء مصفوفة الارتباط في Excel باستخدام أداة الارتباط من الوظيفة الإضافية Analysis ToolPak . تتوفر هذه الوظيفة الإضافية في كافة إصدارات Excel 2003 حتى Excel 2019 ، ولكن لا يتم تمكينها افتراضيًا. إذا لم تقم بتنشيطه بعد ، فالرجاء القيام بذلك الآن باتباع الخطوات الموضحة في كيفية تمكين Data Analysis ToolPak في Excel.
باستخدامتمت إضافة أدوات تحليل البيانات إلى شريط Excel ، فأنت على استعداد لتشغيل تحليل الارتباط:
- في الزاوية اليمنى العليا من علامة التبويب البيانات & gt ؛ التحليل المجموعة ، انقر فوق الزر تحليل البيانات .
- في مربع الحوار تحليل البيانات ، حدد الارتباط وانقر فوق موافق.
- في المربع الارتباط ، قم بتكوين المعلمات بهذه الطريقة:
- انقر في المربع نطاق الإدخال وحدد النطاق باستخدام بيانات المصدر ، بما في ذلك رؤوس الأعمدة (B1: D13 في حالتنا).
- في القسم مجمعة حسب ، تأكد من تحديد مربع الاختيار الأعمدة (معطى أن بيانات المصدر الخاصة بك مجمعة في أعمدة).
- حدد خانة الاختيار التسميات في الصف الأول إذا كان النطاق المحدد يحتوي على رؤوس أعمدة.
- اختر خيار الإخراج المطلوب. للحصول على المصفوفة في نفس الورقة ، حدد نطاق الإخراج وحدد المرجع إلى الخلية الموجودة في أقصى اليسار حيث سيتم إخراج المصفوفة (A15 في هذا المثال).
عند الانتهاء ، انقر فوق الزر موافق :
تم الانتهاء من مصفوفة معاملات الارتباط ويجب أن تبدو كما هو موضح في القسم التالي.
تفسير نتائج تحليل الارتباط
في مصفوفة ارتباط Excel ، يمكنك العثور على المعاملات عند تقاطع الصفوف والأعمدة. إذا كانت إحداثيات العمود والصف هي نفسها ، فإن القيمة 1 تكون ناتجة.
في ما سبقعلى سبيل المثال ، نحن مهتمون بمعرفة العلاقة بين المتغير التابع (عدد السخانات المباعة) ومتغيرين مستقلين (متوسط درجة الحرارة الشهرية وتكاليف الإعلان). لذلك ، ننظر فقط إلى الأرقام الموجودة عند تقاطع هذه الصفوف والأعمدة ، والتي تم تمييزها في لقطة الشاشة أدناه:
يُظهر المعامل السلبي -0.97 (مقربًا إلى منزلتين عشريتين) ارتباطًا عكسيًا قويًا بين مبيعات السخان ودرجات الحرارة الشهرية - مع ارتفاع درجة الحرارة ، يتم بيع عدد أقل من السخانات.
يشير المعامل الإيجابي البالغ 0.97 (مقربًا إلى منزلتين عشريتين) إلى وجود اتصال مباشر قوي بين ميزانية الإعلان والمبيعات - كلما زادت الأموال التي تنفقها على الإعلان ، زادت المبيعات.
كيفية إجراء تحليل الارتباط المتعدد في Excel باستخدام الصيغ
من السهل إنشاء جدول الارتباط باستخدام أداة تحليل البيانات. ومع ذلك ، فإن هذه المصفوفة ثابتة ، مما يعني أنك ستحتاج إلى تشغيل تحليل الارتباط من جديد في كل مرة تتغير فيها بيانات المصدر.
والخبر السار هو أنه يمكنك بسهولة إنشاء جدول ارتباط مماثل بنفسك ، وسيتم تحديث هذه المصفوفة تلقائيًا مع كل تغيير في قيم المصدر.
للقيام بذلك ، استخدم هذه الصيغة العامة:
ملاحظة مهمة! لكي تعمل الصيغة ، يجب عليك القفلالنطاق المتغير الأول باستخدام مراجع الخلية المطلقة.
في حالتنا ، النطاق المتغير الأول هو $ B $ 2: $ B $ 13 (يرجى ملاحظة علامة $ التي تغلق المرجع) ، وصيغة الارتباط لدينا تأخذ هذا الشكل:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))
مع الصيغة جاهزة ، دعنا نبني مصفوفة ارتباط:
- في الصف الأول والعمود الأول من المصفوفة ، اكتب المتغيرات ' التسميات بنفس الترتيب الذي تظهر به في جدول المصدر (يرجى الاطلاع على لقطة الشاشة أدناه).
- أدخل الصيغة أعلاه في الخلية الموجودة في أقصى اليسار (B16 في حالتنا).
- اسحب الصيغة لأسفل وإلى اليمين لنسخها إلى أي عدد من الصفوف والأعمدة حسب الحاجة (3 صفوف و 3 أعمدة في مثالنا).
نتيجة لذلك ، لدينا المصفوفة التالية ذات الارتباط المتعدد معاملات. يرجى ملاحظة أن المعاملات التي يتم إرجاعها بواسطة الصيغة الخاصة بنا هي بالضبط نفس الإخراج بواسطة Excel في المثال السابق (يتم تمييز المعاملات ذات الصلة):
كيف تعمل هذه الصيغة
كما تعلم بالفعل ، ترجع الدالة Excel CORREL معامل الارتباط لمجموعتين من المتغيرات التي تحددها. التحدي الرئيسي هو توفير النطاقات المناسبة في الخلايا المقابلة للمصفوفة. لهذا ، تقوم بإدخال النطاق المتغير الأول فقط في الصيغة واستخدام الوظائف التالية لإجراء التعديلات اللازمة:
- OFFSET - إرجاع نطاق يمثل عددًا معينًا من الصفوف والأعمدة