Συσχέτιση στο Excel: συντελεστής, πίνακας και γράφημα

  • Μοιραστείτε Αυτό
Michael Brown

Το σεμινάριο εξηγεί τα βασικά στοιχεία της συσχέτισης στο Excel, δείχνει πώς να υπολογίσετε έναν συντελεστή συσχέτισης, να δημιουργήσετε έναν πίνακα συσχέτισης και να ερμηνεύσετε τα αποτελέσματα.

Ένας από τους απλούστερους στατιστικούς υπολογισμούς που μπορείτε να κάνετε στο Excel είναι η συσχέτιση. Αν και απλή, είναι πολύ χρήσιμη για την κατανόηση των σχέσεων μεταξύ δύο ή περισσότερων μεταβλητών. Το Microsoft Excel παρέχει όλα τα απαραίτητα εργαλεία για την εκτέλεση της ανάλυσης συσχέτισης, απλώς πρέπει να γνωρίζετε πώς να τα χρησιμοποιείτε.

    Συσχέτιση στο Excel - τα βασικά

    Συσχέτιση είναι ένα μέτρο που περιγράφει την ισχύ και την κατεύθυνση μιας σχέσης μεταξύ δύο μεταβλητών. Χρησιμοποιείται συνήθως στη στατιστική, τα οικονομικά και τις κοινωνικές επιστήμες για προϋπολογισμούς, επιχειρηματικά σχέδια και άλλα παρόμοια.

    Η μέθοδος που χρησιμοποιείται για να μελετηθεί πόσο στενά συνδέονται οι μεταβλητές ονομάζεται ανάλυση συσχέτισης .

    Ακολουθούν μερικά παραδείγματα ισχυρής συσχέτισης:

    • Ο αριθμός των θερμίδων που καταναλώνετε και το βάρος σας (θετική συσχέτιση)
    • Η εξωτερική θερμοκρασία και οι λογαριασμοί θέρμανσης (αρνητική συσχέτιση)

    Και εδώ τα παραδείγματα δεδομένων που έχουν ασθενή ή καθόλου συσχέτιση:

    • Το όνομα της γάτας σας και το αγαπημένο της φαγητό
    • Το χρώμα των ματιών σας και το ύψος σας

    Ένα βασικό πράγμα που πρέπει να κατανοήσετε σχετικά με τη συσχέτιση είναι ότι δείχνει μόνο πόσο στενά συνδεδεμένες είναι δύο μεταβλητές. Η συσχέτιση, ωστόσο, δεν συνεπάγεται αιτιώδη συνάφεια. Το γεγονός ότι οι μεταβολές σε μια μεταβλητή συνδέονται με μεταβολές στην άλλη μεταβλητή δεν σημαίνει ότι η μια μεταβλητή προκαλεί πράγματι τη μεταβολή της άλλης.

    Αν σας ενδιαφέρει να μάθετε την αιτιότητα και να κάνετε προβλέψεις, κάντε ένα βήμα μπροστά και εκτελέστε ανάλυση γραμμικής παλινδρόμησης.

    Συντελεστής συσχέτισης στο Excel - ερμηνεία της συσχέτισης

    Το αριθμητικό μέτρο του βαθμού συσχέτισης μεταξύ δύο συνεχών μεταβλητών ονομάζεται συντελεστής συσχέτισης (r).

    Η τιμή του συντελεστή κυμαίνεται πάντα μεταξύ -1 και 1 και μετρά τόσο την ισχύ όσο και την κατεύθυνση της γραμμικής σχέσης μεταξύ των μεταβλητών.

    Δύναμη

    Όσο μεγαλύτερη είναι η απόλυτη τιμή του συντελεστή, τόσο ισχυρότερη είναι η σχέση:

    • Οι ακραίες τιμές -1 και 1 υποδηλώνουν μια τέλεια γραμμική σχέση, όταν όλα τα σημεία των δεδομένων εμπίπτουν σε μια γραμμή. Στην πράξη, σπάνια παρατηρείται τέλεια συσχέτιση, είτε θετική είτε αρνητική.
    • Ένας συντελεστής 0 υποδηλώνει ότι δεν υπάρχει γραμμική σχέση μεταξύ των μεταβλητών. Αυτό είναι που είναι πιθανό να προκύψει με δύο σύνολα τυχαίων αριθμών.
    • Οι τιμές μεταξύ 0 και +1/-1 αντιπροσωπεύουν μια κλίμακα ασθενών, μέτριων και ισχυρών σχέσεων. r πλησιάζει είτε στο -1 είτε στο 1, η ισχύς της σχέσης αυξάνεται.

    Κατεύθυνση

    Το πρόσημο του συντελεστή (συν ή πλην) υποδηλώνει την κατεύθυνση της σχέσης.

    • Θετικό οι συντελεστές αντιπροσωπεύουν την άμεση συσχέτιση και παράγουν μια ανοδική κλίση σε ένα γράφημα - καθώς αυξάνεται η μία μεταβλητή, αυξάνεται και η άλλη, και αντίστροφα.
    • Αρνητικό οι συντελεστές αντιπροσωπεύουν αντίστροφη συσχέτιση και παράγουν μια καθοδική κλίση σε ένα γράφημα - καθώς αυξάνεται η μία μεταβλητή, η άλλη μεταβλητή τείνει να μειωθεί.

    Για καλύτερη κατανόηση, ρίξτε μια ματιά στα ακόλουθα γραφήματα συσχέτισης:

    • Ένας συντελεστής 1 σημαίνει τέλεια θετική σχέση - καθώς αυξάνεται η μία μεταβλητή, αυξάνεται αναλογικά και η άλλη.
    • Ένας συντελεστής -1 σημαίνει τέλεια αρνητική σχέση - καθώς αυξάνεται η μία μεταβλητή, η άλλη μειώνεται αναλογικά.
    • Ένας συντελεστής 0 σημαίνει ότι δεν υπάρχει σχέση μεταξύ δύο μεταβλητών - τα σημεία των δεδομένων είναι διάσπαρτα σε όλο το γράφημα.

    Συσχέτιση Pearson

    Στη στατιστική, μετρούν διάφορους τύπους συσχέτισης ανάλογα με τον τύπο των δεδομένων με τα οποία εργάζεστε. Σε αυτό το σεμινάριο, θα επικεντρωθούμε στον πιο συνηθισμένο.

    Συσχέτιση Pearson , το πλήρες όνομα είναι το Συσχέτιση Pearson Product Moment (PPMC), χρησιμοποιείται για την αξιολόγηση γραμμικό σχέσεις μεταξύ των δεδομένων, όταν μια μεταβολή σε μια μεταβλητή συνδέεται με μια ανάλογη μεταβολή στην άλλη μεταβλητή. Με απλά λόγια, η συσχέτιση Pearson απαντά στην ερώτηση: Μπορούν τα δεδομένα να αναπαρασταθούν σε μια ευθεία;

    Στη στατιστική, είναι ο πιο δημοφιλής τύπος συσχέτισης, και αν έχετε να κάνετε με έναν "συντελεστή συσχέτισης" χωρίς περαιτέρω διευκρινίσεις, το πιθανότερο είναι να είναι ο Pearson.

    Ακολουθεί ο πιο συχνά χρησιμοποιούμενος τύπος για την εύρεση του συντελεστή συσχέτισης Pearson, που ονομάζεται επίσης R του Pearson :

    Κατά καιρούς, μπορεί να συναντήσετε δύο άλλους τύπους για τον υπολογισμό του δειγματικός συντελεστής συσχέτισης (r) και το συντελεστής συσχέτισης πληθυσμού (ρ).

    Πώς να κάνετε συσχέτιση Pearson στο Excel

    Ο υπολογισμός του συντελεστή συσχέτισης Pearson με το χέρι περιλαμβάνει αρκετά μαθηματικά. Ευτυχώς, το Microsoft Excel έχει κάνει τα πράγματα πολύ απλά. Ανάλογα με το σύνολο των δεδομένων σας και τον στόχο σας, μπορείτε να χρησιμοποιήσετε μία από τις ακόλουθες τεχνικές:

    • Βρείτε τον συντελεστή συσχέτισης Pearson με τη συνάρτηση CORREL.
    • Δημιουργήστε έναν πίνακα συσχέτισης εκτελώντας την Ανάλυση δεδομένων.
    • Βρείτε πολλαπλούς συντελεστές συσχέτισης με έναν τύπο.
    • Σχεδιάστε ένα γράφημα συσχέτισης για να αποκτήσετε την οπτική αναπαράσταση της σχέσης δεδομένων.

    Πώς να υπολογίσετε το συντελεστή συσχέτισης στο Excel

    Για να υπολογίσετε έναν συντελεστή συσχέτισης με το χέρι, θα πρέπει να χρησιμοποιήσετε αυτόν τον μακροσκελή τύπο. Για να βρείτε τον συντελεστή συσχέτισης στο Excel, αξιοποιήστε τη συνάρτηση CORREL ή PEARSON και λάβετε το αποτέλεσμα σε κλάσμα του δευτερολέπτου.

    Συνάρτηση Excel CORREL

    Η συνάρτηση CORREL επιστρέφει τον συντελεστή συσχέτισης Pearson για δύο σύνολα τιμών. Η σύνταξή της είναι πολύ εύκολη και απλή:

    CORREL(array1, array2)

    Πού:

    • Συστοιχία1 είναι το πρώτο εύρος τιμών.
    • Array2 είναι το δεύτερο εύρος τιμών.

    Οι δύο πίνακες πρέπει να έχουν ίσο μήκος.

    Υποθέτοντας ότι έχουμε ένα σύνολο ανεξάρτητων μεταβλητών ( x ) σε B2:B13 και εξαρτημένες μεταβλητές (y) σε C2:C13, ο τύπος του συντελεστή συσχέτισης έχει ως εξής:

    =CORREL(B2:B13, C2:C13)

    Ή, θα μπορούσαμε να αλλάξουμε τις περιοχές και να έχουμε το ίδιο αποτέλεσμα:

    =CORREL(C2:C13, B2:B13)

    Όπως και να έχει, ο τύπος δείχνει μια ισχυρή αρνητική συσχέτιση (περίπου -0,97) μεταξύ της μέσης μηνιαίας θερμοκρασίας και του αριθμού των θερμαντικών συσκευών που πωλούνται:

    3 πράγματα που πρέπει να γνωρίζετε για τη συνάρτηση CORREL στο Excel

    Για να υπολογίσετε τον συντελεστή συσχέτισης στο Excel με επιτυχία, λάβετε υπόψη σας αυτά τα 3 απλά γεγονότα:

    • Εάν ένα ή περισσότερα κελιά σε έναν πίνακα περιέχουν κείμενο, λογικές τιμές ή κενά, τα κελιά αυτά αγνοούνται- τα κελιά με μηδενικές τιμές υπολογίζονται.
    • Εάν οι παρεχόμενοι πίνακες έχουν διαφορετικό μήκος, επιστρέφεται σφάλμα #N/A.
    • Αν ένας από τους πίνακες είναι άδειος ή αν η τυπική απόκλιση των τιμών τους είναι ίση με μηδέν, εμφανίζεται σφάλμα #DIV/0!.

    Συνάρτηση PEARSON του Excel

    Η συνάρτηση PEARSON στο Excel κάνει το ίδιο πράγμα - υπολογίζει τον συντελεστή συσχέτισης Pearson Product Moment Correlation.

    PEARSON(array1, array2)

    Πού:

    • Συστοιχία1 είναι ένα εύρος ανεξάρτητων τιμών.
    • Array2 είναι ένα εύρος εξαρτημένων τιμών.

    Επειδή το PEARSON και το CORREL υπολογίζουν αμφότερα τον συντελεστή γραμμικής συσχέτισης Pearson, τα αποτελέσματά τους θα πρέπει να συμφωνούν και γενικά συμφωνούν στις πρόσφατες εκδόσεις του Excel 2007 έως Excel 2019.

    Ωστόσο, στο Excel 2003 και σε παλαιότερες εκδόσεις, η συνάρτηση PEARSON μπορεί να εμφανίσει ορισμένα σφάλματα στρογγυλοποίησης. Επομένως, σε παλαιότερες εκδόσεις, συνιστάται η χρήση του CORREL αντί του PEARSON.

    Στο σύνολο των δεδομένων του δείγματός μας, και οι δύο συναρτήσεις παρουσιάζουν τα ίδια αποτελέσματα:

    =CORREL(B2:B13, C2:C13)

    =PEARSON(B2:B13, C2:C13)

    Πώς να δημιουργήσετε έναν πίνακα συσχέτισης στο Excel με την Ανάλυση δεδομένων

    Όταν χρειάζεται να ελέγξετε τις σχέσεις μεταξύ περισσότερων από δύο μεταβλητών, είναι λογικό να κατασκευάσετε έναν πίνακα συσχέτισης, ο οποίος μερικές φορές ονομάζεται πολλαπλός συντελεστής συσχέτισης .

    Το πίνακας συσχέτισης είναι ένας πίνακας που παρουσιάζει τους συντελεστές συσχέτισης μεταξύ των μεταβλητών στο σημείο τομής των αντίστοιχων γραμμών και στηλών.

    Ο πίνακας συσχέτισης στο Excel κατασκευάζεται με τη χρήση της εντολής Συσχέτιση εργαλείο από το Εργαλειοθήκη ανάλυσης Αυτό το πρόσθετο είναι διαθέσιμο σε όλες τις εκδόσεις του Excel 2003 έως το Excel 2019, αλλά δεν είναι ενεργοποιημένο από προεπιλογή. Εάν δεν το έχετε ενεργοποιήσει ακόμη, παρακαλούμε να το κάνετε τώρα ακολουθώντας τα βήματα που περιγράφονται στην ενότητα Πώς να ενεργοποιήσετε το Data Analysis ToolPak στο Excel.

    Με τα εργαλεία ανάλυσης δεδομένων που προστέθηκαν στην κορδέλα του Excel, είστε έτοιμοι να εκτελέσετε ανάλυση συσχέτισης:

    1. Στην επάνω δεξιά γωνία του Δεδομένα tab>, Ανάλυση ομάδα, κάντε κλικ στο Ανάλυση δεδομένων κουμπί.
    2. Στο Ανάλυση δεδομένων παράθυρο διαλόγου, επιλέξτε Συσχέτιση και κάντε κλικ στο OK.
    3. Στο Συσχέτιση ρυθμίστε τις παραμέτρους με αυτόν τον τρόπο:
      • Κάντε κλικ στο Εύρος εισόδου και επιλέξτε την περιοχή με τα δεδομένα της πηγής σας, συμπεριλαμβανομένων των επικεφαλίδων των στηλών (B1:D13 στην περίπτωσή μας).
      • Στο Ομαδοποιημένα κατά ενότητα, βεβαιωθείτε ότι το Στήλες είναι επιλεγμένο το πλαίσιο επιλογής (δεδομένου ότι τα δεδομένα της πηγής σας είναι ομαδοποιημένα σε στήλες).
      • Επιλέξτε το Ετικέτες στην πρώτη σειρά πλαίσιο ελέγχου εάν η επιλεγμένη περιοχή περιέχει επικεφαλίδες στηλών.
      • Επιλέξτε την επιθυμητή επιλογή εξόδου. Για να έχετε τον πίνακα στο ίδιο φύλλο, επιλέξτε Εύρος εξόδου και καθορίστε την αναφορά στο αριστερότερο κελί στο οποίο θα εξάγεται ο πίνακας (A15 σε αυτό το παράδειγμα).

    Όταν τελειώσετε, κάντε κλικ στο OK κουμπί:

    Ο πίνακας με τους συντελεστές συσχέτισης είναι έτοιμος και θα πρέπει να μοιάζει κάπως όπως φαίνεται στην επόμενη ενότητα.

    Ερμηνεία των αποτελεσμάτων της ανάλυσης συσχέτισης

    Στον πίνακα συσχέτισης του Excel, μπορείτε να βρείτε τους συντελεστές στην τομή των γραμμών και των στηλών. Εάν οι συντεταγμένες στήλης και γραμμής είναι ίδιες, εξάγεται η τιμή 1.

    Στο παραπάνω παράδειγμα, μας ενδιαφέρει να μάθουμε τη συσχέτιση μεταξύ της εξαρτημένης μεταβλητής (αριθμός πωληθέντων θερμαντικών σωμάτων) και δύο ανεξάρτητων μεταβλητών (μέση μηνιαία θερμοκρασία και κόστος διαφήμισης). Έτσι, εξετάζουμε μόνο τους αριθμούς στην τομή αυτών των γραμμών και στηλών, οι οποίοι επισημαίνονται στο παρακάτω στιγμιότυπο οθόνης:

    Ο αρνητικός συντελεστής -0,97 (στρογγυλοποιημένος σε 2 δεκαδικά ψηφία) δείχνει μια ισχυρή αντίστροφη συσχέτιση μεταξύ της μηνιαίας θερμοκρασίας και των πωλήσεων θερμαντήρων - όσο η θερμοκρασία αυξάνεται, τόσο λιγότεροι θερμαντήρες πωλούνται.

    Ο θετικός συντελεστής 0,97 (στρογγυλοποιημένος σε 2 δεκαδικά ψηφία) υποδηλώνει μια ισχυρή άμεση σχέση μεταξύ του διαφημιστικού προϋπολογισμού και των πωλήσεων - όσο περισσότερα χρήματα ξοδεύετε για διαφήμιση, τόσο υψηλότερες είναι οι πωλήσεις.

    Πώς να κάνετε ανάλυση πολλαπλής συσχέτισης στο Excel με τύπους

    Η δημιουργία του πίνακα συσχέτισης με το εργαλείο Ανάλυση δεδομένων είναι εύκολη. Ωστόσο, αυτός ο πίνακας είναι στατικός, πράγμα που σημαίνει ότι θα πρέπει να εκτελείτε εκ νέου την ανάλυση συσχέτισης κάθε φορά που αλλάζουν τα δεδομένα προέλευσης.

    Τα καλά νέα είναι ότι μπορείτε εύκολα να δημιουργήσετε έναν παρόμοιο πίνακα συσχέτισης μόνοι σας και ότι ο πίνακας αυτός θα ενημερώνεται αυτόματα με κάθε αλλαγή στις τιμές της πηγής.

    Για να το κάνετε, χρησιμοποιήστε αυτόν τον γενικό τύπο:

    CORREL(OFFSET( first_variable_range , 0, ROWS($1:1)-1), OFFSET( first_variable_range , 0, COLUMNS($A:A)-1))

    Σημαντική σημείωση! Για να λειτουργήσει ο τύπος, θα πρέπει να κλειδώσετε την πρώτη περιοχή μεταβλητών χρησιμοποιώντας απόλυτες αναφορές κελιών.

    Στην περίπτωσή μας, το εύρος της πρώτης μεταβλητής είναι $B$2:$B$13 (προσέξτε το σύμβολο $ που κλειδώνει την αναφορά) και ο τύπος συσχέτισης παίρνει αυτή τη μορφή:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    Με τον τύπο έτοιμο, ας κατασκευάσουμε έναν πίνακα συσχέτισης:

    1. Στην πρώτη γραμμή και στην πρώτη στήλη του πίνακα, πληκτρολογήστε τις ετικέτες των μεταβλητών με την ίδια σειρά που εμφανίζονται στον πηγαίο σας πίνακα (βλ. το παρακάτω στιγμιότυπο οθόνης).
    2. Εισάγετε τον παραπάνω τύπο στο αριστερότερο κελί (B16 στην περίπτωσή μας).
    3. Σύρετε τον τύπο προς τα κάτω και προς τα δεξιά για να τον αντιγράψετε σε όσες γραμμές και στήλες χρειάζεται (3 γραμμές και 3 στήλες στο παράδειγμά μας).

    Ως αποτέλεσμα, έχουμε τον ακόλουθο πίνακα με πολλαπλούς συντελεστές συσχέτισης. Παρατηρήστε ότι οι συντελεστές που επιστρέφονται από τον τύπο μας είναι ακριβώς οι ίδιοι με αυτούς που εξάγονται από το Excel στο προηγούμενο παράδειγμα (οι σχετικοί επισημαίνονται):

    Πώς λειτουργεί αυτή η φόρμουλα

    Όπως ήδη γνωρίζετε, η συνάρτηση CORREL του Excel επιστρέφει τον συντελεστή συσχέτισης για δύο σύνολα μεταβλητών που εσείς καθορίζετε. Η κύρια πρόκληση είναι να παρέχετε τις κατάλληλες περιοχές στα αντίστοιχα κελιά του πίνακα. Για τον σκοπό αυτό, εισάγετε μόνο την πρώτη περιοχή μεταβλητών στον τύπο και χρησιμοποιείτε τις ακόλουθες συναρτήσεις για να κάνετε τις απαραίτητες προσαρμογές:

    • OFFSET - επιστρέφει ένα εύρος που απέχει συγκεκριμένο αριθμό γραμμών και στηλών από ένα καθορισμένο εύρος.
    • ROWS και COLUMNS - επιστρέφουν τον αριθμό των γραμμών και των στηλών σε ένα εύρος, αντίστοιχα. Στον τύπο συσχέτισης που χρησιμοποιούμε, και οι δύο χρησιμοποιούνται με έναν σκοπό - να πάρουμε τον αριθμό των στηλών που πρέπει να μετατοπιστούν από το αρχικό εύρος. Και αυτό επιτυγχάνεται με την έξυπνη χρήση απόλυτων και σχετικών αναφορών.

    Για να κατανοήσετε καλύτερα τη λογική, ας δούμε πώς ο τύπος υπολογίζει τους συντελεστές που επισημαίνονται στο παραπάνω στιγμιότυπο.

    Κατ' αρχάς, ας εξετάσουμε τον τύπο στο Β18, ο οποίος βρίσκει συσχέτιση μεταξύ της μηνιαίας θερμοκρασίας (B2:B13) και των πωληθέντων θερμαντικών συσκευών (D2:D13):

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    Στην πρώτη συνάρτηση OFFSET, η ROWS($1:1) έχει μετατραπεί σε ROWS($1:3), επειδή η δεύτερη συντεταγμένη είναι σχετική, οπότε αλλάζει με βάση τη σχετική θέση της γραμμής όπου αντιγράφεται ο τύπος (2 σειρές κάτω). Έτσι, η ROWS() επιστρέφει 3, από την οποία αφαιρούμε 1 και παίρνουμε μια περιοχή που βρίσκεται 2 στήλες δεξιά από την αρχική περιοχή, δηλαδή $D$2:$D$13 (πωλήσεις θερμαστρών).

    Η δεύτερη OFFSET δεν αλλάζει το καθορισμένο εύρος $B$2:$B$13 (θερμοκρασία) επειδή η COLUMNS($A:A)-1 επιστρέφει μηδέν.

    Ως αποτέλεσμα, ο μακροσκελής τύπος μας μετατρέπεται σε ένα απλό CORREL($D$2:$D$13, $B$2:$B$13) και επιστρέφει ακριβώς τον συντελεστή που θέλουμε.

    Ο τύπος στο C18 που υπολογίζει έναν συντελεστή συσχέτισης για το κόστος διαφήμισης (C2:C13) και τις πωλήσεις (D2:D13) λειτουργεί με παρόμοιο τρόπο:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))

    Η πρώτη συνάρτηση OFFSET είναι απολύτως η ίδια όπως περιγράφεται παραπάνω, επιστρέφοντας το εύρος των $D$2:$D$13 (πωλήσεις θερμαστρών).

    Στη δεύτερη OFFSET, COLUMNS($A:A)-1 αλλάζει σε COLUMNS($A:B)-1 επειδή έχουμε αντιγράψει τον τύπο 1 στήλη προς τα δεξιά. Κατά συνέπεια, η OFFSET παίρνει ένα εύρος που βρίσκεται 1 στήλη προς τα δεξιά του αρχικού εύρους, δηλαδή $C$2:$C$13 (κόστος διαφήμισης).

    Πώς να σχεδιάσετε ένα γράφημα συσχέτισης στο Excel

    Όταν κάνετε συσχέτιση στο Excel, ο καλύτερος τρόπος για να έχετε μια οπτική αναπαράσταση των σχέσεων μεταξύ των δεδομένων σας είναι να σχεδιάσετε ένα διάγραμμα διασποράς με ένα γραμμή τάσης Ακούστε πώς:

    1. Επιλέξτε δύο στήλες με αριθμητικά δεδομένα, συμπεριλαμβανομένων των επικεφαλίδων των στηλών. Η σειρά των στηλών είναι σημαντική: η ανεξάρτητο μεταβλητή πρέπει να βρίσκεται στην αριστερή στήλη, καθώς αυτή η στήλη θα απεικονίζεται στον άξονα x- η εξαρτημένο μεταβλητή θα πρέπει να βρίσκεται στη δεξιά στήλη, καθώς θα απεικονίζεται στον άξονα y.
    2. Στο Ενσωματωμένο στην καρτέλα Συζητήσεις ομάδα, κάντε κλικ στο Διασπορά Αυτό θα εισάγει αμέσως ένα διάγραμμα διασποράς XY στο φύλλο εργασίας σας.
    3. Κάντε δεξί κλικ σε οποιοδήποτε σημείο δεδομένων στο διάγραμμα και επιλέξτε Προσθήκη γραμμής τάσης... από το μενού περιβάλλοντος.

    Για λεπτομερείς οδηγίες βήμα προς βήμα, ανατρέξτε στην ενότητα:

    • Πώς να δημιουργήσετε διάγραμμα διασποράς στο Excel
    • Πώς να προσθέσετε γραμμή τάσης στο διάγραμμα του Excel

    Για το σύνολο δεδομένων του δείγματός μας, τα γραφήματα συσχέτισης φαίνονται όπως φαίνεται στην παρακάτω εικόνα. Επιπλέον, εμφανίσαμε την τιμή R-τετράγωνο, που ονομάζεται επίσης Συντελεστής προσδιορισμού Η τιμή αυτή δείχνει πόσο καλά η γραμμή τάσης αντιστοιχεί στα δεδομένα - όσο πιο κοντά στο R2 στο 1, τόσο καλύτερη είναι η προσαρμογή.

    Από την τιμή R2 που εμφανίζεται στο διάγραμμα διασποράς, μπορείτε εύκολα να υπολογίσετε τον συντελεστή συσχέτισης:

    1. Για μεγαλύτερη ακρίβεια, βάλτε το Excel να εμφανίζει περισσότερα ψηφία στην τιμή του R-τετραγώνου από ό,τι κάνει από προεπιλογή.
    2. Κάντε κλικ στην τιμή R2 στο διάγραμμα, επιλέξτε την με το ποντίκι και πατήστε Ctrl + C για να την αντιγράψετε.
    3. Πάρτε μια τετραγωνική ρίζα του R2 είτε χρησιμοποιώντας τη συνάρτηση SQRT είτε αυξάνοντας την αντιγραμμένη τιμή R2 στη δύναμη του 0,5.

    Για παράδειγμα, η τιμή R2 στο δεύτερο γράφημα είναι 0,9174339392. Έτσι, μπορείτε να βρείτε τον συντελεστή συσχέτισης για Διαφήμιση και Πωλούνται θερμάστρες με έναν από αυτούς τους τύπους:

    =SQRT(0,9174339392)

    =0.9174339392^0.5

    Όπως μπορείτε να βεβαιωθείτε, οι συντελεστές που υπολογίζονται με αυτόν τον τρόπο είναι απολύτως σύμφωνοι με τους συντελεστές συσχέτισης που βρέθηκαν στα προηγούμενα παραδείγματα, εκτός από το σημείο :

    Πιθανά προβλήματα με τη συσχέτιση στο Excel

    Το Συσχέτιση Pearson Product Moment αποκαλύπτει μόνο ένα γραμμικό σχέση μεταξύ των δύο μεταβλητών. Δηλαδή, οι μεταβλητές σας μπορεί να συνδέονται στενά με έναν άλλο, καμπυλόγραμμο, τρόπο και παρόλα αυτά ο συντελεστής συσχέτισης να είναι ίσος ή κοντά στο μηδέν.

    Η συσχέτιση Pearson δεν είναι σε θέση να διακρίνει εξαρτημένο και ανεξάρτητο μεταβλητές. Για παράδειγμα, όταν χρησιμοποιήσαμε τη συνάρτηση CORREL για να βρούμε τη συσχέτιση μεταξύ μιας μέσης μηνιαίας θερμοκρασίας και του αριθμού των πωληθέντων θερμαντικών σωμάτων, πήραμε ένα συντελεστή -0,97, ο οποίος υποδηλώνει μια υψηλή αρνητική συσχέτιση. Ωστόσο, θα μπορούσαμε να αλλάξουμε τις μεταβλητές και να πάρουμε το ίδιο αποτέλεσμα. Έτσι, κάποιος μπορεί να συμπεράνει ότι οι υψηλότερες πωλήσεις θερμαντικών σωμάτων προκαλούν πτώση της θερμοκρασίας, κάτι που προφανώς δεν κάνει καμίαΕπομένως, όταν εκτελείτε ανάλυση συσχέτισης στο Excel, να έχετε επίγνωση των δεδομένων που παρέχετε.

    Εξάλλου, η συσχέτιση Pearson είναι πολύ ευαίσθητη σε outliers Εάν έχετε ένα ή περισσότερα σημεία δεδομένων που διαφέρουν σημαντικά από τα υπόλοιπα δεδομένα, μπορεί να έχετε μια στρεβλή εικόνα της σχέσης μεταξύ των μεταβλητών. Σε αυτή την περίπτωση, θα ήταν συνετό να χρησιμοποιήσετε αντί αυτού τη συσχέτιση κατάταξης Spearman.

    Αυτός είναι ο τρόπος με τον οποίο μπορείτε να κάνετε συσχέτιση στο Excel. Για να ρίξετε μια πιο προσεκτική ματιά στα παραδείγματα που αναλύονται σε αυτό το σεμινάριο, μπορείτε να κατεβάσετε το δείγμα του βιβλίου εργασίας μας παρακάτω. Σας ευχαριστώ για την ανάγνωση και ελπίζω να σας δω στο ιστολόγιό μας την επόμενη εβδομάδα!

    Βιβλίο ασκήσεων

    Υπολογισμός συσχέτισης στο Excel (.xlsx αρχείο)

    Ο Michael Brown είναι ένας αφοσιωμένος λάτρης της τεχνολογίας με πάθος για την απλοποίηση πολύπλοκων διαδικασιών χρησιμοποιώντας εργαλεία λογισμικού. Με περισσότερο από μια δεκαετία εμπειρίας στον κλάδο της τεχνολογίας, έχει βελτιώσει τις δεξιότητές του στο Microsoft Excel και το Outlook, καθώς και στα Φύλλα Google και στα Έγγραφα. Το blog του Michael είναι αφιερωμένο στο να μοιράζεται τη γνώση και την τεχνογνωσία του με άλλους, παρέχοντας εύκολες συμβουλές και σεμινάρια για τη βελτίωση της παραγωγικότητας και της αποτελεσματικότητας. Είτε είστε έμπειρος επαγγελματίας είτε αρχάριος, το ιστολόγιο του Michael προσφέρει πολύτιμες πληροφορίες και πρακτικές συμβουλές για να αξιοποιήσετε στο έπακρο αυτά τα βασικά εργαλεία λογισμικού.