Ανάλυση γραμμικής παλινδρόμησης στο Excel

  • Μοιραστείτε Αυτό
Michael Brown

Το σεμινάριο εξηγεί τα βασικά στοιχεία της ανάλυσης παλινδρόμησης και παρουσιάζει μερικούς διαφορετικούς τρόπους για να κάνετε γραμμική παλινδρόμηση στο Excel.

Φανταστείτε το εξής: Σας παρέχονται ένα σωρό διαφορετικά δεδομένα και σας ζητείται να προβλέψετε τα νούμερα των πωλήσεων της επόμενης χρονιάς για την εταιρεία σας. Έχετε ανακαλύψει δεκάδες, ίσως και εκατοντάδες, παράγοντες που ενδεχομένως να επηρεάζουν τα νούμερα. Αλλά πώς ξέρετε ποιοι από αυτούς είναι πραγματικά σημαντικοί; Εκτελέστε ανάλυση παλινδρόμησης στο Excel. Θα σας δώσει απάντηση σε αυτό και σε πολλά άλλα ερωτήματα: Ποιοι παράγοντεςπόσο στενά συνδέονται αυτοί οι παράγοντες μεταξύ τους; Και πόσο σίγουροι μπορείτε να είστε για τις προβλέψεις;

    Ανάλυση παλινδρόμησης στο Excel - τα βασικά

    Στη στατιστική μοντελοποίηση, ανάλυση παλινδρόμησης χρησιμοποιείται για την εκτίμηση των σχέσεων μεταξύ δύο ή περισσότερων μεταβλητών:

    Εξαρτημένη μεταβλητή (ή αλλιώς κριτήριο μεταβλητή) είναι ο κύριος παράγοντας που προσπαθείτε να κατανοήσετε και να προβλέψετε.

    Ανεξάρτητες μεταβλητές (ή αλλιώς επεξηγηματικό μεταβλητές, ή προγνωστικοί παράγοντες ) είναι οι παράγοντες που ενδέχεται να επηρεάσουν την εξαρτημένη μεταβλητή.

    Η ανάλυση παλινδρόμησης σας βοηθά να κατανοήσετε πώς μεταβάλλεται η εξαρτημένη μεταβλητή όταν μεταβάλλεται μία από τις ανεξάρτητες μεταβλητές και επιτρέπει να προσδιορίσετε μαθηματικά ποια από αυτές τις μεταβλητές έχει πραγματικά αντίκτυπο.

    Τεχνικά, ένα μοντέλο ανάλυσης παλινδρόμησης βασίζεται στην άθροισμα τετραγώνων , το οποίο είναι ένας μαθηματικός τρόπος για να βρεθεί η διασπορά των σημείων δεδομένων. Ο στόχος ενός μοντέλου είναι να προκύψει το μικρότερο δυνατό άθροισμα τετραγώνων και να σχεδιαστεί μια γραμμή που πλησιάζει περισσότερο στα δεδομένα.

    Στη στατιστική, κάνουν διάκριση μεταξύ απλής και πολλαπλής γραμμικής παλινδρόμησης. Απλή γραμμική παλινδρόμηση μοντελοποιεί τη σχέση μεταξύ μιας εξαρτημένης μεταβλητής και μιας ανεξάρτητης μεταβλητής χρησιμοποιώντας μια γραμμική συνάρτηση. Εάν χρησιμοποιείτε δύο ή περισσότερες επεξηγηματικές μεταβλητές για να προβλέψετε την εξαρτημένη μεταβλητή, έχετε να κάνετε με πολλαπλή γραμμική παλινδρόμηση Εάν η εξαρτημένη μεταβλητή μοντελοποιείται ως μη γραμμική συνάρτηση επειδή οι σχέσεις των δεδομένων δεν ακολουθούν ευθεία γραμμή, χρησιμοποιήστε μη γραμμική παλινδρόμηση Η εστίαση αυτού του σεμιναρίου θα είναι σε μια απλή γραμμική παλινδρόμηση.

    Ως παράδειγμα, ας πάρουμε τους αριθμούς πωλήσεων ομπρελών για τους τελευταίους 24 μήνες και ας βρούμε τη μέση μηνιαία βροχόπτωση για την ίδια περίοδο. Σχεδιάστε αυτές τις πληροφορίες σε ένα διάγραμμα και η γραμμή παλινδρόμησης θα καταδείξει τη σχέση μεταξύ της ανεξάρτητης μεταβλητής (βροχόπτωση) και της εξαρτημένης μεταβλητής (πωλήσεις ομπρελών):

    Εξίσωση γραμμικής παλινδρόμησης

    Μαθηματικά, μια γραμμική παλινδρόμηση ορίζεται από την εξίσωση αυτή:

    y = bx + a + ε

    Πού:

    • x είναι μια ανεξάρτητη μεταβλητή.
    • y είναι μια εξαρτημένη μεταβλητή.
    • a είναι η Y-διακοπή , η οποία είναι η αναμενόμενη μέση τιμή της y όταν όλα x μεταβλητές είναι ίσες με 0. Σε ένα γράφημα παλινδρόμησης, είναι το σημείο όπου η γραμμή τέμνει τον άξονα Υ.
    • b είναι το κλίση μιας γραμμής παλινδρόμησης, η οποία είναι ο ρυθμός μεταβολής για y ως x αλλαγές.
    • ε είναι ο τυχαίος όρος σφάλματος, ο οποίος είναι η διαφορά μεταξύ της πραγματικής τιμής μιας εξαρτημένης μεταβλητής και της προβλεπόμενης τιμής της.

    Η εξίσωση της γραμμικής παλινδρόμησης έχει πάντα έναν όρο σφάλματος, επειδή, στην πραγματική ζωή, οι προγνωστικοί παράγοντες δεν είναι ποτέ απόλυτα ακριβείς. Ωστόσο, ορισμένα προγράμματα, συμπεριλαμβανομένου του Excel, κάνουν τον υπολογισμό του όρου σφάλματος πίσω από τις σκηνές. Έτσι, στο Excel, κάνετε γραμμική παλινδρόμηση χρησιμοποιώντας την εντολή ελάχιστα τετράγωνα μέθοδος και αναζήτηση συντελεστών a και b έτσι ώστε:

    y = bx + a

    Για το παράδειγμά μας, η εξίσωση γραμμικής παλινδρόμησης έχει την ακόλουθη μορφή:

    Πωληθείσες ομπρέλες = b * βροχόπτωση + a

    Υπάρχουν μια χούφτα διαφορετικοί τρόποι για να βρείτε a και b Οι τρεις κύριες μέθοδοι για την εκτέλεση γραμμικής ανάλυσης παλινδρόμησης στο Excel είναι:

    • Εργαλείο παλινδρόμησης που περιλαμβάνεται στο Analysis ToolPak
    • Διάγραμμα διασποράς με γραμμή τάσης
    • Τύπος γραμμικής παλινδρόμησης

    Παρακάτω θα βρείτε λεπτομερείς οδηγίες για τη χρήση κάθε μεθόδου.

    Πώς να κάνετε γραμμική παλινδρόμηση στο Excel με το Analysis ToolPak

    Αυτό το παράδειγμα δείχνει πώς να εκτελείτε παλινδρόμηση στο Excel χρησιμοποιώντας ένα ειδικό εργαλείο που περιλαμβάνεται στο πρόσθετο Analysis ToolPak.

    Ενεργοποιήστε το πρόσθετο Analysis ToolPak

    Το Analysis ToolPak είναι διαθέσιμο σε όλες τις εκδόσεις του Excel 365 έως 2003, αλλά δεν είναι ενεργοποιημένο από προεπιλογή. Έτσι, πρέπει να το ενεργοποιήσετε χειροκίνητα. Ακολουθεί ο τρόπος:

    1. Στο Excel σας, κάντε κλικ στο Αρχείο >, Επιλογές .
    2. Στο Επιλογές Excel παράθυρο διαλόγου, επιλέξτε Πρόσθετα στην αριστερή πλαϊνή μπάρα, βεβαιωθείτε ότι Πρόσθετα του Excel είναι επιλεγμένο στο Διαχείριση και κάντε κλικ στο κουμπί Go .
    3. Στο Πρόσθετα παράθυρο διαλόγου, τσεκάρετε την επιλογή Εργαλειοθήκη ανάλυσης , και κάντε κλικ στο OK :

    Αυτό θα προσθέσει το Ανάλυση δεδομένων εργαλεία στο Δεδομένα της κορδέλας του Excel.

    Εκτέλεση ανάλυσης παλινδρόμησης

    Σε αυτό το παράδειγμα, θα κάνουμε μια απλή γραμμική παλινδρόμηση στο Excel. Αυτό που έχουμε είναι μια λίστα με τη μέση μηνιαία βροχόπτωση για τους τελευταίους 24 μήνες στη στήλη Β, η οποία είναι η ανεξάρτητη μεταβλητή μας (προβλεπτικός παράγοντας), και τον αριθμό των ομπρελών που πωλήθηκαν στη στήλη Γ, η οποία είναι η εξαρτημένη μεταβλητή. Φυσικά, υπάρχουν πολλοί άλλοι παράγοντες που μπορούν να επηρεάσουν τις πωλήσεις, αλλά προς το παρόν επικεντρωνόμαστε μόνο σε αυτές τις δύο μεταβλητές:

    Με ενεργοποιημένο το πρόσθετο Analysis Toolpak, εκτελέστε τα παρακάτω βήματα για να εκτελέσετε ανάλυση παλινδρόμησης στο Excel:

    1. Στο Δεδομένα στην καρτέλα Ανάλυση ομάδα, κάντε κλικ στο Ανάλυση δεδομένων κουμπί.
    2. Επιλέξτε Παλινδρόμηση και κάντε κλικ στο OK .
    3. Στο Παλινδρόμηση διαλόγου, διαμορφώστε τις ακόλουθες ρυθμίσεις:
      • Επιλέξτε το Εύρος εισόδου Y , το οποίο είναι το δικό σας εξαρτημένη μεταβλητή Στην περίπτωσή μας, πρόκειται για πωλήσεις ομπρελών (C1:C25).
      • Επιλέξτε το Εύρος εισόδου X , δηλ. ανεξάρτητη μεταβλητή Σε αυτό το παράδειγμα, πρόκειται για τη μέση μηνιαία βροχόπτωση (B1:B25).

      Εάν κατασκευάζετε ένα μοντέλο πολλαπλής παλινδρόμησης, επιλέξτε δύο ή περισσότερες γειτονικές στήλες με διαφορετικές ανεξάρτητες μεταβλητές.

      • Ελέγξτε το Κουτί ετικετών αν υπάρχουν κεφαλίδες στην κορυφή των περιοχών Χ και Υ.
      • Επιλέξτε το προτιμώμενο Επιλογή εξόδου, ένα νέο φύλλο εργασίας στην περίπτωσή μας.
      • Προαιρετικά, επιλέξτε το Υπολείμματα για να λάβετε τη διαφορά μεταξύ των προβλεπόμενων και των πραγματικών τιμών.
    4. Κάντε κλικ στο OK και παρατηρήστε την έξοδο της ανάλυσης παλινδρόμησης που δημιουργήθηκε από το Excel.

    Ερμηνεία των αποτελεσμάτων της ανάλυσης παλινδρόμησης

    Όπως μόλις είδατε, η εκτέλεση της παλινδρόμησης στο Excel είναι εύκολη, επειδή όλοι οι υπολογισμοί εκτελούνται αυτόματα. Η ερμηνεία των αποτελεσμάτων είναι λίγο πιο δύσκολη, επειδή πρέπει να γνωρίζετε τι κρύβεται πίσω από κάθε αριθμό. Παρακάτω θα βρείτε μια ανάλυση των 4 κύριων τμημάτων της εξόδου της ανάλυσης παλινδρόμησης.

    Έξοδος ανάλυσης παλινδρόμησης: Περίληψη εξόδου

    Αυτό το μέρος σας λέει πόσο καλά η υπολογισμένη εξίσωση γραμμικής παλινδρόμησης ταιριάζει με τα δεδομένα της πηγής σας.

    Ακολουθεί τι σημαίνει κάθε πληροφορία:

    Πολλαπλό R Είναι το C Συντελεστής συσχέτισης που μετρά την ισχύ μιας γραμμικής σχέσης μεταξύ δύο μεταβλητών. Ο συντελεστής συσχέτισης μπορεί να έχει οποιαδήποτε τιμή μεταξύ -1 και 1, και η απόλυτη τιμή του υποδηλώνει την ισχύ της σχέσης. Όσο μεγαλύτερη είναι η απόλυτη τιμή, τόσο ισχυρότερη είναι η σχέση:

    • 1 σημαίνει ισχυρή θετική σχέση
    • -1 σημαίνει ισχυρή αρνητική σχέση
    • 0 σημαίνει ότι δεν υπάρχει καμία σχέση

    Τετράγωνο R . Είναι το Συντελεστής προσδιορισμού , η οποία χρησιμοποιείται ως δείκτης της καλής προσαρμογής. Δείχνει πόσα σημεία εμπίπτουν στην ευθεία παλινδρόμησης. Η τιμή R2 υπολογίζεται από το συνολικό άθροισμα των τετραγώνων, ακριβέστερα, είναι το άθροισμα των τετραγωνικών αποκλίσεων των αρχικών δεδομένων από τον μέσο όρο.

    Στο παράδειγμά μας, το R2 είναι 0,91 (στρογγυλοποιημένο σε 2 ψηφία), το οποίο είναι αρκετά καλό. Αυτό σημαίνει ότι το 91% των τιμών μας ταιριάζει στο μοντέλο ανάλυσης παλινδρόμησης. Με άλλα λόγια, το 91% των εξαρτημένων μεταβλητών (τιμές y) εξηγείται από τις ανεξάρτητες μεταβλητές (τιμές x). Γενικά, R Squared 95% ή περισσότερο θεωρείται καλή προσαρμογή.

    Προσαρμοσμένο τετράγωνο R . Είναι το Τετράγωνο R προσαρμοσμένη για τον αριθμό των ανεξάρτητων μεταβλητών στο μοντέλο. Θα θέλετε να χρησιμοποιήσετε αυτή την τιμή αντί της Τετράγωνο R για ανάλυση πολλαπλής παλινδρόμησης.

    Τυπικό σφάλμα Είναι ένα άλλο μέτρο καλής προσαρμογής που δείχνει την ακρίβεια της ανάλυσης παλινδρόμησης - όσο μικρότερος είναι ο αριθμός, τόσο πιο σίγουροι μπορείτε να είστε για την εξίσωση παλινδρόμησης. Ενώ το R2 αντιπροσωπεύει το ποσοστό της διακύμανσης των εξαρτημένων μεταβλητών που εξηγείται από το μοντέλο, το τυπικό σφάλμα είναι ένα απόλυτο μέτρο που δείχνει τη μέση απόσταση που τα σημεία δεδομένων απέχουν από την παλινδρόμηση.γραμμή.

    Παρατηρήσεις Είναι απλώς ο αριθμός των παρατηρήσεων στο μοντέλο σας.

    Έξοδος ανάλυσης παλινδρόμησης: ANOVA

    Το δεύτερο μέρος του αποτελέσματος είναι η ανάλυση διακύμανσης (ANOVA):

    Βασικά, χωρίζει το άθροισμα των τετραγώνων σε επιμέρους συνιστώσες που δίνουν πληροφορίες σχετικά με τα επίπεδα μεταβλητότητας εντός του μοντέλου παλινδρόμησής σας:

    • df είναι ο αριθμός των βαθμών ελευθερίας που σχετίζονται με τις πηγές διακύμανσης.
    • SS είναι το άθροισμα των τετραγώνων. Όσο μικρότερο είναι το Residual SS σε σύγκριση με το Total SS, τόσο καλύτερα ταιριάζει το μοντέλο σας με τα δεδομένα.
    • MS είναι το μέσο τετράγωνο.
    • F είναι η στατιστική F ή F-test για τη μηδενική υπόθεση. Χρησιμοποιείται για τον έλεγχο της συνολικής σημαντικότητας του μοντέλου.
    • Σημασία F είναι η τιμή P-value του F.

    Το τμήμα ANOVA χρησιμοποιείται σπάνια για μια απλή ανάλυση γραμμικής παλινδρόμησης στο Excel, αλλά θα πρέπει οπωσδήποτε να ρίξετε μια προσεκτική ματιά στο τελευταίο στοιχείο. Σημασία F δίνει μια ιδέα για το πόσο αξιόπιστα (στατιστικά σημαντικά) είναι τα αποτελέσματά σας. Εάν η τιμή Significance F είναι μικρότερη από 0,05 (5%), το μοντέλο σας είναι εντάξει. Εάν είναι μεγαλύτερη από 0,05, μάλλον θα ήταν καλύτερα να επιλέξετε μια άλλη ανεξάρτητη μεταβλητή.

    Έξοδος ανάλυσης παλινδρόμησης: συντελεστές

    Αυτή η ενότητα παρέχει συγκεκριμένες πληροφορίες σχετικά με τα στοιχεία της ανάλυσής σας:

    Το πιο χρήσιμο στοιχείο σε αυτό το τμήμα είναι Συντελεστές Σας επιτρέπει να δημιουργήσετε μια εξίσωση γραμμικής παλινδρόμησης στο Excel:

    y = bx + a

    Για το σύνολο των δεδομένων μας, όπου y είναι ο αριθμός των ομπρελών που πωλούνται και x είναι η μέση μηνιαία βροχόπτωση, ο τύπος της γραμμικής παλινδρόμησης έχει ως εξής:

    Y = Συντελεστής βροχόπτωσης * x + Διακοπή

    Εξοπλισμένο με τιμές a και b στρογγυλοποιημένες σε τρία δεκαδικά ψηφία, μετατρέπεται σε:

    Y=0,45*x-19,074

    Για παράδειγμα, με μέση μηνιαία βροχόπτωση ίση με 82 mm, οι πωλήσεις ομπρελών θα είναι περίπου 17,8:

    0.45*82-19.074=17.8

    Με παρόμοιο τρόπο, μπορείτε να βρείτε πόσες ομπρέλες θα πουληθούν με οποιαδήποτε άλλη μηνιαία βροχόπτωση (μεταβλητή x) που θα καθορίσετε.

    Έξοδος ανάλυσης παλινδρόμησης: υπολείμματα

    Αν συγκρίνετε τον εκτιμώμενο και τον πραγματικό αριθμό των πωληθέντων ομπρελών που αντιστοιχούν στη μηνιαία βροχόπτωση των 82 mm, θα διαπιστώσετε ότι οι αριθμοί αυτοί διαφέρουν ελαφρώς:

    • Εκτιμώμενο: 17,8 (υπολογίστηκε παραπάνω)
    • Πραγματικό: 15 (σειρά 2 των αρχικών δεδομένων)

    Γιατί υπάρχει διαφορά; Επειδή οι ανεξάρτητες μεταβλητές δεν είναι ποτέ τέλειοι προγνωστικοί δείκτες των εξαρτημένων μεταβλητών. Και τα κατάλοιπα μπορούν να σας βοηθήσουν να καταλάβετε πόσο απέχουν οι πραγματικές τιμές από τις προβλεπόμενες τιμές:

    Για το πρώτο σημείο δεδομένων (βροχόπτωση 82 mm), το υπόλοιπο είναι περίπου -2,8. Έτσι, προσθέτουμε αυτόν τον αριθμό στην προβλεπόμενη τιμή και παίρνουμε την πραγματική τιμή: 17,8 - 2,8 = 15.

    Πώς να φτιάξετε ένα γράφημα γραμμικής παλινδρόμησης στο Excel

    Αν θέλετε να απεικονίσετε γρήγορα τη σχέση μεταξύ των δύο μεταβλητών, σχεδιάστε ένα διάγραμμα γραμμικής παλινδρόμησης. Αυτό είναι πολύ εύκολο! Ακολουθεί ο τρόπος:

    1. Επιλέξτε τις δύο στήλες με τα δεδομένα σας, συμπεριλαμβανομένων των επικεφαλίδων.
    2. Στο Ενσωματωμένο στην καρτέλα Συζητήσεις ομάδα, κάντε κλικ στο Διάγραμμα διασποράς και επιλέξτε το εικονίδιο Scatter μικρογραφία (η πρώτη):

      Αυτό θα εισάγει ένα διάγραμμα διασποράς στο φύλλο εργασίας σας, το οποίο θα μοιάζει με αυτό:

    3. Τώρα, πρέπει να σχεδιάσουμε τη γραμμή παλινδρόμησης ελαχίστων τετραγώνων. Για να το κάνουμε, κάντε δεξί κλικ σε οποιοδήποτε σημείο και επιλέξτε Προσθήκη γραμμής τάσης... από το μενού περιβάλλοντος.
    4. Στο δεξί παράθυρο, επιλέξτε το Γραμμική σχήμα γραμμής τάσης και, προαιρετικά, έλεγχος Εμφάνιση εξίσωσης στο διάγραμμα για να λάβετε τον τύπο παλινδρόμησης:

      Όπως μπορείτε να παρατηρήσετε, η εξίσωση παλινδρόμησης που μας δημιούργησε το Excel είναι η ίδια με τον τύπο γραμμικής παλινδρόμησης που κατασκευάσαμε με βάση την έξοδο Coefficients.

    5. Μεταβείτε στο Συμπλήρωση & Γραμμή και προσαρμόστε τη γραμμή στις προτιμήσεις σας. Για παράδειγμα, μπορείτε να επιλέξετε ένα διαφορετικό χρώμα γραμμής και να χρησιμοποιήσετε μια συμπαγή γραμμή αντί για διακεκομμένη (επιλέξτε Συμπαγής γραμμή στην καρτέλα Τύπος Dash box):

    Σε αυτό το σημείο, το γράφημά σας μοιάζει ήδη με ένα αξιοπρεπές γράφημα παλινδρόμησης:

    Παρόλα αυτά, μπορεί να θέλετε να κάνετε μερικές ακόμη βελτιώσεις:

    • Σύρετε την εξίσωση όπου εσείς κρίνετε κατάλληλο.
    • Προσθήκη τίτλων αξόνων ( Στοιχεία διαγράμματος κουμπί>, Τίτλοι άξονα ).
    • Εάν τα σημεία των δεδομένων σας ξεκινούν στη μέση του οριζόντιου ή/και του κατακόρυφου άξονα, όπως σε αυτό το παράδειγμα, μπορεί να θέλετε να απαλλαγείτε από το υπερβολικό λευκό διάστημα. Η ακόλουθη συμβουλή εξηγεί πώς να το κάνετε αυτό: Κλιμακώστε τους άξονες του διαγράμματος για να μειώσετε το λευκό διάστημα.

      Και κάπως έτσι μοιάζει το βελτιωμένο γράφημα παλινδρόμησης:

      Σημαντική σημείωση! Στο γράφημα παλινδρόμησης, η ανεξάρτητη μεταβλητή θα πρέπει πάντα να βρίσκεται στον άξονα Χ και η εξαρτημένη μεταβλητή στον άξονα Υ. Εάν το γράφημά σας απεικονίζεται με την αντίστροφη σειρά, αλλάξτε τις στήλες στο φύλλο εργασίας σας και, στη συνέχεια, σχεδιάστε εκ νέου το γράφημα. Εάν δεν σας επιτρέπεται να αναδιατάξετε τα δεδομένα προέλευσης, τότε μπορείτε να αλλάξετε τους άξονες Χ και Υ απευθείας σε ένα γράφημα.

    Πώς να κάνετε παλινδρόμηση στο Excel χρησιμοποιώντας τύπους

    Το Microsoft Excel διαθέτει μερικές στατιστικές συναρτήσεις που μπορούν να σας βοηθήσουν να κάνετε ανάλυση γραμμικής παλινδρόμησης, όπως οι LINEST, SLOPE, INTERCEPT και CORREL.

    Η συνάρτηση LINEST χρησιμοποιεί τη μέθοδο παλινδρόμησης ελαχίστων τετραγώνων για να υπολογίσει μια ευθεία γραμμή που εξηγεί καλύτερα τη σχέση μεταξύ των μεταβλητών σας και επιστρέφει έναν πίνακα που περιγράφει αυτή την ευθεία. Μπορείτε να βρείτε τη λεπτομερή εξήγηση της σύνταξης της συνάρτησης σε αυτό το σεμινάριο. Προς το παρόν, ας φτιάξουμε απλώς έναν τύπο για το σύνολο δεδομένων του δείγματός μας:

    =LINEST(C2:C25, B2:B25)

    Επειδή η συνάρτηση LINEST επιστρέφει έναν πίνακα τιμών, πρέπει να την εισαγάγετε ως τύπο πίνακα. Επιλέξτε δύο γειτονικά κελιά στην ίδια γραμμή, E2:F2 στην περίπτωσή μας, πληκτρολογήστε τον τύπο και πατήστε Ctrl + Shift + Enter για να τον ολοκληρώσετε.

    Ο τύπος επιστρέφει το b συντελεστή (Ε1) και το a σταθερά (F1) για την ήδη γνωστή εξίσωση γραμμικής παλινδρόμησης:

    y = bx + a

    Εάν αποφεύγετε τη χρήση τύπων συστοιχιών στα φύλλα εργασίας σας, μπορείτε να υπολογίσετε a και b μεμονωμένα με κανονικούς τύπους:

    Πάρτε την τετμημένη Υ (a):

    =INTERCEPT(C2:C25, B2:B25)

    Πάρτε την κλίση (b):

    =SLOPE(C2:C25, B2:B25)

    Επιπλέον, μπορείτε να βρείτε το συντελεστής συσχέτισης ( Πολλαπλό R στη συνοπτική έξοδο της ανάλυσης παλινδρόμησης) που δείχνει πόσο ισχυρά σχετίζονται οι δύο μεταβλητές μεταξύ τους:

    =CORREL(B2:B25,C2:C25)

    Το ακόλουθο στιγμιότυπο οθόνης δείχνει όλες αυτές τις φόρμουλες παλινδρόμησης του Excel σε δράση:

    Συμβουλή. Αν θέλετε να λάβετε πρόσθετα στατιστικά στοιχεία για την ανάλυση παλινδρόμησης, χρησιμοποιήστε τη συνάρτηση LINEST με την εντολή s tats η παράμετρος έχει οριστεί σε TRUE, όπως φαίνεται σε αυτό το παράδειγμα.

    Με αυτόν τον τρόπο κάνετε γραμμική παλινδρόμηση στο Excel. Τούτου λεχθέντος, λάβετε υπόψη σας ότι το Microsoft Excel δεν είναι στατιστικό πρόγραμμα. Εάν πρέπει να εκτελέσετε ανάλυση παλινδρόμησης σε επαγγελματικό επίπεδο, ίσως να θέλετε να χρησιμοποιήσετε στοχευμένο λογισμικό όπως το XLSTAT, το RegressIt κ.λπ.

    Για να ρίξετε μια πιο προσεκτική ματιά στους τύπους γραμμικής παλινδρόμησης και σε άλλες τεχνικές που αναλύονται σε αυτό το σεμινάριο, μπορείτε να κατεβάσετε το δείγμα του βιβλίου εργασίας μας παρακάτω. Σας ευχαριστούμε για την ανάγνωση!

    Βιβλίο ασκήσεων

    Ανάλυση παλινδρόμησης στο Excel - παραδείγματα (.xlsx αρχείο)

    Ο Michael Brown είναι ένας αφοσιωμένος λάτρης της τεχνολογίας με πάθος για την απλοποίηση πολύπλοκων διαδικασιών χρησιμοποιώντας εργαλεία λογισμικού. Με περισσότερο από μια δεκαετία εμπειρίας στον κλάδο της τεχνολογίας, έχει βελτιώσει τις δεξιότητές του στο Microsoft Excel και το Outlook, καθώς και στα Φύλλα Google και στα Έγγραφα. Το blog του Michael είναι αφιερωμένο στο να μοιράζεται τη γνώση και την τεχνογνωσία του με άλλους, παρέχοντας εύκολες συμβουλές και σεμινάρια για τη βελτίωση της παραγωγικότητας και της αποτελεσματικότητας. Είτε είστε έμπειρος επαγγελματίας είτε αρχάριος, το ιστολόγιο του Michael προσφέρει πολύτιμες πληροφορίες και πρακτικές συμβουλές για να αξιοποιήσετε στο έπακρο αυτά τα βασικά εργαλεία λογισμικού.