Excel-də xətti reqressiya təhlili

  • Bunu Paylaş
Michael Brown

Təlimat reqressiya təhlilinin əsaslarını izah edir və Excel-də xətti reqressiyanın bir neçə fərqli üsulunu göstərir.

Bunu təsəvvür edin: sizə çoxlu müxtəlif verilənlər və məlumatlar verilir. şirkətiniz üçün gələn il satış rəqəmlərini proqnozlaşdırmaq istənir. Siz saylara təsir edə biləcək onlarla, bəlkə də yüzlərlə faktor kəşf etdiniz. Ancaq hansının həqiqətən vacib olduğunu necə bilirsiniz? Excel-də reqressiya təhlilini yerinə yetirin. O, sizə bu və daha bir çox suallara cavab verəcək: Hansı amillər vacibdir və hansını nəzərə almamaq olar? Bu amillər bir-biri ilə nə dərəcədə sıx bağlıdır? Və proqnozlara nə dərəcədə əmin ola bilərsiniz?

    Excel-də reqressiya təhlili - əsaslar

    Statistik modelləşdirmədə reqressiya təhlili istifadə olunur. iki və ya daha çox dəyişən arasındakı əlaqələri təxmin edin:

    Asılı dəyişən (aka kriteriya dəyişən) başa düşməyə və proqnozlaşdırmağa çalışdığınız əsas amildir.

    Müstəqil dəyişənlər (aka izahedici dəyişənlər və ya prediktorlar ) asılı dəyişənə təsir edə biləcək amillərdir.

    Reqressiya təhlili sizə kömək edir. müstəqil dəyişənlərdən biri dəyişdikdə asılı dəyişənin necə dəyişdiyini başa düşmək və həmin dəyişənlərdən hansının həqiqətən təsir göstərdiyini riyazi olaraq müəyyən etməyə imkan verir.

    Texniki cəhətdən reqressiya təhlili modeli məlumatların cəminə əsaslanır.

    Bu nöqtədə qrafikiniz artıq layiqli reqressiya qrafikinə bənzəyir:

    Yenə də bir neçə təkmilləşdirmə etmək istəyə bilərsiniz:

    • Tənliyi uyğun gördüyünüz yerə dartın.
    • Ox başlıqlarını əlavə edin ( Qrafik Elementləri düyməsi > Ox Başlıqları ).
    • Əgər məlumat nöqtələri bu nümunədə olduğu kimi üfüqi və/və ya şaquli oxun ortasında başlayır, həddindən artıq boş boşluqdan xilas olmaq istəyə bilərsiniz. Aşağıdakı ipucu bunun necə ediləcəyini izah edir: Ağ boşluğu azaltmaq üçün diaqram oxlarını miqyaslayın.

      Və təkmilləşdirilmiş reqressiya qrafikimiz belə görünür:

      Vacib qeyd! Reqressiya qrafikində müstəqil dəyişən həmişə X oxunda, asılı dəyişən isə Y oxunda olmalıdır. Qrafikiniz tərs qaydada qurulubsa, iş vərəqinizdəki sütunları dəyişdirin və sonra qrafiki yenidən çəkin. Mənbə məlumatlarını yenidən təşkil etməyə icazəniz yoxdursa, onda siz X və Y oxlarını birbaşa diaqramda dəyişə bilərsiniz.

    Düsturlardan istifadə edərək Excel-də reqressiyanı necə etmək olar

    Microsoft Excel-də LINEST, SLOPE, INTERCEPT və CORREL kimi xətti reqressiya təhlili aparmağa kömək edə biləcək bir neçə statistik funksiya var.

    SƏT funksiyası düz hesablamaq üçün ən kiçik kvadratların reqressiya metodundan istifadə edir. dəyişənləriniz arasındakı əlaqəni ən yaxşı izah edən və həmin xətti təsvir edən massivi qaytaran xətt. Ətraflı izahatını tapa bilərsinizbu dərslikdə funksiyanın sintaksisi. Hələlik gəlin nümunə verilənlər dəstimiz üçün düstur yaradaq:

    =LINEST(C2:C25, B2:B25)

    XATQ funksiyası dəyərlər massivini qaytardığına görə siz onu massiv düsturu kimi daxil etməlisiniz. Eyni cərgədə iki qonşu xana seçin, bizim vəziyyətimizdə E2:F2, düsturu yazın və tamamlamaq üçün Ctrl + Shift + Enter düymələrini basın.

    Düstur b əmsalını qaytarır ( E1) və artıq tanış olan xətti reqressiya tənliyi üçün a sabiti (F1):

    y = bx + a

    İş vərəqlərində massiv düsturlarından istifadə etməsəniz, a və b ayrı-ayrılıqda adi düsturlarla:

    Y-kəsicini (a) alın:

    =INTERCEPT(C2:C25, B2:B25)

    Mamacı alın (b):

    =SLOPE(C2:C25, B2:B25)

    Bundan əlavə, siz korrelyasiya əmsalı (reqressiya təhlilinin xülasə çıxışında Çoxlu R ) tapa bilərsiniz iki dəyişən bir-biri ilə güclü şəkildə əlaqəlidir:

    =CORREL(B2:B25,C2:C25)

    Aşağıdakı skrinshot bütün bu Excel reqressiya düsturlarını işləyir:

    İpucu. Əgər reqressiya təhliliniz üçün əlavə statistika əldə etmək istəyirsinizsə, bu misalda göstərildiyi kimi s tats parametri TRUE olaraq təyin edilmiş LINEST funksiyasından istifadə edin.

    Xətti reqressiyanı belə edirsiniz. Excel-də. Bununla belə, Microsoft Excel-in statistik proqram olmadığını unutmayın. Peşəkar səviyyədə reqressiya təhlili aparmaq lazımdırsa, hədəflənmiş istifadə etmək istəyə bilərsinizXLSTAT, RegressIt və s. kimi proqram təminatı

    Bu dərslikdə müzakirə olunan xətti reqressiya düsturlarımıza və digər texnikalarımıza daha yaxından baxmaq üçün aşağıdakı nümunə iş dəftərimizi endirə bilərsiniz. Oxuduğunuz üçün təşəkkür edirik!

    İş dəftərini məşq edin

    Excel-də reqressiya təhlili - nümunələr (.xlsx faylı)

    kvadratlar, məlumat nöqtələrinin dispersiyasını tapmaq üçün riyazi üsuldur. Modelin məqsədi kvadratların mümkün olan ən kiçik cəmini əldə etmək və verilənlərə ən yaxın olan xətti çəkməkdir.

    Statistikada onlar sadə və çoxlu xətti reqressiyanı fərqləndirirlər. Sadə xətti reqressiya xətti funksiyadan istifadə edərək asılı dəyişən ilə bir müstəqil dəyişən arasındakı əlaqəni modelləşdirir. Asılı dəyişəni proqnozlaşdırmaq üçün iki və ya daha çox izahlı dəyişəndən istifadə etsəniz, çox xətti reqressiya ilə məşğul olursunuz. Əgər asılı dəyişən qeyri-xətti funksiya kimi modelləşdirilibsə, çünki məlumat əlaqələri düz xəttə əməl etmirsə, bunun əvəzinə qeyri-xətti reqressiya istifadə edin. Bu dərsliyin diqqəti sadə xətti reqressiya üzərində olacaq.

    Nümunə olaraq, son 24 ay üçün çətirlərin satış rəqəmlərini götürək və eyni dövr üçün orta aylıq yağıntını öyrənək. Bu məlumatı qrafikdə tərtib edin və reqressiya xətti müstəqil dəyişən (yağış) və asılı dəyişən (çətir satışları) arasındakı əlaqəni nümayiş etdirəcək:

    Xətti reqressiya tənliyi

    Riyazi olaraq xətti reqressiya bu tənliklə müəyyən edilir:

    y = bx + a + ε

    Burada:

    • x müstəqil dəyişəndir.
    • y asılı dəyişəndir.
    • a Y-kəsici , gözlənilən orta dəyəridir. y bütün x dəyişənləri 0-a bərabər olduqda. Reqressiya qrafikində bu xəttin Y oxunu kəsdiyi nöqtədir.
    • b -dir. y üçün x dəyişdikcə dəyişmə sürəti olan reqressiya xəttinin mailliyi .
    • ε təsadüfi xətadır. şərtdir ki, bu da asılı dəyişənin faktiki dəyəri ilə onun proqnozlaşdırılan dəyəri arasındakı fərqdir.

    Xətti reqressiya tənliyində həmişə xəta termini olur, çünki real həyatda proqnozlaşdırıcılar heç vaxt tam dəqiq olmur. Bununla belə, bəzi proqramlar, o cümlədən Excel, pərdə arxasında səhv müddətinin hesablanmasını həyata keçirir. Beləliklə, Excel-də siz kiçik kvadratlar metodundan istifadə edərək xətti reqressiya edirsiniz və a b əmsallarını axtarırsınız ki:

    y = bx + a

    Nümunəmiz üçün xətti reqressiya tənliyi aşağıdakı formanı alır:

    Umbrellas sold = b * rainfall + a

    a b<-ni tapmaq üçün bir çox müxtəlif yollar mövcuddur. 2>. Excel-də xətti reqressiya təhlilini yerinə yetirmək üçün üç əsas üsul bunlardır:

    • Analiz ToolPak-a daxil olan reqressiya aləti
    • Trend xətti ilə səpilmə qrafiki
    • Xətti reqressiya düsturu

    Aşağıda siz hər bir metoddan istifadə ilə bağlı ətraflı təlimatları tapa bilərsiniz.

    Excel-də Analiz Alətlər Paketi ilə xətti reqressiyanı necə etmək olar

    Bu nümunə Excel-də reqressiyanın necə icra olunacağını göstərir. Analysis ToolPak əlavəsinə daxil olan xüsusi alətdən istifadə etməklə.

    Analiz ToolPak əlavəsini aktivləşdirinin

    Analysis ToolPak Excel 365-2003-ün bütün versiyalarında mövcuddur, lakin defolt olaraq aktiv deyil. Beləliklə, onu əl ilə yandırmalısınız. Budur:

    1. Excel-də Fayl > Seçimlər üzərinə klikləyin.
    2. Excel Seçimlərində dialoq qutusunda, sol yan paneldə Əlavələr seçin, İdarə et qutusunda Excel Əlavələri seçildiyinə əmin olun və Get .
    3. Əlavələr dialoq qutusunda Analysis Toolpak üzərinə işarələyin və OK üzərinə klikləyin:

    Bu, Məlumat Analizi alətlərini Excel lentinizin Məlumat nişanına əlavə edəcək.

    Reqressiya təhlilini həyata keçirin

    İçində bu nümunədə Excel-də sadə xətti reqressiya edəcəyik. Əlimizdə olan, müstəqil dəyişənimiz (proqnozlaşdırıcı) olan B sütununda son 24 ayda orta aylıq yağıntının siyahısı və asılı dəyişən olan C sütununda satılan çətirlərin sayıdır. Əlbəttə ki, satışa təsir edə biləcək bir çox başqa amillər var, lakin hələlik biz yalnız bu iki dəyişənə diqqət yetiririk:

    Təhlil alətlər paketi əlavə olunduqda, Excel-də reqressiya təhlilini həyata keçirmək üçün bu addımları yerinə yetirin:

    1. Məlumat nişanında, Təhlil qrupunda Məlumat Analizi düyməsini klikləyin.
    2. Reqressiya seçin və OK klikləyin.
    3. Reqressiya dialoq qutusunda aşağıdakı parametrləri konfiqurasiya edin:
      • Daxiletməni seçinY Aralığı , sizin asılı dəyişəniniz . Bizim vəziyyətimizdə bu, çətir satışlarıdır (C1:C25).
      • Input X Range seçin, yəni sizin müstəqil dəyişən . Bu misalda bu, orta aylıq yağıntıdır (B1:B25).

      Çoxsaylı reqressiya modeli qurursanız, müxtəlif müstəqil dəyişənlərə malik iki və ya daha çox bitişik sütun seçin.

      • X və Y diapazonlarınızın yuxarısında başlıqlar varsa Etiketlər qutusunu yoxlayın.
      • Tercih etdiyiniz Çıxış seçimini, bizimdə yeni iş vərəqini seçin halda.
      • İstəyə görə, proqnozlaşdırılan və faktiki dəyərlər arasında fərqi əldə etmək üçün Qalıqlar qutusunu seçin.
    4. OK düyməsinə klikləyin və Excel tərəfindən yaradılmış reqressiya analizi çıxışını müşahidə edin.

    Reqressiya analizinin nəticəsini şərh edin

    İndi gördüyünüz kimi, Excel-də reqressiyanın icrası asandır, çünki bütün hesablamalar avtomatik olaraq hazırlanır. Nəticələrin təfsiri bir qədər çətin olur, çünki hər bir rəqəmin arxasında nə olduğunu bilməlisiniz. Aşağıda siz reqressiya təhlili çıxışının 4 əsas hissəsinin bölgüsü ilə tanış olacaqsınız.

    Reqressiya təhlilinin nəticəsi: Xülasə Nəticə

    Bu hissə sizə hesablanmış xətti reqressiya tənliyinin mənbə məlumatlarınıza nə dərəcədə uyğun olduğunu bildirir.

    Hər bir məlumatın mənası budur:

    Çoxlu R . Gücünü ölçən C orrelyasiya əmsalı diriki dəyişən arasında xətti əlaqə. Korrelyasiya əmsalı -1 ilə 1 arasında istənilən qiymət ola bilər və onun mütləq dəyəri əlaqənin gücünü göstərir. Mütləq dəyər nə qədər böyükdürsə, əlaqə bir o qədər güclüdür:

    • 1 güclü müsbət əlaqə deməkdir
    • -1 güclü mənfi əlaqə deməkdir
    • 0 əlaqənin olmaması deməkdir. hamısı

    R Meydanı . Bu, uyğunluğun yaxşılığının göstəricisi kimi istifadə edilən Determinasiya əmsalı -dir. Bu, reqressiya xəttində neçə nöqtənin düşdüyünü göstərir. R2 dəyəri kvadratların ümumi cəmindən hesablanır, daha dəqiq desək, ilkin məlumatların ortadan kvadrat kənara çıxmalarının cəmidir.

    Bizim nümunəmizdə R2 0,91-dir (2 rəqəmə yuvarlaqlaşdırılıb) , bu çox yaxşıdır. Bu o deməkdir ki, dəyərlərimizin 91%-i reqressiya analizi modelinə uyğun gəlir. Başqa sözlə, asılı dəyişənlərin (y-qiymətləri) 91%-i müstəqil dəyişənlər (x-qiymətləri) ilə izah olunur. Ümumiyyətlə, 95% və ya daha çox olan R Kvadratı yaxşı uyğunluq hesab olunur.

    Düzenlenmiş R kvadratı . Bu, modeldəki müstəqil dəyişənlərin sayına uyğunlaşdırılmış R kvadratı -dir. Çoxlu reqressiya təhlili üçün R kvadratı əvəzinə bu dəyəri istifadə etmək istərdiniz.

    Standart Xəta . Bu, reqressiya analizinizin dəqiqliyini göstərən başqa bir uyğunluq ölçüsüdür - rəqəm nə qədər kiçik olsa, bir o qədər əmin ola bilərsiniz.reqressiya tənliyiniz. R2 model tərəfindən izah edilən asılı dəyişənlərin dispersiyasının faizini təmsil etdiyi halda, Standart Səhv məlumat nöqtələrinin reqressiya xəttindən düşdüyü orta məsafəni göstərən mütləq ölçüdür.

    Müşahidələr . Bu, sadəcə olaraq modelinizdə müşahidələrin sayıdır.

    Reqressiya analizinin nəticəsi: ANOVA

    Çıxışın ikinci hissəsi Variasiya Təhlilidir (ANOVA):

    Əsasən, o, kvadratların cəmini reqressiya modelinizdə dəyişkənlik səviyyələri haqqında məlumat verən fərdi komponentlərə bölür:

    • df mənbələrlə əlaqəli sərbəstlik dərəcələrinin sayıdır. dispersiya.
    • SS kvadratların cəmidir. Ümumi SS ilə müqayisədə Qalıq SS nə qədər kiçik olsa, modeliniz dataya bir o qədər yaxşı uyğun gəlir.
    • MS orta kvadratdır.
    • F F statistikası və ya sıfır fərziyyə üçün F-testidir. O, modelin ümumi əhəmiyyətini yoxlamaq üçün istifadə olunur.
    • Əhəmiyyətlilik F F-nin P-qiymətidir.

    ANOVA hissəsi nadir hallarda istifadə olunur. Excel-də sadə xətti reqressiya təhlili, lakin mütləq sonuncu komponentə yaxından nəzər salmalısınız. Əhəmiyyətlilik F qiyməti nəticələrinizin nə qədər etibarlı (statistik cəhətdən əhəmiyyətli) olması barədə fikir verir. Əhəmiyyətlilik F 0,05-dən (5%) azdırsa, modeliniz qaydasındadır. Əgər 0,05-dən çox olarsa, bunu edərdinizyəqin ki, daha yaxşı başqa müstəqil dəyişən seçmək daha yaxşıdır.

    Reqressiya analizinin nəticəsi: əmsallar

    Bu bölmə təhlilinizin komponentləri haqqında xüsusi məlumat verir:

    Bu bölmədə ən faydalı komponent əmsallar . O, Excel-də xətti reqressiya tənliyini qurmağa imkan verir:

    y = bx + a

    Məlumat dəstimiz üçün, burada y satılan çətirlərin sayı, x isə orta aylıq yağıntıdır, xətti reqressiya düsturumuz aşağıdakı kimidir:

    Y = Rainfall Coefficient * x + Intercept

    Üç onluq yerə yuvarlaqlaşdırılan a və b qiymətləri ilə təchiz edilmiş, o çevrilir:

    Y=0.45*x-19.074

    Məsələn, orta aylıq yağıntının 82 mm-ə bərabər olması ilə çətir satışı təxminən 17,8 olacaq:

    0.45*82-19.074=17.8

    Oxşar şəkildə, neçə çətir olacağını öyrənə bilərsiniz. Sizin göstərdiyiniz hər hansı digər aylıq yağıntı (x dəyişəni) ilə satılır.

    Reqressiya təhlili çıxışı: qalıqlar

    Aylıq 82 mm yağıntıya uyğun gələn satılan çətirlərin təxmini və faktiki sayını müqayisə etsəniz, bu rəqəmlərin bir qədər fərqli olduğunu görəcəksiniz:

    • Təxmini: 17,8 (yuxarıda hesablanıb)
    • Faktiki: 15 (mənbə məlumatının 2-ci sətiri)

    Niyə fərq var? Çünki müstəqil dəyişənlər heç vaxt asılı dəyişənlərin mükəmməl proqnozlaşdırıcıları deyillər. Və qalıqlar faktiki dəyərlərin proqnozlaşdırılan dəyərlərdən nə qədər uzaq olduğunu anlamağa kömək edə bilər:

    Üçünilk məlumat nöqtəsi (82 mm yağıntı), qalıq təxminən -2,8-dir. Beləliklə, biz bu rəqəmi proqnozlaşdırılan dəyərə əlavə edirik və faktiki dəyəri əldə edirik: 17,8 - 2,8 = 15.

    Excel-də xətti reqressiya qrafikini necə etmək olar

    Əgər siz tez vizuallaşdırmaq lazımdırsa iki dəyişən arasındakı əlaqəni, xətti reqressiya grafiğini çəkin. Bu çox asandır! Budur:

    1. Başlıqlar daxil olmaqla datanızla iki sütun seçin.
    2. Daxil tabında, Söhbətlər qrupunda , Scatter chart ikonasına klikləyin və Scatter miniatürünü seçin (birinci):

      Bu, iş vərəqinizə buna bənzəyən səpələnmə qrafiki daxil edəcək. biri:

    3. İndi isə ən kiçik kvadratların reqressiya xəttini çəkməliyik. Bunu etmək üçün istənilən nöqtəni sağ klikləyin və kontekst menyusundan Trend xətti əlavə et... seçin.
    4. Sağ paneldə Xətti trend xətti şəklini seçin və istəyə görə, reqressiya düsturunuzu əldə etmək üçün Qrafikdə Tənliyi göstərin:

      Gördüyünüz kimi, Excel-in bizim üçün yaratdığı reqressiya tənliyi Əmsallar çıxışı əsasında qurduğumuz xətti reqressiya düsturu ilə eynidir.

    5. Doldur və amp; Line tab və xətti öz zövqünüzə uyğunlaşdırın. Məsələn, siz fərqli xətt rəngi seçə və kəsikli xətt əvəzinə düz xətt istifadə edə bilərsiniz ( Tire növü qutusunda Bərk xətt seçin):

    Michael Brown proqram alətlərindən istifadə edərək mürəkkəb prosesləri sadələşdirməyə həvəsi olan xüsusi texnologiya həvəskarıdır. Texnologiya sənayesində on ildən artıq təcrübəyə malik olmaqla, o, Microsoft Excel və Outlook, həmçinin Google Cədvəl və Sənədlərdə bacarıqlarını mükəmməlləşdirib. Mayklın bloqu öz biliyini və təcrübəsini başqaları ilə bölüşməyə, məhsuldarlığı və səmərəliliyi artırmaq üçün asan izlənilən məsləhətlər və dərslikləri təqdim etməyə həsr olunub. İstər təcrübəli peşəkar, istərsə də yeni başlayan biri olmağınızdan asılı olmayaraq, Mayklın bloqu bu vacib proqram alətlərindən maksimum yararlanmaq üçün dəyərli fikirlər və praktiki məsləhətlər təklif edir.