Analisis regresi linear dalam Excel

  • Berkongsi Ini
Michael Brown

Tutorial menerangkan asas analisis regresi dan menunjukkan beberapa cara berbeza untuk melakukan regresi linear dalam Excel.

Bayangkan ini: anda dibekalkan dengan banyak data yang berbeza dan diminta untuk meramalkan nombor jualan tahun depan untuk syarikat anda. Anda telah menemui berpuluh-puluh, mungkin bahkan ratusan, faktor yang mungkin boleh menjejaskan nombor. Tetapi bagaimana anda tahu yang mana yang benar-benar penting? Jalankan analisis regresi dalam Excel. Ia akan memberi anda jawapan kepada ini dan banyak lagi soalan: Faktor manakah yang penting dan yang boleh diabaikan? Sejauh manakah faktor ini berkait antara satu sama lain? Dan sejauh manakah anda pasti tentang ramalan?

    Analisis regresi dalam Excel - asas

    Dalam pemodelan statistik, analisis regresi digunakan untuk anggarkan hubungan antara dua atau lebih pembolehubah:

    Pembolehubah bersandar (aka kriteria pembolehubah) ialah faktor utama yang anda cuba fahami dan ramalkan.

    Pembolehubah tidak bersandar (aka pembolehubah penjelasan atau peramal ) ialah faktor yang mungkin mempengaruhi pembolehubah bersandar.

    Analisis regresi membantu anda memahami bagaimana pembolehubah bersandar berubah apabila salah satu pembolehubah tidak bersandar berubah-ubah dan membolehkan untuk menentukan secara matematik yang mana antara pembolehubah tersebut benar-benar mempunyai kesan.

    Secara teknikal, model analisis regresi adalah berdasarkan jumlah

    Pada ketika ini, carta anda sudah kelihatan seperti graf regresi yang baik:

    Namun, anda mungkin mahu membuat beberapa peningkatan lagi:

    • Seret persamaan ke mana sahaja yang anda rasa sesuai.
    • Tambahkan tajuk paksi ( Elemen Carta butang > Tajuk Paksi ).
    • Jika anda titik data bermula di tengah-tengah paksi mendatar dan/atau menegak seperti dalam contoh ini, anda mungkin mahu menyingkirkan ruang putih yang berlebihan. Petua berikut menerangkan cara melakukan ini: Skala paksi carta untuk mengurangkan ruang putih.

      Dan beginilah rupa graf regresi kami yang dipertingkatkan:

      Nota penting! Dalam graf regresi, pembolehubah bebas hendaklah sentiasa berada pada paksi X dan pembolehubah bersandar pada paksi Y. Jika graf anda diplot dalam susunan terbalik, tukar lajur dalam lembaran kerja anda, dan kemudian lukis carta itu baharu. Jika anda tidak dibenarkan menyusun semula data sumber, maka anda boleh menukar paksi X dan Y terus dalam carta.

    Cara melakukan regresi dalam Excel menggunakan formula

    Microsoft Excel mempunyai beberapa fungsi statistik yang boleh membantu anda melakukan analisis regresi linear seperti LINEST, CERUN, INTERCEPT dan CORREL.

    Fungsi LINEST menggunakan kaedah regresi kuasa dua terkecil untuk mengira lurus baris yang paling baik menerangkan hubungan antara pembolehubah anda dan mengembalikan tatasusunan yang menerangkan baris itu. Anda boleh mendapatkan penjelasan terperinci tentangsintaks fungsi dalam tutorial ini. Buat masa ini, mari buat formula untuk set data sampel kami:

    =LINEST(C2:C25, B2:B25)

    Oleh kerana fungsi LINEST mengembalikan tatasusunan nilai, anda mesti memasukkannya sebagai formula tatasusunan. Pilih dua sel bersebelahan dalam baris yang sama, E2:F2 dalam kes kami, taipkan formula dan tekan Ctrl + Shift + Enter untuk melengkapkannya.

    Formula mengembalikan pekali b ( E1) dan pemalar a (F1) untuk persamaan regresi linear yang sudah biasa:

    y = bx + a

    Jika anda mengelak daripada menggunakan formula tatasusunan dalam lembaran kerja anda, anda boleh mengira a dan b secara berasingan dengan formula biasa:

    Dapatkan pintasan Y (a):

    =INTERCEPT(C2:C25, B2:B25)

    Dapatkan cerun (b):

    =SLOPE(C2:C25, B2:B25)

    Selain itu, anda boleh mencari pekali korelasi ( Berbilang R dalam output ringkasan analisis regresi) yang menunjukkan bagaimana kedua-dua pembolehubah adalah berkaitan antara satu sama lain:

    =CORREL(B2:B25,C2:C25)

    Tangkapan skrin berikut menunjukkan semua formula regresi Excel ini dalam tindakan:

    Petua. Jika anda ingin mendapatkan statistik tambahan untuk analisis regresi anda, gunakan fungsi LINEST dengan parameter s tats ditetapkan kepada TRUE seperti yang ditunjukkan dalam contoh ini.

    Begitulah anda melakukan regresi linear dalam Excel. Walau bagaimanapun, sila ingat bahawa Microsoft Excel bukanlah program statistik. Jika anda perlu melakukan analisis regresi di peringkat profesional, anda mungkin mahu menggunakan disasarkanperisian seperti XLSTAT, RegressIt, dsb.

    Untuk melihat dengan lebih dekat formula regresi linear kami dan teknik lain yang dibincangkan dalam tutorial ini, anda dialu-alukan untuk memuat turun contoh buku kerja kami di bawah. Terima kasih kerana membaca!

    Buku kerja berlatih

    Analisis Regresi dalam Excel - contoh (fail .xlsx)

    segi empat sama, iaitu cara matematik untuk mencari serakan titik data. Matlamat model adalah untuk mendapatkan jumlah kuasa dua terkecil yang mungkin dan melukis garisan yang paling hampir dengan data.

    Dalam statistik, mereka membezakan antara regresi linear mudah dan berbilang. Regresi linear mudah memodelkan hubungan antara pembolehubah bersandar dan satu pembolehubah tidak bersandar menggunakan fungsi linear. Jika anda menggunakan dua atau lebih pembolehubah penjelasan untuk meramalkan pembolehubah bersandar, anda berurusan dengan regresi linear berganda . Jika pembolehubah bersandar dimodelkan sebagai fungsi bukan linear kerana hubungan data tidak mengikut garis lurus, gunakan regresi bukan linear sebaliknya. Tumpuan tutorial ini adalah pada regresi linear mudah.

    Sebagai contoh, mari kita ambil nombor jualan untuk payung selama 24 bulan yang lalu dan ketahui purata hujan bulanan untuk tempoh yang sama. Plot maklumat ini pada carta, dan garis regresi akan menunjukkan hubungan antara pembolehubah bebas (hujan) dan pembolehubah bersandar (jualan payung):

    Persamaan regresi linear

    Secara matematik, regresi linear ditakrifkan oleh persamaan ini:

    y = bx + a + ε

    Di mana:

    • x ialah pembolehubah bebas.
    • y ialah pembolehubah bersandar.
    • a ialah Y-pintasan , iaitu nilai min yang dijangkakan bagi y apabila semua x pembolehubah adalah sama dengan 0. Pada graf regresi, ia adalah titik di mana garis melintasi paksi Y.
    • b ialah cerun garis regresi, iaitu kadar perubahan untuk y apabila x berubah.
    • ε ialah ralat rawak istilah, iaitu perbezaan antara nilai sebenar pembolehubah bersandar dan nilai ramalannya.

    Persamaan regresi linear sentiasa mempunyai istilah ralat kerana, dalam kehidupan sebenar, peramal tidak pernah tepat dengan sempurna. Walau bagaimanapun, sesetengah program, termasuk Excel, melakukan pengiraan jangka ralat di belakang tabir. Jadi, dalam Excel, anda melakukan regresi linear menggunakan kaedah petak terkecil dan cari pekali a dan b supaya:

    y = bx + a

    Untuk contoh kami, persamaan regresi linear mengambil bentuk berikut:

    Umbrellas sold = b * rainfall + a

    Terdapat beberapa cara yang berbeza untuk mencari a dan b . Tiga kaedah utama untuk melaksanakan analisis regresi linear dalam Excel ialah:

    • Alat regresi disertakan dengan Analysis ToolPak
    • Carta taburan dengan garis arah aliran
    • Formula regresi linear

    Di bawah anda akan menemui arahan terperinci tentang menggunakan setiap kaedah.

    Cara melakukan regresi linear dalam Excel dengan Analysis ToolPak

    Contoh ini menunjukkan cara menjalankan regresi dalam Excel dengan menggunakan alat khas yang disertakan dengan alat tambah Analysis ToolPak.

    Dayakan tambahan Analysis ToolPak-dalam

    Analysis ToolPak tersedia dalam semua versi Excel 365 hingga 2003 tetapi tidak didayakan secara lalai. Jadi, anda perlu menghidupkannya secara manual. Begini caranya:

    1. Dalam Excel anda, klik Fail > Pilihan .
    2. Dalam Excel Options kotak dialog, pilih Add-in pada bar sisi kiri, pastikan Excel Add-in dipilih dalam kotak Urus dan klik Go .
    3. Dalam kotak dialog Add-in , tandakan Analysis Toolpak dan klik OK :

    Ini akan menambah alat Analisis Data pada tab Data pada reben Excel anda.

    Jalankan analisis regresi

    Dalam contoh ini, kita akan melakukan regresi linear mudah dalam Excel. Apa yang kami ada ialah senarai purata hujan bulanan selama 24 bulan terakhir dalam lajur B, iaitu pembolehubah bebas kami (peramal) dan bilangan payung yang dijual dalam lajur C, yang merupakan pembolehubah bersandar. Sudah tentu, terdapat banyak faktor lain yang boleh menjejaskan jualan, tetapi buat masa ini kami hanya menumpukan pada dua pembolehubah ini:

    Dengan Analisis Toolpak ditambah didayakan, jalankan langkah ini untuk melaksanakan analisis regresi dalam Excel:

    1. Pada tab Data , dalam kumpulan Analisis , klik butang Analisis Data .
    2. Pilih Regression dan klik OK .
    3. Dalam kotak dialog Regression , konfigurasikan tetapan berikut:
      • Pilih InputJulat Y , iaitu pembolehubah bersandar anda. Dalam kes kami, ia adalah jualan payung (C1:C25).
      • Pilih Julat X Input , iaitu pembolehubah bebas anda. Dalam contoh ini, ini ialah purata hujan bulanan (B1:B25).

      Jika anda sedang membina model regresi berbilang, pilih dua atau lebih lajur bersebelahan dengan pembolehubah bebas yang berbeza.

      • Semak kotak Label jika terdapat pengepala di bahagian atas julat X dan Y anda.
      • Pilih pilihan Output pilihan anda, lembaran kerja baharu dalam kami kes.
      • Sebagai pilihan, pilih kotak pilihan Residual untuk mendapatkan perbezaan antara nilai yang diramalkan dan sebenar.
    4. Klik OK dan perhatikan output analisis regresi yang dibuat oleh Excel.

    Terjemahkan output analisis regresi

    Seperti yang baru anda lihat, menjalankan regresi dalam Excel adalah mudah kerana semua pengiraan telah dibentuk secara automatik. Tafsiran keputusan agak rumit kerana anda perlu tahu apa yang ada di sebalik setiap nombor. Di bawah anda akan menemui pecahan 4 bahagian utama output analisis regresi.

    Output analisis regresi: Output Ringkasan

    Bahagian ini memberitahu anda sejauh mana persamaan regresi linear yang dikira sesuai dengan data sumber anda.

    Berikut ialah maksud setiap maklumat:

    Berbilang R . Ia ialah C Orelation Coefficient yang mengukur kekuatanhubungan linear antara dua pembolehubah. Pekali korelasi boleh menjadi sebarang nilai antara -1 dan 1, dan nilai mutlaknya menunjukkan kekuatan hubungan. Lebih besar nilai mutlak, lebih kuat hubungan:

    • 1 bermakna hubungan positif yang kuat
    • -1 bermakna hubungan negatif yang kuat
    • 0 bermakna tiada hubungan di semua

    R Square . Ia ialah Pekali Penentuan , yang digunakan sebagai penunjuk kebaikan kesesuaian. Ia menunjukkan berapa banyak mata jatuh pada garis regresi. Nilai R2 dikira daripada jumlah kuasa dua, lebih tepat lagi, ia adalah jumlah sisihan kuasa dua data asal daripada min.

    Dalam contoh kami, R2 ialah 0.91 (dibundarkan kepada 2 digit) , yang adalah dongeng yang baik. Ini bermakna 91% daripada nilai kami sesuai dengan model analisis regresi. Dalam erti kata lain, 91% daripada pembolehubah bersandar (nilai-y) dijelaskan oleh pembolehubah bebas (nilai-x). Secara umumnya, R Squared sebanyak 95% atau lebih dianggap sesuai.

    R Squared Terlaras . Ia ialah R square yang dilaraskan untuk bilangan pembolehubah bebas dalam model. Anda akan mahu menggunakan nilai ini dan bukannya R square untuk analisis regresi berbilang.

    Ralat Standard . Ia adalah satu lagi ukuran kebaikan yang menunjukkan ketepatan analisis regresi anda - semakin kecil bilangannya, semakin pasti anda akanpersamaan regresi anda. Walaupun R2 mewakili peratusan varians pembolehubah bersandar yang dijelaskan oleh model, Ralat Piawai ialah ukuran mutlak yang menunjukkan jarak purata titik data jatuh dari garis regresi.

    Pemerhatian . Ia hanyalah bilangan pemerhatian dalam model anda.

    Output analisis regresi: ANOVA

    Bahagian kedua output ialah Analisis Varians (ANOVA):

    Pada asasnya, ia membahagikan jumlah kuasa dua kepada komponen individu yang memberikan maklumat tentang tahap kebolehubahan dalam model regresi anda:

    • df ialah bilangan darjah kebebasan yang dikaitkan dengan sumber varians.
    • SS ialah hasil tambah kuasa dua. Lebih kecil Residual SS berbanding Jumlah SS, lebih baik model anda sesuai dengan data.
    • MS ialah min kuasa dua.
    • F ialah statistik F, atau ujian-F untuk hipotesis nol. Ia digunakan untuk menguji kepentingan keseluruhan model.
    • Kesignifikan F ialah nilai P bagi F.

    Bahagian ANOVA jarang digunakan untuk analisis regresi linear mudah dalam Excel, tetapi anda pasti perlu melihat dengan teliti komponen terakhir. Nilai Significance F memberikan gambaran tentang sejauh mana kebolehpercayaan (signifikan secara statistik) hasil anda. Jika Kepentingan F kurang daripada 0.05 (5%), model anda adalah OK. Jika lebih besar daripada 0.05, anda akanmungkin lebih baik memilih pembolehubah bebas yang lain.

    Output analisis regresi: pekali

    Bahagian ini menyediakan maklumat khusus tentang komponen analisis anda:

    Komponen yang paling berguna dalam bahagian ini ialah Pekali . Ia membolehkan anda membina persamaan regresi linear dalam Excel:

    y = bx + a

    Untuk set data kami, dengan y ialah bilangan payung yang dijual dan x ialah purata hujan bulanan, formula regresi linear kami adalah seperti berikut:

    Y = Rainfall Coefficient * x + Intercept

    Dilengkapi dengan nilai a dan b yang dibundarkan kepada tiga tempat perpuluhan, ia bertukar menjadi:

    Y=0.45*x-19.074

    Sebagai contoh, dengan purata hujan bulanan bersamaan dengan 82 mm, jualan payung adalah lebih kurang 17.8:

    0.45*82-19.074=17.8

    Dengan cara yang sama, anda boleh mengetahui bilangan payung yang akan dijual dengan mana-mana hujan bulanan lain (x pembolehubah) yang anda tentukan.

    Keluaran analisis regresi: baki

    Jika anda membandingkan anggaran dan bilangan sebenar payung yang dijual sepadan dengan hujan bulanan 82 mm, anda akan melihat bahawa nombor ini berbeza sedikit:

    • Anggaran: 17.8 (dikira di atas)
    • Sebenar: 15 (baris 2 data sumber)

    Mengapa perbezaannya? Kerana pembolehubah bebas tidak pernah menjadi peramal yang sempurna bagi pembolehubah bersandar. Dan sisa boleh membantu anda memahami sejauh mana nilai sebenar daripada nilai yang diramalkan:

    Untuktitik data pertama (hujan 82 mm), baki adalah lebih kurang -2.8. Jadi, kami menambah nombor ini pada nilai yang diramalkan dan mendapatkan nilai sebenar: 17.8 - 2.8 = 15.

    Cara membuat graf regresi linear dalam Excel

    Jika anda perlu memvisualisasikan dengan cepat hubungan antara dua pembolehubah, lukis carta regresi linear. Itu sangat mudah! Begini caranya:

    1. Pilih dua lajur dengan data anda, termasuk pengepala.
    2. Pada tab Inset , dalam kumpulan Sembang , klik ikon Carta taburan dan pilih lakaran kecil Taburan (yang pertama):

      Ini akan memasukkan plot taburan dalam lembaran kerja anda, yang akan menyerupai ini satu:

    3. Sekarang, kita perlu melukis garis regresi kuasa dua terkecil. Untuk melakukannya, klik kanan pada mana-mana titik dan pilih Tambah Garis Aliran... daripada menu konteks.
    4. Pada anak tetingkap kanan, pilih bentuk garis arah aliran Linear dan, secara pilihan, semak Persamaan Paparan pada Carta untuk mendapatkan formula regresi anda:

      Seperti yang anda mungkin perasan, persamaan regresi yang telah dicipta oleh Excel untuk kami adalah sama dengan formula regresi linear yang kami bina berdasarkan output Pekali.

    5. Tukar kepada Isi & Tab Line dan sesuaikan baris mengikut keinginan anda. Sebagai contoh, anda boleh memilih warna garisan yang berbeza dan menggunakan garis pepejal dan bukannya garis putus-putus (pilih Garisan pepejal dalam kotak Jenis sempang ):

    Michael Brown ialah peminat teknologi yang berdedikasi dengan semangat untuk memudahkan proses kompleks menggunakan alat perisian. Dengan lebih sedekad pengalaman dalam industri teknologi, beliau telah mengasah kemahirannya dalam Microsoft Excel dan Outlook, serta Helaian Google dan Dokumen. Blog Michael berdedikasi untuk berkongsi pengetahuan dan kepakarannya dengan orang lain, menyediakan petua dan tutorial yang mudah diikuti untuk meningkatkan produktiviti dan kecekapan. Sama ada anda seorang profesional berpengalaman atau pemula, blog Michael menawarkan pandangan berharga dan nasihat praktikal untuk memanfaatkan sepenuhnya alatan perisian penting ini.