Isi kandungan
Tutorial menerangkan asas korelasi dalam Excel, menunjukkan cara mengira pekali korelasi, membina matriks korelasi dan mentafsir keputusan.
Salah satu pengiraan statistik paling mudah yang boleh anda lakukan dalam Excel ialah korelasi. Walaupun mudah, ia sangat berguna dalam memahami hubungan antara dua atau lebih pembolehubah. Microsoft Excel menyediakan semua alatan yang diperlukan untuk menjalankan analisis korelasi, anda hanya perlu tahu cara menggunakannya.
Korelasi dalam Excel - asas
Korelasi ialah ukuran yang menerangkan kekuatan dan arah hubungan antara dua pembolehubah. Ia biasanya digunakan dalam perangkaan, ekonomi dan sains sosial untuk belanjawan, rancangan perniagaan dan seumpamanya.
Kaedah yang digunakan untuk mengkaji sejauh mana pembolehubah itu berkaitan dipanggil analisis korelasi .
Berikut ialah beberapa contoh korelasi yang kuat:
- Bilangan kalori yang anda makan dan berat anda (kaitan positif)
- Suhu di luar dan bil pemanasan anda ( korelasi negatif)
Dan di sini contoh data yang mempunyai korelasi lemah atau tiada:
- Nama kucing anda dan makanan kegemaran mereka
- Warna mata anda dan ketinggian anda
Perkara penting untuk memahami tentang korelasi ialah ia hanya menunjukkan betapa rapatnya dua pembolehubah. Korelasi, bagaimanapun, tidak membayangkandaripada julat yang ditentukan.
Untuk lebih memahami logik, mari lihat cara formula mengira pekali yang diserlahkan dalam tangkapan skrin di atas.
Pertama, mari kita lihat periksa formula dalam B18, yang mencari korelasi antara suhu bulanan (B2:B13) dan pemanas yang dijual (D2:D13):
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))
Dalam fungsi OFFSET pertama, ROWS($1: 1) telah bertukar kepada ROWS($1:3) kerana koordinat kedua adalah relatif, jadi ia berubah berdasarkan kedudukan relatif baris tempat formula disalin (2 baris ke bawah). Oleh itu, ROWS() mengembalikan 3, daripadanya kita tolak 1, dan dapatkan julat iaitu 2 lajur di sebelah kanan julat sumber, iaitu $D$2:$D$13 (jualan pemanas).
The OFFSET kedua tidak mengubah julat yang ditentukan $B$2:$B$13 (suhu) kerana COLUMNS($A:A)-1 mengembalikan sifar.
Hasilnya, formula panjang kami bertukar menjadi CORREL( $D$2:$D$13, $B$2:$B$13) dan mengembalikan dengan tepat pekali yang kita inginkan.
Formula dalam C18 yang mengira pekali korelasi untuk kos pengiklanan (C2:C13) dan jualan ( D2:D13) berfungsi dengan cara yang sama:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))
Fungsi OFFSET pertama ialahsama sekali seperti yang diterangkan di atas, mengembalikan julat $D$2:$D$13 (jualan pemanas).
Dalam OFFSET kedua, COLUMNS($A:A)-1 bertukar kepada COLUMNS($A: B)-1 kerana kami telah menyalin lajur formula 1 ke kanan. Akibatnya, OFFSET mendapat julat iaitu 1 lajur di sebelah kanan julat sumber, iaitu $C$2:$C$13 (kos pengiklanan).
Cara memplot graf korelasi dalam Excel
Apabila melakukan korelasi dalam Excel, cara terbaik untuk mendapatkan gambaran visual perhubungan antara data anda ialah dengan melukis plot serakan dengan garis arah aliran . Begini caranya:
- Pilih dua lajur dengan data berangka, termasuk pengepala lajur. Susunan lajur adalah penting: pembolehubah bebas harus berada di lajur kiri kerana lajur ini akan diplot pada paksi x; pembolehubah bersandar hendaklah berada di lajur kanan kerana ia akan diplot pada paksi y.
- Pada tab Inset , dalam Sembang kumpulan, klik ikon carta Sebarkan . Ini akan segera memasukkan carta taburan XY dalam lembaran kerja anda.
- Klik kanan mana-mana titik data dalam carta dan pilih Tambah Garis Aliran... daripada menu konteks.
Untuk mendapatkan arahan langkah demi langkah yang terperinci, sila lihat:
- Cara membuat plot taburan dalam Excel
- Cara menambah garis arah aliran pada carta Excel
Untuk set data sampel kami, graf korelasi kelihatan seperti ditunjukkan dalam imej di bawah.Selain itu, kami memaparkan nilai kuasa dua R, juga dipanggil Pekali Penentuan . Nilai ini menunjukkan sejauh mana garis arah aliran sepadan dengan data - semakin hampir R2 kepada 1, lebih baik padanannya.
Daripada nilai R2 yang dipaparkan pada plot serakan anda, anda boleh mengira pekali korelasi dengan mudah:
- Untuk ketepatan yang lebih baik, dapatkan Excel untuk menunjukkan lebih banyak digit dalam nilai kuasa dua R daripada nilai lalainya.
- Klik nilai R2 pada carta, pilihnya menggunakan tetikus dan tekan Ctrl + C untuk menyalinnya.
- Dapatkan punca kuasa dua R2 sama ada dengan menggunakan fungsi SQRT atau dengan menaikkan nilai R2 yang disalin kepada kuasa 0.5.
Sebagai contoh, Nilai R2 dalam graf kedua ialah 0.9174339392. Jadi, anda boleh mencari pekali korelasi untuk Pengiklanan dan Pemanas yang dijual dengan salah satu formula ini:
=SQRT(0.9174339392)
=0.9174339392^0.5
Seperti yang anda boleh pastikan, pekali yang dikira dengan cara ini adalah selaras dengan pekali korelasi yang terdapat dalam contoh sebelumnya, kecuali tanda :
Potensi masalah dengan korelasi dalam Excel
Korelasi Momen Produk Pearson hanya mendedahkan hubungan linear antara kedua-dua pembolehubah. Bermaksud, pembolehubah anda mungkin sangat berkaitan dengan cara lain, melengkung, dan masih mempunyai pekali korelasi sama atau hampir dengan sifar.
Korelasi Pearson tidak dapatbezakan pembolehubah bersandar dan tidak bersandar . Sebagai contoh, apabila menggunakan fungsi CORREL untuk mencari perkaitan antara purata suhu bulanan dan bilangan pemanas yang dijual, kami mendapat pekali -0.97, yang menunjukkan korelasi negatif yang tinggi. Walau bagaimanapun, anda boleh menukar pembolehubah dan mendapatkan hasil yang sama. Jadi, seseorang mungkin membuat kesimpulan bahawa jualan pemanas yang lebih tinggi menyebabkan suhu turun, yang jelas tidak masuk akal. Oleh itu, semasa menjalankan analisis korelasi dalam Excel, perhatikan data yang anda bekalkan.
Selain itu, korelasi Pearson sangat sensitif kepada outlier . Jika anda mempunyai satu atau lebih titik data yang sangat berbeza daripada data yang lain, anda mungkin mendapat gambaran herot tentang hubungan antara pembolehubah. Dalam kes ini, anda lebih bijak untuk menggunakan korelasi kedudukan Spearman.
Begitulah cara melakukan korelasi dalam Excel. Untuk melihat dengan lebih dekat contoh yang dibincangkan dalam tutorial ini, anda dialu-alukan untuk memuat turun contoh buku kerja kami di bawah. Saya berterima kasih kerana membaca dan berharap dapat berjumpa anda di blog kami minggu hadapan!
Buku kerja latihan
Kira Korelasi dalam Excel (fail .xlsx)
sebab musabab. Hakikat bahawa perubahan dalam satu pembolehubah dikaitkan dengan perubahan dalam pembolehubah lain tidak bermakna bahawa satu pembolehubah sebenarnya menyebabkan pembolehubah yang lain berubah.Jika anda berminat untuk mempelajari sebab akibat dan membuat ramalan, ambil langkah ke hadapan dan lakukan analisis regresi linear.
Pekali korelasi dalam Excel - tafsiran korelasi
Ukuran berangka bagi darjah perkaitan antara dua pembolehubah selanjar dipanggil pekali korelasi ( r).
Nilai pekali sentiasa antara -1 dan 1 dan ia mengukur kedua-dua kekuatan dan arah hubungan linear antara pembolehubah.
Kekuatan
Lebih besar nilai mutlak pekali, lebih kuat hubungan:
- Nilai ekstrem -1 dan 1 menunjukkan hubungan linear yang sempurna apabila semua titik data jatuh pada satu garis. Dalam amalan, korelasi sempurna, sama ada positif atau negatif, jarang diperhatikan.
- Pekali 0 menunjukkan tiada hubungan linear antara pembolehubah. Inilah yang mungkin anda perolehi dengan dua set nombor rawak.
- Nilai antara 0 dan +1/-1 mewakili skala perhubungan yang lemah, sederhana dan kuat. Apabila r semakin menghampiri sama ada -1 atau 1, kekuatan perhubungan bertambah.
Arah
Tanda pekali (tambah atau tolak) menunjukkan arahhubungan.
- Positif pekali mewakili korelasi langsung dan menghasilkan cerun menaik pada graf - apabila satu pembolehubah meningkat begitu juga pembolehubah yang lain, dan sebaliknya.
- Pekali negatif mewakili korelasi songsang dan menghasilkan cerun ke bawah pada graf - apabila satu pembolehubah meningkat, pembolehubah lain cenderung menurun.
Untuk pemahaman yang lebih baik, sila lihat di graf korelasi berikut:
- Pekali 1 bermaksud hubungan positif yang sempurna - apabila satu pembolehubah meningkat, pembolehubah lain meningkat secara berkadar.
- Pekali -1 bermaksud hubungan negatif yang sempurna - apabila satu pembolehubah meningkat, pembolehubah lain berkurangan secara berkadar.
- Pekali 0 bermakna tiada hubungan antara dua pembolehubah - titik data adalah bertaburan di seluruh graf.
Korelasi Pearson
Dalam statistik, mereka mengukur beberapa jenis korelasi bergantung pada jenis data yang anda gunakan. Dalam tutorial ini, kami akan menumpukan pada yang paling biasa.
Korelasi Pearson , nama penuh ialah Korelasi Momen Produk Pearson (PPMC), digunakan untuk menilai hubungan linear antara data apabila perubahan dalam satu pembolehubah dikaitkan dengan perubahan berkadar dalam pembolehubah yang lain. Secara ringkas, Korelasi Pearson menjawab soalan: Bolehkah data diwakili pada abaris?
Dalam perangkaan, ia adalah jenis korelasi yang paling popular dan jika anda berurusan dengan "pekali korelasi" tanpa kelayakan lanjut, kemungkinan besar ia adalah Pearson.
Berikut ialah formula yang paling biasa digunakan untuk mencari pekali korelasi Pearson, juga dipanggil R Pearson :
Ada kalanya, anda mungkin terjumpa dua formula lain untuk mengira pekali korelasi sampel (r) dan pekali korelasi populasi (ρ).
Cara melakukan korelasi Pearson dalam Excel
Mengira pekali korelasi Pearson dengan tangan melibatkan banyak matematik . Nasib baik, Microsoft Excel telah membuat perkara yang sangat mudah. Bergantung pada set data anda dan matlamat anda, anda bebas menggunakan salah satu daripada teknik berikut:
- Cari pekali korelasi Pearson dengan fungsi CORREL.
- Buat matriks korelasi dengan menjalankan Analisis Data.
- Cari berbilang pekali korelasi dengan formula.
- Plot graf korelasi untuk mendapatkan perwakilan visual perhubungan data.
Cara mengira pekali korelasi dalam Excel
Untuk mengira pekali korelasi dengan tangan, anda perlu menggunakan formula yang panjang ini. Untuk mencari pekali korelasi dalam Excel, manfaatkan fungsi CORREL atau PEARSON dan dapatkan hasilnya dalam sepersekian saat.
Fungsi Excel CORREL
Fungsi CORREL mengembalikanPekali korelasi Pearson untuk dua set nilai. Sintaksnya sangat mudah dan mudah:
CORREL(array1, array2)Di mana:
- Array1 ialah julat pertama nilai.
- Array2 ialah julat kedua nilai.
Dua tatasusunan harus mempunyai panjang yang sama.
Dengan mengandaikan kita mempunyai satu set pembolehubah bebas ( x ) dalam B2:B13 dan pembolehubah bersandar (y) dalam C2:C13, formula pekali korelasi kami adalah seperti berikut:
=CORREL(B2:B13, C2:C13)
Atau, kami boleh menukar julat dan masih dapatkan hasil yang sama:
=CORREL(C2:C13, B2:B13)
Walau apa pun, formula menunjukkan korelasi negatif yang kuat (kira-kira -0.97) antara purata suhu bulanan dan bilangan pemanas yang dijual:
3 perkara yang perlu anda ketahui tentang fungsi CORREL dalam Excel
Untuk mengira pekali korelasi dalam Excel berjaya, sila ingat 3 fakta mudah ini:
- Jika satu atau lebih sel dalam tatasusunan mengandungi teks, nilai logik atau kosong, sel tersebut diabaikan; sel dengan nilai sifar dikira.
- Jika tatasusunan yang dibekalkan mempunyai panjang yang berbeza, ralat #N/A dikembalikan.
- Jika salah satu tatasusunan kosong atau jika sisihan piawai bagi nilai mereka sama dengan sifar, #DIV/0! ralat berlaku.
Fungsi PEARSON Excel
Fungsi PEARSON dalam Excel melakukan perkara yang sama - mengira pekali Korelasi Momen Produk Pearson.
PEARSON(array1,tatasusunan2)Di mana:
- Array1 ialah julat nilai bebas.
- Array2 ialah julat nilai bergantung.
Oleh kerana PEARSON dan CORREL kedua-duanya mengira pekali korelasi linear Pearson, keputusan mereka sepatutnya bersetuju dan mereka biasanya melakukannya dalam versi terkini Excel 2007 hingga Excel 2019.
Dalam Excel 2003 dan versi terdahulu, bagaimanapun, fungsi PEARSON mungkin memaparkan beberapa ralat pembundaran. Oleh itu, dalam versi yang lebih lama, adalah disyorkan untuk menggunakan CORREL sebagai keutamaan kepada PEARSON.
Pada set data sampel kami, kedua-dua fungsi mempamerkan hasil yang sama:
=CORREL(B2:B13, C2:C13)
=PEARSON(B2:B13, C2:C13)
Cara membuat matriks korelasi dalam Excel dengan Analisis Data
Apabila anda perlu menguji saling hubungan antara lebih daripada dua pembolehubah, masuk akal untuk membina matriks korelasi, yang kadangkala dipanggil pekali korelasi berbilang .
matriks korelasi ialah jadual yang menunjukkan pekali korelasi antara pembolehubah di persilangan baris dan lajur yang sepadan.
Matriks korelasi dalam Excel dibina menggunakan alat Korelasi daripada alat tambah Analysis ToolPak . Alat tambah ini tersedia dalam semua versi Excel 2003 hingga Excel 2019, tetapi tidak didayakan secara lalai. Jika anda belum mengaktifkannya lagi, sila lakukan ini sekarang dengan mengikuti langkah yang diterangkan dalam Cara mendayakan Data Analysis ToolPak dalam Excel.
Denganalat Analisis Data yang ditambahkan pada reben Excel anda, anda bersedia untuk menjalankan analisis korelasi:
- Di penjuru kanan sebelah atas tab Data > Analisis kumpulan, klik butang Analisis Data .
- Dalam kotak dialog Analisis Data , pilih Korelasi dan klik OK.
- Dalam kotak Korelasi , konfigurasikan parameter dengan cara ini:
- Klik dalam kotak Julat Input dan pilih julat dengan data sumber anda, termasuk pengepala lajur (B1:D13 dalam kes kami).
- Dalam bahagian Dikumpulkan oleh , pastikan kotak radio Lajur dipilih (diberikan bahawa data sumber anda dikumpulkan ke dalam lajur).
- Pilih kotak semak Label dalam baris pertama jika julat yang dipilih mengandungi pengepala lajur.
- Pilih pilihan output yang diingini. Untuk mempunyai matriks dalam helaian yang sama, pilih Julat Keluaran dan nyatakan rujukan kepada sel paling kiri di mana matriks akan dikeluarkan (A15 dalam contoh ini).
Apabila selesai, klik butang OK :
Matriks pekali korelasi anda telah selesai dan sepatutnya kelihatan seperti yang ditunjukkan dalam bahagian seterusnya.
Mentafsir keputusan analisis korelasi
Dalam matriks korelasi Excel anda, anda boleh mencari pekali di persimpangan baris dan lajur. Jika koordinat lajur dan baris adalah sama, nilai 1 adalah output.
Dalam perkara di atascontoh, kami berminat untuk mengetahui korelasi antara pembolehubah bersandar (bilangan pemanas yang dijual) dan dua pembolehubah tidak bersandar (purata suhu bulanan dan kos pengiklanan). Jadi, kita hanya melihat nombor di persimpangan baris dan lajur ini, yang diserlahkan dalam tangkapan skrin di bawah:
Pekali negatif -0.97 (dibundarkan kepada 2 tempat perpuluhan) menunjukkan korelasi songsang yang kuat antara suhu bulanan dan jualan pemanas - apabila suhu meningkat lebih tinggi, lebih sedikit pemanas dijual.
Pekali positif 0.97 (dibundarkan kepada 2 tempat perpuluhan) menunjukkan hubungan langsung yang kukuh antara belanjawan pengiklanan dan jualan - semakin banyak wang yang anda belanjakan untuk pengiklanan, semakin tinggi jualan.
Cara melakukan analisis korelasi berbilang dalam Excel dengan formula
Membina jadual korelasi dengan alat Analisis Data adalah mudah. Walau bagaimanapun, matriks itu adalah statik, bermakna anda perlu menjalankan analisis korelasi semula setiap kali data sumber berubah.
Berita baiknya ialah anda boleh membina sendiri jadual korelasi yang serupa dengan mudah dan matriks itu akan dikemas kini secara automatik dengan setiap perubahan dalam nilai sumber.
Untuk melakukannya, gunakan formula generik ini:
CORREL(OFFSET( first_variable_range , 0, ROWS($1:1)-1) , OFFSET( julat_pembolehubah_pertama , 0, COLUMNS($A:A)-1))Nota penting! Untuk formula berfungsi, anda harus menguncijulat pembolehubah pertama dengan menggunakan rujukan sel mutlak.
Dalam kes kami, julat pembolehubah pertama ialah $B$2:$B$13 (sila perhatikan tanda $ yang mengunci rujukan), dan formula korelasi kami mengambil ini bentuk:
=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))
Dengan formula sedia, mari kita bina matriks korelasi:
- Dalam baris pertama dan lajur pertama matriks, taipkan pembolehubah' label dalam susunan yang sama seperti yang dipaparkan dalam jadual sumber anda (sila lihat tangkapan skrin di bawah).
- Masukkan formula di atas dalam sel paling kiri (B16 dalam kes kami).
- Seret formula ke bawah dan ke kanan untuk menyalinnya ke seberapa banyak baris dan lajur yang diperlukan (3 baris dan 3 lajur dalam contoh kami).
Hasilnya, kami mempunyai matriks berikut dengan berbilang korelasi pekali. Sila ambil perhatian bahawa pekali yang dikembalikan oleh formula kami adalah sama seperti output oleh Excel dalam contoh sebelumnya (yang berkaitan diserlahkan):
Cara formula ini berfungsi
Seperti yang anda sedia maklum, fungsi Excel CORREL mengembalikan pekali korelasi untuk dua set pembolehubah yang anda tentukan. Cabaran utama adalah untuk membekalkan julat yang sesuai dalam sel matriks yang sepadan. Untuk ini, anda hanya memasukkan julat pembolehubah pertama dalam formula dan menggunakan fungsi berikut untuk membuat pelarasan yang diperlukan:
- OFFSET - mengembalikan julat yang merupakan bilangan baris dan lajur yang diberikan