Isi kandungan
Tutorial menerangkan asas korelasi Spearman dalam bahasa yang mudah dan menunjukkan cara mengira pekali korelasi kedudukan Spearman dalam Excel.
Apabila melakukan analisis korelasi dalam Excel, dalam kebanyakan kes anda akan berurusan dengan korelasi Pearson. Tetapi kerana pekali korelasi Pearson hanya mengukur perhubungan linear antara dua pembolehubah, ia tidak berfungsi untuk semua jenis data - pembolehubah anda mungkin dikaitkan kuat dengan cara bukan linear dan masih mempunyai pekali yang hampir kepada sifar. Dalam keadaan sedemikian, anda boleh melakukan korelasi kedudukan Spearman dan bukannya Pearson.
Korelasi Spearman - asas
Korelasi Spearman ialah bukan parametrik versi pekali korelasi Pearson yang mengukur tahap perkaitan antara dua pembolehubah berdasarkan kedudukannya.
Korelasi Momen Produk Pearson menguji hubungan linear antara dua berterusan pembolehubah. Linear bermaksud hubungan apabila dua pembolehubah berubah dalam arah yang sama pada kadar yang tetap.
Korelasi Kedudukan Spearman menilai hubungan monotonik antara nilai kedudukan. Dalam perhubungan monotonik, pembolehubah juga cenderung berubah bersama-sama, tetapi tidak semestinya pada kadar tetap.
Bila hendak melakukan korelasi Spearman
Analisis korelasi Spearman akan digunakan dalam mana-mana mengikutikeadaan apabila andaian asas korelasi Pearson tidak dipenuhi:
- Jika data anda menunjukkan hubungan bukan linear atau tidak diedarkan secara normal.
- Jika sekurang-kurangnya satu pembolehubah ialah ordinal . Jika nilai anda boleh diletakkan dalam susunan "pertama, kedua, ketiga...", anda berurusan dengan data ordinal.
- Jika terdapat outlier yang ketara. Tidak seperti korelasi Pearson, korelasi Spearman tidak sensitif kepada outlier kerana ia melakukan pengiraan pada pangkat, jadi perbezaan antara nilai sebenar tidak mempunyai makna.
Sebagai contoh, anda boleh menggunakan korelasi Spearman untuk mencari jawapan kepada soalan berikut:
- Adakah orang yang mempunyai tahap pendidikan yang lebih tinggi lebih mengambil berat tentang alam sekitar?
- Adakah bilangan simptom yang dialami oleh pesakit berkaitan dengan kesediaan mereka untuk mengambil ubat?
Pekali korelasi Spearman
Dalam perangkaan, pekali korelasi Spearman diwakili oleh sama ada r s atau huruf Yunani ρ ("rho"), itulah sebabnya ia sering dipanggil rho Spearman .
Pekali korelasi pangkat Spearman mengukur kedua-dua kekuatan dan arah hubungan antara jajaran data. Ia boleh menjadi sebarang nilai dari -1 hingga 1, dan semakin hampir nilai mutlak pekali kepada 1, semakin kuat hubungan:
- 1 ialah positif sempurnakorelasi
- -1 ialah korelasi negatif sempurna
- 0 ialah tiada korelasi
Formula korelasi pangkat Spearman
Bergantung pada sama ada ada atau ada tiada ikatan dalam kedudukan (kedudukan yang sama diberikan kepada dua atau lebih pemerhatian), pekali korelasi Spearman boleh dikira dengan salah satu daripada formula berikut.
Jika terdapat tiada kedudukan terikat , formula yang lebih mudah akan dilakukan:
Di mana:
- d i ialah perbezaan antara sepasang pangkat
- n ialah bilangan pemerhatian
Untuk menangani pangkat terikat , versi penuh korelasi Spearman formula perlu digunakan, iaitu versi Pearson's r yang diubah suai sedikit:
Di mana:
- R(x) dan R(y ) ialah pangkat bagi pembolehubah x dan y
- R(x) dan R(y) ialah kedudukan min
Cara mengira korelasi Spearman dalam Excel dengan fungsi CORREL
Malangnya, Excel tidak mempunyai fungsi terbina untuk mengira Spea pekali korelasi pangkat rman. Walau bagaimanapun, itu tidak bermakna anda perlu memerah otak anda dengan formula di atas. Dengan memanipulasi Excel sedikit, kita boleh menghasilkan cara yang lebih mudah untuk melakukan korelasi Spearman.
Sebagai contoh, mari cuba ketahui sama ada aktiviti fizikal kita mempunyai kaitan dengan tekanan darah kita. Dalam lajur B, kami mempunyai bilangan minit yang dihabiskan oleh 10 lelaki pada umur yang samasetiap hari di gim dan dalam lajur C, kita mempunyai tekanan darah sistoliknya.
Untuk mencari pekali korelasi Spearman dalam Excel, lakukan langkah berikut:
- Kedudukan data anda
Oleh kerana korelasi Spearman menilai perkaitan antara dua pembolehubah berdasarkan kedudukannya, anda perlu menyusun data sumber anda. Ini boleh dilakukan dengan cepat dengan menggunakan fungsi Excel RANK.AVG.
Untuk meletakkan pembolehubah pertama (aktiviti fizikal), masukkan formula di bawah dalam D2 dan kemudian seretnya ke D11:
=RANK.AVG(B2,$B$2:$B$11,0)
Untuk menentukan kedudukan pembolehubah kedua (tekanan darah), letakkan formula berikut dalam sel E2 dan salin ke bawah lajur:
=RANK.AVG(C2,$C$2:$C$11,0)
Agar formula berfungsi dengan betul , sila pastikan untuk mengunci julat dengan rujukan sel mutlak.
Pada ketika ini, data sumber anda sepatutnya kelihatan serupa dengan ini:
- Cari pekali korelasi Spearman
Dengan kedudukan yang ditetapkan, kini kita boleh menggunakan fungsi Excel CORREL untuk mendapatkan rho Spearman:
=CORREL(D2:D11, E2:E11)
Formula mengembalikan pekali -0.7576 (dibundarkan kepada 4 digit), yang menunjukkan korelasi negatif yang agak kuat dan membolehkan kita membuat kesimpulan bahawa semakin banyak seseorang bersenam, semakin rendah tekanan darahnya.
Pekali korelasi Pearson untuk sampel yang sama (- 0.7445) menunjukkan korelasi yang agak lemah, tetapi masih bersifat statistik Sangat penting:
Keindahan inikaedahnya ialah ia cepat, mudah dan berfungsi tanpa mengira sama ada terdapat hubungan dalam kedudukan atau tidak.
Kira pekali korelasi Spearman dalam Excel dengan formula tradisional
Jika anda tidak pasti bahawa fungsi CORREL telah mengira Spearman's rho dengan betul, anda boleh mengesahkan hasilnya dengan formula tradisional yang digunakan dalam statistik. Begini caranya:
- Cari perbezaan antara setiap pasangan kedudukan ( d ) dengan menolak satu kedudukan daripada yang lain:
=D2-E2
Formula ini berfungsi ke F2 dan kemudian disalin ke bawah lajur.
- Naikkan setiap perbezaan kedudukan kepada kuasa dua ( d2 ):
=F2^2
Formula ini pergi ke lajur G.
- Tambahkan perbezaan kuasa dua:
=SUM(G2:G11)
Formula ini boleh pergi ke mana-mana sel kosong, G12 dalam kes kami.
Daripada tangkapan skrin berikut, anda mungkin akan mendapat lebih baik pemahaman tentang susunan data:
- Bergantung pada sama ada set data anda mempunyai sebarang kedudukan terikat atau tidak, gunakan salah satu daripada formula ini untuk mengira pekali korelasi Spearman.
Dalam contoh kita, tiada ikatan, jadi kita boleh menggunakan formula yang lebih mudah:
Dengan d2 sama hingga 290, dan n (bilangan pemerhatian) bersamaan dengan 10, formula mengalami transformasi berikut:
Hasilnya, anda mendapat -0.757575758 , yang sangat bersetuju dengan pekali korelasi Spearman yang dikira dalamcontoh sebelumnya.
Dalam Microsoft Excel, pengiraan di atas boleh dilakukan dengan persamaan berikut:
=1-(6*G12/(10*(10^2-1)))
Di mana G12 ialah jumlah perbezaan pangkat kuasa dua (d2) .
Cara melakukan korelasi Spearman dalam Excel menggunakan graf
Pekali korelasi dalam Excel hanya mengukur hubungan linear (Pearson) atau monotonik (Spearman). Walau bagaimanapun, persatuan lain mungkin. Jadi, tidak kira apa korelasi yang anda lakukan, adalah idea yang baik untuk mewakili hubungan antara pembolehubah dalam graf.
Untuk melukis graf korelasi bagi data kedudukan, berikut ialah perkara yang perlu anda lakukan:
- Kira kedudukan menggunakan fungsi RANK.AVG seperti yang dijelaskan dalam contoh ini.
- Pilih dua lajur dengan kedudukan.
- Sisipkan carta serakan XY. Untuk ini, klik ikon Sebarkan carta pada tab Inset , dalam kumpulan Sembang .
- Tambahkan trendline ke carta anda. Cara terpantas ialah dengan mengklik butang Elemen Carta > Tambah Garis Aliran... .
- Paparkan nilai R-kuadrat pada carta. Klik dua kali garis arah aliran untuk membuka anak tetingkapnya, tukar ke tab Pilihan Garis Aliran dan pilih kotak Paparkan nilai kuasa dua R pada carta .
- Tunjukkan lebih banyak digit dalam nilai R2 untuk ketepatan yang lebih baik.
Hasilnya, anda akan mendapat gambaran visual perhubungan antara pangkat. Selain itu, anda akan mendapat Pekali Penentuan (R2), punca kuasa duanya ialah pekali korelasi Pearson (r). Tetapi kerana anda telah memplot data kedudukan, r Pearson ini tidak lain adalah rho Spearman.
Nota. R-kuasa dua sentiasa nombor positif, maka pekali korelasi pangkat Spearman yang disimpulkan juga akan sentiasa positif. Untuk menambah tanda yang sesuai, lihat sahaja garis dalam graf korelasi anda - cerun ke atas menunjukkan korelasi positif (tanda tambah) dan cerun ke bawah menunjukkan korelasi negatif (tanda tolak).
Dalam kes kami, R2 bersamaan dengan 0.5739210285. Gunakan fungsi SQRT untuk mencari punca kuasa dua:
=SQRT(0.5739210285)
…dan anda akan mendapat pekali 0.757575758 yang sudah biasa.
Kecerunan ke bawah dalam graf menunjukkan negatif korelasi, jadi kami menambah tanda tolak dan mendapatkan pekali korelasi Spearman yang betul iaitu -0.757575758.
Begitulah anda boleh mengira pekali korelasi kedudukan Spearman dalam Excel. Untuk melihat dengan lebih dekat contoh yang dibincangkan dalam tutorial ini, anda dialu-alukan untuk memuat turun contoh buku kerja kami di bawah. Saya berterima kasih kerana membaca dan berharap dapat berjumpa anda di blog kami minggu hadapan!
Buku kerja latihan
Korelasi Kedudukan Spearman dalam Excel (fail.xlsx)