Daftar Isi
Tutorial ini menjelaskan dasar-dasar korelasi Spearman dalam bahasa yang sederhana dan menunjukkan cara menghitung koefisien korelasi peringkat Spearman di Excel.
Ketika melakukan analisis korelasi di Excel, dalam banyak kasus Anda akan berurusan dengan korelasi Pearson. Tetapi karena koefisien korelasi Pearson hanya mengukur hubungan linier antara dua variabel, itu tidak berfungsi untuk semua jenis data - variabel Anda mungkin sangat terkait dengan cara non-linier dan masih memiliki koefisien mendekati nol. Dalam keadaan seperti itu, Anda dapat melakukan Spearmankorelasi peringkat, bukan Pearson.
Korelasi Spearman - dasar-dasarnya
The Korelasi Spearman adalah versi nonparametrik dari koefisien korelasi Pearson yang mengukur derajat asosiasi antara dua variabel berdasarkan peringkatnya.
The Korelasi Momen Produk Pearson menguji linier Linier berarti hubungan ketika dua variabel berubah dalam arah yang sama pada tingkat yang konstan.
Korelasi Peringkat Spearman mengevaluasi monotonik Dalam hubungan monotonik, variabel-variabel juga cenderung berubah bersama-sama, tetapi tidak harus pada tingkat yang konstan.
Kapan melakukan korelasi Spearman
Analisis korelasi Spearman digunakan dalam salah satu keadaan berikut ini ketika asumsi yang mendasari korelasi Pearson tidak terpenuhi:
- Jika data Anda menunjukkan non-linear hubungan atau tidak terdistribusi secara normal.
- Jika sekurang-kurangnya satu variabel ordinal Jika nilai Anda dapat ditempatkan dalam urutan "pertama, kedua, ketiga...", Anda berurusan dengan data ordinal.
- Jika ada yang signifikan pencilan Tidak seperti korelasi Pearson, korelasi Spearman tidak sensitif terhadap outlier karena melakukan perhitungan pada peringkat, sehingga perbedaan antara nilai aktual tidak memiliki arti.
Sebagai contoh, Anda dapat menggunakan korelasi Spearman untuk menemukan jawaban atas pertanyaan-pertanyaan berikut:
- Apakah orang dengan tingkat pendidikan yang lebih tinggi lebih peduli terhadap lingkungan?
- Apakah jumlah gejala yang dimiliki pasien berhubungan dengan kesediaan mereka untuk minum obat?
Koefisien korelasi Spearman
Dalam statistik, yang Koefisien korelasi Spearman diwakili oleh salah satu r s atau huruf Yunani ρ ("rho"), itulah sebabnya mengapa sering disebut Spearman's rho .
Koefisien korelasi peringkat Spearman mengukur kekuatan dan arah hubungan antara peringkat data. Ini bisa berupa nilai apa pun dari -1 hingga 1, dan semakin dekat nilai absolut koefisien ke 1, semakin kuat hubungannya:
- 1 adalah korelasi positif sempurna
- -1 adalah korelasi negatif sempurna
- 0 adalah tidak ada korelasi
Rumus korelasi peringkat Spearman
Tergantung pada apakah ada atau tidak ada ikatan dalam pemeringkatan (peringkat yang sama diberikan kepada dua atau lebih pengamatan), koefisien korelasi Spearman dapat dihitung dengan salah satu rumus berikut.
Jika ada tidak ada peringkat terikat , rumus yang lebih sederhana bisa digunakan:
Di mana:
- d i adalah perbedaan antara sepasang peringkat
- n adalah jumlah pengamatan
Untuk menangani peringkat terikat , versi lengkap dari rumus korelasi Spearman harus digunakan, yang merupakan versi yang sedikit dimodifikasi dari Pearson's r:
Di mana:
- R(x) dan R(y) adalah peringkat dari x dan y variabel
- R(x) dan R(y) adalah peringkat rata-rata
Cara menghitung korelasi Spearman di Excel dengan fungsi CORREL
Sayangnya, Excel tidak memiliki fungsi bawaan untuk menghitung koefisien korelasi peringkat Spearman. Namun, itu tidak berarti Anda harus memutar otak dengan rumus di atas. Dengan sedikit memanipulasi Excel, kita dapat menemukan cara yang jauh lebih sederhana untuk melakukan korelasi Spearman.
Sebagai contoh, mari kita coba mencari tahu apakah aktivitas fisik kita memiliki hubungan dengan tekanan darah kita. Di kolom B, kita memiliki jumlah menit yang dihabiskan 10 pria dengan usia yang sama setiap hari di gym, dan di kolom C, kita memiliki tekanan darah sistolik mereka.
Untuk menemukan koefisien korelasi Spearman di Excel, lakukan langkah-langkah ini:
- Beri peringkat data Anda
Karena korelasi Spearman mengevaluasi asosiasi antara dua variabel berdasarkan peringkatnya, Anda perlu memberi peringkat pada data sumber Anda. Ini dapat dengan cepat dilakukan dengan menggunakan fungsi Excel RANK.AVG.
Untuk menentukan peringkat variabel pertama (aktivitas fisik), masukkan rumus di bawah ini di D2 dan kemudian tarik ke bawah ke D11:
=RANK.AVG(B2,$B$2:$B$11,0)
Untuk memberi peringkat variabel kedua (tekanan darah), letakkan rumus berikut di sel E2 dan salin ke bawah kolom:
=RANK.AVG(C2,$C$2:$C$11,0)
Agar rumus berfungsi dengan benar, pastikan untuk mengunci rentang dengan referensi sel absolut.
Pada titik ini, sumber data Anda akan terlihat mirip dengan ini:
- Temukan koefisien korelasi Spearman
Dengan peringkat yang telah ditetapkan, kita sekarang dapat menggunakan fungsi Excel CORREL untuk mendapatkan Spearman's rho:
=CORREL(D2:D11, E2:E11)
Rumus ini menghasilkan koefisien -0,7576 (dibulatkan menjadi 4 digit), yang menunjukkan korelasi negatif yang cukup kuat dan memungkinkan kita untuk menyimpulkan bahwa semakin banyak seseorang berolahraga, semakin rendah tekanan darahnya.
Koefisien korelasi Pearson untuk sampel yang sama (-0,7445) menunjukkan korelasi yang sedikit lebih lemah, tetapi masih signifikan secara statistik:
Keindahan metode ini adalah cepat, mudah, dan berfungsi terlepas dari apakah ada ikatan dalam peringkat atau tidak.
Hitung koefisien korelasi Spearman di Excel dengan rumus tradisional
Jika Anda tidak yakin bahwa fungsi CORREL telah menghitung Spearman's rho dengan benar, Anda dapat memverifikasi hasilnya dengan rumus tradisional yang digunakan dalam statistik. Begini caranya:
- Temukan perbedaan antara setiap pasangan peringkat ( d ) dengan mengurangi satu peringkat dari peringkat lainnya:
=D2-E2
Rumus ini masuk ke F2 dan kemudian disalin ke bawah kolom.
- Naikkan setiap perbedaan peringkat ke pangkat dua ( d2 ):
=F2^2
Rumus ini masuk ke kolom G.
- Jumlahkan perbedaan kuadrat:
=SUM(G2:G11)
Rumus ini bisa masuk ke sel kosong mana pun, G12 dalam kasus kita.
Dari tangkapan layar berikut ini, Anda mungkin akan mendapatkan pemahaman yang lebih baik mengenai pengaturan data:
- Bergantung pada apakah kumpulan data Anda memiliki peringkat terikat atau tidak, gunakan salah satu rumus ini untuk menghitung koefisien korelasi Spearman.
Dalam contoh kita, tidak ada ikatan, jadi kita bisa menggunakan rumus yang lebih sederhana:
Dengan d2 sama dengan 290, dan n (jumlah pengamatan) sama dengan 10, rumus mengalami transformasi berikut:
Hasilnya, Anda mendapatkan -0.757575758, yang secara sempurna sesuai dengan koefisien korelasi Spearman yang dihitung dalam contoh sebelumnya.
Dalam Microsoft Excel, perhitungan di atas dapat dilakukan dengan persamaan berikut ini:
=1-(6*G12/(10*(10^2-1)))
Di mana G12 adalah jumlah perbedaan peringkat kuadrat (d2).
Bagaimana melakukan korelasi Spearman di Excel menggunakan grafik
Koefisien korelasi di Excel hanya mengukur hubungan linear (Pearson) atau monotonik (Spearman). Namun, asosiasi lain mungkin terjadi. Jadi, tidak peduli korelasi mana yang Anda lakukan, selalu merupakan ide yang baik untuk mewakili hubungan antara variabel dalam grafik.
Untuk menggambar grafik korelasi untuk data peringkat, inilah yang perlu Anda lakukan:
- Hitung peringkat dengan menggunakan fungsi RANK.AVG seperti yang dijelaskan dalam contoh ini.
- Pilih dua kolom dengan peringkat.
- Sisipkan bagan sebar XY. Untuk ini, klik tombol Menyebar bagan ikon pada Inset tab, di tab Obrolan kelompok.
- Tambahkan garis tren ke grafik Anda. Cara tercepat adalah dengan mengklik tombol Elemen Bagan tombol> Tambahkan Trendline... .
- Tampilkan nilai R-kuadrat pada grafik. Klik dua kali garis tren untuk membuka panelnya, beralih ke panel Opsi Garis Tren dan pilih tab Menampilkan nilai R-kuadrat pada grafik kotak.
- Tampilkan lebih banyak digit dalam nilai R2 untuk akurasi yang lebih baik.
Sebagai hasilnya, Anda akan mendapatkan representasi visual dari hubungan antara peringkat. Selain itu, Anda akan mendapatkan Koefisien Determinasi (R2), akar kuadratnya adalah koefisien korelasi Pearson (r). Tetapi karena Anda telah memplotkan data peringkat, maka r Pearson ini tidak lain adalah rho Spearman.
Catatan. R-kuadrat selalu merupakan angka positif, maka koefisien korelasi peringkat Spearman yang disimpulkan juga akan selalu positif. Untuk menambahkan tanda yang sesuai, lihat saja garis dalam grafik korelasi Anda - kemiringan ke atas menunjukkan korelasi positif (tanda plus) dan kemiringan ke bawah menunjukkan korelasi negatif (tanda minus).
Dalam kasus kami, R2 sama dengan 0,5739210285. Gunakan fungsi SQRT untuk menemukan akar kuadrat:
=SQRT(0.5739210285)
...dan Anda akan mendapatkan koefisien yang sudah dikenal sebesar 0.757575758.
Kemiringan ke bawah dalam grafik menunjukkan korelasi negatif, jadi kami menambahkan tanda minus dan mendapatkan koefisien korelasi Spearman yang benar -0.757575758.
Itulah cara Anda dapat menghitung koefisien korelasi peringkat Spearman di Excel. Untuk melihat lebih dekat contoh-contoh yang dibahas dalam tutorial ini, Anda dipersilakan untuk mengunduh buku kerja sampel kami di bawah ini. Saya berterima kasih telah membaca dan berharap dapat melihat Anda di blog kami minggu depan!
Buku kerja praktik
Korelasi Peringkat Spearman di Excel (file .xlsx)