İçindekiler
Bu eğitim Spearman korelasyonunun temellerini basit bir dille açıklamakta ve Excel'de Spearman sıra korelasyon katsayısının nasıl hesaplanacağını göstermektedir.
Excel'de korelasyon analizi yaparken, çoğu durumda Pearson korelasyonu ile uğraşırsınız. Ancak Pearson korelasyon katsayısı yalnızca iki değişken arasındaki doğrusal bir ilişkiyi ölçtüğü için, tüm veri türleri için işe yaramaz - değişkenleriniz doğrusal olmayan bir şekilde güçlü bir şekilde ilişkili olabilir ve yine de sıfıra yakın katsayıya sahip olabilir. Bu gibi durumlarda, SpearmanPearson yerine sıra korelasyonu.
Spearman korelasyonu - temel bilgiler
Bu Spearman korelasyonu Pearson korelasyon katsayısının parametrik olmayan versiyonudur ve iki değişken arasındaki ilişkinin derecesini sıralamalarına göre ölçer.
Bu Pearson Momentler Çarpımı Korelasyonu test eder doğrusal İki sürekli değişken arasındaki ilişki. Doğrusal, iki değişkenin sabit bir oranda aynı yönde değiştiği bir ilişki anlamına gelir.
Spearman Sıra Korelasyonu değerlendirir monotonik Monotonik bir ilişkide, değişkenler de birlikte değişme eğilimindedir, ancak sabit bir oranda olması gerekmez.
Spearman korelasyonu ne zaman yapılmalı
Spearman korelasyon analizi, Pearson korelasyonunun altında yatan varsayımların karşılanmadığı aşağıdaki durumlardan herhangi birinde kullanılmalıdır:
- Eğer verileriniz bir doğrusal olmayan ilişki veya normal dağılıma sahip değildir.
- Eğer en az bir değişken sıralı Değerleriniz "birinci, ikinci, üçüncü..." şeklinde sıralanabiliyorsa, sıralı verilerle uğraşıyorsunuz demektir.
- Önemli bir sorun varsa aykırı değerler Pearson korelasyonunun aksine, Spearman korelasyonu aykırı değerlere karşı hassas değildir çünkü hesaplamaları sıralamalar üzerinden yapar, bu nedenle gerçek değerler arasındaki farkın bir anlamı yoktur.
Örneğin, aşağıdaki soruların yanıtlarını bulmak için Spearman korelasyonunu kullanabilirsiniz:
- Daha yüksek eğitim seviyesine sahip insanlar çevre konusunda daha mı endişeli?
- Bir hastanın sahip olduğu semptom sayısı, ilaç alma istekliliği ile ilişkili midir?
Spearman korelasyon katsayısı
İstatistiklerde Spearman korelasyon katsayısı ile temsil edilir ya da r s ya da Yunanca harf ρ ("rho"), bu yüzden genellikle Spearman's rho .
Spearman sıra korelasyon katsayısı, veri sıraları arasındaki ilişkinin hem gücünü hem de yönünü ölçer. -1 ile 1 arasında herhangi bir değer olabilir ve katsayının mutlak değeri 1'e ne kadar yakınsa, ilişki o kadar güçlüdür:
- 1 mükemmel bir pozitif korelasyondur
- -1 mükemmel bir negatif korelasyondur
- 0 korelasyon yok demektir
Spearman sıra korelasyon formülü
Sıralamada bağ olup olmamasına bağlı olarak (iki veya daha fazla gözleme aynı sıranın atanması), Spearman korelasyon katsayısı aşağıdaki formüllerden biriyle hesaplanabilir.
Eğer varsa bağlı rütbe yok daha basit bir formül yeterli olacaktır:
Nerede?
- d i bir çift rütbe arasındaki farktır
- n gözlem sayısıdır
ile başa çıkmak için bağlı sıralar Pearson r'nin biraz değiştirilmiş bir versiyonu olan Spearman korelasyon formülünün tam versiyonu kullanılmalıdır:
Nerede?
- R(x) ve R(y), aşağıdaki değişkenlerin rütbeleridir x ve y değişkenler
- R(x) ve R(y) ortalama rütbelerdir
CORREL işlevi ile Excel'de Spearman korelasyonu nasıl hesaplanır
Ne yazık ki, Excel'in Spearman sıra korelasyon katsayısını hesaplamak için dahili bir işlevi yoktur. Ancak bu, yukarıdaki formüllerle beyninizi yormanız gerektiği anlamına gelmez. Excel'i biraz manipüle ederek, Spearman korelasyonunu yapmanın çok daha basit bir yolunu bulabiliriz.
Örnek olarak, fiziksel aktivitemizin kan basıncımızla herhangi bir ilişkisi olup olmadığını bulmaya çalışalım. B sütununda, aynı yaştaki 10 erkeğin spor salonunda günlük harcadıkları dakika sayısı ve C sütununda sistolik kan basınçları var.
Excel'de Spearman korelasyon katsayısını bulmak için aşağıdaki adımları uygulayın:
- Verilerinizi sıralayın
Spearman korelasyonu iki değişken arasındaki ilişkileri sıralamalarına göre değerlendirdiğinden, kaynak verilerinizi sıralamanız gerekir. Bu, Excel RANK.AVG işlevi kullanılarak hızlı bir şekilde yapılabilir.
İlk değişkeni (fiziksel aktivite) sıralamak için aşağıdaki formülü D2'ye girin ve ardından D11'e sürükleyin:
=RANK.AVG(B2,$B$2:$B$11,0)
İkinci değişkeni (kan basıncı) sıralamak için, aşağıdaki formülü E2 hücresine koyun ve sütunun aşağısına kopyalayın:
=RANK.AVG(C2,$C$2:$C$11,0)
Formüllerin doğru çalışması için, lütfen aralıkları mutlak hücre referanslarıyla kilitlediğinizden emin olun.
Bu noktada, kaynak verileriniz şuna benzer görünmelidir:
- Spearman korelasyon katsayısını bulun
Sıralamalar oluşturulduktan sonra, Spearman'ın rho değerini elde etmek için artık Excel CORREL işlevini kullanabiliriz:
=CORREL(D2:D11, E2:E11)
Formül -0,7576 (4 haneye yuvarlanmıştır) katsayısını verir, bu da oldukça güçlü bir negatif korelasyon gösterir ve bir kişi ne kadar çok egzersiz yaparsa kan basıncının o kadar düşük olduğu sonucuna varmamızı sağlar.
Aynı örneklem için Pearson korelasyon katsayısı (-0,7445) biraz daha zayıf bir korelasyona işaret etmektedir, ancak yine de istatistiksel olarak anlamlıdır:
Bu yöntemin güzelliği hızlı, kolay olması ve sıralamada bağ olup olmadığına bakılmaksızın çalışmasıdır.
Excel'de Spearman korelasyon katsayısını geleneksel formülle hesaplama
CORREL fonksiyonunun Spearman'ın rho değerini doğru hesapladığından emin değilseniz, sonucu istatistikte kullanılan geleneksel formülle doğrulayabilirsiniz. İşte nasıl yapılacağı:
- Her bir sıra çifti arasındaki farkı bulun ( d ) bir rütbenin diğerinden çıkarılmasıyla elde edilir:
=D2-E2
Bu formül F2'ye gider ve ardından sütundan aşağı kopyalanır.
- Her sıra farkını ikinin kuvvetine yükseltin ( d2 ):
=F2^2
Bu formül G sütununa gider.
- Kareli farkları toplayın:
=TOPLA(G2:G11)
Bu formül herhangi bir boş hücreye, bizim durumumuzda G12'ye gidebilir.
Aşağıdaki ekran görüntüsünden, muhtemelen veri düzenlemesini daha iyi anlayacaksınız:
- Veri setinizde bağlı sıralar olup olmamasına bağlı olarak, Spearman korelasyon katsayısını hesaplamak için bu formüllerden birini kullanın.
Örneğimizde eşitlik yok, bu yüzden daha basit bir formülle devam edebiliriz:
ile d2 290'a eşittir ve n (gözlem sayısı) 10'a eşit olduğunda, formül aşağıdaki dönüşümlere uğrar:
Sonuç olarak, önceki örnekte hesaplanan Spearman korelasyon katsayısına mükemmel şekilde uyan -0,757575758 değerini elde edersiniz.
Microsoft Excel'de yukarıdaki hesaplamalar aşağıdaki denklem ile gerçekleştirilebilir:
=1-(6*G12/(10*(10^2-1)))
Burada G12 karesel sıra farklarının toplamıdır (d2).
Excel'de grafik kullanarak Spearman korelasyonu nasıl yapılır
Excel'deki korelasyon katsayıları yalnızca doğrusal (Pearson) veya monotonik (Spearman) ilişkileri ölçer. Ancak, başka ilişkiler de mümkündür. Bu nedenle, hangi korelasyonu yaparsanız yapın, değişkenler arasındaki ilişkiyi bir grafikte göstermek her zaman iyi bir fikirdir.
Sıralanan veriler için bir korelasyon grafiği çizmek için yapmanız gerekenler şunlardır:
- Bu örnekte açıklandığı gibi RANK.AVG fonksiyonunu kullanarak sıralamaları hesaplayın.
- Sıralamaları içeren iki sütun seçin.
- Bir XY dağılım grafiği ekleyin. Bunun için Dağılım Grafik simgesi üzerinde Giriş sekmesinde Sohbetler Grup.
- Grafiğinize bir eğilim çizgisi eklemenin en hızlı yolu Grafik Unsurları düğme> Trend Çizgisi Ekle... .
- Grafik üzerinde R-kare değerini görüntüleyin. Bölmesini açmak için trend çizgisine çift tıklayın, trend çizgisinin Trend Çizgisi Seçenekleri sekmesini seçin ve R-kare değerini görüntüle grafik üzerinde Kutu.
- Daha iyi doğruluk için R2 değerinde daha fazla basamak gösterin.
Sonuç olarak, rütbeler arasındaki ilişkinin görsel bir temsilini elde edeceksiniz. Belirleme Katsayısı (R2), bunun karekökü Pearson korelasyon katsayısıdır (r). Ancak sıralı verileri çizdiğiniz için, bu Pearson'ın r'si Spearman'ın rho'sundan başka bir şey değildir.
Not: R-kare her zaman pozitif bir sayıdır, dolayısıyla çıkarılan Spearman sıra korelasyon katsayısı da her zaman pozitif olacaktır. Uygun bir işaret eklemek için, korelasyon grafiğinizdeki çizgiye bakın - yukarı doğru eğim pozitif bir korelasyonu (artı işareti) ve aşağı doğru eğim negatif bir korelasyonu (eksi işareti) gösterir.
Bizim durumumuzda R2 0,5739210285'e eşittir. Karekökü bulmak için SQRT fonksiyonunu kullanın:
=SQRT(0.5739210285)
...ve zaten bilinen 0,757575758 katsayısını elde edersiniz.
Grafikteki aşağı doğru eğim negatif bir korelasyon göstermektedir, bu nedenle eksi işaretini ekleriz ve doğru Spearman korelasyon katsayısı olan -0,757575758'i elde ederiz.
Excel'de Spearman sıra korelasyon katsayısını bu şekilde hesaplayabilirsiniz. Bu eğitimde ele alınan örneklere daha yakından bakmak için aşağıdaki örnek çalışma kitabımızı indirebilirsiniz. Okuduğunuz için teşekkür eder, gelecek hafta blogumuzda görüşmek dileğiyle!
Alıştırma çalışma kitabı
Excel'de Spearman Sıralama Korelasyonu (.xlsx dosyası)