Spearman რანგის კორელაცია Excel-ში: ფორმულა და გრაფიკი

  • გააზიარეთ ეს
Michael Brown

გაკვეთილი განმარტავს Spearman-ის კორელაციის საფუძვლებს მარტივ ენაზე და გვიჩვენებს, თუ როგორ უნდა გამოვთვალოთ Spearman რანგის კორელაციის კოეფიციენტი Excel-ში.

Excel-ში კორელაციის ანალიზის კეთებისას, უმეტეს შემთხვევაში თქვენ გაუმკლავდებით პირსონის კორელაციას. მაგრამ იმის გამო, რომ პირსონის კორელაციის კოეფიციენტი ზომავს მხოლოდ წრფივ ურთიერთობას ორ ცვლადს შორის, ის არ მუშაობს მონაცემთა ყველა ტიპისთვის - თქვენი ცვლადები შეიძლება მჭიდროდ იყოს დაკავშირებული არაწრფივი გზით და მაინც ჰქონდეს კოეფიციენტი ნულთან ახლოს. ასეთ პირობებში, პირსონის ნაცვლად შეგიძლიათ გააკეთოთ სპირმენის რანგის კორელაცია.

    სპირმენის კორელაცია - საფუძვლები

    სპირმენის კორელაცია არის არაპარამეტრული პირსონის კორელაციის კოეფიციენტის ვერსია, რომელიც გაზომავს ორ ცვლადს შორის კავშირის ხარისხს მათი რიგებიდან გამომდინარე.

    Pearson პროდუქტის მომენტის კორელაცია ამოწმებს წრფივ ურთიერთობას ორ უწყვეტს შორის. ცვლადები. ხაზოვანი ნიშნავს ურთიერთობას, როდესაც ორი ცვლადი იცვლება ერთი და იმავე მიმართულებით მუდმივი სიჩქარით.

    Spearman Rank Correlation აფასებს მონოტონურ ურთიერთობას რანჟირებულ მნიშვნელობებს შორის. მონოტონურ ურთიერთობაში, ცვლადები ასევე იცვლება ერთად, მაგრამ არა აუცილებლად მუდმივი ტემპით.

    როდის უნდა გავაკეთოთ სპირმენის კორელაცია

    სპირმენის კორელაციის ანალიზი გამოყენებული უნდა იყოს რომელიმეში. შემდეგგარემოებები, როდესაც პირსონის კორელაციის ძირითადი დაშვებები არ არის დაკმაყოფილებული:

    1. თუ თქვენი მონაცემები აჩვენებს არაწრფივ ურთიერთობას ან არ არის ნორმალურად განაწილებული.
    2. თუ ერთი ცვლადი მაინც არის რიგგარეშე . თუ თქვენი მნიშვნელობები შეიძლება განთავსდეს "პირველი, მეორე, მესამე..." თანმიმდევრობით, თქვენ საქმე გაქვთ რიგით მონაცემებთან.
    3. თუ არის მნიშვნელოვანი აღმოჩენილი . პირსონის კორელაციისგან განსხვავებით, სპირმენის კორელაცია არ არის მგრძნობიარე ხაზების მიმართ, რადგან ის ახორციელებს გამოთვლებს რიგებში, ამიტომ რეალურ მნიშვნელობებს შორის განსხვავებას მნიშვნელობა არ აქვს.

    მაგალითად, შეგიძლიათ გამოიყენოთ Spearman კორელაცია. იპოვონ პასუხები შემდეგ კითხვებზე:

    • უფრო მაღალი განათლების მქონე ადამიანები უფრო მეტად ზრუნავენ გარემოზე? მიიღოს მედიკამენტები?

    Spearman-ის კორელაციის კოეფიციენტი

    სტატისტიკაში Spearman-ის კორელაციის კოეფიციენტი წარმოდგენილია ან r s ან ბერძნული ასო ρ ("rho"), რის გამოც მას ხშირად უწოდებენ Spearman's rho .

    სპირმენის რანგის კორელაციის კოეფიციენტი ზომავს ორივეს. მონაცემთა რიგებს შორის ურთიერთობის სიძლიერე და მიმართულება. ეს შეიძლება იყოს ნებისმიერი მნიშვნელობა -1-დან 1-მდე და რაც უფრო ახლოსაა კოეფიციენტის აბსოლუტური მნიშვნელობა 1-თან, მით უფრო ძლიერია კავშირი:

    • 1 არის სრულყოფილი დადებითიკორელაცია
    • -1 არის სრულყოფილი უარყოფითი კორელაცია
    • 0 არ არის კორელაცია

    Spearman-ის რანგის კორელაციის ფორმულა

    დამოკიდებულია არსებობს თუ არა რეიტინგში არ არის კავშირი (იგივე წოდება ენიჭება ორ ან მეტ დაკვირვებას), სპირმენის კორელაციის კოეფიციენტი შეიძლება გამოითვალოს ერთ-ერთი შემდეგი ფორმულით.

    თუ არ არის თანაბარი წოდებები , უფრო მარტივი ფორმულა გააკეთებს:

    სად:

    • d i არის განსხვავება რიგების წყვილს შორის
    • n არის დაკვირვებების რაოდენობა

    დაკავშირებულ რიგებთან , სპირმენის კორელაციის სრული ვერსია უნდა იქნას გამოყენებული ფორმულა, რომელიც არის პირსონის r-ის ოდნავ შეცვლილი ვერსია:

    Where:

    • R(x) და R(y ) არის x და y ცვლადების რიგები
    • R(x) და R(y) არის საშუალო რიგები

    როგორ გამოვთვალოთ Spearman-ის კორელაცია Excel-ში CORREL ფუნქციით

    სამწუხაროდ, Excel-ს არ აქვს ჩაშენებული ფუნქცია Spea-ს გამოსათვლელად rman რანგის კორელაციის კოეფიციენტი. თუმცა, ეს არ ნიშნავს იმას, რომ თქვენ მოგიწევთ თქვენი ტვინი ზემოაღნიშნული ფორმულებით დალაგებით. Excel-ის მცირე მანიპულირებით, ჩვენ შეგვიძლია მოვიფიქროთ ბევრად უფრო მარტივი გზა Spearman-ის კორელაციის გასაკეთებლად.

    მაგალითად, ვცადოთ გავარკვიოთ, აქვს თუ არა რაიმე კავშირი ჩვენს ფიზიკურ აქტივობას ჩვენს არტერიულ წნევასთან. B სვეტში გვაქვს წუთების რაოდენობა, რომელსაც ატარებს იმავე ასაკის 10 მამაკაციყოველდღიურად სპორტდარბაზში და C სვეტში გვაქვს მათი სისტოლური წნევა.

    Excel-ში Spearman-ის კორელაციის კოეფიციენტის საპოვნელად, შეასრულეთ შემდეგი ნაბიჯები:

    1. დააფასეთ თქვენი მონაცემები

      რადგან Spearman-ის კორელაცია აფასებს ასოციაციებს ორ ცვლადს შორის მათი რანგების მიხედვით, თქვენ უნდა მოაწყოთ თქვენი წყაროს მონაცემები. ეს შეიძლება სწრაფად გაკეთდეს Excel RANK.AVG ფუნქციის გამოყენებით.

      პირველი ცვლადის (ფიზიკური აქტივობის) რეიტინგისთვის, შეიყვანეთ ქვემოთ მოცემული ფორმულა D2-ში და შემდეგ გადაიტანეთ იგი D11-ზე:

      =RANK.AVG(B2,$B$2:$B$11,0)

      მეორე ცვლადის (არტერიული წნევის) რეიტინგისთვის, ჩადეთ შემდეგი ფორმულა E2 უჯრედში და დააკოპირეთ იგი სვეტში:

      =RANK.AVG(C2,$C$2:$C$11,0)

      ფორმულების სწორად მუშაობისთვის , დარწმუნდით, რომ დაბლოკეთ დიაპაზონები უჯრედების აბსოლუტური მითითებით.

      ამ ეტაპზე, თქვენი წყაროს მონაცემები მსგავსი უნდა იყოს:

    2. იპოვეთ Spearman-ის კორელაციის კოეფიციენტი

      დადგენილ წოდებებთან ერთად, ახლა შეგვიძლია გამოვიყენოთ Excel CORREL ფუნქცია Spearman-ის rho-ს მისაღებად:

      =CORREL(D2:D11, E2:E11)

      ფორმულა აბრუნებს კოეფიციენტს -0,7576 (დამრგვალებულია 4 ციფრით), რაც აჩვენებს საკმაოდ ძლიერ უარყოფით კორელაციას და საშუალებას გვაძლევს დავასკვნათ, რომ რაც მეტს ვარჯიშობს ადამიანი, მით უფრო დაბალია არტერიული წნევა.

      პირსონის კორელაციის კოეფიციენტი იმავე ნიმუშისთვის (- 0.7445) მიუთითებს ოდნავ სუსტ კორელაციაზე, მაგრამ მაინც სტატისტიკაზე lly მნიშვნელოვანი:

    ამის სილამაზემეთოდი არის ის, რომ ის არის სწრაფი, მარტივი და მუშაობს მიუხედავად იმისა, არის თუ არა კავშირები რეიტინგში.

    გამოთვალეთ Spearman-ის კორელაციის კოეფიციენტი Excel-ში ტრადიციული ფორმულით

    თუ ბოლომდე დარწმუნებული არ ხართ რომ CORREL ფუნქციამ სწორად გამოთვალა Spearman-ის rho, შედეგის შემოწმება შეგიძლიათ სტატისტიკაში გამოყენებული ტრადიციული ფორმულით. აი, როგორ:

    1. იპოვეთ განსხვავება თითოეულ წყვილს შორის ( d ) ერთი რანგის მეორეს გამოკლებით:

      =D2-E2

      ეს ფორმულა მუშაობს F2-ზე და შემდეგ კოპირდება სვეტში.

    2. თითო რანგის სხვაობა აწიეთ ორის ხარისხზე ( d2 ):

      =F2^2

      ეს ფორმულა მიდის სვეტში G.

    3. დაამატეთ კვადრატული განსხვავებები:

      =SUM(G2:G11)

      ეს ფორმულა შეიძლება გადავიდეს ნებისმიერ ცარიელ უჯრედში, ჩვენს შემთხვევაში G12.

      შემდეგი სკრინშოტიდან, ალბათ, უკეთესს მიიღებთ მონაცემთა განლაგების გაგება:

    4. დამოკიდებულია თუ არა თქვენს მონაცემთა ნაკრების რაიმე მიბმული რიგები თუ არა, გამოიყენეთ ერთ-ერთი ეს ფორმულა Spearman-ის კორელაციის კოეფიციენტის გამოსათვლელად.

    ჩვენს მაგალითში არ არის კავშირები, ამიტომ შეგვიძლია უფრო მარტივი ფორმულით მივმართოთ:

    d2 ტოლი 290-მდე და n (დაკვირვებების რაოდენობა) უდრის 10-ს, ფორმულა განიცდის შემდეგ გარდაქმნებს:

    შედეგად მიიღებთ -0,757575758 , რომელიც სრულყოფილად ეთანხმება სპირმენის კორელაციის კოეფიციენტს, რომელიც გამოითვლებაწინა მაგალითი.

    Microsoft Excel-ში ზემოაღნიშნული გამოთვლები შეიძლება შესრულდეს შემდეგი განტოლებით:

    =1-(6*G12/(10*(10^2-1)))

    სადაც G12 არის კვადრატული რანგის სხვაობების ჯამი (d2) .

    როგორ გავაკეთოთ Spearman-ის კორელაცია Excel-ში გრაფიკის გამოყენებით

    კორელაციის კოეფიციენტები Excel-ში ზომავს მხოლოდ წრფივ (Pearson) ან მონოტონურ (Spearman) ურთიერთობებს. თუმცა, სხვა ასოციაციები შესაძლებელია. ასე რომ, არ აქვს მნიშვნელობა რომელ კორელაციას აკეთებთ, ყოველთვის კარგი იდეაა ცვლადებს შორის კავშირის წარმოდგენა გრაფაში.

    რანგირებული მონაცემებისთვის კორელაციის გრაფიკის დასახატად, აი, რა უნდა გააკეთოთ:

    1. გამოთვალეთ რანგები RANK.AVG ფუნქციის გამოყენებით, როგორც ეს აღწერილია ამ მაგალითში.
    2. აირჩიეთ ორი სვეტი რიგებით.
    3. ჩადეთ XY სკატერის დიაგრამა. ამისათვის დააწკაპუნეთ Scatter დიაგრამის ხატულაზე Inset ჩანართზე, Chats ჯგუფში.
    4. დაამატეთ ტენდენციის ხაზი თქვენს გრაფიკზე. ყველაზე სწრაფი გზაა დააწკაპუნოთ დიაგრამის ელემენტები ღილაკზე > ტენდენციის ხაზის დამატება... .
    5. ჩაგრამაზე R-კვადრატული მნიშვნელობის ჩვენება. ორჯერ დააწკაპუნეთ ტრენდის ხაზზე მისი პანელის გასახსნელად, გადადით Trendline Options ჩანართზე და აირჩიეთ R-კვადრატული მნიშვნელობის ჩვენება დიაგრამაზე .
    6. <. 13>აჩვენეთ მეტი ციფრი R2 მნიშვნელობაში უკეთესი სიზუსტისთვის.

    შედეგად, თქვენ მიიღებთ რიგებს შორის ურთიერთობის ვიზუალურ წარმოდგენას. გარდა ამისა, თქვენ მიიღებთ განსაზღვრების კოეფიციენტი (R2), რომლის კვადრატული ფესვი არის პირსონის კორელაციის კოეფიციენტი (r). მაგრამ რადგან თქვენ შეადგინეთ რანჟირებული მონაცემები, ეს პირსონის r სხვა არაფერია, თუ არა Spearman-ის rho.

    შენიშვნა. R-კვადრატი ყოველთვის დადებითი რიცხვია, შესაბამისად გამოტანილი Spearman რანგის კორელაციის კოეფიციენტიც ყოველთვის დადებითი იქნება. შესაბამისი ნიშნის დასამატებლად, უბრალოდ შეხედეთ თქვენს კორელაციის გრაფიკის ხაზს - ზევით დახრილობა მიუთითებს დადებით კორელაციაზე (პლუს ნიშანი) და დაღმავალი ფერდობი მიუთითებს უარყოფით კორელაციაზე (მინუს ნიშანი).

    ჩვენს შემთხვევაში, R2 უდრის 0.5739210285. გამოიყენეთ SQRT ფუნქცია კვადრატული ფესვის მოსაძებნად:

    =SQRT(0.5739210285)

    …და თქვენ მიიღებთ უკვე ნაცნობ კოეფიციენტს 0,757575758.

    გრაფიკის დაღმავალი დახრილობა აჩვენებს უარყოფითს. კორელაცია, ასე რომ, ჩვენ ვამატებთ მინუს ნიშანს და მივიღებთ სწორ Spearman-ის კორელაციის კოეფიციენტს -0,757575758.

    ასე შეგიძლიათ გამოთვალოთ Spearman რანგის კორელაციის კოეფიციენტი Excel-ში. ამ სახელმძღვანელოში განხილული მაგალითების უფრო დეტალურად დასათვალიერებლად, შეგიძლიათ ჩამოტვირთოთ ჩვენი სამუშაო წიგნის ნიმუში ქვემოთ. მადლობას გიხდით წაკითხვისთვის და იმედი მაქვს, რომ მომავალ კვირას გნახავთ ჩვენს ბლოგზე!

    სავარჯიშო სამუშაო წიგნი

    Spearman Rank Correlation in Excel (.xlsx ფაილი)

    მაიკლ ბრაუნი არის ტექნოლოგიის ერთგული ენთუზიასტი, რომელსაც აქვს გატაცება პროგრამული ინსტრუმენტების გამოყენებით რთული პროცესების გამარტივებისთვის. ტექნოლოგიურ ინდუსტრიაში ათწლეულზე მეტი გამოცდილებით, მან დახვეწა თავისი უნარები Microsoft Excel-სა და Outlook-ში, ასევე Google Sheets-სა და Docs-ში. მაიკლის ბლოგი ეძღვნება თავისი ცოდნისა და გამოცდილების სხვებს გაზიარებას, ადვილად მისაწვდომ რჩევებსა და გაკვეთილებს პროდუქტიულობისა და ეფექტურობის გასაუმჯობესებლად. მიუხედავად იმისა, გამოცდილი პროფესიონალი ხართ თუ დამწყები, მაიკლის ბლოგი გთავაზობთ ღირებულ შეხედულებებსა და პრაქტიკულ რჩევებს ამ აუცილებელი პროგრამული ხელსაწყოებიდან მაქსიმალური სარგებლობის მისაღებად.