Tương quan xếp hạng Spearman trong Excel: công thức và đồ thị

  • Chia Sẻ Cái Này
Michael Brown

Hướng dẫn giải thích những điều cơ bản về tương quan Spearman bằng ngôn ngữ đơn giản và cho biết cách tính hệ số tương quan xếp hạng Spearman trong Excel.

Khi thực hiện phân tích tương quan trong Excel, trong hầu hết các trường hợp bạn sẽ giải quyết mối tương quan Pearson. Nhưng vì hệ số tương quan Pearson chỉ đo lường mối quan hệ tuyến tính giữa hai biến nên nó không hoạt động đối với tất cả các loại dữ liệu - các biến của bạn có thể được liên kết chặt chẽ theo cách phi tuyến tính và vẫn có hệ số gần bằng không. Trong những trường hợp như vậy, bạn có thể thực hiện tương quan xếp hạng Spearman thay vì Pearson.

    Tương quan Spearman - những điều cơ bản

    Tương quan Spearman là không tham số phiên bản của hệ số tương quan Pearson đo lường mức độ liên kết giữa hai biến dựa trên thứ hạng của chúng.

    Tương quan thời điểm sản phẩm Pearson kiểm tra mối quan hệ tuyến tính giữa hai biến liên tục biến. Tuyến tính có nghĩa là mối quan hệ khi hai biến thay đổi theo cùng một hướng với tốc độ không đổi.

    Tương quan thứ hạng Spearman đánh giá mối quan hệ đơn điệu giữa các giá trị được xếp hạng. Trong một mối quan hệ đơn điệu, các biến cũng có xu hướng thay đổi cùng nhau, nhưng không nhất thiết phải ở một tốc độ không đổi.

    Khi nào nên thực hiện tương quan Spearman

    Phân tích tương quan Spearman sẽ được sử dụng trong bất kỳ tiếp theocác trường hợp khi các giả định cơ bản của mối tương quan Pearson không được đáp ứng:

    1. Nếu dữ liệu của bạn thể hiện mối quan hệ phi tuyến tính hoặc không có phân phối chuẩn.
    2. Nếu ít nhất một biến là ordinal . Nếu các giá trị của bạn có thể được đặt theo thứ tự "thứ nhất, thứ hai, thứ ba...", thì bạn đang xử lý dữ liệu theo thứ tự.
    3. Nếu có giá trị ngoại lệ đáng kể. Không giống như tương quan Pearson, tương quan Spearman không nhạy cảm với các giá trị ngoại lệ vì nó thực hiện các phép tính trên thứ hạng, do đó, sự khác biệt giữa các giá trị thực tế không có ý nghĩa.

    Ví dụ: bạn có thể sử dụng tương quan Spearman để tìm câu trả lời cho những câu hỏi sau:

    • Những người có trình độ học vấn cao hơn có quan tâm hơn đến môi trường không?
    • Số lượng các triệu chứng mà bệnh nhân mắc phải có liên quan đến mức độ sẵn sàng của họ không? uống thuốc?

    Hệ số tương quan Spearman

    Trong thống kê, Hệ số tương quan Spearman được biểu thị bằng r s hoặc chữ cái Hy Lạp ρ ("rho"), đó là lý do tại sao nó thường được gọi là Spearman's rho .

    Hệ số tương quan xếp hạng Spearman đo lường cả sức mạnh và hướng của mối quan hệ giữa các cấp dữ liệu. Nó có thể là bất kỳ giá trị nào từ -1 đến 1 và giá trị tuyệt đối của hệ số càng gần 1 thì mối quan hệ càng chặt chẽ:

    • 1 là một số dương hoàn hảotương quan
    • -1 là tương quan âm hoàn hảo
    • 0 là không tương quan

    Công thức tương quan xếp hạng Spearman

    Tùy thuộc vào việc có hay không không có mối quan hệ nào trong thứ hạng (cùng một thứ hạng được chỉ định cho hai hoặc nhiều quan sát), hệ số tương quan Spearman có thể được tính bằng một trong các công thức sau.

    Nếu có không có thứ hạng nào bị ràng buộc , một công thức đơn giản hơn sẽ thực hiện:

    Trong đó:

    • d i là hiệu giữa một cặp xếp hạng
    • n là số quan sát

    Để đối phó với xếp hạng ngang nhau , phiên bản đầy đủ của tương quan Spearman công thức phải được sử dụng, đây là phiên bản sửa đổi một chút của Pearson's r:

    Trong đó:

    • R(x) và R(y ) là thứ hạng của các biến x y
    • R(x) và R(y) là thứ hạng trung bình

    Cách tính tương quan Spearman trong Excel bằng hàm CORREL

    Rất tiếc Excel không có sẵn hàm tính Spea hệ số tương quan hạng rman. Tuy nhiên, điều đó không có nghĩa là bạn sẽ phải vắt óc với những công thức trên. Bằng cách thao tác một chút với Excel, chúng ta có thể tìm ra một cách đơn giản hơn nhiều để thực hiện tương quan Spearman.

    Ví dụ: hãy thử tìm hiểu xem hoạt động thể chất của chúng ta có liên quan gì đến huyết áp hay không. Ở cột B, chúng ta có số phút mà 10 người đàn ông cùng tuổi dànhhàng ngày trong phòng tập thể dục và ở cột C, chúng tôi có huyết áp tâm thu của họ.

    Để tìm hệ số tương quan Spearman trong Excel, hãy thực hiện các bước sau:

    1. Xếp hạng dữ liệu của bạn

      Vì tương quan Spearman đánh giá mối liên hệ giữa hai biến dựa trên thứ hạng của chúng, nên bạn cần xếp hạng dữ liệu nguồn của mình. Điều này có thể được thực hiện nhanh chóng bằng cách sử dụng hàm RANK.AVG của Excel.

      Để xếp hạng biến đầu tiên (hoạt động thể chất), hãy nhập công thức dưới đây vào D2 rồi kéo xuống D11:

      =RANK.AVG(B2,$B$2:$B$11,0)

      Để xếp hạng biến thứ hai (huyết áp), hãy nhập công thức sau vào ô E2 và sao chép xuống dưới cột:

      =RANK.AVG(C2,$C$2:$C$11,0)

      Để công thức hoạt động chính xác , hãy nhớ khóa các phạm vi có tham chiếu ô tuyệt đối.

      Tại thời điểm này, dữ liệu nguồn của bạn sẽ giống như sau:

    2. Tìm hệ số tương quan của Spearman

      Với thứ hạng đã được thiết lập, giờ đây chúng ta có thể sử dụng hàm CORREL của Excel để lấy rho của Spearman:

      =CORREL(D2:D11, E2:E11)

      Công thức trả về một hệ số là -0,7576 (làm tròn đến 4 chữ số), cho thấy mối tương quan nghịch khá mạnh và cho phép chúng tôi kết luận rằng một người càng tập thể dục nhiều thì huyết áp của họ càng thấp.

      Hệ số tương quan Pearson cho cùng một mẫu (- 0,7445) biểu thị mối tương quan yếu hơn một chút, nhưng vẫn là thống kê Rất quan trọng:

    Vẻ đẹp của điều nàyphương pháp này nhanh chóng, dễ dàng và hoạt động bất kể có mối quan hệ nào trong bảng xếp hạng hay không.

    Tính toán hệ số tương quan Spearman trong Excel bằng công thức truyền thống

    Nếu bạn không chắc lắm rằng hàm CORREL đã tính đúng rho của Spearman, bạn có thể xác minh kết quả bằng công thức truyền thống được sử dụng trong thống kê. Dưới đây là cách thực hiện:

    1. Tìm sự khác biệt giữa mỗi cặp thứ hạng ( d ) bằng cách lấy thứ hạng kia trừ đi một thứ hạng:

      =D2-E2

      Công thức này áp dụng đến F2 và sau đó được sao chép xuống cột.

    2. Nâng từng chênh lệch thứ hạng lên lũy thừa hai ( d2 ):

      =F2^2

      Công thức này chuyển đến cột G.

    3. Cộng các chênh lệch bình phương:

      =SUM(G2:G11)

      Công thức này có thể đi tới bất kỳ ô trống nào, trong trường hợp của chúng tôi là G12.

      Từ ảnh chụp màn hình sau, bạn có thể sẽ hiểu rõ hơn hiểu biết về cách sắp xếp dữ liệu:

    4. Tùy thuộc vào việc tập dữ liệu của bạn có bất kỳ thứ hạng ràng buộc nào hay không, hãy sử dụng một trong các công thức sau để tính hệ số tương quan Spearman.

    Trong ví dụ của chúng ta, không có ràng buộc nào, vì vậy chúng ta có thể sử dụng công thức đơn giản hơn:

    Với d2 bằng nhau thành 290 và n (số lượng quan sát) bằng 10, công thức sẽ trải qua các phép biến đổi sau:

    Kết quả là bạn nhận được -0,757575758 , hoàn toàn phù hợp với hệ số tương quan Spearman được tính trongví dụ trước.

    Trong Microsoft Excel, các tính toán trên có thể được thực hiện với phương trình sau:

    =1-(6*G12/(10*(10^2-1)))

    Trong đó G12 là tổng của bình phương chênh lệch thứ hạng (d2) .

    Cách thực hiện tương quan Spearman trong Excel bằng biểu đồ

    Các hệ số tương quan trong Excel chỉ đo lường các mối quan hệ tuyến tính (Pearson) hoặc đơn điệu (Spearman). Tuy nhiên, các hiệp hội khác là có thể. Vì vậy, bất kể bạn thực hiện mối tương quan nào, bạn luôn nên biểu thị mối quan hệ giữa các biến trong biểu đồ.

    Để vẽ biểu đồ tương quan cho dữ liệu được xếp hạng, bạn cần làm như sau:

    1. Tính thứ hạng bằng cách sử dụng hàm RANK.AVG như được giải thích trong ví dụ này.
    2. Chọn hai cột có thứ hạng.
    3. Chèn biểu đồ phân tán XY. Đối với điều này, hãy nhấp vào biểu tượng Scatter chart trên tab Inset , trong nhóm Trò chuyện .
    4. Thêm một đường xu hướng vào biểu đồ của bạn. Cách nhanh nhất là nhấp vào nút Thành phần biểu đồ > Thêm đường xu hướng… .
    5. Hiển thị giá trị bình phương R trên biểu đồ. Nhấp đúp vào đường xu hướng để mở ngăn của nó, chuyển sang tab Tùy chọn đường xu hướng và chọn hộp Hiển thị giá trị bình phương R trên biểu đồ .
    6. Hiển thị nhiều chữ số hơn trong giá trị R2 để có độ chính xác cao hơn.

    Kết quả là bạn sẽ nhận được biểu diễn trực quan về mối quan hệ giữa các cấp bậc. Ngoài ra, bạn sẽ nhận được Hệ số xác định (R2), căn bậc hai của nó là hệ số tương quan Pearson (r). Nhưng vì bạn đã vẽ biểu đồ dữ liệu được xếp hạng, r của Pearson này không gì khác chính là rho của Spearman.

    Lưu ý. R-squared luôn là một số dương, do đó hệ số tương quan xếp hạng Spearman suy ra cũng sẽ luôn dương. Để thêm một dấu hiệu thích hợp, chỉ cần nhìn vào đường thẳng trong biểu đồ tương quan của bạn - đường dốc lên biểu thị mối tương quan thuận (dấu cộng) và đường dốc xuống biểu thị mối tương quan âm (dấu trừ).

    Trong trường hợp của chúng ta, R2 bằng 0,5739210285. Sử dụng hàm SQRT để tìm căn bậc hai:

    =SQRT(0.5739210285)

    …và bạn sẽ nhận được hệ số quen thuộc là 0,757575758.

    Độ dốc xuống trong biểu đồ thể hiện giá trị âm tương quan, vì vậy chúng tôi thêm dấu trừ và nhận được hệ số tương quan Spearman chính xác là -0,757575758.

    Đó là cách bạn có thể tính hệ số tương quan xếp hạng Spearman trong Excel. Để xem kỹ hơn các ví dụ được thảo luận trong hướng dẫn này, bạn có thể tải xuống sổ làm việc mẫu của chúng tôi bên dưới. Tôi cảm ơn bạn đã đọc và hy vọng sẽ gặp bạn trên blog của chúng tôi vào tuần tới!

    Sách bài tập thực hành

    Tương quan Xếp hạng Spearman trong Excel (tệp .xlsx)

    Michael Brown là một người đam mê công nghệ chuyên dụng với niềm đam mê đơn giản hóa các quy trình phức tạp bằng các công cụ phần mềm. Với hơn một thập kỷ kinh nghiệm trong ngành công nghệ, anh ấy đã trau dồi kỹ năng của mình trong Microsoft Excel và Outlook, cũng như Google Trang tính và Tài liệu. Blog của Michael dành để chia sẻ kiến ​​thức và chuyên môn của anh ấy với những người khác, cung cấp các mẹo và hướng dẫn dễ thực hiện để cải thiện năng suất và hiệu quả. Cho dù bạn là một chuyên gia dày dạn kinh nghiệm hay người mới bắt đầu, blog của Michael đều cung cấp những hiểu biết có giá trị và lời khuyên thiết thực để tận dụng tối đa những công cụ phần mềm thiết yếu này.