สารบัญ
บทช่วยสอนอธิบายพื้นฐานของความสัมพันธ์ของ Spearman ในภาษาง่ายๆ และแสดงวิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับ Spearman ใน Excel
เมื่อทำการวิเคราะห์ความสัมพันธ์ใน Excel ในกรณีส่วนใหญ่ คุณจะจัดการกับความสัมพันธ์แบบเพียร์สัน แต่เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันวัดเฉพาะความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว จึงใช้ไม่ได้กับข้อมูลทุกประเภท ตัวแปรของคุณอาจเชื่อมโยงอย่างมากในลักษณะที่ไม่ใช่เชิงเส้นและยังคงมีค่าสัมประสิทธิ์ใกล้เคียงกับศูนย์ ในสถานการณ์ดังกล่าว คุณสามารถทำความสัมพันธ์อันดับของ Spearman แทนของ Pearson ได้
ความสัมพันธ์ของ Spearman - พื้นฐาน
ความสัมพันธ์ของ Spearman เป็นความสัมพันธ์แบบไม่อิงพารามิเตอร์ เวอร์ชันของค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันที่วัดระดับความสัมพันธ์ระหว่างตัวแปรสองตัวตามอันดับของตัวแปร
ความสัมพันธ์ระหว่างช่วงเวลาของผลิตภัณฑ์เพียร์สัน ทดสอบความสัมพันธ์ เชิงเส้น ระหว่างสองความสัมพันธ์ที่ต่อเนื่องกัน ตัวแปร เชิงเส้นหมายถึงความสัมพันธ์เมื่อตัวแปรสองตัวเปลี่ยนไปในทิศทางเดียวกันด้วยอัตราคงที่
ความสัมพันธ์อันดับสเปียร์แมน ประเมินความสัมพันธ์ โมโนโทนิก ระหว่างค่าอันดับ ในความสัมพันธ์แบบโมโนโทนิก ตัวแปรต่างๆ ก็มีแนวโน้มที่จะเปลี่ยนแปลงพร้อมกันเช่นกัน แต่ไม่จำเป็นต้องเป็นอัตราคงที่
เมื่อใดควรทำความสัมพันธ์แบบสเปียร์แมน
การวิเคราะห์สหสัมพันธ์แบบสเปียร์แมนจะใช้ในสิ่งใดสิ่งหนึ่ง กำลังติดตามสถานการณ์ที่สมมติฐานพื้นฐานของความสัมพันธ์เพียร์สันไม่เป็นไปตาม:
- หากข้อมูลของคุณแสดงความสัมพันธ์ ไม่เป็นเชิงเส้น หรือไม่ได้กระจายตามปกติ
- หาก ตัวแปรอย่างน้อยหนึ่งตัวคือ ลำดับ หากค่าของคุณอยู่ในลำดับ "ที่หนึ่ง สอง สาม…" แสดงว่าคุณกำลังจัดการกับข้อมูลลำดับ
- หากมี ค่าผิดปกติ ที่สำคัญ ซึ่งแตกต่างจากสหสัมพันธ์เพียร์สัน สหสัมพันธ์สเปียร์แมนไม่ไวต่อค่าผิดปกติเนื่องจากทำการคำนวณตามลำดับ ดังนั้นความแตกต่างระหว่างค่าจริงจึงไม่มีความหมาย
ตัวอย่างเช่น คุณสามารถใช้สหสัมพันธ์สเปียร์แมน เพื่อหาคำตอบสำหรับคำถามต่อไปนี้:
- ผู้ที่มีการศึกษาระดับสูงกังวลเกี่ยวกับสิ่งแวดล้อมมากกว่าหรือไม่
- จำนวนอาการของผู้ป่วยมีความสัมพันธ์กับความตั้งใจของพวกเขาหรือไม่ ใช้ยาหรือไม่
สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน
ในทางสถิติ ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน แสดงด้วย r s หรืออักษรกรีก ρ ("rho") ซึ่งเป็นเหตุผลว่าทำไมจึงมักเรียกว่า Spearman's rho .
สัมประสิทธิ์สหสัมพันธ์อันดับ Spearman วัดทั้ง ความแรงและทิศทางของความสัมพันธ์ระหว่างอันดับของข้อมูล สามารถเป็นค่าใดก็ได้ตั้งแต่ -1 ถึง 1 และยิ่งค่าสัมประสิทธิ์ของสัมประสิทธิ์เข้าใกล้ 1 มากเท่าไร ความสัมพันธ์ก็จะแน่นแฟ้นขึ้น:
- 1 เป็นค่าบวกที่สมบูรณ์แบบความสัมพันธ์
- -1 คือความสัมพันธ์เชิงลบที่สมบูรณ์แบบ
- 0 คือไม่มีความสัมพันธ์
สูตรความสัมพันธ์อันดับสเปียร์แมน
ขึ้นอยู่กับว่ามีหรือไม่มี ไม่มีความสัมพันธ์กันในการจัดอันดับ (อันดับเดียวกันที่กำหนดให้กับการสังเกตตั้งแต่ 2 ครั้งขึ้นไป) ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนสามารถคำนวณได้ด้วยสูตรใดสูตรหนึ่งต่อไปนี้
หากมี ไม่มีอันดับเท่ากัน สูตรที่ง่ายกว่าจะทำ:
ที่ไหน:
- d i คือความแตกต่าง ระหว่างคู่ของอันดับ
- n คือจำนวนของการสังเกต
เพื่อจัดการกับ อันดับที่เท่ากัน เวอร์ชันเต็มของ Spearman correlation ต้องใช้สูตรซึ่งเป็นเวอร์ชันแก้ไขเล็กน้อยของ Pearson's r:
ที่ไหน:
- R(x) และ R(y ) คืออันดับของตัวแปร x และ y
- R(x) และ R(y) คืออันดับเฉลี่ย
วิธีคำนวณความสัมพันธ์ของ Spearman ใน Excel ด้วยฟังก์ชัน CORREL
ขออภัย Excel ไม่มีฟังก์ชันในตัวสำหรับคำนวณ Spea ค่าสัมประสิทธิ์สหสัมพันธ์อันดับที่ rman อย่างไรก็ตาม นั่นไม่ได้หมายความว่าคุณจะต้องเครียดกับสูตรข้างต้น ด้วยการจัดการกับ Excel เล็กน้อย เราสามารถหาวิธีที่ง่ายกว่ามากในการสร้างความสัมพันธ์ของสเปียร์แมน
ตัวอย่างเช่น ลองค้นหาว่าการออกกำลังกายของเรามีความสัมพันธ์กับความดันโลหิตของเราหรือไม่ ในคอลัมน์ B เรามีจำนวนนาทีที่ผู้ชายอายุเท่ากัน 10 คนใช้เวลาทุกวันในโรงยิม และในคอลัมน์ C เรามีความดันโลหิตซิสโตลิก
หากต้องการหาค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนใน Excel ให้ทำตามขั้นตอนเหล่านี้:
<12เนื่องจากความสัมพันธ์ของ Spearman ประเมินความสัมพันธ์ระหว่างตัวแปรสองตัวตามอันดับของตัวแปรเหล่านั้น คุณจึงต้องจัดลำดับแหล่งข้อมูลของคุณ ซึ่งสามารถทำได้อย่างรวดเร็วโดยใช้ฟังก์ชัน Excel RANK.AVG
หากต้องการจัดอันดับตัวแปรแรก (การออกกำลังกาย) ให้ป้อนสูตรด้านล่างใน D2 แล้วลากลงไปที่ D11:
=RANK.AVG(B2,$B$2:$B$11,0)
หากต้องการจัดอันดับตัวแปรที่สอง (ความดันโลหิต) ให้ใส่สูตรต่อไปนี้ในเซลล์ E2 และคัดลอกลงในคอลัมน์:
=RANK.AVG(C2,$C$2:$C$11,0)
เพื่อให้สูตรทำงานได้อย่างถูกต้อง โปรดตรวจสอบให้แน่ใจว่าได้ล็อกช่วงด้วยการอ้างอิงเซลล์แบบสัมบูรณ์
ณ จุดนี้ แหล่งข้อมูลของคุณควรมีลักษณะดังนี้:
เมื่อสร้างอันดับแล้ว ตอนนี้เราสามารถใช้ฟังก์ชัน CORREL ของ Excel เพื่อรับค่า Rho ของสเปียร์แมนได้:
=CORREL(D2:D11, E2:E11)
สูตรส่งคืนค่าสัมประสิทธิ์ของ -0.7576 (ปัดเศษเป็นตัวเลข 4 หลัก) ซึ่งแสดงความสัมพันธ์เชิงลบค่อนข้างแรง และช่วยให้เราสรุปได้ว่ายิ่งออกกำลังกายมาก ความดันโลหิตก็จะยิ่งลดลง
ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันสำหรับตัวอย่างเดียวกัน (- 0.7445) บ่งชี้ความสัมพันธ์ที่อ่อนแอลงเล็กน้อย แต่ยังคงเป็นสถิติ นัยสำคัญ:
ความสวยงามของสิ่งนี้วิธีการคือรวดเร็ว ง่าย และได้ผลไม่ว่าจะมีความสัมพันธ์กันในการจัดอันดับหรือไม่
คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ของ Spearman ใน Excel ด้วยสูตรดั้งเดิม
หากคุณไม่แน่ใจ ที่ฟังก์ชัน CORREL ได้คำนวณค่า Rho Right ของ Spearman แล้ว คุณสามารถตรวจสอบผลลัพธ์ได้ด้วยสูตรดั้งเดิมที่ใช้ในสถิติ มีวิธีการดังนี้:
- ค้นหาความแตกต่างระหว่างอันดับแต่ละคู่ ( d ) โดยการลบหนึ่งอันดับออกจากอีกอันดับ:
=D2-E2
ใช้สูตรนี้ ไปที่ F2 แล้วคัดลอกลงในคอลัมน์
- ยกกำลังสอง ( d2 ):
=F2^2
สูตรนี้ไปที่คอลัมน์ G
- บวกผลต่างกำลังสอง:
=SUM(G2:G11)
สูตรนี้สามารถไปที่เซลล์ว่างใดก็ได้ ซึ่งก็คือ G12 ในกรณีของเรา
จากภาพหน้าจอต่อไปนี้ คุณอาจจะเก่งขึ้น ความเข้าใจในการจัดเรียงข้อมูล:
- ขึ้นอยู่กับว่าชุดข้อมูลของคุณมีอันดับที่สัมพันธ์กันหรือไม่ ให้ใช้หนึ่งในสูตรเหล่านี้เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน
ในตัวอย่างของเรา ไม่มีการเสมอกัน ดังนั้นเราจึงสามารถใช้สูตรที่ง่ายกว่านี้:
ด้วย d2 เท่ากับ ถึง 290 และ n (จำนวนการสังเกต) เท่ากับ 10 สูตรผ่านการแปลงต่อไปนี้:
ผลลัพธ์ที่ได้คือ -0.757575758 ซึ่งเห็นด้วยอย่างยิ่งกับค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนที่คำนวณในตัวอย่างก่อนหน้านี้
ใน Microsoft Excel การคำนวณข้างต้นสามารถทำได้ด้วยสมการต่อไปนี้:
=1-(6*G12/(10*(10^2-1)))
โดยที่ G12 คือผลรวมของผลต่างอันดับกำลังสอง (d2) .
วิธีสร้างความสัมพันธ์แบบสเปียร์แมนใน Excel โดยใช้กราฟ
ค่าสัมประสิทธิ์สหสัมพันธ์ใน Excel วัดเฉพาะความสัมพันธ์เชิงเส้น (เพียร์สัน) หรือแบบโมโนโทนิก (สเปียร์แมน) อย่างไรก็ตาม สมาคมอื่นๆ เป็นไปได้ ดังนั้น ไม่ว่าคุณจะใช้ความสัมพันธ์แบบใด คุณควรแสดงความสัมพันธ์ระหว่างตัวแปรในกราฟเสมอ
ในการวาดกราฟความสัมพันธ์สำหรับข้อมูลที่จัดลำดับ สิ่งที่คุณต้องทำมีดังนี้:
- คำนวณอันดับโดยใช้ฟังก์ชัน RANK.AVG ตามที่อธิบายในตัวอย่างนี้
- เลือกสองคอลัมน์ที่มีอันดับ
- แทรกแผนภูมิกระจาย XY สำหรับสิ่งนี้ คลิกไอคอน กระจาย แผนภูมิ บนแท็บ สิ่งที่ใส่เข้าไป ในกลุ่ม แชท
- เพิ่ม เส้นแนวโน้มไปยังแผนภูมิของคุณ วิธีที่เร็วที่สุดคือคลิกปุ่ม องค์ประกอบแผนภูมิ > เพิ่มเส้นแนวโน้ม… .
- แสดงค่า R-squared บนแผนภูมิ ดับเบิลคลิกเส้นแนวโน้มเพื่อเปิดบานหน้าต่าง เปลี่ยนไปที่แท็บ ตัวเลือกเส้นแนวโน้ม และเลือกช่อง แสดงค่า R-squared บนแผนภูมิ
- แสดงตัวเลขมากขึ้นในค่า R2 เพื่อความแม่นยำที่ดีขึ้น
ด้วยเหตุนี้ คุณจะได้รับภาพที่แสดงถึงความสัมพันธ์ระหว่างอันดับ นอกจากนี้ คุณจะได้รับ ค่าสัมประสิทธิ์ของการหาค่า (R2) รากที่สองของค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (r) แต่เนื่องจากคุณได้พล็อตข้อมูลอันดับแล้ว r ของ Pearson นี้จึงไม่ใช่อย่างอื่นนอกจาก Rho ของ Spearman
หมายเหตุ R-squared เป็นจำนวนบวกเสมอ ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์อันดับ Spearman ที่อนุมานได้จะเป็นค่าบวกเสมอ ในการเพิ่มเครื่องหมายที่เหมาะสม เพียงแค่ดูที่เส้นในกราฟความสัมพันธ์ของคุณ ความชันขึ้นบ่งชี้ความสัมพันธ์เชิงบวก (เครื่องหมายบวก) และความชันลงบ่งชี้ความสัมพันธ์เชิงลบ (เครื่องหมายลบ)
ในกรณีของเรา R2 เท่ากับ 0.5739210285 ใช้ฟังก์ชัน SQRT เพื่อหารากที่สอง:
=SQRT(0.5739210285)
…และคุณจะได้ค่าสัมประสิทธิ์ที่คุ้นเคยคือ 0.757575758
ความชันที่ลดลงในกราฟแสดงค่าลบ ความสัมพันธ์ เราจึงเพิ่มเครื่องหมายลบและรับค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมนที่ถูกต้องเป็น -0.757575758
นั่นคือวิธีที่คุณสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมนใน Excel หากต้องการดูตัวอย่างที่กล่าวถึงในบทช่วยสอนนี้อย่างละเอียดยิ่งขึ้น คุณสามารถดาวน์โหลดสมุดงานตัวอย่างด้านล่าง ฉันขอขอบคุณสำหรับการอ่านและหวังว่าจะได้พบคุณในบล็อกของเราในสัปดาห์หน้า!
สมุดงานแบบฝึกหัด
ความสัมพันธ์ของอันดับสเปียร์แมนใน Excel (ไฟล์ .xlsx)