Mục lục
Trong hướng dẫn này, chúng ta sẽ xem xét cách thực hiện phân tích phương sai trong Excel và sử dụng công thức nào để tìm phương sai của mẫu và tổng thể.
Phương sai là một trong những cách hữu ích nhất công cụ trong lý thuyết xác suất và thống kê. Trong khoa học, nó mô tả mỗi số trong tập dữ liệu cách giá trị trung bình bao xa. Trong thực tế, nó thường cho thấy một cái gì đó thay đổi nhiều như thế nào. Ví dụ, nhiệt độ gần xích đạo có ít phương sai hơn so với các vùng khí hậu khác. Trong bài viết này, chúng ta sẽ phân tích các phương pháp tính phương sai khác nhau trong Excel.
Phương sai là gì?
Phương sai là thước đo độ biến thiên của một bộ dữ liệu cho biết các giá trị khác nhau được trải rộng bao xa. Về mặt toán học, nó được định nghĩa là giá trị trung bình của các chênh lệch bình phương so với giá trị trung bình.
Để hiểu rõ hơn những gì bạn đang thực sự tính toán với phương sai, vui lòng xem xét ví dụ đơn giản này.
Giả sử có 5 hổ trong sở thú địa phương của bạn 14, 10, 8, 6 và 2 tuổi.
Để tìm phương sai, hãy làm theo các bước đơn giản sau:
- Tính giá trị trung bình (trung bình đơn giản) của năm số:
- Từ mỗi số, trừ đi giá trị trung bình để tìm sự khác biệt. Để hình dung điều này, hãy vẽ biểu đồ các chênh lệch trên biểu đồ:
- Bình phương mỗi chênh lệch.
- Tính giá trị trung bình của các chênh lệch bình phương.
Vậy phương sai là 16. Nhưng con số này là gìthực sự có nghĩa là gì?
Thực ra, phương sai chỉ cho bạn ý tưởng rất chung chung về sự phân tán của tập dữ liệu. Giá trị 0 có nghĩa là không có sự thay đổi, tức là tất cả các số trong tập dữ liệu đều giống nhau. Con số càng lớn, dữ liệu càng trải rộng.
Ví dụ này dành cho phương sai dân số (tức là 5 con hổ là toàn bộ nhóm mà bạn quan tâm). Nếu dữ liệu của bạn là sự lựa chọn từ một tổng thể lớn hơn thì bạn cần tính phương sai mẫu bằng cách sử dụng một công thức hơi khác.
Cách tính phương sai trong Excel
Có 6 hàm tích hợp để thực hiện phương sai trong Excel: VAR, VAR.S, VARP, VAR.P, VARA và VARPA.
Lựa chọn công thức phương sai của bạn được xác định bởi các yếu tố sau:
- Phiên bản Excel bạn đang sử dụng.
- Cho dù bạn tính phương sai mẫu hay tổng thể.
- Cho dù bạn muốn đánh giá hay bỏ qua các giá trị logic và văn bản.
Các hàm biến thiên trong Excel
Bảng bên dưới cung cấp thông tin tổng quan về các hàm biến thiên có sẵn trong Excel để giúp bạn chọn công thức phù hợp nhất cho nhu cầu của mình.
Tên | Phiên bản Excel | Loại dữ liệu | Văn bản và logic |
VAR | 2000 - 2019 | Mẫu | Bỏ qua |
VAR.S | 2010 - 2019 | Mẫu | Bỏ qua |
VARA | 2000 -2019 | Mẫu | Đánh giá |
VARP | 2000 - 2019 | Dân số | Bỏ qua |
VAR.P | 2010 - 2019 | Dân số | Bỏ qua |
VARPA | 2000 - 2019 | Dân số | Đánh giá |
VAR.S so với VARA và VAR.P so với VARPA
VARA và VARPA khác với các hàm phương sai khác chỉ ở cách chúng xử lý các giá trị logic và văn bản trong tham chiếu. Bảng sau đây cung cấp tóm tắt về cách đánh giá biểu diễn văn bản của số và giá trị logic.
Loại đối số | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Giá trị logic trong mảng và tham chiếu | Bỏ qua | Đánh giá (TRUE=1, FALSE=0) |
Biểu diễn văn bản của các số trong mảng và tham chiếu | Bỏ qua | Được đánh giá bằng 0 |
Logic giá trị và biểu diễn văn bản của các số được nhập trực tiếp vào đối số | Đánh giá (TRUE=1, FALSE=0) | |
Ô trống | Bỏ qua |
Cách tính phương sai mẫu trong Excel
Một mẫu là một tập hợp dữ liệu được trích xuất từ toàn bộ tập hợp. Và phương sai được tính toán từ một mẫu được gọi là phương sai mẫu .
Ví dụ: nếu bạn muốn biết chiều cao của mọi người khác nhau như thế nào, thì về mặt kỹ thuật, bạn sẽ không thể đo lường mọi người trên Trái đất.Giải pháp là lấy một mẫu dân số, chẳng hạn như 1.000 người và ước tính chiều cao của toàn bộ dân số dựa trên mẫu đó.
Phương sai mẫu được tính theo công thức sau:
Trong đó:
- x̄ là giá trị trung bình (trung bình đơn giản) của các giá trị mẫu.
- n là kích thước mẫu, tức là số lượng giá trị trong mẫu.
Có 3 hàm để tìm phương sai mẫu trong Excel: VAR, VAR.S và VARA.
Hàm VAR trong Excel
Đây là hàm lâu đời nhất Hàm Excel để ước tính phương sai dựa trên một mẫu. Hàm VAR có sẵn trong tất cả các phiên bản Excel 2000 đến 2019.
VAR(number1, [number2],…)Lưu ý. Trong Excel 2010, hàm VAR đã được thay thế bằng VAR.S giúp cải thiện độ chính xác. Mặc dù VAR vẫn có sẵn để tương thích ngược nhưng bạn nên sử dụng VAR.S trong các phiên bản Excel hiện tại.
Hàm VAR.S trong Excel
Đây là phiên bản hiện đại của Excel Chức năng VAR. Sử dụng hàm VAR.S để tìm phương sai mẫu trong Excel 2010 trở lên.
VAR.S(number1, [number2],…)Hàm VARA trong Excel
Hàm VARA của Excel trả về một phương sai mẫu dựa trên tập hợp các số, văn bản và giá trị lô-gic như trong bảng này.
VARA(value1, [value2],…)Công thức phương sai mẫu trong Excel
Khi làm việc với một bộ dữ liệu dạng số mà bạn có thể sử dụng bất kỳ hàm nào ở trên để tính phương sai mẫutrong Excel.
Ví dụ: hãy tìm phương sai của một mẫu bao gồm 6 mục (B2:B7). Đối với điều này, bạn có thể sử dụng một trong các công thức dưới đây:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Như minh họa trong ảnh chụp màn hình, tất cả các công thức đều trả về giá trị cùng một kết quả (làm tròn đến 2 chữ số thập phân):
Để kiểm tra kết quả, hãy thực hiện phép tính var theo cách thủ công:
- Tìm giá trị trung bình bằng cách sử dụng hàm AVERAGE:
=AVERAGE(B2:B7)
Giá trị trung bình đi đến bất kỳ ô trống nào, chẳng hạn như B8.
- Trừ giá trị trung bình từ mỗi số trong mẫu:
=B2-$B$8
Sự khác biệt sẽ chuyển đến cột C, bắt đầu từ C2.
- Bình phương mỗi chênh lệch và đặt kết quả vào cột D, bắt đầu từ D2:
=C2^2
- Cộng các chênh lệch bình phương và chia kết quả cho số các mục trong mẫu trừ đi 1:
=SUM(D2:D7)/(6-1)
Như bạn có thể thấy, kết quả tính toán var thủ công của chúng tôi hoàn toàn giống với số được trả về bởi các hàm tích hợp sẵn của Excel:
Nếu tập dữ liệu của bạn chứa các giá trị Boolean và/hoặc văn bản , thì hàm VARA sẽ trả về một kết quả khác. Lý do là VAR và VAR.S bỏ qua bất kỳ giá trị nào khác ngoài số trong tham chiếu, trong khi VARA đánh giá giá trị văn bản là 0, TRUE là 1 và FALSE là 0. Vì vậy, vui lòng chọn cẩn thận hàm phương sai cho phép tính của bạn tùy thuộc vào việc bạn có muốn xử lý hoặc bỏ qua văn bản và logic.
Cáchtính toán phương sai dân số trong Excel
Dân số là tất cả các thành viên của một nhóm nhất định, tức là tất cả các quan sát trong lĩnh vực nghiên cứu. Phương sai dân số mô tả cách các điểm dữ liệu trong toàn bộ dân số trải đều.
Có thể tìm thấy phương sai dân số theo công thức sau:
Trong đó:
- x̄ là giá trị trung bình của tổng thể.
- n là quy mô tổng thể, tức là tổng số giá trị trong tổng thể.
Có 3 hàm tính phương sai tổng thể trong Excel: VARP, VAR .P và VARPA.
Hàm VARP trong Excel
Hàm VARP trong Excel trả về phương sai của một tổng thể dựa trên toàn bộ tập hợp số. Nó có sẵn trong tất cả các phiên bản Excel 2000 đến 2019.
VARP(số1, [số2],…)Lưu ý. Trong Excel 2010, VARP đã được thay thế bằng VAR.P nhưng vẫn được giữ để tương thích ngược. Bạn nên sử dụng VAR.P trong các phiên bản Excel hiện tại vì không có gì đảm bảo rằng hàm VARP sẽ khả dụng trong các phiên bản Excel trong tương lai.
Hàm VAR.P trong Excel
Đây là phiên bản cải tiến của hàm VARP có sẵn trong Excel 2010 trở lên.
VAR.P(number1, [number2],…)Hàm VARPA trong Excel
Hàm VARPA tính toán phương sai của một tập hợp dựa trên toàn bộ tập hợp số, văn bản và giá trị logic. Nó có sẵn trong tất cả các phiên bản Excel 2000 đến 2019.
VARA(value1,[value2],…)Công thức phương sai dân số trong Excel
Trong ví dụ tính toán var mẫu, chúng tôi đã tìm thấy phương sai của 5 điểm bài kiểm tra giả sử những điểm đó là sự lựa chọn từ một nhóm học sinh lớn hơn. Nếu bạn thu thập dữ liệu về tất cả học sinh trong nhóm, thì dữ liệu đó sẽ đại diện cho toàn bộ tập hợp và bạn sẽ tính toán phương sai tổng thể bằng cách sử dụng các hàm trên.
Giả sử, chúng ta có điểm bài kiểm tra của một nhóm của 10 sinh viên (B2:B11). Điểm số cấu thành toàn bộ tổng thể, vì vậy chúng tôi sẽ thực hiện phương sai với các công thức sau:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
Và tất cả các công thức sẽ trả về kết quả giống hệt nhau:
Để đảm bảo Excel đã thực hiện đúng phương sai, bạn có thể kiểm tra bằng công thức tính var thủ công được hiển thị trong ảnh chụp màn hình bên dưới:
Nếu một số học sinh không tham gia kỳ thi và có N/A thay vì số điểm, hàm VARPA sẽ trả về một kết quả khác. Lý do là VARPA đánh giá các giá trị văn bản bằng 0 trong khi VARP và VAR.P bỏ qua các giá trị logic và văn bản trong tham chiếu. Vui lòng xem VAR.P so với VARPA để biết chi tiết đầy đủ.
Công thức phương sai trong Excel - lưu ý sử dụng
Để thực hiện phân tích phương sai trong Excel một cách chính xác, vui lòng làm theo các quy tắc đơn giản sau:
- Cung cấp đối số dưới dạng giá trị, mảng hoặc tham chiếu ô.
- Trong Excel 2007 trở lên, bạn có thể cung cấp tối đa 255 đối số tương ứng với mộtmẫu hoặc quần thể; trong Excel 2003 trở lên - tối đa 30 đối số.
- Để chỉ đánh giá số trong tham chiếu, bỏ qua ô trống, văn bản và giá trị lô-gic, hãy sử dụng hàm VAR hoặc VAR.S để tính phương sai mẫu và VARP hoặc VAR.P để tìm phương sai tổng thể.
- Để đánh giá các giá trị logic và văn bản trong tham chiếu, hãy sử dụng hàm VARA hoặc VARPA.
- Cung cấp ít nhất hai giá trị số cho công thức phương sai mẫu và ít nhất một giá trị số cho công thức phương sai tổng thể trong Excel, nếu không sẽ là #DIV/0! xảy ra lỗi.
- Các đối số chứa văn bản không thể hiểu là số gây ra lỗi #VALUE! lỗi.
Phương sai so với độ lệch chuẩn trong Excel
Phương sai chắc chắn là một khái niệm hữu ích trong khoa học, nhưng nó cung cấp rất ít thông tin thực tế. Ví dụ: chúng tôi tìm thấy độ tuổi của quần thể hổ trong một sở thú địa phương và tính toán phương sai, bằng 16. Câu hỏi đặt ra là - chúng ta thực sự có thể sử dụng con số này như thế nào?
Bạn có thể sử dụng phương sai để tính toán độ lệch chuẩn, là thước đo tốt hơn nhiều về lượng biến thể trong tập dữ liệu.
Độ lệch chuẩn được tính bằng căn bậc hai của phương sai. Vì vậy, chúng tôi lấy căn bậc hai của 16 và nhận được độ lệch chuẩn là 4.
Kết hợp với giá trị trung bình, độ lệch chuẩn có thể cho bạn biết tuổi của hầu hết các con hổ. Ví dụ, nếutrung bình là 8 và độ lệch chuẩn là 4, phần lớn hổ trong vườn thú là từ 4 tuổi (8 - 4) đến 12 tuổi (8 + 4).
Microsoft Excel có các hàm đặc biệt để tính độ lệch chuẩn của mẫu và tổng thể. Bạn có thể tìm thấy giải thích chi tiết về tất cả các hàm trong hướng dẫn này: Cách tính độ lệch chuẩn trong Excel.
Đó là cách thực hiện phương sai trong Excel. Để xem kỹ hơn các công thức được thảo luận trong hướng dẫn này, bạn có thể tải xuống sổ làm việc mẫu của chúng tôi ở cuối bài đăng này. Tôi cảm ơn bạn đã đọc và hy vọng sẽ gặp bạn trên blog của chúng tôi vào tuần tới!
Sách bài tập thực hành
Tính toán phương sai trong Excel - ví dụ (tệp .xlsx)