Độ lệch chuẩn trong Excel: ví dụ về hàm và công thức

  • Chia Sẻ Cái Này
Michael Brown

Hướng dẫn giải thích bản chất của độ lệch chuẩn và sai số chuẩn của giá trị trung bình cũng như công thức nào được sử dụng tốt nhất để tính độ lệch chuẩn trong Excel.

Trong thống kê mô tả , trung bình cộng (còn gọi là trung bình cộng) và độ lệch chuẩn và là hai khái niệm có liên quan mật thiết với nhau. Nhưng trong khi cái trước được đa số hiểu rõ, thì cái sau lại được ít người hiểu. Mục đích của hướng dẫn này là làm sáng tỏ độ lệch chuẩn thực sự là gì và cách tính toán nó trong Excel.

    Độ lệch chuẩn là gì?

    The độ lệch chuẩn là thước đo cho biết giá trị của tập hợp dữ liệu lệch (chênh lệch) bao nhiêu so với giá trị trung bình. Nói cách khác, độ lệch chuẩn cho biết dữ liệu của bạn gần với giá trị trung bình hay dao động nhiều.

    Mục đích của độ lệch chuẩn là giúp bạn hiểu liệu giá trị trung bình có thực sự trả về dữ liệu "điển hình" hay không. Độ lệch chuẩn càng gần bằng không, độ biến thiên của dữ liệu càng thấp và giá trị trung bình càng đáng tin cậy. Độ lệch chuẩn bằng 0 cho biết rằng mọi giá trị trong tập dữ liệu đều chính xác bằng giá trị trung bình. Độ lệch chuẩn càng cao thì dữ liệu càng có nhiều biến thể và giá trị trung bình càng kém chính xác.

    Để hiểu rõ hơn về cách hoạt động của tính năng này, vui lòng xem dữ liệu sau:

    Đối với Sinh học, độ lệch chuẩnđộ lệch của mẫu và tổng thể

    Tùy thuộc vào bản chất dữ liệu của bạn, hãy sử dụng một trong các công thức sau:

    • Để tính độ lệch chuẩn dựa trên toàn bộ tổng thể , tức là danh sách đầy đủ các giá trị (B2:B50 trong ví dụ này), hãy sử dụng hàm STDEV.P:

      =STDEV.P(B2:B50)

    • Để tìm độ lệch chuẩn dựa trên mẫu tạo thành một phần hoặc tập hợp con của tổng thể (B2:B10 trong ví dụ này), hãy sử dụng hàm STDEV.S:

      =STDEV.S(B2:B10)

    Như bạn có thể thấy trong ảnh chụp màn hình bên dưới, các công thức trả về các số hơi khác nhau (mẫu càng nhỏ, chênh lệch càng lớn):

    Trong Excel 2007 trở xuống, bạn nên sử dụng các hàm STDEVP và STDEV thay vào đó:

    • Để lấy độ lệch chuẩn tổng thể:

      =STDEVP(B2:B50)

    • Để tính độ lệch chuẩn mẫu:

      =STDEV(B2:B10)

    Tính độ lệch chuẩn cho văn bản biểu diễn số

    Khi thảo luận về các hàm khác nhau để tính độ lệch chuẩn trong Excel, đôi khi chúng ta đề cập đến "text r biểu diễn số" và bạn có thể tò mò muốn biết điều đó thực sự có nghĩa là gì.

    Trong ngữ cảnh này, "biểu diễn văn bản của số" chỉ đơn giản là các số được định dạng dưới dạng văn bản. Làm thế nào những con số như vậy có thể xuất hiện trong bảng tính của bạn? Thông thường, chúng được xuất khẩu từ các nguồn bên ngoài. Hoặc, được trả về bởi cái gọi là Hàm văn bản được thiết kế để thao tác với chuỗi văn bản, ví dụ: VĂN BẢN, GIỮA, PHẢI, TRÁI,v.v... Một số hàm trong số đó cũng có thể hoạt động với các số nhưng đầu ra của chúng luôn ở dạng văn bản, ngay cả khi nó trông rất giống một số.

    Để minh họa rõ hơn điểm này, vui lòng xem xét ví dụ sau. Giả sử bạn có một cột mã sản phẩm như "Jeans-105" trong đó các chữ số sau dấu gạch nối biểu thị số lượng. Mục tiêu của bạn là trích xuất số lượng của từng mặt hàng, sau đó tìm độ lệch chuẩn của các số được trích xuất.

    Kéo số lượng sang cột khác không thành vấn đề:

    =RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))

    Vấn đề là khi sử dụng công thức độ lệch chuẩn Excel trên các số được trích xuất sẽ trả về lỗi #DIV/0! hoặc 0 như trong ảnh chụp màn hình bên dưới:

    Tại sao lại có kết quả kỳ lạ như vậy? Như đã đề cập ở trên, đầu ra của hàm RIGHT luôn là một chuỗi văn bản. Nhưng cả STDEV.S và STDEVA đều không thể xử lý các số được định dạng dưới dạng văn bản trong tham chiếu (số trước chỉ cần bỏ qua chúng trong khi số sau được tính là số không). Để có được độ lệch chuẩn của những "số văn bản" như vậy, bạn cần cung cấp chúng trực tiếp vào danh sách đối số, có thể thực hiện việc này bằng cách nhúng tất cả các hàm RIGHT vào công thức STDEV.S hoặc STDEVA của bạn:

    =STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    =STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    Các công thức hơi rườm rà nhưng đó có thể là một giải pháp hiệu quả cho một mẫu nhỏ. Đối với một cái lớn hơn, chưa kể đến toàn bộ dân số, nó chắc chắn không phải là một lựa chọn. Trong trường hợp này, một giải pháp tao nhã hơn sẽ cóHàm VALUE chuyển đổi "số văn bản" thành số mà bất kỳ công thức độ lệch chuẩn nào cũng có thể hiểu được (vui lòng lưu ý các số được căn phải trong ảnh chụp màn hình bên dưới thay vì chuỗi văn bản được căn trái trong ảnh chụp màn hình ở trên):

    Cách tính sai số chuẩn của giá trị trung bình trong Excel

    Trong thống kê, có một biện pháp nữa để ước tính độ biến thiên của dữ liệu - sai số chuẩn của giá trị trung bình , mà đôi khi được rút ngắn (tuy nhiên, không chính xác) thành "lỗi tiêu chuẩn". Độ lệch chuẩn và sai số chuẩn của giá trị trung bình là hai khái niệm có liên quan chặt chẽ với nhau nhưng không giống nhau.

    Mặc dù độ lệch chuẩn đo lường mức độ biến thiên của một tập dữ liệu so với giá trị trung bình, nhưng sai số chuẩn của giá trị trung bình (SEM) ước tính trung bình mẫu có thể cách trung bình dân số thực bao xa. Nói cách khác - nếu bạn lấy nhiều mẫu từ cùng một quần thể, sai số chuẩn của giá trị trung bình sẽ cho thấy sự phân tán giữa các giá trị trung bình mẫu đó. Vì thông thường, chúng tôi chỉ tính một giá trị trung bình cho một tập hợp dữ liệu chứ không phải nhiều giá trị trung bình, nên sai số chuẩn của giá trị trung bình được ước tính thay vì đo lường.

    Trong toán học, sai số chuẩn của giá trị trung bình được tính theo công thức sau:

    Trong đó SD là độ lệch chuẩn và n là cỡ mẫu (số lượng giá trị trong mẫu).

    Trong bảng tính Excel, bạn có thể sử dụng hàm COUNT để lấy sốcủa các giá trị trong một mẫu, SQRT để lấy căn bậc hai của số đó và STDEV.S để tính độ lệch chuẩn của một mẫu.

    Kết hợp tất cả những điều này lại với nhau, bạn sẽ nhận được lỗi tiêu chuẩn của công thức trung bình trong Excel :

    STDEV.S( range )/SQRT(COUNT( range ))

    Giả sử dữ liệu mẫu nằm trong B2:B10, công thức SEM của chúng ta sẽ như sau :

    =STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))

    Và kết quả có thể tương tự như sau:

    Cách thêm các thanh độ lệch chuẩn trong Excel

    Để hiển thị trực quan lề của độ lệch chuẩn, bạn có thể thêm các thanh độ lệch chuẩn vào biểu đồ Excel của mình. Dưới đây là cách thực hiện:

    1. Tạo biểu đồ theo cách thông thường (nhóm Chèn thẻ > Biểu đồ ).
    2. Nhấp vào bất kỳ đâu trên biểu đồ để chọn nó, sau đó nhấp vào nút Thành phần biểu đồ .
    3. Nhấp vào mũi tên bên cạnh Thanh lỗi và chọn Độ lệch chuẩn .

    Thao tác này sẽ chèn cùng một thanh độ lệch chuẩn cho tất cả các điểm dữ liệu.

    Đây là cách thực hiện độ lệch chuẩn trên Excel. Tôi hy vọng bạn sẽ tìm thấy thông tin này hữu ích. Dù sao, tôi cảm ơn bạn đã đọc và hy vọng sẽ gặp bạn trên blog của chúng tôi vào tuần tới.

    là 5 (được làm tròn thành một số nguyên), cho chúng ta biết rằng phần lớn các điểm cách xa giá trị trung bình không quá 5 điểm. Điều đó có tốt không? Vâng, vâng, điều đó cho thấy rằng điểm Sinh học của các học sinh khá đồng đều.

    Đối với môn Toán, độ lệch chuẩn là 23. Điều đó cho thấy có sự phân tán (chênh lệch) lớn về điểm số, nghĩa là một số sinh viên thể hiện tốt hơn nhiều và/hoặc một số học sinh kém hơn nhiều so với mức trung bình.

    Trong thực tế, độ lệch chuẩn thường được các nhà phân tích kinh doanh sử dụng làm thước đo rủi ro đầu tư - độ lệch chuẩn càng cao thì mức độ biến động càng cao của kết quả trả về.

    Độ lệch chuẩn của mẫu so với Độ lệch chuẩn của tổng thể

    Liên quan đến độ lệch chuẩn, bạn có thể thường nghe các thuật ngữ "mẫu" và "dân số", đề cập đến tính đầy đủ của dữ liệu bạn đang làm việc với. Sự khác biệt chính như sau:

    • Dân số bao gồm tất cả các phần tử từ tập dữ liệu.
    • Mẫu là một tập hợp con của dữ liệu bao gồm một hoặc nhiều yếu tố từ tổng thể.

    Các nhà nghiên cứu và nhà phân tích hoạt động dựa trên độ lệch chuẩn của mẫu và tổng thể trong các tình huống khác nhau. Ví dụ, khi tổng kết điểm thi của một lớp học sinh, giáo viên sẽ sử dụng độ lệch chuẩn dân số. Các nhà thống kê tính toán điểm trung bình SAT quốc gia sẽ sử dụng độ lệch chuẩn mẫu vìchúng chỉ được trình bày với dữ liệu từ một mẫu chứ không phải từ toàn bộ tổng thể.

    Hiểu công thức độ lệch chuẩn

    Lý do bản chất của dữ liệu quan trọng là do độ lệch chuẩn tổng thể và mẫu độ lệch chuẩn được tính bằng các công thức hơi khác nhau:

    Độ lệch chuẩn mẫu

    Độ lệch chuẩn dân số

    Ở đâu:

    • x i là các giá trị riêng lẻ trong tập hợp dữ liệu
    • x là giá trị trung bình của tất cả x giá trị
    • n là tổng số giá trị x trong tập dữ liệu

    Bạn gặp khó khăn trong việc hiểu các công thức? Chia chúng thành các bước đơn giản có thể hữu ích. Nhưng trước tiên, hãy để chúng tôi có một số dữ liệu mẫu để xử lý:

    1. Tính giá trị trung bình (trung bình)

    Trước tiên, bạn tìm giá trị trung bình của tất cả các giá trị trong tập dữ liệu ( x trong các công thức trên). Khi tính toán bằng tay, bạn cộng các số rồi chia tổng cho tổng của các số đó, như sau:

    (1+2+4+5+6+8+9)/7=5

    Để tìm giá trị trung bình trong Excel, hãy sử dụng hàm AVERAGE, ví dụ: =AVERAGE(A2:G2)

    2. Đối với mỗi số, hãy trừ đi giá trị trung bình và bình phương kết quả

    Đây là một phần của công thức độ lệch chuẩn cho biết: ( x i - x )2

    Để hình dung điều gì đang thực sự xảy ra, mời các bạn xem quacác hình ảnh sau.

    Trong ví dụ này, giá trị trung bình là 5, vì vậy chúng tôi tính toán sự khác biệt giữa mỗi điểm dữ liệu và 5.

    Sau đó, bạn bình phương sự khác biệt, biến tất cả chúng thành số dương:

    3. Cộng các chênh lệch bình phương

    Để nói "tổng hợp mọi thứ" trong toán học, bạn sử dụng sigma Σ. Vì vậy, những gì chúng ta làm bây giờ là cộng các hiệu bình phương để hoàn thành phần này của công thức: Σ( x i - x )2

    16 + 9 + 1 + 1 + 9 + 16 = 52

    4. Chia tổng chênh lệch bình phương cho số lượng giá trị

    Cho đến nay, các công thức độ lệch chuẩn mẫu và độ lệch chuẩn tổng thể giống hệt nhau. Tại thời điểm này, chúng khác nhau.

    Đối với độ lệch chuẩn mẫu , bạn nhận được phương sai mẫu bằng cách chia tổng bình phương chênh lệch cho cỡ mẫu trừ đi 1:

    52 / (7-1) = 8,67

    Đối với độ lệch chuẩn tổng thể , bạn tìm giá trị trung bình của các khác biệt bình phương bằng cách chia tổng bình phương sự khác biệt theo số lượng của chúng:

    52/7 = 7,43

    Tại sao lại có sự khác biệt này trong các công thức? Bởi vì trong công thức độ lệch chuẩn mẫu, bạn cần sửa sai lệch trong ước tính của giá trị trung bình mẫu thay vì giá trị trung bình thực của tổng thể. Và bạn làm điều này bằng cách sử dụng n - 1 thay vì n , được gọi là hiệu chỉnh Bessel.

    5. Lấy căn bậc hai

    Cuối cùng lấy căn bậc hai của vế trêncác số và bạn sẽ nhận được độ lệch chuẩn của mình (trong các phương trình bên dưới, được làm tròn đến 2 chữ số thập phân):

    Độ lệch chuẩn của mẫu Độ lệch chuẩn của dân số
    √ 8,67 = 2,94 √ 7,43 = 2,73

    Trong Microsoft Excel, độ lệch chuẩn được tính trong theo cùng một cách, nhưng tất cả các tính toán trên đều được thực hiện ẩn. Điều quan trọng đối với bạn là chọn một hàm độ lệch chuẩn phù hợp, phần sau đây sẽ cung cấp cho bạn một số gợi ý.

    Cách tính độ lệch chuẩn trong Excel

    Nói chung, có sáu hàm khác nhau các hàm tìm độ lệch chuẩn trong excel. Việc sử dụng loại nào phụ thuộc chủ yếu vào bản chất của dữ liệu bạn đang làm việc - cho dù đó là toàn bộ tổng thể hay một mẫu.

    Các hàm tính độ lệch chuẩn mẫu trong Excel

    Cách tính độ lệch chuẩn sai lệch dựa trên một mẫu, hãy sử dụng một trong các công thức sau (tất cả chúng đều dựa trên phương pháp "n-1" được mô tả ở trên).

    Hàm STDEV của Excel

    STDEV(number1,[number2],…) là Excel lâu đời nhất hàm ước tính độ lệch chuẩn dựa trên mẫu và có sẵn trong tất cả các phiên bản Excel 2003 đến 2019.

    Trong Excel 2007 trở lên, STDEV có thể chấp nhận tối đa 255 đối số có thể được biểu thị bằng số, mảng , phạm vi được đặt tên hoặc tham chiếu đến ô chứa số. Trong Excel 2003, hàm chỉ có thể chấp nhận tối đa30 đối số.

    Các giá trị logic và biểu diễn văn bản của các số được cung cấp trực tiếp trong danh sách đối số được tính. Trong mảng và tham chiếu, chỉ các số được tính; các ô trống, giá trị logic TRUE và FALSE, giá trị văn bản và lỗi sẽ bị bỏ qua.

    Lưu ý. Excel STDEV là một hàm lỗi thời, được giữ trong các phiên bản Excel mới hơn chỉ để tương thích ngược. Tuy nhiên, Microsoft không hứa hẹn gì về các phiên bản trong tương lai. Vì vậy, trong Excel 2010 trở lên, bạn nên sử dụng STDEV.S thay vì STDEV.

    Hàm STDEV.S của Excel

    STDEV.S(number1,[number2],…) là phiên bản cải tiến của STDEV, được giới thiệu trong Excel 2010.

    Giống như STDEV, hàm STDEV.S tính toán độ lệch chuẩn mẫu của một tập hợp các giá trị dựa trên công thức độ lệch chuẩn mẫu cổ điển đã thảo luận trong phần trước.

    Hàm Excel STDEVA

    STDEVA(value1, [value2], …) là một hàm khác để tính độ lệch chuẩn của một mẫu trong Excel. Nó chỉ khác hai loại trên ở cách nó xử lý các giá trị logic và văn bản:

    • Tất cả giá trị logic đều được tính, cho dù chúng được chứa trong mảng hay tham chiếu hay được nhập trực tiếp vào danh sách các đối số (TRUE đánh giá là 1, FALSE đánh giá là 0).
    • Giá trị văn bản trong mảng hoặc đối số tham chiếu được tính là 0, bao gồm các chuỗi rỗng (""), văn bản đại diện của các con số, và bất kỳ văn bản nào khác. văn bản đại diện củacác số được cung cấp trực tiếp trong danh sách đối số được tính là số mà chúng đại diện (đây là ví dụ về công thức).
    • Các ô trống sẽ bị bỏ qua.

    Lưu ý. Để công thức độ lệch chuẩn mẫu hoạt động chính xác, các đối số được cung cấp phải chứa ít nhất hai giá trị số, nếu không thì lỗi #DIV/0! lỗi được trả về.

    Các hàm tính độ lệch chuẩn của tổng thể trong Excel

    Nếu bạn đang xử lý toàn bộ tổng thể, hãy sử dụng một trong các hàm sau để tính độ lệch chuẩn trong Excel. Các hàm này dựa trên phương pháp "n".

    Hàm Excel STDEVP

    STDEVP(number1,[number2],…) là hàm Excel cũ để tìm độ lệch chuẩn của một tổng thể.

    Trong các phiên bản mới của Excel 2010, 2013, 2016 và 2019, nó được thay thế bằng hàm STDEV.P cải tiến nhưng vẫn được giữ để tương thích ngược.

    Hàm STDEV.P của Excel

    STDEV.P(number1,[number2],…) là hàm hiện đại phiên bản của hàm STDEVP cung cấp độ chính xác được cải thiện. Hàm này có sẵn trong Excel 2010 và các phiên bản mới hơn.

    Giống như các đối số độ lệch chuẩn mẫu của chúng, trong các mảng hoặc đối số tham chiếu, các hàm STDEVP và STDEV.P chỉ đếm các số. Trong danh sách các đối số, chúng cũng đếm các giá trị logic và biểu diễn văn bản của các số.

    Hàm STDEVPA của Excel

    STDEVPA(value1, [value2], …) tính toán độ lệch chuẩn của một tổng thể, bao gồm các giá trị logic và văn bản. Đối với phi sốcác giá trị, STDEVPA hoạt động chính xác như chức năng STDEVA.

    Lưu ý. Cho dù bạn sử dụng công thức độ lệch chuẩn Excel nào, nó sẽ trả về lỗi nếu một hoặc nhiều đối số chứa giá trị lỗi do một hàm hoặc văn bản khác trả về mà không thể hiểu là một số.

    Sử dụng hàm độ lệch chuẩn Excel nào?

    Một loạt các hàm độ lệch chuẩn trong Excel chắc chắn có thể gây ra sự lộn xộn, đặc biệt đối với người dùng chưa có kinh nghiệm. Để chọn đúng công thức độ lệch chuẩn cho một tác vụ cụ thể, bạn chỉ cần trả lời 3 câu hỏi sau:

    • Bạn có tính toán độ lệch chuẩn của một mẫu hoặc tổng thể không?
    • Bạn dùng phiên bản Excel nào sử dụng?
    • Tập dữ liệu của bạn có chỉ bao gồm các số hoặc giá trị logic và cả văn bản không?

    Để tính độ lệch chuẩn dựa trên một mẫu số, hãy sử dụng Hàm STDEV.S trong Excel 2010 trở lên; STDEV trong Excel 2007 trở về trước.

    Để tìm độ lệch chuẩn của dân số , hãy sử dụng hàm STDEV.P trong Excel 2010 trở lên; STDEVP trong Excel 2007 trở về trước.

    Nếu bạn muốn đưa các giá trị logic hoặc văn bản vào phép tính, hãy sử dụng STDEVA (độ lệch chuẩn mẫu) hoặc STDEVPA ( Độ lệch tiêu chuẩn dân số). Mặc dù tôi không thể nghĩ ra bất kỳ tình huống nào trong đó một trong hai hàm có thể hữu ích, nhưng chúng có thể hữu ích trong các công thức lớn hơn, trong đó một hoặc nhiều đối số được trả về bởicác hàm khác dưới dạng giá trị logic hoặc biểu diễn văn bản của các số.

    Để giúp bạn quyết định hàm độ lệch chuẩn Excel nào phù hợp nhất với nhu cầu của mình, vui lòng xem lại bảng tóm tắt thông tin bạn đã học sau đây.

    <3 4>Bỏ qua
    STDEV STDEV.S STDEVP STDEV.P STDEVA STDEVPA
    Phiên bản Excel 2003 - 2019 2010 - 2019 2003 - 2019 2010 - 2019 2003 - 2019 2003 - 2019
    Mẫu
    Dân số
    Giá trị logic trong mảng hoặc tham chiếu Bỏ qua Đánh giá

    (TRUE=1, FALSE=0)

    Văn bản trong mảng hoặc tham chiếu Bỏ qua Được đánh giá bằng 0
    Các giá trị logic và "số văn bản" trong danh sách đối số Được đánh giá

    (TRUE =1, FALSE=0)

    Ô trống

    Ví dụ về công thức độ lệch chuẩn Excel

    Khi bạn đã chọn hàm tương ứng với loại dữ liệu của mình, sẽ không gặp khó khăn gì khi viết hàm công thức - cú pháp đơn giản và minh bạch đến mức không có chỗ cho sai sót :) Các ví dụ sau minh họa một số công thức độ lệch chuẩn trong Excel đang hoạt động.

    Tính toán chuẩn

    Michael Brown là một người đam mê công nghệ chuyên dụng với niềm đam mê đơn giản hóa các quy trình phức tạp bằng các công cụ phần mềm. Với hơn một thập kỷ kinh nghiệm trong ngành công nghệ, anh ấy đã trau dồi kỹ năng của mình trong Microsoft Excel và Outlook, cũng như Google Trang tính và Tài liệu. Blog của Michael dành để chia sẻ kiến ​​thức và chuyên môn của anh ấy với những người khác, cung cấp các mẹo và hướng dẫn dễ thực hiện để cải thiện năng suất và hiệu quả. Cho dù bạn là một chuyên gia dày dạn kinh nghiệm hay người mới bắt đầu, blog của Michael đều cung cấp những hiểu biết có giá trị và lời khuyên thiết thực để tận dụng tối đa những công cụ phần mềm thiết yếu này.