목차
이 자습서에서는 분산 분석 Excel을 수행하는 방법과 표본 및 모집단의 분산을 찾는 데 사용할 공식을 살펴봅니다.
분산은 가장 유용한 것 중 하나입니다. 확률 이론 및 통계 도구. 과학에서는 데이터 세트의 각 숫자가 평균에서 얼마나 떨어져 있는지 설명합니다. 실제로는 종종 무언가가 얼마나 많이 변하는지 보여줍니다. 예를 들어 적도 근처의 온도는 다른 기후대보다 변동이 적습니다. 이 기사에서는 Excel에서 분산을 계산하는 다양한 방법을 분석합니다.
분산이란 무엇입니까?
분산 은 서로 다른 값이 얼마나 퍼져 있는지를 나타내는 데이터 세트입니다. 수학적으로는 평균과의 차이 제곱의 평균으로 정의됩니다.
분산으로 실제로 계산하는 것을 더 잘 이해하려면 이 간단한 예를 살펴보십시오.
5가 있다고 가정합니다. 지역 동물원에 있는 14, 10, 8, 6, 2살 호랑이.
분산을 찾으려면 다음 간단한 단계를 따르십시오.
- 평균 계산(단순 평균) 5개의 숫자 중:
- 각 숫자에서 평균을 빼서 차이점을 찾습니다. 이를 시각화하기 위해 차트에 차이를 표시해 보겠습니다.
- 각 차이를 제곱합니다.
- 차이 제곱의 평균을 계산합니다.
그래서 분산은 16입니다.실제 의미는?
사실 분산은 데이터 세트의 분산에 대한 매우 일반적인 개념을 제공합니다. 0 값은 가변성이 없음을 의미합니다. 즉, 데이터 세트의 모든 숫자가 동일합니다. 숫자가 클수록 데이터가 더 많이 분산됩니다.
이 예는 개체군 분산을 위한 것입니다(즉, 호랑이 5마리가 관심 있는 전체 그룹임). 데이터가 더 큰 모집단에서 선택한 것이라면 약간 다른 수식을 사용하여 표본 분산을 계산해야 합니다.
Excel에서 분산을 계산하는 방법
6개의 기본 제공 함수가 있습니다. Excel에서 분산을 수행하려면: VAR, VAR.S, VARP, VAR.P, VARA 및 VARPA.
분산 수식의 선택은 다음 요소에 의해 결정됩니다.
- 사용 중인 Excel 버전.
- 샘플 또는 모집단 분산을 계산하는지 여부.
- 텍스트 및 논리 값을 평가하거나 무시할지 여부.
Excel 분산 함수
아래 표는 필요에 가장 적합한 수식을 선택하는 데 도움이 되도록 Excel에서 사용할 수 있는 변동 함수에 대한 개요를 제공합니다.
이름 | Excel 버전 | 데이터 유형 | 텍스트 및 논리 |
VAR | 2000 - 2019 | 샘플 | 무시됨 |
VAR.S | 2010 - 2019 | 샘플 | 무시됨 |
바라 | 2000 -2019 | 샘플 | 평가 |
VARP | 2000 - 2019 | 인구 | 무시됨 |
VAR.P | 2010 - 2019 | 인구 | 무시됨 |
VARPA | 2000 - 2019 | 인구 | 평가됨 |
VAR.S 대 VARA 및 VAR.P 대 VARPA
VARA 및 VARPA는 참조의 논리 및 텍스트 값을 처리하는 방식에서만 다른 분산 함수와 다릅니다. 다음 표는 숫자 및 논리 값의 텍스트 표현이 평가되는 방법에 대한 요약을 제공합니다.
인수 유형 | VAR, VAR.S, VARP, VAR.P | 바라 & VARPA |
배열 및 참조 내의 논리 값 | 무시됨 | 평가됨 (TRUE=1, FALSE=0) |
배열 및 참조 내 숫자의 텍스트 표현 | 무시됨 | 0으로 평가됨 |
논리적 인수에 직접 입력된 숫자의 값 및 텍스트 표현 | 평가됨 (TRUE=1, FALSE=0) | |
빈 셀 | 무시됨 |
Excel에서 표본 분산을 계산하는 방법
표본 은 전체 모집단에서 추출한 데이터 집합입니다. 그리고 표본에서 계산된 분산을 표본 분산 이라고 합니다.
예를 들어 사람들의 키가 어떻게 다른지 알고 싶다면 모든 사람을 측정하는 것은 기술적으로 불가능합니다. 지구.해결책은 1,000명이라고 하는 모집단의 표본을 취하고 해당 표본을 기반으로 전체 모집단의 키를 추정하는 것입니다.
표본 분산은 다음 공식으로 계산됩니다.
여기서:
- x̄는 샘플 값의 평균(단순 평균)입니다.
- n은 샘플 크기입니다. sample.
엑셀에서 표본분산을 찾는 함수는 VAR, VAR.S, VARA 3가지가 있다.
엑셀의 VAR 함수
가장 오래된 것이다. 샘플을 기반으로 분산을 추정하는 Excel 함수. VAR 함수는 엑셀 2000부터 2019까지 모든 버전에서 사용 가능합니다.
VAR(숫자1, [숫자2], …)참고. Excel 2010에서는 VAR 함수가 향상된 정확도를 제공하는 VAR.S로 대체되었습니다. 이전 버전과의 호환성을 위해 VAR을 계속 사용할 수 있지만 현재 버전의 Excel에서는 VAR.S를 사용하는 것이 좋습니다.
Excel의 VAR.S 함수
Excel의 최신 버전입니다. VAR 기능. VAR.S 함수를 사용하여 Excel 2010 이상에서 표본 분산을 찾습니다.
VAR.S(숫자1, [숫자2], …)Excel의 VARA 함수
Excel VARA 함수는 a를 반환합니다. 이 표에 나와 있는 숫자, 텍스트 및 논리 값 집합을 기반으로 하는 샘플 분산.
VARA(value1, [value2], …)Excel의 샘플 분산 수식
작업할 때 샘플 분산을 계산하기 위해 위의 함수 중 하나를 사용할 수 있는 숫자 데이터 세트Excel에서.
예를 들어 6개 항목(B2:B7)으로 구성된 표본의 분산을 구해 보겠습니다. 이를 위해 아래 수식 중 하나를 사용할 수 있습니다.
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
스크린샷에 표시된 것처럼 모든 수식은 같은 결과(소수점 2자리로 반올림):
결과를 확인하기 위해 수동으로 var 계산을 수행해 보겠습니다.
- 을 사용하여 평균을 찾습니다. AVERAGE 함수:
=AVERAGE(B2:B7)
평균은 빈 셀(예: B8)로 이동합니다.
- 샘플의 각 숫자에서 평균을 뺍니다.
=B2-$B$8
차이는 C2에서 시작하여 C열로 이동합니다.
- 각 차이를 제곱하고 D2부터 시작하여 D열에 결과를 입력합니다.
=C2^2
- 차이 제곱을 모두 더하고 결과를 샘플의 항목 빼기 1:
=SUM(D2:D7)/(6-1)
보시다시피 수동 var 계산 결과는 Excel의 기본 제공 함수에서 반환된 숫자와 정확히 동일합니다.
데이터 세트에 부울 및/또는 텍스트 값이 포함된 경우 VARA 함수는 다른 결과를 반환합니다. 그 이유는 VAR과 VAR.S는 참조의 숫자 이외의 값을 무시하고 VARA는 텍스트 값을 0으로, TRUE를 1로, FALSE를 0으로 평가하기 때문입니다. 텍스트와 논리를 처리하거나 무시하고 싶습니다.
방법Excel
Population 에서 모집단 분산 계산은 주어진 그룹의 모든 구성원, 즉 연구 분야의 모든 관찰입니다. Population variance 는 전체 모집단이 분산되어 있습니다.
모집단 분산은 다음 공식으로 찾을 수 있습니다.
여기서:
- x̄는 모집단의 평균입니다.
- n은 모집단 크기, 즉 모집단에 있는 값의 총 수입니다.
Excel에는 모집단 분산을 계산하는 3가지 함수가 있습니다: VARP, VAR .P 및 VARPA.
Excel
의 VARP 함수 Excel VARP 함수는 전체 숫자 집합을 기준으로 모집단의 분산을 반환합니다. 엑셀 2000~2019의 모든 버전에서 사용 가능합니다.
VARP(숫자1, [숫자2], …)참고. Excel 2010에서는 VARP가 VAR.P로 대체되었지만 이전 버전과의 호환성을 위해 여전히 유지됩니다. VARP 기능은 향후 버전의 Excel에서 사용할 수 있다는 보장이 없기 때문에 현재 버전의 Excel에서 VAR.P를 사용하는 것이 좋습니다.
Excel
의 VAR.P 기능 엑셀 2010 이상에서 사용할 수 있는 VARP 함수의 개선된 버전입니다.
VAR.P(숫자1, [숫자2], …)엑셀의 VARPA 함수
VARPA 함수는 분산을 계산합니다. 숫자, 텍스트 및 논리 값의 전체 집합을 기반으로 모집단의 Excel 2000 ~ 2019의 모든 버전에서 사용할 수 있습니다.
VARA(value1,[value2], …)Excel의 모집단 분산 공식
샘플 var 계산 예에서 5개의 시험 점수가 더 큰 학생 그룹에서 선택한 점수라고 가정하여 분산을 찾았습니다. 그룹의 모든 학생에 대한 데이터를 수집하면 해당 데이터는 전체 모집단을 나타내며 위의 함수를 사용하여 모집단 분산을 계산합니다.
그룹의 시험 점수가 있다고 가정해 보겠습니다. 10명 중(B2:B11). 점수는 전체 모집단을 구성하므로 다음 공식을 사용하여 분산을 수행합니다.
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
그리고 모든 공식은 동일한 결과:
Excel이 분산을 올바르게 수행했는지 확인하려면 아래 스크린샷에 표시된 수동 var 계산 공식으로 확인할 수 있습니다.
일부 학생이 시험에 응시하지 않고 점수 대신 N/A가 있는 경우 VARPA 함수는 다른 결과를 반환합니다. 그 이유는 VARPA는 텍스트 값을 0으로 평가하는 반면 VARP 및 VAR.P는 참조의 텍스트 및 논리 값을 무시하기 때문입니다. 자세한 내용은 VAR.P 대 VARPA를 참조하십시오.
Excel의 분산 공식 - 사용 참고 사항
Excel에서 분산 분석을 올바르게 수행하려면 다음을 따르십시오. 다음과 같은 간단한 규칙이 있습니다.
- 인수를 값, 배열 또는 셀 참조로 제공합니다.
- Excel 2007 이상에서는샘플 또는 모집단; Excel 2003 및 이전 버전 - 최대 30개의 인수.
- 빈 셀, 텍스트 및 논리 값을 무시하고 참조에서 숫자 만 평가하려면 VAR 또는 VAR.S 함수를 사용하여 샘플 분산과 VARP 또는 VAR.P를 계산하여 모집단 분산을 찾습니다.
- 참조의 논리 및 텍스트 값을 평가하려면 VARA 또는 VARPA 함수를 사용합니다.
- Excel에서 샘플 분산 공식에 두 개의 숫자 값 이상을 제공하고 모집단 분산 공식에 적어도 하나의 숫자 값 을 제공하십시오. 그렇지 않으면 #DIV/0! 오류가 발생합니다.
- 숫자로 해석할 수 없는 텍스트가 포함된 인수는 #VALUE! 오류.
Excel
의 분산 대 표준 편차
분산은 의심할 여지없이 과학에서 유용한 개념이지만 실용적인 정보는 거의 제공하지 않습니다. 예를 들어, 지역 동물원에서 호랑이 개체군의 나이를 찾아 분산을 계산했는데, 이는 16입니다. 문제는 이 숫자를 실제로 어떻게 사용할 수 있습니까?
분산을 사용하여 문제를 해결할 수 있습니다. 표준 편차는 데이터 세트의 변동량을 훨씬 더 잘 측정합니다.
표준 편차 는 분산의 제곱근으로 계산됩니다. 따라서 16의 제곱근을 취하여 표준편차 4를 얻습니다.
평균과 함께 표준편차를 통해 대부분의 호랑이가 몇 살인지 알 수 있습니다. 예를 들어,평균은 8이고 표준 편차는 4이며, 동물원에 있는 대부분의 호랑이는 4세(8 - 4)와 12세(8 + 4) 사이입니다.
Microsoft Excel에는 표본 및 모집단의 표준 편차를 계산하는 특수 기능이 있습니다. 모든 기능에 대한 자세한 설명은 Excel에서 표준편차를 계산하는 방법 튜토리얼에서 확인할 수 있습니다.
이것이 Excel에서 분산을 수행하는 방법입니다. 이 자습서에서 설명하는 수식을 자세히 살펴보려면 이 게시물의 끝에 있는 샘플 통합 문서를 다운로드하세요. 읽어 주셔서 감사합니다. 다음 주 블로그에서 뵙기를 바랍니다!
워크북 연습
Excel에서 분산 계산 - 예제(.xlsx 파일)