Excelで分散を計算する方法 - サンプル & 母集団の分散の計算式

  • これを共有
Michael Brown

このチュートリアルでは、分散分析Excelのやり方と、標本と母集団の分散を求めるためにどのような数式を使用するかについて見ていきます。

分散は、確率論と統計学の最も有用なツールの1つです。 科学的には、データセットの各数値が平均からどれくらい離れているかを表します。 実際には、何かがどれくらい変化するかを示すことが多いです。 例えば、赤道近くの気温は、他の気候帯よりも分散が小さいです。 この記事では、Excelで分散のさまざまな計算方法を分析することにします。

    バリアンスとは何ですか?

    増減率 は、データセットのばらつきを表す指標で、異なる値がどの程度広がっているかを示す。 数学的には、平均からの差の2乗の平均と定義される。

    分散で実際に何を計算しているのか、よりよく理解するために、この簡単な例を考えてみてください。

    あなたの近くの動物園に、14歳、10歳、8歳、6歳、2歳の5頭のトラがいるとします。

    分散を見つけるには、次のような簡単な手順で行います。

    1. 5つの数値の平均値(単純平均)を算出する。

    2. それぞれの数値から平均値を引き、差を求めます。 これを視覚化するために、差をグラフにプロットしてみましょう。

    3. 各差異を二乗する。
    4. 差の二乗の平均を計算する。

    つまり、分散は16である。 しかし、この数字は実際にどのような意味を持つのだろうか。

    実は、分散はデータセットの分散を非常に一般的に示しているだけなのです。 値が0であれば、変動がない、つまりデータセットのすべての数値が同じであることを意味します。 数値が大きくなればなるほど、データはより分散していることを意味します。

    この例は母集団分散の場合です(つまり、5匹のトラがあなたが興味を持っているグループ全体です)。 あなたのデータがより大きな母集団からの選択である場合、少し異なる数式を使用して標本分散を計算する必要があります。

    Excelで分散を計算する方法

    Excelには分散を行うための6つの組み込み関数があります:VAR, VAR.S, VARP, VAR.P, VARA, そして VARPAです。

    分散式の選択は、以下の要素で決まります。

    • 使用しているExcelのバージョン。
    • 標本分散と母集団分散のどちらを計算するか。
    • テキストや論理値を評価するか無視するか。

    エクセル分散関数

    下の表は、Excel で使用できるバリエーション関数の概要を示しており、ニーズに合わせて最適な数式を選択することができます。

    名称 エクセル版 データ型 テキストとロジカル
    バー 2000 - 2019 サンプル 無視される
    バーサス 2010 - 2019 サンプル 無視される
    ヴァーラ 2000 - 2019 サンプル 評価済み
    バープ 2000 - 2019 人口 無視される
    VAR.P 2010 - 2019 人口 無視される
    バルパ 2000 - 2019 人口 評価済み

    VAR.SとVARAの比較、VAR.PとVARPAの比較

    VARAとVARPAは、参照における論理値とテキスト値の扱い方だけが他の分散関数と異なります。 次の表は、数値と論理値のテキスト表現がどのように評価されるかの概要を示しています。

    引数の種類 var、var.s、varp、var.p VARA & VARPA
    配列および参照内の論理値 無視される 評価済み

    (真=1、偽=0)

    配列とリファレンス内の数値のテキスト表現 無視される ゼロとして評価される
    引数に直接入力された数値の論理値およびテキスト表現 評価済み

    (真=1、偽=0)

    空っぽのセル 無視される

    Excelで標本分散を計算する方法

    A サンプル は、母集団全体から抽出されたデータの集合です。 そして、標本から計算された分散は、次のように呼ばれます。 標本分散 .

    例えば、人の身長の違いを知りたい場合、地球上のすべての人の身長を測ることは技術的に不可能です。 そこで、1000人という人口のサンプルをとり、そのサンプルをもとに全人口の身長を推定するのです。

    標本分散はこの式で計算されます。

    どこで

    • x̄はサンプル値の平均(単純平均)である。
    • nはサンプルサイズ、つまりサンプルに含まれる値の数です。

    Excelには標本分散を求める関数として、VAR、VAR.S、VARAの3つがあります。

    ExcelのVAR関数

    標本に基づいて分散を推定するExcel最古の関数です。 VAR関数は、Excel2000から2019のすべてのバージョンで利用できます。

    VAR(番号1, [番号2], ...)

    注)Excel 2010では、VAR関数が精度を向上させたVAR.Sに置き換えられました。 後方互換性のためにVARも使用できますが、現在のExcelのバージョンではVAR.Sを使用することが推奨されます。

    ExcelのVAR.S関数

    ExcelのVAR関数の現代版です。 VAR.S関数は、Excel2010以降で標本分散を求めるために使用します。

    VAR.S(番号1, [番号2], ...)

    エクセルでのVARA関数

    ExcelのVARA関数は、この表に示すように、数値、テキスト、論理値のセットに基づいて、サンプル分散を返します。

    VARA(値1, [値2], ...)

    Excelでの分散計算式の例

    数値データを扱う場合、Excelで標本分散を計算するために上記の関数のいずれかを使用することができます。

    例として、6つの項目(B2:B7)からなるサンプルの分散を求めます。 これには、以下の公式のいずれかを使用できます。

    =VAR(B2:B7)です。

    =VAR.S(B2:B7)

    =VARA(B2:B7)です。

    スクリーンショットに示すように、すべての計算式が同じ結果を返します(小数点以下2桁に丸められます)。

    その結果を確認するために、手動でvar計算をしてみましょう。

    1. AVERAGE関数を使って平均値を求めます。

      =平均値(b2:b7)

      平均は任意の空きセル、例えばB8に行く。

    2. サンプルの各数値から平均値を引きます。

      =B2-$B$8

      差分はC列へ、C2から始まる。

    3. 各差を二乗し、その結果をD列のD2から順に並べます。

      =C2^2

    4. 二乗した差を合計し、その結果をサンプルのアイテム数から1を引いた数で割る。

      =sum(d2:d7)/(6-1)

    ご覧のように、手動で計算したvarの結果は、Excelの組み込み関数が返す数値と全く同じです。

    データセットに ブーリアン または テキスト の値がある場合、VARA関数は異なる結果を返します。 これは、VARとVAR.Sがリファレンスの数値以外を無視するのに対し、VARAはテキストの値を0、TRUEを1、FALSEを0として評価するからです。 したがって、テキストと論理を処理するか無視するかによって、計算の分散関数は慎重に選択して下さい。

    Excelで母集団の分散を計算する方法

    人口 は、与えられたグループのすべてのメンバー、すなわち、研究分野のすべての観測値である。 母集団分散 は、母集団全体のデータ点がどのように広がっているかを記述しています。

    母集団の分散は、この式で求めることができる。

    どこで

    • x̄は母集団の平均値である。
    • nは母集団の大きさ、すなわち母集団に含まれる値の総数である。

    Excelで母集団の分散を計算する関数は3つあります:VARP, VAR.P, VARPA。

    ExcelのVARP関数

    Excel VARP関数は、数値の集合全体に基づいて母集団の分散を返します。 Excel2000から2019のすべてのバージョンで使用できます。

    VARP(番号1, [番号2], ...)

    注)Excel2010では、VARPはVAR.Pに置き換えられましたが、後方互換性のために残されています。 Excelの将来のバージョンでVARP関数が使用できる保証はないため、現在のバージョンではVAR.Pを使用することが推奨されます。

    ExcelのVAR.P関数

    Excel 2010以降で利用可能なVARP関数の改良版です。

    VAR.P(number1, [number2], ...)

    ExcelのVARPA関数

    VARPA関数は、数値、テキスト、論理値のセット全体に基づいて母集団の分散を計算します。 Excel2000から2019のすべてのバージョンで使用できます。

    VARA(値1, [値2], ...)

    Excelでの母集団分散の計算式

    varの計算例では、5つの試験の点数が大きなグループからの選択であると仮定して分散を求めました。 グループ内のすべての学生のデータを収集すれば、そのデータは母集団全体を表すことになり、上記の関数を使用して母集団の分散を計算することになります。

    例えば、10人の学生(B2:B11)の試験の点数があったとします。 この点数は母集団全体を構成しているので、これらの式で分散を行います。

    =VARP(B2:B11)です。

    =VAR.P(B2:B11)

    =VARPA(B2:B11)です。

    そして、すべての計算式が同一の結果を返します。

    Excelが正しく分散を行ったかどうかを確認するために、以下のスクリーンショットに示す手動var計算式で確認することができます。

    一部の学生が試験を受けず、スコア番号の代わりに N/A を持つ場合、VARPA 関数は異なる結果を返します。 これは、VARP と VAR.P が参照中のテキストと論理値を無視するのに対し、VARPA はテキスト値をゼロとして評価するからです。 詳細は、VAR.P vs. VARPA を参照してください。

    Excelの分散式 - 使用上の注意

    Excelで分散分析を正しく行うには、以下の簡単なルールに従ってください。

    • 引数を値、配列、またはセル参照で指定する。
    • Excel 2007以降では、標本または母集団に対応する最大255個の引数を与えることができます。
    • のみを評価すること。 計数 を参照し、空のセル、テキスト、論理値を無視して、VAR または VAR.S 関数で標本分散を計算し、VARP または VAR.P 関数で母集団分散を求めます。
    • 評価するために 論理的 テキスト の値を参照する場合は、VARA または VARPA 機能を使用してください。
    • 少なくとも提供する 二値 を標本分散式に変換し、少なくとも 一数値 をExcelの母集団分散式に代入しないと、#DIV/0!エラーが発生します。
    • 数値として解釈できないテキストを含む引数は、#VALUE!エラーの原因となります。

    Excelで分散と標準偏差を比較する

    分散は科学において有用な概念であることは間違いありませんが、実用的な情報はほとんど得られません。 例えば、地元の動物園のトラの個体数の年齢を求め、分散を計算すると16となります。 問題は、この数字を実際にどう使うか、ということです。

    分散を利用して標準偏差を算出することができますが、これはデータセットのばらつきの大きさを表す、より優れた尺度です。

    標準偏差 は分散の平方根として計算されます。 そこで、16の平方根をとって、標準偏差を4とします。

    例えば、平均が8で標準偏差が4の場合、動物園にいるトラの多くは4歳(8-4)〜12歳(8+4)であることがわかります。

    Microsoft Excelには、標本や母集団の標準偏差を計算するための特別な関数があります。 すべての関数の詳しい説明は、このチュートリアル:How to calculate standard deviation in Excelでご覧いただけます。

    このチュートリアルで説明した数式をより詳しく見るには、この記事の最後にあるサンプルワークブックをダウンロードしてください。 読んでくださってありがとうございました!また来週のブログでお会いしましょう

    練習用ワークブック

    Excelで分散を計算する - サンプル (.xlsx ファイル)

    Michael Brown は、ソフトウェア ツールを使用して複雑なプロセスを簡素化することに情熱を注ぐ熱心なテクノロジー愛好家です。テクノロジー業界で 10 年以上の経験があり、Microsoft Excel と Outlook、さらに Google Sheets と Docs のスキルを磨いてきました。 Michael のブログは、彼の知識と専門知識を他の人と共有することに特化しており、生産性と効率を向上させるためのわかりやすいヒントとチュートリアルを提供しています。経験豊富なプロフェッショナルであろうと初心者であろうと、Michael のブログでは、これらの重要なソフトウェア ツールを最大限に活用するための貴重な洞察と実践的なアドバイスを提供しています。