目次
数値データを分析する際、「典型的な」値を得る方法を探すことがよくあります。 このような目的のために、いわゆる 中心傾向の尺度 データセット内の中心位置を示す単一の値、より専門的には統計分布の中央または中心を表す。 要約統計と分類されることもある。
中心傾向の主な指標は以下の3つです。 平均値 , 中央値 と モード どれも中心位置の有効な指標ですが、それぞれ典型的な値の目安が異なり、状況によって使い分けが必要です。
エクセルで平均を計算する方法
算術平均 とも呼ばれる。 平均 平均は、いくつかの数値を足し合わせて、その合計をそれらの数値の数で割ることによって算出されます。
例えば、数字{1, 2, 2, 3, 4, 6}の平均を計算するには、それらを足して、その合計を6で割ると、(1+2+2+3+4+6)/6=3 となります。
Microsoft Excel では、以下の関数のいずれかを使用して平均を計算することができます。
- AVERAGE- 数値の平均を返します。
- AVERAGEA - 任意のデータ(数値、ブール値、テキスト値)を持つセルの平均を返します。
- AVERAGEIF - 1つの基準に基づいて数値の平均を求めます。
- AVERAGEIFS - 複数の基準に基づいて数値の平均を求めます。
詳細なチュートリアルについては、上記のリンクを参照してください。 これらの機能がどのように動作するかの概念を理解するために、次の例を考えてみましょう。
売上報告書(以下のスクリーンショットを参照)で、セルC2:C8の値の平均を取得したいとします。 そのためには、次の簡単な式を使用します。
=平均値(c2:c8)
バナナ」の売上のみの平均を求めるには、AVERAGEIFの計算式を使います。
=AVERAGEIF(A2:A8, "バナナ", C2:C8)
2つの条件から平均値を計算する場合、例えば、ステータスが「納品済み」の「バナナ」の売上の平均値を計算する場合は、AVERAGEIFSを使用します。
=AVERAGEIFS(C2:C8,A2:A8, "バナナ", B2:B8, "納品済")
このように、条件を別のセルに入力し、数式でそのセルを参照することも可能です。
Excelで中央値を求める方法
中央値 は、昇順または降順に並べられた数値群の中央値である。つまり、半分の数値が中央値より大きく、半分の数値が中央値より小さい。 例えば、データセット{1, 2, 3, 4, 6, 9}の中央値は3である。
この方法は、グループ内の値が奇数である場合にはうまくいきますが、グループ内の値が偶数である場合にはどうなりますか? も この場合、中央値とは、真ん中の2つの値の算術平均(平均)です。 例えば、{1, 2, 2, 3, 4, 6}の中央値は2.5ですが、これを計算するには、データセットの3番目と4番目の値を取って平均すれば、中央値は2.5と計算されます。
Microsoft Excel では、中央値は MEDIAN 関数で計算します。 たとえば、売上報告書のすべての金額の中央値を求めるには、次の数式を使用します。
=MEDIAN(C2:C8)
この例をより分かりやすくするために、C列の数字を昇順にソートしています(ExcelのMedianの計算式が機能するためには、実際にはこのソートは必要ではありませんが)。
平均値とは対照的に、Microsoft Excelには、1つ以上の条件を指定して中央値を計算する特別な関数はありません。 しかし、以下の例に示すように、2つ以上の関数を組み合わせて使用することにより、MEDIANIFとMEDIANIFSの機能を「エミュレート」することが可能です。
- MEDIAN IF式(1つの条件付き)
- MEDIAN IFS式(複数条件あり)
エクセルでモードを計算する方法
モード 平均値や中央値は計算が必要ですが、最頻値は各値の出現回数を数えるだけで求めることができます。
例えば、値{1, 2, 2, 3, 4, 6}の集合の最頻値は2です。 Microsoft Excelでは、同じ名前の関数、MODE関数を使って最頻値を計算できます。 サンプルデータセットでは、次のような式になります。
=MODE(C2:C8)
データセットに2つ以上のモードがある場合、Excel の MODE 関数は さいしょうゆうこうモード .
平均値と中央値:どちらが良いのか?
一般に、中心傾向には「最適な」指標はなく、どの指標を使うかは、扱うデータの種類と、推定しようとする「典型的な値」についての理解度によって決まることがほとんどです。
については、以下の通りです。 そうたいぶんぷ (の場合、平均値、中央値、最頻値は同じになります。 斜め 分布 (極端に高い値や低い値が少数存在する場合)、3つの中心傾向の尺度が異なる場合があります。
平均値は、歪んだデータや外れ値(他のデータと著しく異なる非標準的な値)の影響を大きく受けるため。 ちゅうおうち の中心傾向の指標として望ましいものです。 非対称分布 .
例えば、一般的に、平均値よりも中央値の方が、より良い計算ができると言われています。 標準報酬 一般的な仕事の給料の例をいくつか挙げてみましょう。
- 電気技師 - 時給 $20
- 看護師 - 時給 $26
- 警察官-時給47ドル
- セールスマネージャー - 時給 $54
- 製造エンジニア - 時給 $63
では、平均値を計算してみましょう。上の数字を足して5で割ると、(20+26+47+54+63)/5=42となります。 つまり、平均賃金は時給42ドル。中央値は時給47ドルで、それを稼いでいるのは警察官です(半数は低賃金、半数は高賃金)。 この場合、平均値と中央値は似たような数字になりますね。
しかし、例えば年収3000万円くらいの有名人を入れて、賃金のリストを広げてみるとどうなるか。 平均賃金は時給2451.67ドルになり、誰も稼いでいない賃金になる!対照的に、中央値はこの異常値によって大きく変化せず、時給50.50ドルである。
中央値は、異常な給与の影響をあまり受けないため、一般的な所得をよりよく知ることができます。
以上、エクセルで平均値、中央値、最頻値を計算する方法でした。 読んでくださってありがとうございました!来週のブログでお会いできるのを楽しみにしています。