Оглавление
При анализе числовых данных вы часто можете искать способ получить "типичное" значение. Для этого вы можете использовать так называемый показатели центральной тенденции которые представляют собой одно значение, определяющее центральную позицию в наборе данных или, более технически, середину или центр в статистическом распределении. Иногда их также классифицируют как сводные статистические данные.
Тремя основными показателями центральной тенденции являются Средний , Медиана и Режим Все они являются действительными показателями центрального местоположения, но каждый из них дает различные указания на типичное значение, и при различных обстоятельствах одни показатели целесообразнее использовать, чем другие.
Как вычислить среднее значение в Excel
Среднее арифметическое , также называемый в среднем Среднее значение рассчитывается путем сложения группы чисел и деления суммы на количество этих чисел.
Например, чтобы вычислить среднее значение чисел {1, 2, 2, 3, 4, 6}, вы складываете их, а затем делите сумму на 6, что дает 3: (1+2+2+3+4+6)/6=3.
В Microsoft Excel среднее значение можно рассчитать с помощью одной из следующих функций:
- AVERAGE - возвращает среднее значение чисел.
- AVERAGEA - возвращает среднее значение ячеек с любыми данными (числа, булевы и текстовые значения).
- AVERAGEIF - находит среднее значение чисел по одному критерию.
- AVERAGEIFS - находит среднее значение чисел на основе нескольких критериев.
Для получения подробного руководства, пожалуйста, перейдите по указанным выше ссылкам. Чтобы получить концептуальное представление о работе этих функций, рассмотрим следующий пример.
В отчете о продажах (см. скриншот ниже), предположим, вы хотите получить среднее значение значений в ячейках C2:C8. Для этого используйте эту простую формулу:
= СРЕДНЕЕ(C2:C8)
Чтобы получить среднее значение только продаж "Бананы", используйте формулу AVERAGEIF:
=AVERAGEIF(A2:A8, "Банан", C2:C8)
Чтобы рассчитать среднее значение на основе 2 условий, скажем, среднее значение продаж "Банана" со статусом "Доставлен", используйте AVERAGEIFS:
=AVERAGEIFS(C2:C8,A2:A8, "Банан", B2:B8, "Доставлен")
Вы также можете ввести условия в отдельные ячейки и ссылаться на эти ячейки в формулах, например, так:
Как найти медиану в Excel
Медиана это среднее значение в группе чисел, которые расположены в порядке возрастания или убывания, т.е. половина чисел больше медианы и половина чисел меньше медианы. Например, медиана набора данных {1, 2, 2, 3, 4, 6, 9} равна 3.
Это хорошо работает, когда в группе нечетное количество значений. Но что если у вас есть даже В этом случае медиана - это среднее арифметическое (среднее) двух средних значений. Например, медиана {1, 2, 2, 3, 4, 6} равна 2,5. Чтобы вычислить ее, возьмите 3-е и 4-е значения в наборе данных и усредните их, чтобы получить медиану 2,5.
В Microsoft Excel медиана рассчитывается с помощью функции MEDIAN. Например, чтобы получить медиану всех сумм в нашем отчете о продажах, используйте эту формулу:
=MEDIAN(C2:C8)
Чтобы сделать пример более наглядным, я отсортировал числа в столбце C в порядке возрастания (хотя на самом деле это не требуется для работы формулы Excel Median):
В отличие от среднего, Microsoft Excel не предоставляет никакой специальной функции для вычисления медианы с одним или несколькими условиями. Однако вы можете "эмулировать" функциональность MEDIANIF и MEDIANIFS, используя комбинацию двух или более функций, как показано в этих примерах:
- Формула MEDIAN IF (с одним условием)
- Формула MEDIAN IFS (с несколькими критериями)
Как рассчитать режим в Excel
Режим это наиболее часто встречающееся значение в наборе данных. В то время как среднее и медиана требуют некоторых вычислений, значение моды можно найти, просто подсчитав, сколько раз встречается каждое значение.
Например, мода набора значений {1, 2, 2, 3, 4, 6} равна 2. В Microsoft Excel вычислить моду можно с помощью одноименной функции - функции MODE. Для нашего набора данных формула выглядит следующим образом:
=MODE(C2:C8)
В ситуациях, когда в вашем наборе данных есть два или более режимов, функция Excel MODE вернет значение минимальный режим .
Среднее значение и медиана: что лучше?
Как правило, не существует "лучшей" меры центральной тенденции. Выбор меры зависит от типа данных, с которыми вы работаете, а также от вашего понимания "типичного значения", которое вы пытаетесь оценить.
Для симметричное распределение (в которых значения встречаются с регулярной частотой), среднее, медиана и мода одинаковы. Для перекошенный распространение (где есть небольшое количество чрезвычайно высоких или низких значений), три показателя центральной тенденции могут быть разными.
Поскольку на среднее значение сильно влияют перекошенные данные и выбросы (нетипичные значения, которые значительно отличаются от остальных данных), медиана является предпочтительной мерой центральной тенденции для асимметричное распределение .
Например, принято считать, что медиана лучше, чем среднее значение для расчета типичная зарплата Почему? Лучше всего это можно понять на примере. Пожалуйста, посмотрите на несколько примеров зарплат для распространенных профессий:
- Электрик - $20/час
- Медсестра - $26/час
- Офицер полиции - $47/час
- Менеджер по продажам - $54/час
- Инженер-технолог - $63/час
Теперь вычислим среднее значение (mean): сложим приведенные выше цифры и разделим на 5: (20+26+47+54+63)/5=42. Итак, средняя зарплата составляет $42/час. Медианная зарплата - $47/час, и зарабатывает ее именно полицейский (1/2 зарплаты ниже, а 1/2 - выше). В данном конкретном случае среднее и медиана дают схожие цифры.
Но давайте посмотрим, что произойдет, если мы расширим список зарплат, включив в него знаменитость, которая зарабатывает, скажем, около $30 млн. в год, что составляет примерно $14 500 в час. Теперь средняя зарплата становится $2 451,67 в час - зарплата, которую не зарабатывает никто! В отличие от этого, медиана не претерпевает значительных изменений из-за одного выброса, она составляет $50,50 в час.
Согласитесь, медиана дает лучшее представление о том, сколько обычно зарабатывают люди, поскольку на нее не так сильно влияют аномальные зарплаты.
Вот как вычисляются среднее, медиана и мода в Excel. Благодарю вас за прочтение и надеюсь увидеть вас в нашем блоге на следующей неделе!