Оглавление
В учебнике объясняется суть стандартного отклонения и стандартной ошибки среднего, а также то, какую формулу лучше использовать для расчета стандартного отклонения в Excel.
В описательной статистике среднее арифметическое (также называемое средним) и стандартное отклонение - два тесно связанных понятия. Но если первое хорошо понятно большинству, то второе понимают немногие. Цель данного учебника - пролить свет на то, что такое стандартное отклонение и как его рассчитать в Excel.
Что такое стандартное отклонение?
Сайт стандартное отклонение это мера, показывающая, насколько сильно значения набора данных отклоняются (разбросаны) от среднего значения. Говоря иначе, стандартное отклонение показывает, близки ли ваши данные к среднему значению или сильно колеблются.
Чем ближе стандартное отклонение к нулю, тем меньше изменчивость данных и тем надежнее среднее значение. Стандартное отклонение, равное 0, означает, что каждое значение в наборе данных в точности равно среднему. Чем выше стандартное отклонение, тем больше разброс в данных.данных и тем меньше точность среднего значения.
Чтобы лучше понять, как это работает, посмотрите, пожалуйста, на следующие данные:
Для биологии стандартное отклонение равно 5 (округленное до целого числа), что говорит нам о том, что большинство оценок не более чем на 5 баллов отклоняются от среднего значения. Хорошо ли это? Да, это говорит о том, что оценки студентов по биологии довольно стабильны.
Для математики стандартное отклонение равно 23. Это показывает, что в оценках присутствует огромная дисперсия (разброс), что означает, что некоторые студенты показали гораздо лучшие результаты и/или некоторые - гораздо худшие, чем в среднем.
На практике стандартное отклонение часто используется бизнес-аналитиками в качестве меры инвестиционного риска - чем выше стандартное отклонение, тем выше волатильность доходов.
Стандартное отклонение выборки по сравнению со стандартным отклонением популяции
В связи со стандартным отклонением вы часто можете услышать термины "выборка" и "популяция", которые относятся к полноте данных, с которыми вы работаете. Основное различие заключается в следующем:
- Население включает все элементы из набора данных.
- Образец это подмножество данных, которое включает один или несколько элементов из совокупности.
Исследователи и аналитики оперируют стандартным отклонением выборки и популяции в разных ситуациях. Например, при подведении итогов экзаменационных оценок класса учеников учитель будет использовать стандартное отклонение популяции. Статистики, рассчитывающие средний национальный балл SAT, будут использовать стандартное отклонение выборки, потому что им представлены данные только выборки, а не популяции.из всего населения.
Понимание формулы стандартного отклонения
Причина, по которой характер данных имеет значение, заключается в том, что стандартное отклонение популяции и стандартное отклонение выборки рассчитываются по немного разным формулам:
Стандартное отклонение выборки | Стандартное отклонение популяции |
Где:
- x i это отдельные значения в наборе данных
- x это среднее значение всех x значения
- n общее количество x значения в наборе данных
У вас возникли трудности с пониманием формул? Разбивка формул на простые шаги может помочь. Но сначала давайте поработаем с примерами данных:
1. вычислите среднее значение (среднее)
Сначала вы находите среднее значение всех значений в наборе данных ( x При вычислении вручную вы складываете числа, а затем делите сумму на количество этих чисел, например, так:
(1+2+4+5+6+8+9)/7=5
Чтобы найти среднее значение в Excel, используйте функцию AVERAGE, например, =AVERAGE(A2:G2)
2. Для каждого числа вычтите среднее значение и возведите результат в квадрат
Это часть формулы стандартного отклонения, которая гласит: ( x i - x )2
Чтобы представить себе, что происходит на самом деле, посмотрите на следующие изображения.
В данном примере среднее значение равно 5, поэтому мы вычисляем разницу между каждой точкой данных и 5.
Затем возведите разность в квадрат, превратив ее в положительное число:
3. сложить квадраты разностей
Чтобы сказать "подвести итог" в математике, вы используете сигму Σ. Итак, что мы делаем сейчас, это складываем квадраты разностей, чтобы завершить эту часть формулы: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. разделите общую квадратичную разницу на количество значений
До сих пор формулы стандартного отклонения выборки и стандартного отклонения популяции были идентичны. Сейчас они отличаются.
Для стандартное отклонение выборки , вы получаете дисперсия выборки путем деления общей квадратичной разницы на объем выборки минус 1:
52 / (7-1) = 8.67
Для стандартное отклонение популяции , вы находите среднее квадратичное отклонение путем деления общей квадратичной разницы на их количество:
52 / 7 = 7.43
Почему такая разница в формулах? Потому что в формуле выборочного стандартного отклонения необходимо исправить смещение при оценке выборочного среднего вместо истинного среднего значения популяции. И вы делаете это, используя n - 1 вместо n , что называется поправкой Бесселя.
5. Возьмите квадратный корень
Наконец, возьмите квадратный корень из вышеуказанных чисел, и вы получите стандартное отклонение (в приведенных ниже уравнениях округленное до 2 знаков после запятой):
Стандартное отклонение выборки | Стандартное отклонение популяции |
√ 8.67 = 2.94 | √ 7.43 = 2.73 |
В Microsoft Excel стандартное отклонение вычисляется таким же образом, но все вышеперечисленные вычисления выполняются за сценой. Главное для вас - выбрать подходящую функцию стандартного отклонения, о чем вам подскажет следующий раздел.
Как рассчитать стандартное отклонение в Excel
В целом, существует шесть различных функций для нахождения стандартного отклонения в Excel. Какая из них будет использоваться, зависит в первую очередь от характера данных, с которыми вы работаете - будь то вся совокупность или выборка.
Функции для расчета стандартного отклонения выборки в Excel
Для расчета стандартного отклонения по выборке используйте одну из следующих формул (все они основаны на методе "n-1", описанном выше).
Функция Excel STDEV
STDEV(number1,[number2],...)
это самая старая функция Excel для оценки стандартного отклонения на основе выборки, которая доступна во всех версиях Excel с 2003 по 2019 год.
В Excel 2007 и более поздних версиях функция STDEV может принимать до 255 аргументов, которые могут быть представлены числами, массивами, именованными диапазонами или ссылками на ячейки, содержащие числа. В Excel 2003 функция может принимать только до 30 аргументов.
В массивах и ссылках учитываются только числа; пустые ячейки, логические значения TRUE и FALSE, текст и значения ошибок игнорируются.
Примечание. Excel STDEV - это устаревшая функция, которая сохраняется в новых версиях Excel только для обратной совместимости. Однако Microsoft не дает никаких обещаний относительно будущих версий. Поэтому в Excel 2010 и более поздних версиях рекомендуется использовать STDEV.S вместо STDEV.
Функция Excel STDEV.S
STDEV.S(number1,[number2],...)
это улучшенная версия STDEV, представленная в Excel 2010.
Как и STDEV, функция STDEV.S вычисляет выборочное стандартное отклонение набора значений на основе классической формулы выборочного стандартного отклонения, рассмотренной в предыдущем разделе.
Функция Excel STDEVA
STDEVA(value1, [value2], ...)
это еще одна функция для вычисления стандартного отклонения выборки в Excel. Она отличается от двух предыдущих только тем, что обрабатывает логические и текстовые значения:
- Все логические значения учитываются, независимо от того, содержатся ли они в массивах или ссылках, или введены непосредственно в список аргументов (TRUE оценивается как 1, FALSE - как 0).
- Текстовые значения В массивах или ссылочных аргументах считается 0, включая пустые строки (""), текстовые представления чисел и любой другой текст. Текстовые представления чисел, заданные непосредственно в списке аргументов, считаются как числа, которые они представляют (вот пример формулы).
- Пустые ячейки игнорируются.
Примечание. Чтобы формула стандартного отклонения образца работала корректно, предоставленные аргументы должны содержать как минимум два числовых значения, иначе возвращается ошибка #DIV/0!
Функции для расчета стандартного отклонения популяции в Excel
Если вы имеете дело со всей совокупностью, используйте одну из следующих функций для выполнения стандартного отклонения в Excel. Эти функции основаны на методе "n".
Функция Excel STDEVP
STDEVP(number1,[number2],...)
это старая функция Excel для нахождения стандартного отклонения популяции.
В новых версиях Excel 2010, 2013, 2016 и 2019 она заменена улучшенной функцией STDEV.P, но все еще сохраняется для обратной совместимости.
Функция Excel STDEV.P
STDEV.P(number1,[number2],...)
это современная версия функции STDEVP, обеспечивающая повышенную точность. Она доступна в Excel 2010 и более поздних версиях.
Функции STDEVP и STDEV.P, как и их аналоги стандартного отклонения выборки, в массивах или ссылочных аргументах считают только числа. В списке аргументов они также считают логические значения и текстовые представления чисел.
Функция Excel STDEVPA
STDEVPA(value1, [value2], ...)
вычисляет стандартное отклонение совокупности, включая текстовые и логические значения. В отношении нечисловых значений STDEVPA работает точно так же, как и функция STDEVA.
Примечание. Какую бы формулу стандартного отклонения Excel вы ни использовали, она выдаст ошибку, если один или несколько аргументов содержат значение ошибки, возвращенное другой функцией, или текст, который нельзя интерпретировать как число.
Какую функцию стандартного отклонения использовать в Excel?
Разнообразие функций стандартного отклонения в Excel может привести в замешательство, особенно неопытных пользователей. Чтобы выбрать правильную формулу стандартного отклонения для конкретной задачи, просто ответьте на следующие 3 вопроса:
- Рассчитываете ли вы стандартное отклонение выборки или совокупности?
- Какую версию Excel вы используете?
- Включает ли ваш набор данных только числа или логические значения, а также текст?
Чтобы рассчитать стандартное отклонение на основе числового значения образец Используйте функцию STDEV.S в Excel 2010 и более поздних версиях; STDEV в Excel 2007 и более ранних версиях.
Чтобы найти стандартное отклонение население Используйте функцию STDEV.P в Excel 2010 и более поздних версиях; STDEVP в Excel 2007 и более ранних версиях.
Если вы хотите логический или текст Хотя я не могу придумать сценарий, в котором обе функции могут быть полезны сами по себе, они могут пригодиться в больших формулах, где один или несколько аргументов возвращаются другими функциями как логические значения или текстовые представления чисел.
Чтобы помочь вам решить, какая из функций стандартного отклонения Excel лучше всего подходит для ваших нужд, просмотрите следующую таблицу, в которой обобщена уже изученная вами информация.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Версия Excel | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Образец | ✓ | ✓ | ✓ | |||
Население | ✓ | ✓ | ✓ | |||
Логические значения в массивах или ссылках | Игнорируется | Оценено (TRUE=1, FALSE=0) | ||||
Текст в массивах или ссылках | Игнорируется | Оценивается как ноль | ||||
Логические значения и "текст-число" в списке аргументов | Оценено (TRUE=1, FALSE=0) | |||||
Пустые клетки | Игнорируется |
Примеры формулы стандартного отклонения в Excel
После того как вы выбрали функцию, соответствующую вашему типу данных, не должно возникнуть никаких трудностей с написанием формулы - синтаксис настолько прост и прозрачен, что не оставляет места для ошибок :) Следующие примеры демонстрируют пару формул стандартного отклонения Excel в действии.
Вычисление стандартного отклонения выборки и популяции
В зависимости от характера ваших данных используйте одну из следующих формул:
- Для расчета стандартного отклонения на основе всего население т.е. полный список значений (B2:B50 в данном примере), используйте функцию STDEV.P:
=STDEV.P(B2:B50)
- Чтобы найти стандартное отклонение на основе образец которые составляют часть или подмножество популяции (B2:B10 в данном примере), используйте функцию STDEV.S:
=STDEV.S(B2:B10)
Как видно на скриншоте ниже, формулы возвращают немного разные числа (чем меньше выборка, тем больше разница):
В Excel 2007 и ниже вместо этого используются функции STDEVP и STDEV:
- Чтобы получить стандартное отклонение популяции:
=STDEVP(B2:B50)
- Чтобы рассчитать стандартное отклонение выборки:
=STDEV(B2:B10)
Вычисление стандартного отклонения для текстовых представлений чисел
При обсуждении различных функций для расчета стандартного отклонения в Excel мы иногда упоминали "текстовые представления чисел", и вам может быть интересно узнать, что это на самом деле означает.
В данном контексте "текстовые представления чисел" - это просто числа, оформленные в виде текста. Как такие числа могут появиться в ваших рабочих листах? Чаще всего они экспортируются из внешних источников. Или возвращаются так называемыми текстовыми функциями, которые предназначены для работы с текстовыми строками, например, TEXT, MID, RIGHT, LEFT и т.д. Некоторые из этих функций могут работать и с числами, но их выходные данные всегда являются текстом, дажеесли она очень похожа на число.
Предположим, у вас есть столбец кодов товаров типа "Jeans-105", где цифры после дефиса обозначают количество. Ваша цель - извлечь количество каждого товара, а затем найти стандартное отклонение извлеченных чисел.
Перетаскивание количества в другой столбец не является проблемой:
=RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))
Проблема в том, что использование формулы стандартного отклонения Excel для извлеченных чисел дает либо #DIV/0!, либо 0, как показано на скриншоте ниже:
Почему такие странные результаты? Как уже упоминалось выше, выход функции RIGHT всегда является текстовой строкой. Но ни STDEV.S, ни STDEVA не могут обрабатывать числа, отформатированные как текст в ссылках (первая просто игнорирует их, а вторая считает как нули). Чтобы получить стандартное отклонение таких "текстовых чисел", необходимо предоставить их непосредственно в список аргументов, что можно сделать, внедрив всефункции RIGHT в формулу STDEV.S или STDEVA:
=STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
Формулы немного громоздки, но это может быть рабочим решением для небольшой выборки. Для большой выборки, не говоря уже о всей популяции, это определенно не вариант. В этом случае более элегантным решением будет преобразование функцией VALUE "текстовых чисел" в числа, которые может понять любая формула стандартного отклонения (обратите внимание на выровненные вправо числа на скриншоте).ниже, в отличие от выровненных по левому краю текстовых строк на скриншоте выше):
Как рассчитать стандартную ошибку среднего в Excel
В статистике существует еще одна мера для оценки изменчивости данных - это стандартная ошибка среднего значения Стандартное отклонение и стандартная ошибка среднего - два тесно связанных понятия, но не одно и то же.
В то время как стандартное отклонение измеряет изменчивость набора данных от среднего значения, стандартная ошибка среднего (SEM) оценивает, насколько далеко среднее значение выборки может быть от истинного среднего значения популяции. Говоря иначе - если вы взяли несколько выборок из одной и той же популяции, стандартная ошибка среднего покажет дисперсию между этими выборочными значениями. Поскольку обычно мы вычисляем только односреднее значение для набора данных, а не множественное среднее, стандартная ошибка среднего оценивается, а не измеряется.
В математике стандартная ошибка среднего рассчитывается по этой формуле:
Где SD стандартное отклонение, и n размер выборки (количество значений в выборке).
В рабочих листах Excel вы можете использовать функцию COUNT для получения количества значений в выборке, SQRT для извлечения квадратного корня из этого числа и STDEV.S для расчета стандартного отклонения выборки.
Сложив все это вместе, вы получите формулу стандартной ошибки среднего значения в Excel:
STDEV.S( ассортимент )/SQRT(COUNT( ассортимент ))Если предположить, что данные выборки находятся в формате B2:B10, то наша формула SEM будет выглядеть следующим образом:
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
И результат может быть примерно таким:
Как добавить столбики стандартного отклонения в Excel
Чтобы визуально отобразить границы стандартного отклонения, вы можете добавить столбики стандартного отклонения на диаграмму Excel. Вот как это сделать:
- Создайте график обычным способом ( Вставка вкладка> Графики группа).
- Нажмите в любом месте графика, чтобы выбрать его, затем нажмите кнопку Элементы диаграммы кнопка.
- Нажмите на стрелку рядом с Бары ошибок , и выбрать Стандартное отклонение .
Это позволит вставить одинаковые столбики стандартного отклонения для всех точек данных.
Вот как сделать стандартное отклонение в Excel. Надеюсь, эта информация будет вам полезна. В любом случае, я благодарю вас за чтение и надеюсь увидеть вас в нашем блоге на следующей неделе.