Зміст
При аналізі числових даних часто виникає потреба в тому, щоб отримати "типове" значення. Для цього можна використовувати так звані показники центральної тенденції які представляють єдине значення, що визначає центральну позицію в наборі даних або, більш технічно, середину або центр статистичного розподілу. Іноді вони також класифікуються як зведені статистичні дані.
Трьома основними показниками центральної тенденції є Середнє значення , Медіана і Режим Всі вони є дійсними мірами центрального розташування, але кожна з них по-різному вказує на типове значення, і за різних обставин деякі міри є більш доречними для використання, ніж інші.
Як розрахувати середнє арифметичне в Excel
Середнє арифметичне також відомий як середній Середнє значення обчислюється шляхом додавання групи чисел, а потім ділення суми на кількість цих чисел.
Наприклад, щоб обчислити середнє арифметичне чисел {1, 2, 2, 3, 4, 6}, потрібно їх скласти, а потім суму поділити на 6, що дає 3: (1+2+2+3+4+6)/6=3.
У Microsoft Excel середнє значення може бути розраховане за допомогою однієї з наступних функцій:
- AVERAGE - повертає середнє арифметичне чисел.
- AVERAGEA - повертає середнє значення комірок з будь-якими даними (числами, логічними і текстовими значеннями).
- AVERAGEIF - знаходить середнє значення чисел на основі одного критерію.
- AVERAGEIFS - знаходить середнє значення чисел на основі декількох критеріїв.
Для отримання більш детальної інформації, будь ласка, перейдіть за вищевказаними посиланнями. Для того, щоб отримати концептуальне уявлення про те, як працюють ці функції, розглянемо наступний приклад.
У звіті про продажі (див. скріншот нижче), припустимо, потрібно отримати середнє арифметичне значень в комірках С2:С8. Для цього скористайтеся такою простою формулою:
=СЕРЕДНЄ(C2:C8)
Щоб отримати середнє значення тільки продажів "Бананів", використовуйте формулу СРЗНАЧ = СРЗНАЧ:
=AVERAGEIF(A2:A8, "Banana", C2:C8)
Щоб розрахувати середнє значення на основі 2 умов, скажімо, середнє значення продажів "Банана" зі статусом "Доставлено", використовуйте СРЗНАЧ = СРЗНАЧ:
=AVERAGEIFS(C2:C8,A2:A8, "Банан", B2:B8, "Доставлено")
Ви також можете ввести свої умови в окремі клітинки і посилатися на ці клітинки у формулах, як показано нижче:
Як знайти медіану в Excel
Медіана це середнє значення в групі чисел, які розташовані в порядку зростання або спадання, тобто половина чисел більше медіани, а половина чисел менше медіани. Наприклад, медіана набору даних {1, 2, 2, 3, 4, 6, 9} дорівнює 3.
Це добре працює, коли в групі непарна кількість значень. Але що, якщо у вас є навіть кількість значень? У цьому випадку медіана - це середнє арифметичне (середнє арифметичне) двох середніх значень. Наприклад, медіана {1, 2, 2, 3, 4, 6} дорівнює 2,5. Для її обчислення береться 3-тє і 4-те значення в наборі даних і усереднюється, щоб отримати медіану 2,5.
У Microsoft Excel медіана розраховується за допомогою функції СРЗНАЧ. Наприклад, щоб отримати медіану всіх сум у нашому звіті про продажі, скористайтеся цією формулою:
=MEDIAN(C2:C8)
Щоб зробити приклад більш наочним, я відсортував числа в стовпчику С за зростанням (хоча насправді це не є обов'язковим для роботи формули медіани Excel):
На відміну від середнього, Microsoft Excel не надає спеціальної функції для обчислення медіани з однією або декількома умовами. Однак ви можете "емулювати" функціональність MEDIANIF та MEDIANIFS, використовуючи комбінацію двох або більше функцій, як показано в цих прикладах:
- Формула СРЕДНЕЕ ЕСЛИ (з однією умовою)
- Формула MEDIAN IFS (з декількома критеріями)
Як розрахувати режим в Excel
Режим це значення, що найчастіше зустрічається в наборі даних. В той час як середнє та медіана вимагають певних розрахунків, мода може бути знайдена шляхом підрахунку кількості разів, коли зустрічається кожне значення.
Наприклад, мода набору значень {1, 2, 2, 3, 4, 6} дорівнює 2. У Microsoft Excel розрахувати моду можна за допомогою однойменної функції, функції МОДА. Для нашого прикладу набору даних формула виглядає наступним чином:
=MODE(C2:C8)
У ситуаціях, коли у вашому наборі даних є два або більше режимів, функція РЕЖИМ Excel поверне значення найнижчий режим .
Середнє значення vs медіана: що краще?
Як правило, не існує "найкращого" показника центральної тенденції. Який показник використовувати, в основному залежить від типу даних, з якими ви працюєте, а також від вашого розуміння "типового значення", яке ви намагаєтесь оцінити.
Для симетричний розподіл (в яких значення зустрічаються з однаковими частотами), середнє, медіана і мода збігаються. перекошений розподіл (коли є невелика кількість екстремально високих або низьких значень), три міри центральної тенденції можуть бути різними.
Оскільки на середнє значення сильно впливають викривлені дані та викиди (нетипові значення, які суттєво відрізняються від решти даних), медіана є кращою мірою центральної тенденції для асиметричний розподіл .
Наприклад, прийнято вважати, що медіана є кращим показником, ніж середнє значення, для обчислення типова заробітна плата Чому? Найкращий спосіб зрозуміти це - на прикладі. Будь ласка, подивіться на кілька зразків заробітних плат для поширених видів робіт:
- Електрик - $20/год
- Медсестра - $26/год
- Поліцейський - $47/год.
- Менеджер з продажу - $54/год
- Інженер-технолог - $63/год
Тепер порахуємо середню (медіанну): складемо наведені вище цифри і розділимо на 5: (20+26+47+54+63)/5=42. Отже, середня зарплата - $42/год. Медіанна зарплата - $47/год, і саме стільки заробляє поліцейський (1/2 зарплати - нижча, 1/2 - вища). Що ж, у даному конкретному випадку середня і медіанна дають близькі цифри.
Але давайте подивимося, що станеться, якщо ми розширимо список заробітних плат, включивши в нього знаменитостей, які заробляють, скажімо, близько 30 мільйонів доларів на рік, що становить приблизно 14 500 доларів на годину. Тепер середня заробітна плата стане 2 451,67 доларів на годину, тобто такою, яку ніхто не заробляє! На відміну від цього, медіана не зазнає суттєвих змін від цього одного викиду, вона становить 50,50 доларів на годину.
Погодьтеся, медіана дає краще уявлення про те, скільки зазвичай заробляють люди, оскільки на неї не так сильно впливають аномальні зарплати.
Ось так можна розрахувати середнє, медіану і моду в Excel. Дякую за увагу і сподіваюся побачити вас на нашому блозі наступного тижня!