Съдържание
Когато анализирате числови данни, често се налага да търсите начин да получите "типичната" стойност. За тази цел можете да използвате т.нар. мерки за централна тенденция които представляват единична стойност, идентифицираща централната позиция в даден набор от данни или, по-технически, средата или центъра в статистическо разпределение. Понякога те се класифицират и като обобщени статистики.
Трите основни мерки за централна тенденция са Средна стойност , Медиана и Режим Всички те са валидни мерки за централното местоположение, но всяка от тях дава различна представа за типичната стойност и при различни обстоятелства някои мерки са по-подходящи за използване от други.
Как да изчислим средната стойност в Excel
Средна аритметична стойност , наричан също средно Средната стойност се изчислява, като се сумира група числа и след това сумата се раздели на броя на тези числа.
Например, за да изчислите средната стойност на числата {1, 2, 2, 3, 4, 6}, ги събирате и след това разделяте сумата на 6, което дава 3: (1+2+2+3+4+6)/6=3.
В Microsoft Excel средната стойност може да бъде изчислена с помощта на една от следните функции:
- AVERAGE - връща средна стойност на числата.
- AVERAGEA - връща средната стойност на клетките с всякакви данни (числа, булеви и текстови стойности).
- AVERAGEIF - намира средна стойност на числата въз основа на един критерий.
- AVERAGEIFS - намира средна стойност на числата въз основа на няколко критерия.
За по-задълбочени уроци, моля, последвайте горните връзки. За да получите концептуална представа за работата на тези функции, разгледайте следния пример.
В отчет за продажбите (моля, вижте снимката по-долу), предполагаме, че искате да получите средната стойност на стойностите в клетките C2:C8. За целта използвайте тази проста формула:
=СРЕДНА СТОЙНОСТ(C2:C8)
За да получите средната стойност само на продажбите на "Банана", използвайте формулата AVERAGEIF:
=AVERAGEIF(A2:A8, "Банан", C2:C8)
За да изчислите средната стойност въз основа на 2 условия, например средната стойност на продажбите на "Банани" със статус "Доставени", използвайте AVERAGEIFS:
=AVERAGEIFS(C2:C8,A2:A8, "Banana", B2:B8, "Delivered")
Можете също така да въведете условията си в отделни клетки и да се позовавате на тези клетки във формулите си, както е показано по-долу:
Как да намерим медиана в Excel
Медиана е средната стойност в група числа, които са подредени във възходящ или низходящ ред, т.е. половината числа са по-големи от медианата и половината числа са по-малки от нея. Например медианата на набора от данни {1, 2, 2, 3, 4, 6, 9} е 3.
Това работи добре, когато в групата има нечетен брой стойности. Но какво става, ако имате дори В този случай медианата е средноаритметичната стойност (средната стойност) на двете средни стойности. Например медианата на {1, 2, 2, 3, 4, 6} е 2,5. За да я изчислите, вземете 3-тата и 4-тата стойност в набора от данни и ги осреднете, за да получите медиана от 2,5.
В Microsoft Excel медианата се изчислява с помощта на функцията MEDIAN. Например, за да получите медианата на всички суми в нашия отчет за продажбите, използвайте тази формула:
=MEDIAN(C2:C8)
За да бъде примерът по-нагледен, подредих числата в колона C във възходящ ред (въпреки че това всъщност не е необходимо, за да работи формулата Excel Median):
За разлика от средната стойност, Microsoft Excel не предоставя специална функция за изчисляване на медиана с едно или повече условия. Можете обаче да "имитирате" функционалността на MEDIANIF и MEDIANIFS, като използвате комбинация от две или повече функции, както е показано в тези примери:
- Формула MEDIAN IF (с едно условие)
- Формула MEDIAN IFS (с множество критерии)
Как да изчислим режима в Excel
Режим Докато средната стойност и медианата изискват някои изчисления, стойността на модата може да бъде намерена просто чрез преброяване на броя на случаите, в които се среща всяка стойност.
Например режимът на набора от стойности {1, 2, 2, 3, 4, 6} е 2. В Microsoft Excel можете да изчислите режима, като използвате едноименната функция MODE. За нашия примерен набор от данни формулата е следната:
=MODE(C2:C8)
В случаите, когато в набора от данни има два или повече режима, функцията MODE на Excel ще върне най-нисък режим .
Средна стойност срещу медиана: кое е по-добро?
Като цяло няма "най-добра" мярка за централна тенденция. Коя мярка да използвате зависи най-вече от вида на данните, с които работите, както и от разбирането ви за "типичната стойност", която се опитвате да оцените.
За симетрично разпределение (при които стойностите се появяват с еднаква честота), средната стойност, медианата и модата са едни и същи. изкривен разпространение (където има малък брой изключително високи или ниски стойности), трите мерки за централна тенденция могат да бъдат различни.
Тъй като средната стойност се влияе значително от изкривени данни и отклонения (нетипични стойности, които се различават значително от останалите данни), медиана е предпочитаната мярка за централна тенденция за асиметрично разпределение .
Например, общоприето е, че медианата е по-добра от средната стойност за изчисляване на типична заплата . Защо? Най-добрият начин да разберете това е чрез пример. Моля, разгледайте няколко примерни заплати за често срещани длъжности:
- Електротехник - $20/час
- Медицинска сестра - $26/час
- Полицейски служител - 47 долара на час
- Мениджър продажби - $54/час
- Производствен инженер - 63 долара на час
Сега нека изчислим средната (медианната) стойност: съберете горните числа и ги разделете на 5: (20+26+47+54+63)/5=42. И така, средната заплата е 42 долара на час. Медианата е 47 долара на час и я получава полицейският служител (1/2 от заплатите са по-ниски, а 1/2 - по-високи). Е, в този конкретен случай средната и медианната стойност дават сходни числа.
Но нека видим какво ще се случи, ако разширим списъка на заплатите, като включим знаменитост, която печели, да речем, около 30 млн. долара годишно, което е приблизително 14 500 долара на час. Сега средната заплата става 2 451,67 долара на час - заплата, която никой не печели! За разлика от това, медианната стойност не се променя значително от това отклонение - тя е 50,50 долара на час.
Съгласете се, че медианната стойност дава по-добра представа за обичайните доходи на хората, тъй като не е толкова силно повлияна от необичайните заплати.
Ето как се изчисляват средната стойност, медианата и модата в Excel. Благодаря ви за прочита и се надявам да се видим в нашия блог следващата седмица!