Obsah
Při analýze číselných dat můžete často hledat způsob, jak získat "typickou" hodnotu. K tomuto účelu můžete použít tzv. míry centrální tendence které představují jedinou hodnotu identifikující centrální pozici v rámci datového souboru nebo, odborněji řečeno, střed nebo centrum ve statistickém rozdělení. Někdy jsou také klasifikovány jako souhrnné statistiky.
Tři hlavní míry centrální tendence jsou Průměr , Medián a Režim . Všechny jsou platnými měřítky centrální polohy, ale každé z nich poskytuje jiný údaj o typické hodnotě a za různých okolností jsou některá měřítka vhodnější k použití než jiná.
Jak vypočítat průměr v aplikaci Excel
Aritmetický průměr , označované také jako průměr , je pravděpodobně mírou, kterou znáte nejlépe. Průměr se vypočítá tak, že se sečte skupina čísel a pak se součet vydělí počtem těchto čísel.
Chcete-li například vypočítat průměr čísel {1, 2, 2, 3, 4, 6}, sečtete je a pak součet vydělíte číslem 6, čímž získáte číslo 3: (1+2+2+3+4+6)/6=3.
V aplikaci Microsoft Excel lze průměr vypočítat pomocí jedné z následujících funkcí:
- AVERAGE - vrátí průměr čísel.
- AVERAGEA - vrací průměr buněk s libovolnými daty (čísla, logické a textové hodnoty).
- AVERAGEIF - najde průměr čísel na základě jednoho kritéria.
- AVERAGEIFS - vyhledá průměr čísel na základě více kritérií.
Podrobné výukové programy naleznete na výše uvedených odkazech. Chcete-li získat koncepční představu o tom, jak tyto funkce fungují, podívejte se na následující příklad.
Předpokládejme, že v sestavě o prodeji (viz obrázek níže) chcete získat průměr hodnot v buňkách C2:C8. K tomu použijte tento jednoduchý vzorec:
=PRŮMĚR(C2:C8)
Chcete-li získat průměr pouze z prodeje "banánů", použijte vzorec AVERAGEIF:
=AVERAGEIF(A2:A8, "Banán", C2:C8)
Chcete-li vypočítat průměr na základě 2 podmínek, například průměr prodejů "Banánů" se stavem "Dodáno", použijte AVERAGEIFS:
=AVERAGEIFS(C2:C8,A2:A8, "Banán", B2:B8, "Dodáno")
Podmínky můžete také zadávat do samostatných buněk a odkazovat na ně ve vzorcích, jako například takto:
Jak zjistit medián v aplikaci Excel
Medián je střední hodnota ve skupině čísel, která jsou uspořádána vzestupně nebo sestupně, tj. polovina čísel je větší než medián a polovina čísel je menší než medián. Například medián souboru dat {1, 2, 2, 3, 4, 6, 9} je 3.
To funguje dobře, pokud je ve skupině lichý počet hodnot. Ale co když máte ve skupině i V tomto případě je medián aritmetickým průměrem (průměrem) dvou prostředních hodnot. Například medián {1, 2, 2, 3, 4, 6} je 2,5. Vypočítáme ho tak, že vezmeme 3. a 4. hodnotu v souboru dat a zprůměrujeme je, abychom dostali medián 2,5. V tomto případě je medián aritmetickým průměrem (průměrem) dvou prostředních hodnot.
V aplikaci Microsoft Excel se medián vypočítá pomocí funkce MEDIAN. Chcete-li například získat medián všech částek v naší zprávě o prodeji, použijte tento vzorec:
=MEDIAN(C2:C8)
Aby byl příklad názornější, seřadil jsem čísla ve sloupci C vzestupně (ačkoli to ve skutečnosti není pro fungování vzorce Excel Median nutné):
Na rozdíl od průměru neobsahuje aplikace Microsoft Excel žádnou speciální funkci pro výpočet mediánu s jednou nebo více podmínkami. Funkce MEDIANIF a MEDIANIFS však můžete "napodobit" pomocí kombinace dvou nebo více funkcí, jak je uvedeno v těchto příkladech:
- Vzorec MEDIAN IF (s jednou podmínkou)
- Vzorec MEDIAN IFS (s více kritérii)
Jak vypočítat režim v aplikaci Excel
Režim Zatímco průměr a medián vyžadují určité výpočty, hodnotu modu lze zjistit jednoduše spočítáním počtu výskytů jednotlivých hodnot.
Například modus množiny hodnot {1, 2, 2, 3, 4, 6} je 2. V aplikaci Microsoft Excel můžete vypočítat modus pomocí stejnojmenné funkce MODE. Pro naši ukázkovou množinu dat je vzorec následující:
=MODE(C2:C8)
V situacích, kdy jsou v datové sadě dva nebo více režimů, funkce Excel MODE vrátí hodnotu. nejnižší režim .
Průměr vs. medián: co je lepší?
Obecně platí, že neexistuje žádná "nejlepší" míra centrální tendence. To, kterou míru použijete, většinou závisí na typu dat, s nimiž pracujete, a na vaší představě o "typické hodnotě", kterou se snažíte odhadnout.
Pro symetrické rozložení (kde se hodnoty vyskytují s pravidelnou frekvencí), jsou průměr, medián a modus stejné. zkosené distribuce (kde je malý počet extrémně vysokých nebo nízkých hodnot), mohou se tyto tři míry centrální tendence lišit.
Vzhledem k tomu, že průměr je značně ovlivněn zkreslenými daty a odlehlými hodnotami (netypické hodnoty, které se výrazně liší od zbytku dat), medián je upřednostňovanou mírou centrální tendence pro asymetrické rozložení .
Například je obecně uznáváno, že medián je pro výpočet lepší než průměr. typický plat Proč? Nejlépe to pochopíte na příkladu. Podívejte se prosím na několik vzorových platů pro běžná zaměstnání:
- Elektrikář - 20 USD/hodina
- Zdravotní sestra - 26 USD/hodina
- Policista - 47 dolarů/hodina
- Manažer prodeje - 54 USD/hod.
- Výrobní inženýr - 63 USD/hod.
Nyní vypočítáme průměr (mean): sečteme výše uvedená čísla a vydělíme je 5: (20+26+47+54+63)/5=42. Průměrná mzda je tedy 42 USD/h. Medián mzdy je 47 USD/h a vydělává ji policista (1/2 mzdy je nižší a 1/2 vyšší). No a v tomto konkrétním případě dává průměr a medián podobná čísla.
Podívejme se však, co se stane, když seznam mezd rozšíříme o celebritu, která vydělává, řekněme, asi 30 milionů dolarů ročně, což je zhruba 14 500 dolarů za hodinu. Nyní se průměrná mzda stane 2 451,67 dolaru za hodinu, což je mzda, kterou nikdo nevydělává! Naopak medián se tímto jedním odlehlým příjmem nijak výrazně nezmění, činí 50,50 dolaru za hodinu.
Souhlasím s tím, že medián poskytuje lepší představu o tom, kolik lidé obvykle vydělávají, protože není tak silně ovlivněn abnormálními platy.
Takto se v Excelu počítá průměr, medián a modus. Děkuji vám za přečtení a doufám, že se příští týden uvidíme na našem blogu!