Spis treści
Tutorial wyjaśnia istotę odchylenia standardowego i błędu standardowego średniej, a także jaką formułę najlepiej zastosować do obliczania odchylenia standardowego w Excelu.
W statystyce opisowej, średnia arytmetyczna (zwana również średnią) i odchylenie standardowe i są dwoma ściśle powiązanymi pojęciami. Jednak podczas gdy pierwsza z nich jest dobrze rozumiana przez większość, druga jest rozumiana przez niewielu. Celem tego samouczka jest rzucenie światła na to, czym właściwie jest odchylenie standardowe i jak je obliczyć w Excelu.
Co to jest odchylenie standardowe?
Na stronie odchylenie standardowe to miara, która wskazuje, jak bardzo wartości zbioru danych odbiegają (rozchodzą się) od średniej. Mówiąc inaczej, odchylenie standardowe pokazuje, czy Twoje dane są bliskie średniej, czy też ulegają dużym wahaniom.
Celem odchylenia standardowego jest pomoc w zrozumieniu, czy średnia rzeczywiście zwraca "typowe" dane. Im odchylenie standardowe jest bliższe zeru, tym mniejsza zmienność danych i tym bardziej wiarygodna jest średnia. Odchylenie standardowe równe 0 oznacza, że każda wartość w zbiorze danych jest dokładnie równa średniej. Im wyższe odchylenie standardowe, tym większa zmienność wdanych i tym mniej dokładna jest średnia.
Aby lepiej zrozumieć, jak to działa, proszę spojrzeć na poniższe dane:
W przypadku biologii odchylenie standardowe wynosi 5 (w zaokrągleniu do liczby całkowitej), co mówi nam, że większość wyników jest oddalona od średniej o nie więcej niż 5 punktów. Czy to dobrze? Cóż, tak, wskazuje to, że wyniki uczniów z biologii są dość spójne.
Dla matematyki odchylenie standardowe wynosi 23. Pokazuje to, że istnieje ogromne rozproszenie (spread) w wynikach, co oznacza, że niektórzy uczniowie uzyskali znacznie lepsze wyniki i/lub niektórzy uzyskali znacznie gorsze wyniki niż średnia.
W praktyce odchylenie standardowe jest często wykorzystywane przez analityków gospodarczych jako miara ryzyka inwestycyjnego - im wyższe odchylenie standardowe, tym większa zmienność stóp zwrotu.
Odchylenie standardowe próbki a odchylenie standardowe populacji
W odniesieniu do odchylenia standardowego możesz często usłyszeć terminy "próbka" i "populacja", które odnoszą się do kompletności danych, z którymi pracujesz. Główna różnica jest następująca:
- Ludność zawiera wszystkie elementy z danego zbioru danych.
- Przykładowa strona to podzbiór danych, który zawiera jeden lub więcej elementów z populacji.
Badacze i analitycy operują odchyleniem standardowym próby i populacji w różnych sytuacjach. Na przykład, podsumowując wyniki egzaminów klasy uczniów, nauczyciel użyje odchylenia standardowego populacji. Statystycy obliczający krajowy średni wynik SAT użyliby odchylenia standardowego próby, ponieważ mają do dyspozycji dane tylko z próby, a niez całej populacji.
Rozumienie wzoru na odchylenie standardowe
Powodem, dla którego charakter danych ma znaczenie, jest to, że odchylenie standardowe populacji i odchylenie standardowe próbki są obliczane za pomocą nieco innych wzorów:
Odchylenie standardowe próbki | Odchylenie standardowe populacji |
Gdzie:
- x i są poszczególnymi wartościami w zbiorze danych
- x jest średnią wszystkich x wartości
- n to całkowita liczba x wartości w zbiorze danych
Jeśli masz problemy ze zrozumieniem formuł, to może pomóc Ci rozbicie ich na proste kroki, ale najpierw daj nam kilka przykładowych danych do pracy:
1. obliczyć średnią (average)
Najpierw znajdujemy średnią wszystkich wartości w zbiorze danych ( x W przypadku obliczeń ręcznych sumujemy liczby, a następnie dzielimy sumę przez liczbę tych liczb, jak poniżej:
(1+2+4+5+6+8+9)/7=5
Aby znaleźć średnią w Excelu, użyj funkcji AVERAGE, np. =AVERAGE(A2:G2)
2. dla każdej liczby odjąć średnią i podnieść wynik do kwadratu
To jest ta część wzoru na odchylenie standardowe, która mówi: ( x i - x )2
Aby zwizualizować, co się właściwie dzieje, proszę spojrzeć na poniższe obrazki.
W tym przykładzie średnia wynosi 5, więc obliczamy różnicę między każdym punktem danych a 5.
Następnie podnosimy do kwadratu różnice, zamieniając je wszystkie w liczby dodatnie:
3. dodajemy różnice kwadratowe
Aby powiedzieć "podsumować" w matematyce, używamy sigma Σ. Zatem to, co teraz zrobimy, to dodanie różnic kwadratowych, aby uzupełnić tę część wzoru: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. podzielić całkowitą różnicę kwadratową przez liczbę wartości
Dotychczas wzory na odchylenie standardowe próbki i odchylenie standardowe populacji były identyczne. W tym momencie są one różne.
Dla próbka odchylenie standardowe , dostajesz wariancja próby dzieląc całkowite różnice kwadratowe przez wielkość próby minus 1:
52 / (7-1) = 8.67
Dla odchylenie standardowe populacji , znajdziesz średnia z różnic kwadratowych dzieląc sumę różnic kwadratowych przez ich liczbę:
52 / 7 = 7.43
Skąd ta różnica we wzorach? Ponieważ we wzorze na odchylenie standardowe próbki trzeba skorygować błąd w oszacowaniu średniej z próbki zamiast prawdziwej średniej z populacji. A robi się to za pomocą n - 1 zamiast n , co nazywane jest poprawką Bessela.
5. weź pierwiastek kwadratowy
Na koniec weź pierwiastek kwadratowy z powyższych liczb, a otrzymasz swoje odchylenie standardowe (w poniższych równaniach zaokrąglone do 2 miejsc po przecinku):
Odchylenie standardowe próbki | Odchylenie standardowe populacji |
√ 8.67 = 2.94 | √ 7.43 = 2.73 |
W programie Microsoft Excel odchylenie standardowe oblicza się w ten sam sposób, ale wszystkie powyższe obliczenia wykonywane są za sceną. Kluczową rzeczą dla Ciebie jest wybór odpowiedniej funkcji odchylenia standardowego, o której w dalszej części rozdziału znajdziesz kilka wskazówek.
Jak obliczyć odchylenie standardowe w programie Excel
Ogólnie rzecz biorąc, istnieje sześć różnych funkcji, aby znaleźć odchylenie standardowe w programie Excel. Który z nich należy użyć, zależy przede wszystkim od charakteru danych, z którymi pracujesz - czy jest to cała populacja, czy próbka.
Funkcje do obliczania odchylenia standardowego próbki w Excelu
Aby obliczyć odchylenie standardowe na podstawie próbki, należy użyć jednego z poniższych wzorów (wszystkie opierają się na opisanej powyżej metodzie "n-1").
Funkcja STDEV w programie Excel
STDEV(liczba1,[liczba2],...)
jest najstarszą funkcją programu Excel do szacowania odchylenia standardowego na podstawie próbki i jest dostępna we wszystkich wersjach programu Excel od 2003 do 2019.
W programie Excel 2007 i nowszych STDEV może przyjąć do 255 argumentów, które mogą być reprezentowane przez liczby, tablice, nazwane zakresy lub odwołania do komórek zawierających liczby. W programie Excel 2003 funkcja może przyjąć tylko do 30 argumentów.
Liczone są wartości logiczne i reprezentacje tekstowe liczb podanych bezpośrednio w liście argumentów. W tablicach i referencjach liczone są tylko liczby; puste komórki, wartości logiczne TRUE i FALSE, tekst i wartości błędów są ignorowane.
Uwaga. Excel STDEV jest przestarzałą funkcją, która została zachowana w nowszych wersjach Excela jedynie w celu zachowania kompatybilności wstecznej. Microsoft nie składa jednak żadnych obietnic dotyczących przyszłych wersji. Dlatego w Excelu 2010 i nowszych zaleca się stosowanie STDEV.S zamiast STDEV.
Funkcja STDEV.S w programie Excel
STDEV.S(liczba1,[liczba2],...)
to ulepszona wersja STDEV, wprowadzona w Excelu 2010.
Podobnie jak STDEV, funkcja STDEV.S oblicza próbkowe odchylenie standardowe zbioru wartości w oparciu o klasyczny wzór na próbkowe odchylenie standardowe omówiony w poprzednim punkcie.
Funkcja STDEVA programu Excel
STDEVA(wartość1, [wartość2], ...)
to kolejna funkcja do obliczania odchylenia standardowego próbki w Excelu. Od powyższych dwóch różni się jedynie sposobem obsługi wartości logicznych i tekstowych:
- Wszystkie wartości logiczne są zliczane, niezależnie od tego czy są zawarte w tablicach lub referencjach, czy wpisane bezpośrednio na listę argumentów (TRUE ocenia jako 1, FALSE ocenia jako 0).
- Wartości tekstowe Wewnątrz tablic lub argumentów referencyjnych są liczone jako 0, w tym puste łańcuchy (""), tekstowe reprezentacje liczb i każdy inny tekst. Tekstowe reprezentacje liczb podane bezpośrednio w liście argumentów są liczone jako liczby, które reprezentują (oto przykład formuły).
- Puste komórki są ignorowane.
Uwaga. Aby formuła przykładowego odchylenia standardowego działała poprawnie, dostarczone argumenty muszą zawierać co najmniej dwie wartości liczbowe, w przeciwnym razie zwracany jest błąd #DIV/0!.
Funkcje do obliczania odchylenia standardowego populacji w Excelu
Jeśli masz do czynienia z całą populacją, użyj jednej z następujących funkcji, aby zrobić odchylenie standardowe w programie Excel. Funkcje te są oparte na metodzie "n".
Funkcja STDEVP programu Excel
STDEVP(liczba1,[liczba2],...)
jest starą funkcją Excela, aby znaleźć odchylenie standardowe populacji.
W nowych wersjach Excela 2010, 2013, 2016 i 2019 została ona zastąpiona ulepszoną funkcją STDEV.P, ale nadal jest zachowana dla kompatybilności wstecznej.
Funkcja STDEV.P w programie Excel
STDEV.P(liczba1,[liczba2],...)
to nowoczesna wersja funkcji STDEVP, która zapewnia zwiększoną dokładność. Jest dostępna w programie Excel 2010 i nowszych wersjach.
Podobnie jak ich przykładowe odpowiedniki odchylenia standardowego, wewnątrz tablic lub argumentów referencyjnych funkcje STDEVP i STDEV.P zliczają tylko liczby. Na liście argumentów zliczają również wartości logiczne i tekstowe reprezentacje liczb.
Funkcja STDEVPA w programie Excel
STDEVPA(wartość1, [wartość2], ...)
oblicza odchylenie standardowe populacji, w tym wartości tekstowych i logicznych. W przypadku wartości nienumerycznych STDEVPA działa dokładnie tak samo jak funkcja STDEVA.
Uwaga. Niezależnie od tego, której formuły odchylenia standardowego Excel użyjesz, zwróci ona błąd, jeśli jeden lub więcej argumentów zawiera wartość błędu zwróconą przez inną funkcję lub tekst, który nie może być interpretowany jako liczba.
Jakiej funkcji odchylenia standardowego w Excelu użyć?
Różnorodność funkcji odchylenia standardowego w Excelu może z pewnością spowodować bałagan, zwłaszcza dla niedoświadczonych użytkowników. Aby wybrać prawidłową formułę odchylenia standardowego dla konkretnego zadania, wystarczy odpowiedzieć na poniższe 3 pytania:
- Czy obliczasz odchylenie standardowe próby lub populacji?
- Z jakiej wersji Excela korzystasz?
- Czy Twój zbiór danych zawiera tylko liczby czy wartości logiczne i również tekst?
Aby obliczyć odchylenie standardowe na podstawie liczby przykład , użyj funkcji STDEV.S w programie Excel 2010 i nowszych; STDEV w programie Excel 2007 i wcześniejszych.
Aby znaleźć odchylenie standardowe a populacja , użyj funkcji STDEV.P w programie Excel 2010 i nowszych; STDEVP w programie Excel 2007 i wcześniejszych.
Jeśli chcesz logiczne lub tekst wartości, które mają być uwzględnione w obliczeniach, użyj STDEVA (odchylenie standardowe próbki) lub STDEVPA (odchylenie standardowe populacji). Chociaż nie przychodzi mi do głowy żaden scenariusz, w którym każda z tych funkcji może być przydatna samodzielnie, mogą one być przydatne w większych formułach, w których jeden lub więcej argumentów jest zwracanych przez inne funkcje jako wartości logiczne lub tekstowe reprezentacje liczb.
Aby pomóc Ci w podjęciu decyzji, która z funkcji odchylenia standardowego Excela najlepiej nadaje się do Twoich potrzeb, zapoznaj się z poniższą tabelą, która podsumowuje poznane już informacje.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Wersja dla programu Excel | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Przykładowa strona | ✓ | ✓ | ✓ | |||
Ludność | ✓ | ✓ | ✓ | |||
Wartości logiczne w tablicach lub odwołaniach | Zignorowano | Oceniona (TRUE=1, FALSE=0) | ||||
Tekst w tablicach lub odwołaniach | Zignorowano | Oceniane jako zero | ||||
Wartości logiczne i "text-numbers" w liście argumentów | Oceniona (TRUE=1, FALSE=0) | |||||
Puste komórki | Zignorowano |
Przykłady formuły odchylenia standardowego w Excelu
Po wybraniu funkcji odpowiadającej typowi danych nie powinno być trudności z napisaniem formuły - składnia jest tak prosta i przejrzysta, że nie pozostawia miejsca na błędy :) Poniższe przykłady demonstrują kilka formuł odchylenia standardowego Excela w działaniu.
Obliczanie odchylenia standardowego próby i populacji
W zależności od charakteru danych, użyj jednej z poniższych formuł:
- Aby obliczyć odchylenie standardowe na podstawie całego populacja , czyli pełną listę wartości (B2:B50 w tym przykładzie), użyj funkcji STDEV.P:
=STDEV.P(B2:B50)
- Aby znaleźć odchylenie standardowe na podstawie przykład które stanowią część lub podzbiór populacji (B2:B10 w tym przykładzie), należy użyć funkcji STDEV.S:
=STDEV.S(B2:B10)
Jak widać na zrzucie ekranu poniżej, formuły zwracają nieco inne liczby (im mniejsza próbka, tym większa różnica):
W Excelu 2007 i niższych, zamiast tego używałbyś funkcji STDEVP i STDEV:
- Aby otrzymać odchylenie standardowe populacji:
=STDEVP(B2:B50)
- Aby obliczyć odchylenie standardowe próbki:
=STDEV(B2:B10)
Obliczanie odchylenia standardowego dla tekstowych reprezentacji liczb
Omawiając różne funkcje do obliczania odchylenia standardowego w Excelu, czasami wspominaliśmy o "tekstowych reprezentacjach liczb" i być może jesteś ciekawy, co to właściwie znaczy.
W tym kontekście "tekstowa reprezentacja liczb" to po prostu liczby sformatowane jako tekst. Jak takie liczby mogą pojawić się w arkuszu? Najczęściej są one eksportowane z zewnętrznych źródeł lub zwracane przez tzw. funkcje tekstowe, które są przeznaczone do manipulowania ciągami tekstowymi, np.jeśli wygląda jak liczba.
Aby lepiej zilustrować ten punkt, proszę rozważyć następujący przykład. Załóżmy, że masz kolumnę kodów produktów, takich jak "Jeans-105", gdzie cyfry po myślniku oznaczają ilość. Twoim celem jest wyodrębnienie ilości każdego elementu, a następnie znaleźć odchylenie standardowe wyodrębnionych liczb.
Przeciągnięcie ilości do innej kolumny nie stanowi problemu:
=RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))
Problem polega na tym, że użycie formuły odchylenia standardowego programu Excel na wyodrębnionych liczbach zwraca albo #DIV/0! lub 0, jak pokazano na poniższym zrzucie ekranu:
Skąd takie dziwne wyniki? Jak już wspomniano, wyjście funkcji PRAWDA jest zawsze łańcuchem tekstowym. Jednak ani STDEV.S ani STDEVA nie radzą sobie z liczbami sformatowanymi jako tekst w referencjach (pierwsza po prostu je ignoruje, druga liczy jako zera). Aby uzyskać odchylenie standardowe takich "tekstowych liczb", trzeba je dostarczyć bezpośrednio do listy argumentów, co można zrobić osadzając wszystkieFunkcje RIGHT do formuły STDEV.S lub STDEVA:
=STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))
Formuły są nieco kłopotliwe, ale może to być rozwiązanie dla małej próbki. Dla większej, nie mówiąc już o całej populacji, zdecydowanie nie jest to rozwiązanie. W tym przypadku bardziej eleganckim rozwiązaniem byłoby posiadanie funkcji VALUE konwertującej "liczby tekstowe" na liczby, które każda formuła odchylenia standardowego może zrozumieć (proszę zauważyć wyrównane do prawej strony liczby na zrzucie ekranuponiżej w przeciwieństwie do wyrównanych do lewej strony ciągów tekstowych na zrzucie ekranu powyżej):
Jak obliczyć błąd standardowy średniej w programie Excel
W statystyce istnieje jeszcze jedna miara służąca do szacowania zmienności w danych -. błąd standardowy średniej , który jest czasem skracany (choć niesłusznie) do po prostu "błędu standardowego". Odchylenie standardowe i błąd standardowy średniej to dwa ściśle powiązane pojęcia, ale nie to samo.
Podczas gdy odchylenie standardowe mierzy zmienność zbioru danych w stosunku do średniej, błąd standardowy średniej (SEM) szacuje, jak daleko średnia z próby może być od prawdziwej średniej w populacji. Innymi słowy, gdybyśmy pobrali wiele prób z tej samej populacji, błąd standardowy średniej pokazałby rozrzut między tymi średnimi z próby. Ponieważ zazwyczaj obliczamy tylko jednąśrednia dla zbioru danych, a nie średnia wielokrotna, błąd standardowy średniej jest szacowany, a nie mierzony.
W matematyce błąd standardowy średniej oblicza się za pomocą tego wzoru:
Gdzie SD jest odchyleniem standardowym, a n to wielkość próby (liczba wartości w próbie).
W arkuszach Excela możesz użyć funkcji COUNT, aby uzyskać liczbę wartości w próbce, SQRT, aby wziąć pierwiastek kwadratowy z tej liczby, i STDEV.S, aby obliczyć odchylenie standardowe próbki.
Składając to wszystko razem, otrzymujemy w Excelu formułę błędu standardowego średniej:
STDEV.S( zakres )/SQRT(COUNT( zakres ))Zakładając, że przykładowe dane są w B2:B10, nasza formuła SEM przebiegałaby następująco:
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
A wynik może być podobny do tego:
Jak dodać paski odchylenia standardowego w programie Excel
Aby wizualnie wyświetlić margines odchylenia standardowego, możesz dodać paski odchylenia standardowego do swojego wykresu w programie Excel.Oto jak:
- Utwórz wykres w zwykły sposób ( Wkładka tab> Wykresy grupa).
- Kliknij w dowolnym miejscu wykresu, aby go zaznaczyć, a następnie kliknij przycisk Elementy wykresu przycisk.
- Kliknij strzałkę obok Error Bars i wybrać Odchylenie standardowe .
Spowoduje to wstawienie takich samych słupków odchylenia standardowego dla wszystkich punktów danych.
Oto jak zrobić odchylenie standardowe w Excelu. Mam nadzieję, że te informacje okażą się pomocne. W każdym razie dziękuję za przeczytanie i mam nadzieję, że zobaczymy się na naszym blogu w przyszłym tygodniu.