Desviació estàndard en Excel: funcions i exemples de fórmules

  • Comparteix Això
Michael Brown

El tutorial explica l'essència de la desviació estàndard i l'error estàndard de la mitjana, així com quina fórmula s'ha d'utilitzar millor per calcular la desviació estàndard a Excel.

En estadística descriptiva. , la mitjana aritmètica (també anomenada mitjana) i la desviació estàndard i són dos conceptes estretament relacionats. Però mentre que el primer és ben entès per la majoria, el segon ho entenen pocs. L'objectiu d'aquest tutorial és donar una mica de llum sobre què és realment la desviació estàndard i com calcular-la a Excel.

    Què és la desviació estàndard?

    El la desviació estàndard és una mesura que indica fins a quin punt els valors del conjunt de dades es desvien (escampades) de la mitjana. Per dir-ho d'una altra manera, la desviació estàndard mostra si les vostres dades s'acosten a la mitjana o fluctuen molt.

    La finalitat de la desviació estàndard és ajudar-vos a entendre si la mitjana realment retorna dades "típiques". Com més a prop estigui la desviació estàndard de zero, menor serà la variabilitat de les dades i més fiable serà la mitjana. La desviació estàndard igual a 0 indica que tots els valors del conjunt de dades són exactament iguals a la mitjana. Com més gran sigui la desviació estàndard, més variació hi ha a les dades i menys precisa serà la mitjana.

    Per tenir una millor idea de com funciona això, mireu les dades següents:

    Per a la biologia, la desviació estàndarddesviació d'una mostra i d'una població

    Depenent de la naturalesa de les vostres dades, utilitzeu una de les fórmules següents:

    • Per calcular la desviació estàndard a partir de tota la població , és a dir, la llista completa de valors (B2:B50 en aquest exemple), utilitzeu la funció STDEV.P:

      =STDEV.P(B2:B50)

    • Per trobar la desviació estàndard basada en una mostra que constitueix una part, o subconjunt, de la població (B2:B10 en aquest exemple), utilitzeu la funció STDEV.S:

      =STDEV.S(B2:B10)

    Com podeu veure a la captura de pantalla a continuació, les fórmules retornen números lleugerament diferents (com més petita és una mostra, més gran és la diferència):

    A Excel 2007 i anteriors, utilitzaríeu les funcions STDEVP i STDEV en canvi:

    Càlcul de la desviació estàndard per a representacions de text de nombres

    Quan parlem de diferents funcions per calcular la desviació estàndard a Excel, de vegades hem esmentat "text r epresentacions de nombres" i potser us interessa saber què significa realment.

    En aquest context, les "representacions de text dels números" són simplement números formats com a text. Com poden aparèixer aquests números als vostres fulls de treball? Molt sovint, s'exporten de fonts externes. O, retornat per les anomenades funcions de text que estan dissenyades per manipular cadenes de text, p. TEXT, MITJÀ, DRET, ESQUERRA,etc. Algunes d'aquestes funcions també poden funcionar amb números, però la seva sortida sempre és text, fins i tot si s'assembla molt a un nombre.

    Per il·lustrar millor el punt, considereu l'exemple següent. Suposant que teniu una columna de codis de producte com "Jeans-105" on els dígits després d'un guionet denoten la quantitat. El vostre objectiu és extreure la quantitat de cada article i, a continuació, trobar la desviació estàndard dels números extrets.

    Alleujar la quantitat a una altra columna no és un problema:

    =RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))

    El problema és que l'ús d'una fórmula de desviació estàndard d'Excel als números extrets retorna #DIV/0! o 0 com es mostra a la captura de pantalla següent:

    Per què resultats tan estranys? Com s'ha esmentat anteriorment, la sortida de la funció DRET és sempre una cadena de text. Però ni STDEV.S ni STDEVA poden gestionar números formats com a text a les referències (el primer simplement els ignora mentre que el segon compta com a zeros). Per obtenir la desviació estàndard d'aquests "números de text", cal que els proporcioneu directament a la llista d'arguments, cosa que es pot fer incrussant totes les funcions DRET a la vostra fórmula STDEV.S o STDEVA:

    =STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    =STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    Les fórmules són una mica feixugues, però això podria ser una solució útil per a una mostra petita. Per a un més gran, per no parlar de tota la població, definitivament no és una opció. En aquest cas, una solució més elegant seria tenir elLa funció VALUE converteix "números de text" en números que qualsevol fórmula de desviació estàndard pot entendre (si us plau, tingueu en compte els números alineats a la dreta a la captura de pantalla següent en lloc de les cadenes de text alineades a l'esquerra a la captura de pantalla de dalt):

    Com calcular l'error estàndard de la mitjana a Excel

    En les estadístiques, hi ha una mesura més per estimar la variabilitat de les dades: error estàndard de la mitjana , que de vegades s'escurça (encara que incorrectament) a només "error estàndard". La desviació estàndard i l'error estàndard de la mitjana són dos conceptes estretament relacionats, però no el mateix.

    Si bé la desviació estàndard mesura la variabilitat d'un conjunt de dades a partir de la mitjana, l'error estàndard de la mitjana (SEM) estima a quina distància és probable que la mitjana mostral estigui de la mitjana real de la població. Dit d'una altra manera: si agafeu diverses mostres de la mateixa població, l'error estàndard de la mitjana mostraria la dispersió entre aquestes mitjanes mostrals. Com que normalment calculem només una mitjana per a un conjunt de dades, no diverses mitjanes, l'error estàndard de la mitjana s'estima més que no es mesura.

    En matemàtiques, l'error estàndard de la mitjana es calcula amb aquesta fórmula:

    On SD és la desviació estàndard i n és la mida de la mostra (el nombre de valors de la mostra).

    Als vostres fulls de treball Excel, podeu utilitzar la funció COUNT per obtenir el númerode valors d'una mostra, SQRT per prendre una arrel quadrada d'aquest nombre i STDEV.S per calcular la desviació estàndard d'una mostra.

    Ajuntant tot això, s'obté l'error estàndard de la fórmula mitjana a Excel :

    STDEV.S( range )/SQRT(COUNT( range ))

    Suposant que les dades de la mostra es troben a B2:B10, la nostra fórmula SEM seria de la següent manera :

    =STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))

    I el resultat podria ser similar a aquest:

    Com afegir barres de desviació estàndard a Excel

    Per mostrar visualment un marge de la desviació estàndard, podeu afegir barres de desviació estàndard al vostre gràfic d'Excel. A continuació us indiquem com:

    1. Creeu un gràfic de la manera habitual ( Insereix pestanya > Gràfics grup).
    2. Feu clic a qualsevol lloc del gràfic per seleccionar-lo i, a continuació, feu clic al botó Elements del gràfic .
    3. Feu clic a la fletxa que hi ha al costat de Barres d'errors i seleccioneu Desviació estàndard .

    Això inserirà les mateixes barres de desviació estàndard per a tots els punts de dades.

    Així és com es fa la desviació estàndard a Excel. Espero que aquesta informació us sigui útil. De totes maneres, us agraeixo la lectura i esperem veure-us al nostre blog la setmana vinent.

    és 5 (arrodonit a un nombre enter), la qual cosa ens indica que la majoria de puntuacions no estan a més de 5 punts de la mitjana. Això és bo? Bé, sí, indica que les puntuacions de Biologia dels estudiants són força coherents.

    Per a les matemàtiques, la desviació estàndard és de 23. Mostra que hi ha una gran dispersió (difusió) en les puntuacions, és a dir, que alguns els estudiants van tenir un rendiment molt millor i/o alguns van tenir un rendiment molt pitjor que la mitjana.

    A la pràctica, els analistes de negocis sovint utilitzen la desviació estàndard com a mesura del risc d'inversió: com més gran és la desviació estàndard, més gran és la volatilitat. dels rendiments.

    Desviació estàndard de la mostra vs. desviació estàndard de la població

    En relació a la desviació estàndard, sovint podeu escoltar els termes "mostra" i "població", que fan referència a la integritat de les dades amb les que esteu treballant. La diferència principal és la següent:

    • Població inclou tots els elements d'un conjunt de dades.
    • Mostra és un subconjunt de dades que inclouen un o més elements de la població.

    Els investigadors i analistes operen sobre la desviació estàndard d'una mostra i població en diferents situacions. Per exemple, quan resumeix les puntuacions de l'examen d'una classe d'estudiants, un professor utilitzarà la desviació estàndard de la població. Els estadístics que calculen la puntuació mitjana nacional del SAT utilitzarien una desviació estàndard de mostra perquèes presenten només amb les dades d'una mostra, no de tota la població.

    Entendre la fórmula de la desviació estàndard

    La raó per la qual la naturalesa de les dades importa és perquè la desviació estàndard de la població i la mostra la desviació estàndard es calculen amb fórmules lleugerament diferents:

    Desviació estàndard de la mostra

    Desviació estàndard de la població

    On:

    • x i són valors individuals del conjunt de dades
    • x és la mitjana de tots els x valors
    • n és el nombre total de valors x del conjunt de dades

    Tens dificultats per entendre les fórmules? Desglossar-los en passos senzills pot ajudar. Però primer, tindrem algunes dades de mostra per treballar:

    1. Calculeu la mitjana (mitjana)

    Primer, trobeu la mitjana de tots els valors del conjunt de dades ( x a les fórmules anteriors). Quan calculeu a mà, sumeu els nombres i després dividiu la suma pel recompte d'aquests nombres, així:

    (1+2+4+5+6+8+9)/7=5

    Per trobar la mitjana a Excel, utilitzeu la funció MITJANA, p. =MITJANA(A2:G2)

    2. Per a cada nombre, resta la mitjana i quadrat el resultat

    Aquesta és la part de la fórmula de desviació estàndard que diu: ( x i - x )2

    Per visualitzar què està passant realment, fes-hi una ulladales imatges següents.

    En aquest exemple, la mitjana és 5, de manera que calculem la diferència entre cada punt de dades i 5.

    A continuació, quadrat les diferències, convertint-les totes en nombres positius:

    3. Suma les diferències al quadrat

    Per dir "suma les coses" en matemàtiques, fas servir sigma Σ. Per tant, el que fem ara és sumar les diferències al quadrat per completar aquesta part de la fórmula: Σ( x i - x )2

    16 + 9 + 1 + 1 + 9 + 16 = 52

    4. Dividiu les diferències al quadrat total pel recompte de valors

    Fins ara, les fórmules de desviació estàndard de la mostra i de la desviació estàndard de la població han estat idèntiques. En aquest punt, són diferents.

    Per a la desviació estàndard de la mostra , obteniu la variància mostral dividint les diferències al quadrat total per la mida de la mostra menys 1:

    52 / (7-1) = 8,67

    Per a la desviació estàndard de la població , es troba la mitjana de les diferències al quadrat dividint el total diferències al quadrat pel seu recompte:

    52 / 7 = 7,43

    Per què aquesta diferència en les fórmules? Com que a la fórmula de desviació estàndard de la mostra, cal corregir el biaix en l'estimació de la mitjana mostral en lloc de la mitjana de la població real. I ho feu utilitzant n - 1 en comptes de n , que s'anomena correcció de Bessel.

    5. Agafeu l'arrel quadrada

    Finalment, agafeu l'arrel quadrada de l'anteriornombres, i obtindreu la vostra desviació estàndard (a les equacions següents, arrodonida a 2 decimals):

    Desviació estàndard de mostra Desviació estàndard de la població
    √ 8,67 = 2,94 √ 7,43 = 2,73

    A Microsoft Excel, la desviació estàndard es calcula en el de la mateixa manera, però tots els càlculs anteriors es realitzen darrere de l'escena. El més important per a vostè és triar una funció de desviació estàndard adequada, sobre la qual la secció següent us donarà algunes pistes.

    Com calcular la desviació estàndard a Excel

    En general, hi ha sis diferents funcions per trobar la desviació estàndard a Excel. Quina s'ha d'utilitzar depèn principalment de la naturalesa de les dades amb què treballeu, ja sigui tota la població o una mostra.

    Funcions per calcular la desviació estàndard de la mostra a Excel

    Per calcular l'estàndard desviació basada en una mostra, utilitzeu una de les fórmules següents (totes es basen en el mètode "n-1" descrit anteriorment).

    La funció Excel STDEV

    STDEV(number1,[number2],…) és la funció Excel més antiga. funció per estimar la desviació estàndard a partir d'una mostra, i està disponible en totes les versions d'Excel 2003 a 2019.

    A Excel 2007 i posteriors, STDEV pot acceptar fins a 255 arguments que es poden representar amb números, matrius , intervals amb nom o referències a cel·les que contenen números. A Excel 2003, la funció només pot acceptar fins a30 arguments.

    Es comptabilitzen els valors lògics i les representacions de text dels nombres subministrats directament a la llista d'arguments. En matrius i referències, només es compten els números; les cel·les buides, els valors lògics de TRUE i FALSE, els valors de text i d'error s'ignoren.

    Nota. Excel STDEV és una funció obsoleta, que es manté a les versions més noves d'Excel només per a la compatibilitat enrere. Tanmateix, Microsoft no fa promeses respecte a les futures versions. Per tant, a Excel 2010 i posteriors, es recomana utilitzar STDEV.S en comptes de STDEV.

    La funció Excel STDEV.S

    STDEV.S(number1,[number2],…) és una versió millorada de STDEV, introduïda a Excel 2010.

    Com STDEV, la funció STDEV.S calcula la desviació estàndard de la mostra d'un conjunt de valors basant-se en la fórmula clàssica de desviació estàndard de la mostra que s'explica a la secció anterior.

    Funció Excel STDEVA

    STDEVA(value1, [value2], …) és una altra funció per calcular la desviació estàndard d'una mostra a Excel. Es diferencia dels dos anteriors només en la manera en què gestiona els valors lògics i de text:

    • Tots els valors lògics es compten, tant si estan continguts dins de matrius o referències, com si s'escriuen directament. a la llista d'arguments (TRUE s'avalua com a 1, FALSE s'avalua com a 0).
    • Els valors de text dins de matrius o arguments de referència es compten com a 0, incloses les cadenes buides (""), el text representacions de nombres i qualsevol altre text. Representacions textuals deels números proporcionats directament a la llista d'arguments es compten com els números que representen (aquí teniu un exemple de fórmula).
    • Les cel·les buides s'ignoren.

    Nota. Perquè una fórmula de desviació estàndard de mostra funcioni correctament, els arguments subministrats han de contenir almenys dos valors numèrics, en cas contrari, el #DIV/0! es retorna l'error.

    Funcions per calcular la desviació estàndard de la població a Excel

    Si esteu tractant amb tota la població, utilitzeu una de les funcions següents per fer la desviació estàndard a Excel. Aquestes funcions es basen en el mètode "n".

    La funció Excel STDEVP

    STDEVP(number1,[number2],…) és l'antiga funció d'Excel per trobar la desviació estàndard d'una població.

    En les noves versions. d'Excel 2010, 2013, 2016 i 2019, es substitueix per la funció STDEV.P millorada, però encara es manté per compatibilitat amb versions anteriors.

    La funció Excel STDEV.P

    STDEV.P(number1,[number2],…) és la moderna versió de la funció STDEVP que proporciona una precisió millorada. Està disponible a Excel 2010 i versions posteriors.

    Com els seus homòlegs de desviació estàndard de mostra, dins de matrius o arguments de referència, les funcions STDEVP i STDEV.P només compten els nombres. A la llista d'arguments, també compten els valors lògics i les representacions de text dels nombres.

    La funció Excel STDEVPA

    STDEVPA(value1, [value2], …) calcula la desviació estàndard d'una població, incloent el text i els valors lògics. Pel que fa als no numèricsvalors, STDEVPA funciona exactament com ho fa la funció STDEVA.

    Nota. Sigui quina sigui la fórmula de desviació estàndard d'Excel que utilitzeu, retornarà un error si un o més arguments contenen un valor d'error retornat per una altra funció o text que no es pot interpretar com a nombre.

    Quina funció de desviació estàndard d'Excel utilitzar?

    Una varietat de funcions de desviació estàndard d'Excel poden causar un desastre, especialment als usuaris sense experiència. Per triar la fórmula de desviació estàndard correcta per a una tasca concreta, només cal que respongui a les 3 preguntes següents:

    • Calculeu la desviació estàndard d'una mostra o població?
    • Quina versió d'Excel teniu utilitzar?
    • El vostre conjunt de dades inclou només números o valors lògics i també text?

    Per calcular la desviació estàndard a partir d'una mostra numèrica, utilitzeu el Funció STDEV.S a Excel 2010 i posteriors; STDEV a Excel 2007 i anteriors.

    Per trobar la desviació estàndard d'una població , utilitzeu la funció STDEV.P a Excel 2010 i posteriors; STDEVP a Excel 2007 i anteriors.

    Si voleu que s'incloguin valors lògics o de text al càlcul, utilitzeu STDEVA (desviació estàndard de mostra) o STDEVPA ( desviació estàndard de la població). Tot i que no puc pensar en cap escenari en el qual qualsevol funció pugui ser útil per si sola, poden ser útils en fórmules més grans, on un o més arguments són retornats peraltres funcions com a valors lògics o representacions de text de nombres.

    Per ajudar-vos a decidir quina de les funcions de desviació estàndard d'Excel s'adapta millor a les vostres necessitats, reviseu la taula següent que resumeix la informació que ja heu après.

    <3 4>Ignorat
    STDEV STDEV.S STDEVP STDEV.P STDEVA STDEVPA
    Versió Excel 2003 - 2019 2010 - 2019 2003 - 2019 2010 - 2019 2003 - 2019 2003 - 2019
    Mostra
    Població
    Valors lògics en matrius o referències Ignorat Avaluat

    (VERTADER=1, FALS=0)

    Text en matrius o referències Ignorat Avaluat com a zero
    Valors lògics i "números de text" a la llista d'arguments Avaluat

    (VERTADER =1, FALSE=0)

    Cel·les buides

    Exemples de fórmules de desviació estàndard d'Excel

    Un cop hagis escollit la funció que correspon al teu tipus de dades, no hi hauria d'haver cap dificultat per escriure el fórmula: la sintaxi és tan senzilla i transparent que no deixa espai per a errors :) Els exemples següents mostren un parell de fórmules de desviació estàndard d'Excel en acció.

    Càlcul estàndard.

    Michael Brown és un entusiasta de la tecnologia dedicat amb una passió per simplificar processos complexos mitjançant eines de programari. Amb més d'una dècada d'experiència en la indústria tecnològica, ha perfeccionat les seves habilitats en Microsoft Excel i Outlook, així com en Google Sheets i Docs. El bloc de Michael es dedica a compartir els seus coneixements i experiència amb altres persones, oferint consells i tutorials fàcils de seguir per millorar la productivitat i l'eficiència. Tant si sou un professional experimentat com si sou un principiant, el bloc de Michael ofereix valuoses idees i consells pràctics per treure el màxim profit d'aquestes eines de programari essencials.