Desviación típica en Excel: funcións e exemplos de fórmulas

  • Comparte Isto
Michael Brown

O titorial explica a esencia da desviación estándar e do erro estándar da media, así como cal é a mellor fórmula que se utiliza para calcular a desviación estándar en Excel.

En estatísticas descritivas , a media aritmética (tamén chamada media) e a desviación típica e son dous conceptos moi relacionados. Pero aínda que o primeiro é ben entendido pola maioría, o segundo é comprendido por poucos. O obxectivo deste tutorial é arroxar algo de luz sobre cal é realmente a desviación estándar e como calculala en Excel.

    Que é a desviación estándar?

    O a desviación estándar é unha medida que indica en que medida os valores do conxunto de datos se desvían (esparcidos) da media. Dito doutro xeito, a desviación estándar mostra se os teus datos están preto da media ou fluctúan moito.

    O propósito da desviación estándar é axudarche a comprender se a media realmente devolve un dato "típico". Canto máis próxima estea a desviación estándar de cero, menor será a variabilidade dos datos e máis fiable será a media. A desviación estándar igual a 0 indica que todos os valores do conxunto de datos son exactamente iguais á media. Canto maior sexa a desviación estándar, máis variación hai nos datos e menos precisa será a media.

    Para ter unha mellor idea de como funciona isto, bótalle unha ollada aos seguintes datos:

    Para Bioloxía, a desviación estándardesviación dunha mostra e dunha poboación

    Dependendo da natureza dos teus datos, utiliza unha das seguintes fórmulas:

    • Para calcular a desviación estándar baseándose en toda a poboación , é dicir, a lista completa de valores (B2:B50 neste exemplo), use a función STDEV.P:

      =STDEV.P(B2:B50)

    • Para atopar a desviación estándar baseada nunha mostra que constitúe unha parte, ou subconxunto, da poboación (B2:B10 neste exemplo), utiliza a función STDEV.S:

      =STDEV.S(B2:B10)

    Como podes ver no Captura de pantalla a continuación, as fórmulas devolven números lixeiramente diferentes (canto máis pequena é unha mostra, maior é a diferenza):

    En Excel 2007 e anteriores, usarías as funcións STDEVP e STDEV no seu lugar:

    • Para obter a desviación estándar da poboación:

      =STDEVP(B2:B50)

    • Para calcular a desviación estándar da mostra:

      =STDEV(B2:B10)

    Calculo da desviación estándar para representacións de texto de números

    Ao discutir diferentes funcións para calcular a desviación estándar en Excel, ás veces mencionamos "texto r epresentacións de números" e quizais teña curiosidade por saber o que iso significa realmente.

    Neste contexto, as "representacións de texto de números" son simplemente números con formato de texto. Como poden aparecer eses números nas túas follas de traballo? Na maioría das veces, son exportados de fontes externas. Ou, devolto polas chamadas funcións de texto que están deseñadas para manipular cadeas de texto, p. TEXTO, MEDIO, DEREITA, ESQUERDA,etc. Algunhas destas funcións tamén poden funcionar con números, pero a súa saída é sempre texto, aínda que se pareza moito a un número.

    Para ilustrar mellor o punto, considere o seguinte exemplo. Supoñamos que tes unha columna de códigos de produto como "Jeans-105" onde os díxitos despois dun guión indican a cantidade. O teu obxectivo é extraer a cantidade de cada elemento e, a continuación, atopar a desviación estándar dos números extraídos.

    Levar a cantidade a outra columna non é un problema:

    =RIGHT(A2,LEN(A2)-SEARCH("-",A2,1))

    O problema é que usar unha fórmula de desviación estándar de Excel nos números extraídos devolve #DIV/0! ou 0 como se mostra na seguinte captura de pantalla:

    Por que resultados tan estraños? Como se mencionou anteriormente, a saída da función RIGHT é sempre unha cadea de texto. Pero nin STDEV.S nin STDEVA poden manexar números formateados como texto nas referencias (o primeiro simplemente os ignora mentres que o segundo conta como ceros). Para obter a desviación estándar de tales "números de texto", cómpre fornecelos directamente á lista de argumentos, o que se pode facer incorporando todas as funcións CORRECTAS na súa fórmula STDEV.S ou STDEVA:

    =STDEV.S(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    =STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1)))

    As fórmulas son un pouco complicadas, pero esa pode ser unha solución útil para unha pequena mostra. Para un máis grande, por non falar de toda a poboación, definitivamente non é unha opción. Neste caso, unha solución máis elegante sería ter oA función VALUE converte "números de texto" en números que calquera fórmula de desviación estándar pode entender (observe os números aliñados á dereita na captura de pantalla que aparece a continuación en oposición ás cadeas de texto aliñadas á esquerda na captura de pantalla anterior):

    Como calcular o erro estándar da media en Excel

    En estatística, hai unha medida máis para estimar a variabilidade dos datos: erro estándar da media , que ás veces se acurta (aínda que incorrectamente) a só "erro estándar". A desviación estándar e o erro estándar da media son dous conceptos moi relacionados, pero non o mesmo.

    Mentres a desviación estándar mide a variabilidade dun conxunto de datos a partir da media, o erro estándar da media (SEM) estima ata que punto é probable que a media mostral estea da media real da poboación. Dito doutro xeito: se tomas varias mostras da mesma poboación, o erro estándar da media mostraría a dispersión entre esas medias mostrais. Como normalmente calculamos só unha media para un conxunto de datos, non varias medias, o erro estándar da media é estimado en lugar de medido.

    En matemáticas, o erro estándar da media calcúlase coa seguinte fórmula:

    Onde SD é a desviación estándar e n é o tamaño da mostra (o número de valores da mostra).

    Nas túas follas de cálculo de Excel, podes usar a función COUNT para obter o númerode valores nunha mostra, SQRT para tomar unha raíz cadrada dese número e STDEV.S para calcular a desviación estándar dunha mostra.

    En conxunto, obtén o erro estándar da fórmula da media en Excel. :

    STDEV.S( rango )/SQRT(COUNT( rango ))

    Asumindo que os datos da mostra están en B2:B10, a nosa fórmula SEM sería o seguinte :

    =STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))

    E o resultado pode ser semellante a este:

    Como engadir barras de desviación estándar en Excel

    Para mostrar visualmente unha marxe da desviación estándar, pode engadir barras de desviación estándar ao seu gráfico de Excel. Vexa como:

    1. Cree un gráfico do xeito habitual ( Inserir pestana > Gráficos grupo).
    2. Fai clic en calquera lugar do gráfico para seleccionalo e, a continuación, faga clic no botón Elementos do gráfico .
    3. Faga clic na frecha situada xunto a Barras de erros e escolla Desviación estándar .

    Isto inserirá as mesmas barras de desviación estándar para todos os puntos de datos.

    Así é como facer a desviación estándar en Excel. Espero que che resulte útil esta información. De todos os xeitos, agradézoche a lectura e espero verte no noso blog a vindeira semana.

    é 5 (redondeado a un número enteiro), o que nos indica que a maioría das puntuacións non están a máis de 5 puntos da media. Iso é bo? Ben, si, indica que as puntuacións de Bioloxía dos estudantes son bastante consistentes.

    Para Matemáticas, a desviación estándar é 23. Mostra que hai unha gran dispersión (dispersión) nas puntuacións, o que significa que algúns os estudantes tiveron un rendemento moito mellor e/ou algúns obtiveron un rendemento moito peor que a media.

    Na práctica, a desviación estándar adoita ser utilizada polos analistas empresariais como unha medida do risco de investimento: canto maior sexa a desviación estándar, maior será a volatilidade. dos retornos.

    Desviación estándar da mostra fronte á desviación estándar da poboación

    En relación á desviación estándar, é posible que escoites a miúdo os termos "mostra" e "poboación", que fan referencia á integridade de os datos cos que está a traballar. A principal diferenza é a seguinte:

    • A poboación inclúe todos os elementos dun conxunto de datos.
    • A mostra é un subconxunto de datos que inclúen un ou máis elementos da poboación.

    Os investigadores e analistas operan sobre a desviación típica dunha mostra e poboación en diferentes situacións. Por exemplo, ao resumir as puntuacións dos exames dunha clase de estudantes, un profesor utilizará a desviación estándar da poboación. Os estatísticos que calculan a puntuación media nacional do SAT usarían unha desviación estándar da mostra porquepreséntanse só cos datos dunha mostra, non de toda a poboación.

    Entender a fórmula da desviación estándar

    A razón pola que a natureza dos datos importa é porque a desviación estándar da poboación e a mostra a desviación estándar calcúlase con fórmulas lixeiramente diferentes:

    Desviación estándar da mostra

    Desviación estándar da poboación

    Onde:

    • x i son valores individuais do conxunto de datos
    • x é a media de todos os x valores
    • n é o número total de valores x no conxunto de datos

    Tes dificultades para comprender as fórmulas? Dividilos en pasos sinxelos pode axudar. Pero primeiro, imos ter algúns datos de mostra para traballar:

    1. Calcula a media (media)

    En primeiro lugar, atopa a media de todos os valores do conxunto de datos ( x nas fórmulas anteriores). Cando calculas a man, sumas os números e despois divídese a suma polo reconto deses números, así:

    (1+2+4+5+6+8+9)/7=5

    Para atopar a media en Excel, use a función MEDIA, p. ex. =PROMEDIO(A2:G2)

    2. Para cada número, resta a media e o resultado ao cadrado

    Esta é a parte da fórmula de desviación estándar que di: ( x i - x )2

    Para visualizar o que realmente está a suceder, bótalle unha olladaas seguintes imaxes.

    Neste exemplo, a media é 5, polo que calculamos a diferenza entre cada punto de datos e 5.

    Entón, cadra as diferenzas, converténdoas todas en números positivos:

    3. Sume as diferenzas ao cadrado

    Para dicir "resumar as cousas" en matemáticas, usa sigma Σ. Entón, o que facemos agora é sumar as diferenzas ao cadrado para completar esta parte da fórmula: Σ( x i - x )2

    16 + 9 + 1 + 1 + 9 + 16 = 52

    4. Divide as diferenzas totais ao cadrado polo reconto de valores

    Ata o momento, as fórmulas de desviación estándar da mostra e da desviación estándar da poboación foron idénticas. Neste punto, son diferentes.

    Para a desviación estándar da mostra , obtén a varianza da mostra dividindo as diferenzas cadradas totais polo tamaño da mostra menos 1:

    52 / (7-1) = 8,67

    Para a desviación estándar da poboación , atópase a media das diferenzas cadradas dividindo o total diferenzas ao cadrado polo seu reconto:

    52 / 7 = 7,43

    Por que esta diferenza nas fórmulas? Porque na fórmula de desviación estándar da mostra, cómpre corrixir o sesgo na estimación dunha media mostral en lugar da media da poboación real. E fai isto usando n - 1 en lugar de n , que se chama corrección de Bessel.

    5. Toma a raíz cadrada

    Por último, toma a raíz cadrada do anteriornúmeros e obterá a súa desviación estándar (nas ecuacións seguintes, redondeada a 2 decimais):

    Desviación estándar da mostra Desviación estándar da poboación
    √ 8,67 = 2,94 √ 7,43 = 2,73

    En Microsoft Excel, a desviación estándar calcúlase no do mesmo xeito, pero todos os cálculos anteriores realízanse detrás de escena. A clave para ti é escoller unha función de desviación estándar adecuada, sobre a que a seguinte sección dará algunhas pistas.

    Como calcular a desviación estándar en Excel

    En xeral, hai seis diferentes funcións para atopar a desviación estándar en Excel. Cal usar depende principalmente da natureza dos datos cos que está a traballar, se é a poboación enteira ou unha mostra.

    Funcións para calcular a desviación estándar da mostra en Excel

    Para calcular o estándar desviación baseada nunha mostra, use unha das seguintes fórmulas (todas elas están baseadas no método "n-1" descrito anteriormente).

    A función STDEV de Excel

    STDEV(number1,[number2],…) é o Excel máis antigo función para estimar a desviación estándar baseándose nunha mostra, e está dispoñible en todas as versións de Excel 2003 a 2019.

    En Excel 2007 e posteriores, STDEV pode aceptar ata 255 argumentos que se poden representar mediante números, matrices , intervalos con nome ou referencias a celas que conteñan números. En Excel 2003, a función só pode aceptar ata30 argumentos.

    Contanse os valores lóxicos e as representacións de texto dos números que se proporcionan directamente na lista de argumentos. Nas matrices e referencias só se contan os números; as celas baleiras, os valores lóxicos de VERDADEIRO e FALSO, o texto e os valores de erro son ignorados.

    Nota. Excel STDEV é unha función obsoleta, que se mantén nas versións máis recentes de Excel só para compatibilidade con versións anteriores. Non obstante, Microsoft non fai promesas con respecto ás futuras versións. Polo tanto, en Excel 2010 e posteriores, recoméndase usar STDEV.S en lugar de STDEV.

    A función de Excel STDEV.S

    STDEV.S(number1,[number2],…) é unha versión mellorada de STDEV, introducida en Excel 2010.

    Como STDEV, a función STDEV.S calcula a desviación estándar da mostra dun conxunto de valores baseándose na fórmula clásica de desviación estándar da mostra que se comenta na sección anterior.

    Función Excel STDEVA

    STDEVA(value1, [value2], …) é outra función para calcular a desviación estándar dunha mostra en Excel. Difire dos dous anteriores só na forma en que manexa os valores lóxicos e de texto:

    • Todos os valores lóxicos cóntanse, tanto se están contidos en matrices ou referencias, como se escriben directamente. na lista de argumentos (TRUE avalíase como 1, FALSE avalíase como 0).
    • Os valores de texto dentro de matrices ou argumentos de referencia cóntanse como 0, incluídas cadeas baleiras (""), texto representacións de números e calquera outro texto. Representacións textuales deos números proporcionados directamente na lista de argumentos cóntanse como os números que representan (aquí tes un exemplo de fórmula).
    • Ignoranse as celas baleiras.

    Nota. Para que unha fórmula de desviación estándar de mostra funcione correctamente, os argumentos proporcionados deben conter polo menos dous valores numéricos, senón o #DIV/0! devólvese o erro.

    Funcións para calcular a desviación estándar da poboación en Excel

    Se está a tratar con toda a poboación, use unha das seguintes funcións para facer a desviación estándar en Excel. Estas funcións baséanse no método "n".

    A función Excel STDEVP

    STDEVP(number1,[number2],…) é a antiga función de Excel para atopar a desviación estándar dunha poboación.

    Nas novas versións de Excel 2010, 2013, 2016 e 2019, substitúese pola función STDEV.P mellorada, pero aínda se mantén para a compatibilidade con versións anteriores.

    A función STDEV.P de Excel

    STDEV.P(number1,[number2],…) é a moderna versión da función STDEVP que proporciona unha precisión mellorada. Está dispoñible en Excel 2010 e versións posteriores.

    Como as súas contrapartes de desviación estándar de mostra, dentro de matrices ou argumentos de referencia, as funcións STDEVP e STDEV.P só contan números. Na lista de argumentos, tamén contan os valores lóxicos e as representacións de texto dos números.

    A función Excel STDEVPA

    STDEVPA(value1, [value2], …) calcula a desviación estándar dunha poboación, incluíndo texto e valores lóxicos. No que respecta aos non numéricosvalores, STDEVPA funciona exactamente igual que a función STDEVA.

    Nota. Sexa cal sexa a fórmula de desviación estándar de Excel que use, devolverá un erro se un ou máis argumentos conteñen un valor de erro devolto por outra función ou texto que non se pode interpretar como un número.

    Que función de desviación estándar de Excel usar?

    Unha variedade de funcións de desviación estándar en Excel definitivamente poden causar un desastre, especialmente aos usuarios sen experiencia. Para escoller a fórmula de desviación estándar correcta para unha tarefa concreta, só tes que responder ás 3 preguntas seguintes:

    • Calculas a desviación estándar dunha mostra ou poboación?
    • Que versión de Excel utilizas usar?
    • O seu conxunto de datos inclúe só números ou valores lóxicos e tamén texto?

    Para calcular a desviación estándar baseándose nunha mostra numérica, use o función STDEV.S en Excel 2010 e posteriores; STDEV en Excel 2007 e anteriores.

    Para atopar a desviación estándar dunha poboación , use a función STDEV.P en Excel 2010 e posteriores; STDEVP en Excel 2007 e anteriores.

    Se desexa que os valores lóxicos ou texto se inclúan no cálculo, use STDEVA (desviación estándar de mostra) ou STDEVPA ( desviación estándar da poboación). Aínda que non se me ocorre ningún escenario no que calquera das dúas funcións poida ser útil por si mesma, poden ser útiles en fórmulas máis grandes, onde un ou máis argumentos son devoltos poroutras funcións como valores lóxicos ou representacións de texto de números.

    Para axudarche a decidir cal das funcións de desviación estándar de Excel se adaptan máis ás túas necesidades, consulta a seguinte táboa que resume a información que xa aprendeu.

    <3 4>Ignorado
    STDEV STDEV.S STDEVP STDEV.P STDEVA STDEVPA
    Versión de Excel 2003 - 2019 2010 - 2019 2003 - 2019 2010 - 2019 2003 - 2019 2003 - 2019
    Mostra
    Poboación
    Valores lóxicos en matrices ou referencias Ignorado Avaliado

    (VERDADEIRO=1, FALSO=0)

    Texto en matrices ou referencias Ignorado Avaliado como cero
    Valores lóxicos e "números de texto" na lista de argumentos Avaliado

    (VERDADEIRO =1, FALSO=0)

    Celas baleiras

    Exemplos de fórmulas de desviación estándar de Excel

    Unha vez elixida a función que corresponde ao seu tipo de datos, non debería haber dificultades para escribir o fórmula: a sintaxe é tan sinxela e transparente que non deixa lugar a erros :) Os seguintes exemplos mostran un par de fórmulas de desviación estándar de Excel en acción.

    Calculo estándar

    Michael Brown é un entusiasta da tecnoloxía dedicada á súa paixón por simplificar procesos complexos mediante ferramentas de software. Con máis dunha década de experiencia na industria tecnolóxica, perfeccionou as súas habilidades en Microsoft Excel e Outlook, así como en Follas de cálculo e Documentos de Google. O blog de Michael está dedicado a compartir o seu coñecemento e experiencia con outros, proporcionando consellos e titoriais fáciles de seguir para mellorar a produtividade e a eficiencia. Tanto se es un profesional experimentado como un principiante, o blog de Michael ofrece valiosas ideas e consellos prácticos para sacar o máximo proveito destas ferramentas de software esenciais.