Tabla de contenido
El tutorial explica la esencia de la desviación estándar y el error estándar de la media, así como qué fórmula es mejor utilizar para calcular la desviación estándar en Excel.
En estadística descriptiva, la media aritmética (también llamada promedio) y la desviación típica son dos conceptos estrechamente relacionados. Pero mientras que el primero es bien entendido por la mayoría, el segundo es comprendido por pocos. El objetivo de este tutorial es arrojar algo de luz sobre qué es realmente la desviación típica y cómo calcularla en Excel.
¿Qué es la desviación típica?
En desviación típica es una medida que indica cuánto se desvían (dispersan) de la media los valores del conjunto de datos. Dicho de otro modo, la desviación típica muestra si los datos se acercan a la media o fluctúan mucho.
El propósito de la desviación típica es ayudarle a comprender si la media devuelve realmente un dato "típico". Cuanto más se acerque la desviación típica a cero, menor será la variabilidad de los datos y más fiable será la media. La desviación típica igual a 0 indica que cada valor del conjunto de datos es exactamente igual a la media. Cuanto mayor sea la desviación típica, mayor será la variación en los datos.datos y menos precisa es la media.
Para hacerse una mejor idea de cómo funciona, eche un vistazo a los siguientes datos:
Para Biología, la desviación típica es de 5 (redondeada a un número entero), lo que nos indica que la mayoría de las puntuaciones no se alejan más de 5 puntos de la media. ¿Es eso bueno? Pues sí, indica que las puntuaciones de Biología de los alumnos son bastante coherentes.
En el caso de las Matemáticas, la desviación típica es de 23. Esto demuestra que existe una gran dispersión en las puntuaciones, lo que significa que algunos alumnos obtuvieron resultados mucho mejores o mucho peores que la media.
En la práctica, los analistas empresariales suelen utilizar la desviación típica como medida del riesgo de inversión: cuanto mayor sea la desviación típica, mayor será la volatilidad de los rendimientos.
Desviación típica de la muestra frente a desviación típica de la población
En relación con la desviación típica, es posible que oiga a menudo los términos "muestra" y "población", que se refieren a la integridad de los datos con los que se trabaja. La principal diferencia es la siguiente:
- Población incluye todos los elementos de un conjunto de datos.
- Muestra es un subconjunto de datos que incluye uno o más elementos de la población.
Los investigadores y analistas operan con la desviación típica de una muestra y de una población en diferentes situaciones. Por ejemplo, al resumir las puntuaciones de los exámenes de una clase de alumnos, un profesor utilizará la desviación típica de la población. Los estadísticos que calculan la puntuación media nacional del SAT utilizarían una desviación típica de la muestra porque se les presentan los datos de una muestra únicamente, node toda la población.
Comprender la fórmula de la desviación típica
La razón por la que la naturaleza de los datos es importante es porque la desviación típica de la población y la desviación típica de la muestra se calculan con fórmulas ligeramente diferentes:
Desviación típica de la muestra | Desviación típica de la población |
Dónde:
- x i son valores individuales del conjunto de datos
- x es la media de todos los x valores
- n es el número total de x valores del conjunto de datos
Si tiene dificultades para entender las fórmulas, puede que le ayude desglosarlas en pasos sencillos. Pero antes, vamos a trabajar con algunos datos de ejemplo:
1. Calcular la media
En primer lugar, se calcula la media de todos los valores del conjunto de datos ( x Cuando se calcula a mano, se suman los números y luego se divide la suma por la cuenta de esos números, así:
(1+2+4+5+6+8+9)/7=5
Para hallar la media en Excel, utiliza la función MEDIA, por ejemplo =MEDIA(A2:G2)
2. Para cada número, resta la media y eleva el resultado al cuadrado
Esta es la parte de la fórmula de la desviación típica que dice: ( x i - x )2
Para visualizar lo que ocurre en realidad, eche un vistazo a las siguientes imágenes.
En este ejemplo, la media es 5, por lo que calculamos la diferencia entre cada punto de datos y 5.
Luego, elevas al cuadrado las diferencias, convirtiéndolas todas en números positivos:
3. Suma las diferencias al cuadrado
Para decir "sumar cosas" en matemáticas, se utiliza sigma Σ. Así que, lo que hacemos ahora es sumar las diferencias al cuadrado para completar esta parte de la fórmula: Σ( x i - x )2
16 + 9 + 1 + 1 + 9 + 16 = 52
4. Divida las diferencias totales al cuadrado por el recuento de valores.
Hasta ahora, las fórmulas de la desviación típica muestral y de la desviación típica poblacional han sido idénticas. En este momento, son diferentes.
Para el desviación típica de la muestra , se obtiene el varianza de la muestra dividiendo las diferencias totales al cuadrado por el tamaño de la muestra menos 1:
52 / (7-1) = 8.67
Para el desviación típica de la población , se encuentra el media de las diferencias al cuadrado dividiendo las diferencias totales al cuadrado por su recuento:
52 / 7 = 7.43
¿Por qué esta diferencia en las fórmulas? Porque en la fórmula de la desviación típica muestral, hay que corregir el sesgo en la estimación de una media muestral en lugar de la verdadera media poblacional. Y esto se hace utilizando n - 1 en lugar de n que se denomina corrección de Bessel.
5. Saca la raíz cuadrada
Por último, saca la raíz cuadrada de los números anteriores y obtendrás tu desviación típica (en las ecuaciones siguientes, redondeada a 2 decimales):
Desviación típica de la muestra | Desviación típica de la población |
√ 8.67 = 2.94 | √ 7.43 = 2.73 |
En Microsoft Excel, la desviación típica se calcula de la misma manera, pero todos los cálculos anteriores se realizan entre bastidores. Lo fundamental para usted es elegir una función de desviación típica adecuada, sobre la que la siguiente sección le dará algunas pistas.
Cómo calcular la desviación típica en Excel
En general, existen seis funciones diferentes para hallar la desviación típica en Excel. Cuál utilizar depende principalmente de la naturaleza de los datos con los que se esté trabajando - si se trata de toda la población o de una muestra.
Funciones para calcular la desviación típica muestral en Excel
Para calcular la desviación típica a partir de una muestra, utilice una de las fórmulas siguientes (todas ellas se basan en el método "n-1" descrito anteriormente).
Función STDEV de Excel
STDEV(número1,[número2],...)
es la función más antigua de Excel para estimar la desviación estándar basada en una muestra, y está disponible en todas las versiones de Excel de 2003 a 2019.
En Excel 2007 y versiones posteriores, STDEV puede aceptar hasta 255 argumentos que pueden estar representados por números, matrices, rangos con nombre o referencias a celdas que contengan números. En Excel 2003, la función sólo puede aceptar hasta 30 argumentos.
Se cuentan los valores lógicos y las representaciones de texto de los números suministrados directamente en la lista de argumentos. En las matrices y referencias, sólo se cuentan los números; se ignoran las celdas vacías, los valores lógicos de TRUE y FALSE, el texto y los valores de error.
Nota: Excel STDEV es una función obsoleta, que se mantiene en las nuevas versiones de Excel sólo por compatibilidad con versiones anteriores. Sin embargo, Microsoft no hace promesas con respecto a las versiones futuras. Por lo tanto, en Excel 2010 y posteriores, se recomienda utilizar STDEV.S en lugar de STDEV.
Función STDEV.S de Excel
STDEV.S(número1,[número2],...)
es una versión mejorada de STDEV, introducida en Excel 2010.
Al igual que STDEV, la función STDEV.S calcula la desviación típica muestral de un conjunto de valores basándose en la fórmula clásica de desviación típica muestral comentada en el apartado anterior.
Función STDEVA de Excel
STDEVA(valor1, [valor2], ...)
es otra función para calcular la desviación estándar de una muestra en Excel. Difiere de las dos anteriores sólo en la forma en que maneja los valores lógicos y de texto:
- Todos valores lógicos se cuentan, tanto si están contenidos dentro de matrices o referencias, como si se escriben directamente en la lista de argumentos (TRUE se evalúa como 1, FALSE se evalúa como 0).
- Valores de texto dentro de matrices o argumentos de referencia se cuentan como 0, incluidas las cadenas vacías (""), las representaciones de texto de números y cualquier otro texto. Las representaciones de texto de números suministradas directamente en la lista de argumentos se cuentan como los números que representan (he aquí un ejemplo de fórmula).
- Las celdas vacías se ignoran.
¡Nota: Para que la fórmula de la desviación típica de una muestra funcione correctamente, los argumentos suministrados deben contener al menos dos valores numéricos; de lo contrario, se devuelve el error #DIV/0!
Funciones para calcular la desviación típica de la población en Excel
Si está tratando con toda la población, utilice una de las siguientes funciones para hacer la desviación estándar en Excel. Estas funciones se basan en el método "n".
Función STDEVP de Excel
STDEVP(número1,[número2],...)
es la antigua función de Excel para hallar la desviación estándar de una población.
En las nuevas versiones de Excel 2010, 2013, 2016 y 2019, se sustituye por la función STDEV.P mejorada, pero se sigue manteniendo por compatibilidad con versiones anteriores.
Función STDEV.P de Excel
STDEV.P(número1,[número2],...)
es la versión moderna de la función STDEVP que proporciona una precisión mejorada. Está disponible en Excel 2010 y versiones posteriores.
Al igual que sus homólogas de desviación estándar muestral, dentro de matrices o argumentos de referencia, las funciones STDEVP y STDEV.P sólo cuentan números. En la lista de argumentos, también cuentan valores lógicos y representaciones textuales de números.
Función STDEVPA de Excel
STDEVPA(valor1, [valor2], ...)
calcula la desviación estándar de una población, incluyendo valores de texto y lógicos. Con respecto a los valores no numéricos, STDEVPA funciona exactamente igual que la función STDEVA.
Nota. Cualquiera que sea la fórmula de desviación estándar de Excel que utilices, devolverá un error si uno o más argumentos contienen un valor de error devuelto por otra función o un texto que no puede interpretarse como un número.
¿Qué función de desviación estándar de Excel utilizar?
Una variedad de funciones de desviación estándar en Excel puede definitivamente causar un lío, especialmente a los usuarios inexpertos. Para elegir la fórmula de desviación estándar correcta para una tarea en particular, sólo tienes que responder a las siguientes 3 preguntas:
- ¿Se calcula la desviación típica de una muestra o de una población?
- ¿Qué versión de Excel utiliza?
- ¿Su conjunto de datos incluye sólo números o también valores lógicos y texto?
Para calcular la desviación típica a partir de un valor numérico muestra Utilice la función STDEV.S en Excel 2010 y versiones posteriores; STDEV en Excel 2007 y versiones anteriores.
Para hallar la desviación típica de un población Utilice la función STDEV.P en Excel 2010 y versiones posteriores; STDEVP en Excel 2007 y versiones anteriores.
Si quieres lógico o texto Si desea incluir valores en el cálculo, utilice STDEVA (desviación típica muestral) o STDEVPA (desviación típica poblacional). Aunque no se me ocurre ningún escenario en el que alguna de las dos funciones pueda ser útil por sí sola, pueden resultar útiles en fórmulas más grandes, donde uno o más argumentos son devueltos por otras funciones como valores lógicos o representaciones textuales de números.
Para ayudarte a decidir cuál de las funciones de desviación estándar de Excel se adapta mejor a tus necesidades, revisa la siguiente tabla que resume la información que ya has aprendido.
STDEV | STDEV.S | STDEVP | STDEV.P | STDEVA | STDEVPA | |
Versión Excel | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2010 - 2019 | 2003 - 2019 | 2003 - 2019 |
Muestra | ✓ | ✓ | ✓ | |||
Población | ✓ | ✓ | ✓ | |||
Valores lógicos en matrices o referencias | Ignorado | Evaluado (VERDADERO=1, FALSO=0) | ||||
Texto en matrices o referencias | Ignorado | Evaluado como cero | ||||
Valores lógicos y "números de texto" en la lista de argumentos | Evaluado (VERDADERO=1, FALSO=0) | |||||
Celdas vacías | Ignorado |
Ejemplos de fórmulas de desviación estándar en Excel
Una vez elegida la función que corresponde a su tipo de datos, no debería haber dificultades para escribir la fórmula - la sintaxis es tan sencilla y transparente que no deja lugar a errores :) Los siguientes ejemplos muestran un par de fórmulas de desviación estándar de Excel en acción.
Cálculo de la desviación típica de una muestra y de una población
Dependiendo de la naturaleza de sus datos, utilice una de las siguientes fórmulas:
- Para calcular la desviación típica a partir de toda la población es decir, la lista completa de valores (B2:B50 en este ejemplo), utilice la función STDEV.P:
=STDEV.P(B2:B50)
- Para hallar la desviación típica a partir de una muestra que constituye una parte, o subconjunto, de la población (B2:B10 en este ejemplo), utilice la función STDEV.S:
=STDEV.S(B2:B10)
Como puede ver en la siguiente captura de pantalla, las fórmulas arrojan cifras ligeramente diferentes (cuanto más pequeña es la muestra, mayor es la diferencia):
En Excel 2007 y versiones inferiores, se utilizan las funciones STDEVP y STDEV:
- Para obtener la desviación típica de la población:
=STDEVP(B2:B50)
- Para calcular la desviación típica de la muestra:
=STDEV(B2:B10)
Cálculo de la desviación típica para representaciones textuales de números
Cuando hablamos de diferentes funciones para calcular la desviación estándar en Excel, a veces mencionamos las "representaciones de texto de los números" y puede que tenga curiosidad por saber qué significa eso en realidad.
En este contexto, las "representaciones textuales de números" son simplemente números formateados como texto. ¿Cómo pueden aparecer estos números en sus hojas de cálculo? La mayoría de las veces, son exportados desde fuentes externas. O, devueltos por las llamadas funciones de texto que están diseñadas para manipular cadenas de texto, por ejemplo, TEXT, MID, RIGHT, LEFT, etc. Algunas de estas funciones también pueden trabajar con números, pero su salida es siempre texto, inclusosi se parece mucho a un número.
Para ilustrar mejor el punto, considere el siguiente ejemplo. Suponga que tiene una columna de códigos de producto como "Jeans-105" donde los dígitos después de un guión denotan la cantidad. Su objetivo es extraer la cantidad de cada artículo, y luego encontrar la desviación estándar de los números extraídos.
Tirar la cantidad a otra columna no es un problema:
=DERECHA(A2,LEN(A2)-BUSCAR("-",A2,1))
El problema es que al utilizar una fórmula de desviación estándar de Excel en los números extraídos se obtiene #DIV/0! o 0, como se muestra en la siguiente captura de pantalla:
¿Por qué resultados tan extraños? Como se ha mencionado anteriormente, la salida de la función DERECHA es siempre una cadena de texto. Pero ni STDEV.S ni STDEVA pueden manejar números formateados como texto en las referencias (el primero simplemente los ignora mientras que el segundo los cuenta como ceros). Para obtener la desviación estándar de tales "números-texto", es necesario suministrarlos directamente a la lista de argumentos, lo que puede hacerse incrustando todos losRIGHT en su fórmula STDEV.S o STDEVA:
=STDEV.S(DERECHA(A2,LONGITUD(A2)-BÚSQUEDA("-",A2,1)), DERECHA(A3,LONGITUD(A3)-BÚSQUEDA("-",A3,1)), DERECHA(A4,LONGITUD(A4)-BÚSQUEDA("-",A4,1)), DERECHA(A5,LONGITUD(A5)-BÚSQUEDA("-",A5,1))
=STDEVA(RIGHT(A2,LEN(A2)-SEARCH("-",A2,1)), RIGHT(A3,LEN(A3)-SEARCH("-",A3,1)), RIGHT(A4,LEN(A4)-SEARCH("-",A4,1)), RIGHT(A5,LEN(A5)-SEARCH("-",A5,1))
Las fórmulas son un poco engorrosas, pero podría ser una solución para una muestra pequeña. Para una muestra más grande, por no hablar de toda la población, definitivamente no es una opción. En este caso, una solución más elegante sería tener la función VALOR convertir "texto-números" a los números que cualquier fórmula de desviación estándar puede entender (por favor, observe los números alineados a la derecha en la captura de pantallaa diferencia de las cadenas de texto alineadas a la izquierda en la captura de pantalla anterior):
Cómo calcular el error estándar de la media en Excel
En estadística, existe una medida más para estimar la variabilidad de los datos - error estándar de la media La desviación típica y el error típico de la media son dos conceptos estrechamente relacionados, pero no son lo mismo.
Mientras que la desviación típica mide la variabilidad de un conjunto de datos con respecto a la media, el error típico de la media (SEM) estima la probabilidad de que la media muestral se aleje de la verdadera media de la población. Dicho de otro modo: si se toman varias muestras de la misma población, el error típico de la media mostraría la dispersión entre esas medias muestrales. Como normalmente sólo calculamos unamedia de un conjunto de datos, no medias múltiples, el error estándar de la media se estima en lugar de medirse.
En matemáticas, el error típico de la media se calcula con esta fórmula:
Dónde SD es la desviación típica, y n es el tamaño de la muestra (el número de valores de la muestra).
En las hojas de cálculo de Excel, puede utilizar la función COUNT para obtener el número de valores de una muestra, SQRT para sacar la raíz cuadrada de ese número y STDEV.S para calcular la desviación típica de una muestra.
Juntando todo esto, se obtiene la fórmula del error típico de la media en Excel:
STDEV.S( gama )/SQRT(COUNT( gama ))Suponiendo que los datos de la muestra estén en B2:B10, nuestra fórmula SEM sería la siguiente:
=STDEV.S(B2:B10)/SQRT(COUNT(B2:B10))
Y el resultado podría ser similar a este:
Cómo añadir barras de desviación estándar en Excel
Para mostrar visualmente un margen de la desviación típica, puede añadir barras de desviación típica a su gráfico de Excel. He aquí cómo hacerlo:
- Cree un gráfico de la forma habitual ( Inserte tab> Gráficos grupo).
- Haga clic en cualquier parte del gráfico para seleccionarlo y, a continuación, haga clic en el botón Elementos del gráfico botón.
- Haga clic en la flecha situada junto a Barras de error y elige Desviación típica .
Esto insertará las mismas barras de desviación estándar para todos los puntos de datos.
Así se hace la desviación estándar en Excel. Espero que esta información te resulte útil. En fin, te doy las gracias por leer y espero verte en nuestro blog la semana que viene.