Tabla de contenido
En este tutorial, veremos cómo hacer un análisis de varianza en Excel y qué fórmulas utilizar para hallar la varianza de una muestra y una población.
La varianza es una de las herramientas más útiles de la teoría de la probabilidad y la estadística. En ciencia, describe la distancia que separa cada número del conjunto de datos de la media. En la práctica, a menudo muestra cuánto cambia algo. Por ejemplo, la temperatura cerca del ecuador tiene menos varianza que en otras zonas climáticas. En este artículo, analizaremos distintos métodos para calcular la varianza en Excel.
¿Qué es la varianza?
Desviación es la medida de variabilidad de un conjunto de datos que indica la dispersión de los distintos valores. Matemáticamente, se define como la media de las diferencias al cuadrado con respecto a la media.
Para comprender mejor lo que se calcula realmente con la varianza, considere este sencillo ejemplo.
Supongamos que en tu zoo hay 5 tigres de 14, 10, 8, 6 y 2 años.
Para encontrar la varianza, siga estos sencillos pasos:
- Calcula la media (media simple) de los cinco números:
- De cada número, resta la media para hallar las diferencias. Para visualizarlo, tracemos las diferencias en el gráfico:
- Cuadra cada diferencia.
- Calcula la media de las diferencias al cuadrado.
Así pues, la varianza es de 16. Pero, ¿qué significa realmente esta cifra?
En realidad, la varianza sólo da una idea muy general de la dispersión del conjunto de datos. Un valor de 0 significa que no hay variabilidad, es decir, que todos los números del conjunto de datos son iguales. Cuanto mayor sea el número, más dispersos estarán los datos.
Este ejemplo es para la varianza de la población (es decir, 5 tigres son todo el grupo que le interesa). Si sus datos son una selección de una población mayor, entonces tendrá que calcular la varianza de la muestra utilizando una fórmula ligeramente diferente.
Cómo calcular la varianza en Excel
Existen 6 funciones incorporadas para realizar la varianza en Excel: VAR, VAR.S, VARP, VAR.P, VARA y VARPA.
La elección de la fórmula de varianza viene determinada por los siguientes factores:
- La versión de Excel que está utilizando.
- Si se calcula la varianza muestral o poblacional.
- Si desea evaluar o ignorar los valores de texto y lógicos.
Funciones de varianza de Excel
La siguiente tabla proporciona una visión general de las funciones de variación disponibles en Excel para ayudarle a elegir la fórmula que mejor se adapte a sus necesidades.
Nombre | Versión Excel | Tipo de datos | Texto y lógicas |
VAR | 2000 - 2019 | Muestra | Ignorado |
VAR.S | 2010 - 2019 | Muestra | Ignorado |
VARA | 2000 - 2019 | Muestra | Evaluado |
VARP | 2000 - 2019 | Población | Ignorado |
VAR.P | 2010 - 2019 | Población | Ignorado |
VARPA | 2000 - 2019 | Población | Evaluado |
VAR.S frente a VARA y VAR.P frente a VARPA
VARA y VARPA difieren de otras funciones de varianza sólo en la forma en que tratan los valores lógicos y de texto en las referencias. La siguiente tabla proporciona un resumen de cómo se evalúan las representaciones de texto de los números y los valores lógicos.
Tipo de argumento | VAR, VAR.S, VARP, VAR.P | VARA & VARPA |
Valores lógicos en matrices y referencias | Ignorado | Evaluado (VERDADERO=1, FALSO=0) Ver también: Cómo agrupar columnas en Excel |
Representaciones textuales de números en matrices y referencias | Ignorado | Evaluado como cero |
Valores lógicos y representaciones textuales de números introducidos directamente en los argumentos | Evaluado (VERDADERO=1, FALSO=0) | |
Celdas vacías | Ignorado |
Cómo calcular la varianza muestral en Excel
A muestra es un conjunto de datos extraídos de toda la población. Y la varianza calculada a partir de una muestra se denomina varianza de la muestra .
Por ejemplo, si se quiere saber cómo varía la estatura de las personas, sería técnicamente inviable medir a todas las personas de la Tierra. La solución es tomar una muestra de la población, digamos 1.000 personas, y estimar las estaturas de toda la población basándose en esa muestra.
La varianza de la muestra se calcula con esta fórmula:
Dónde:
- x̄ es la media (promedio simple) de los valores de la muestra.
- n es el tamaño de la muestra, es decir, el número de valores de la muestra.
Existen 3 funciones para encontrar la varianza muestral en Excel: VAR, VAR.S y VARA.
Función VAR en Excel
Es la función más antigua de Excel para estimar la varianza basada en una muestra. La función VAR está disponible en todas las versiones de Excel 2000 a 2019.
VAR(número1, [número2], ...)Nota: En Excel 2010, la función VAR se sustituyó por VAR.S, que proporciona una mayor precisión. Aunque VAR sigue estando disponible por compatibilidad con versiones anteriores, se recomienda utilizar VAR.S en las versiones actuales de Excel.
Función VAR.S en Excel
Es la contrapartida moderna de la función VAR de Excel. Utilice la función VAR.S para hallar la varianza muestral en Excel 2010 y versiones posteriores.
VAR.S(número1, [número2], ...)Función VARA en Excel
La función VARA de Excel devuelve una varianza de muestra basada en un conjunto de números, texto y valores lógicos como se muestra en esta tabla.
VARA(valor1, [valor2], ...)Ejemplo de fórmula de varianza en Excel
Cuando se trabaja con un conjunto numérico de datos se puede utilizar cualquiera de las funciones anteriores para calcular la varianza de la muestra en Excel.
Como ejemplo, vamos a hallar la varianza de una muestra compuesta por 6 elementos (B2:B7). Para ello, puedes utilizar una de las fórmulas siguientes:
=VAR(B2:B7)
=VAR.S(B2:B7)
=VARA(B2:B7)
Como se muestra en la captura de pantalla, todas las fórmulas devuelven el mismo resultado (redondeado a 2 decimales):
Para comprobar el resultado, hagamos el cálculo var manualmente:
- Halla la media utilizando la función PROMEDIO:
=MEDIA(B2:B7)
La media va a cualquier celda vacía, digamos B8.
- Resta la media de cada número de la muestra:
=B2-$B$8
Las diferencias van a la columna C, empezando en C2.
- Eleva al cuadrado cada diferencia y pon los resultados en la columna D, empezando por D2:
=C2^2
- Sume las diferencias al cuadrado y divida el resultado por el número de elementos de la muestra menos 1:
=SUMA(D2:D7)/(6-1)
Como puede ver, el resultado de nuestro cálculo var manual es exactamente el mismo que el número devuelto por las funciones incorporadas de Excel:
Si su conjunto de datos contiene el Booleano y/o texto La razón es que VAR y VAR.S ignoran cualquier valor que no sea un número en las referencias, mientras que VARA evalúa los valores de texto como ceros, TRUE como 1 y FALSE como 0. Por lo tanto, elija cuidadosamente la función de varianza para sus cálculos dependiendo de si desea procesar o ignorar texto y valores lógicos.
Cómo calcular la varianza de la población en Excel
Población son todos los miembros de un grupo determinado, es decir, todas las observaciones del ámbito de estudio. Varianza de la población describe cómo se reparten los puntos de datos en toda la población.
La varianza de la población se puede hallar con esta fórmula:
Dónde:
- x̄ es la media de la población.
- n es el tamaño de la población, es decir, el número total de valores de la población.
Existen 3 funciones para calcular la varianza poblacional en Excel: VARP, VAR.P y VARPA.
Función VARP en Excel
La función VARP de Excel devuelve la varianza de una población basada en todo el conjunto de números. Está disponible en todas las versiones de Excel 2000 a 2019.
VARP(número1, [número2], ...)Nota. En Excel 2010, VARP se sustituyó por VAR.P pero se mantiene por compatibilidad con versiones anteriores. Se recomienda utilizar VAR.P en las versiones actuales de Excel porque no hay garantía de que la función VARP esté disponible en futuras versiones de Excel.
Función VAR.P en Excel
Se trata de una versión mejorada de la función VARP disponible en Excel 2010 y versiones posteriores.
VAR.P(número1, [número2], ...)Función VARPA en Excel
La función VARPA calcula la varianza de una población basándose en todo el conjunto de números, texto y valores lógicos. Está disponible en todas las versiones de Excel 2000 a 2019.
VARA(valor1, [valor2], ...)Fórmula de varianza de la población en Excel
En el ejemplo de cálculo de var, encontramos una varianza de 5 puntuaciones de examen suponiendo que esas puntuaciones eran una selección de un grupo más grande de estudiantes. Si recoge datos de todos los estudiantes del grupo, esos datos representarán a toda la población, y calculará una varianza poblacional utilizando las funciones anteriores.
Supongamos que tenemos las notas de los exámenes de un grupo de 10 alumnos (B2:B11). Las notas constituyen toda la población, por lo que haremos varianza con estas fórmulas:
=VARP(B2:B11)
=VAR.P(B2:B11)
=VARPA(B2:B11)
Y todas las fórmulas devolverán el mismo resultado:
Para asegurarse de que Excel ha hecho bien la varianza, puede comprobarlo con la fórmula de cálculo manual var que se muestra en la captura de pantalla siguiente:
Si algunos de los alumnos no realizaron el examen y tienen N/A en lugar de un número de puntuación, la función VARPA devolverá un resultado diferente. La razón es que VARPA evalúa los valores de texto como ceros mientras que VARP y VAR.P ignoran los valores de texto y lógicos en las referencias. Consulte VAR.P vs. VARPA para obtener todos los detalles.
Fórmula de desviación en Excel - notas de uso
Para realizar correctamente el análisis de varianza en Excel, siga estas sencillas reglas:
- Proporcione argumentos como valores, matrices o referencias de celdas.
- En Excel 2007 y versiones posteriores, puede suministrar hasta 255 argumentos correspondientes a una muestra o población; en Excel 2003 y versiones anteriores, hasta 30 argumentos.
- Evaluar únicamente números en las referencias, ignorando las celdas vacías, el texto y los valores lógicos, utilice la función VAR o VAR.S para calcular la varianza de la muestra y VARP o VAR.P para hallar la varianza de la población.
- Evaluar lógico y texto en referencias, utilice la función VARA o VARPA.
- Proporcionar al menos dos valores numéricos a una fórmula de varianza muestral y al menos un valor numérico ¡a una fórmula de varianza poblacional en Excel, de lo contrario se produce un error #DIV/0!
- Los argumentos que contienen texto que no puede interpretarse como números provocan errores #¡VALOR!
Varianza frente a desviación estándar en Excel
La varianza es, sin duda, un concepto útil en ciencia, pero aporta muy poca información práctica. Por ejemplo, encontramos las edades de la población de tigres de un zoo local y calculamos la varianza, que es igual a 16. La pregunta es: ¿cómo podemos utilizar realmente esta cifra?
Puedes utilizar la varianza para calcular la desviación estándar, que es una medida mucho mejor de la cantidad de variación en un conjunto de datos.
Desviación típica se calcula como la raíz cuadrada de la varianza. Así, tomamos la raíz cuadrada de 16 y obtenemos la desviación típica de 4.
En combinación con la media, la desviación típica puede indicar la edad de la mayoría de los tigres. Por ejemplo, si la media es 8 y la desviación típica es 4, la mayoría de los tigres del zoo tienen entre 4 años (8 - 4) y 12 años (8 + 4).
Microsoft Excel dispone de funciones especiales para calcular la desviación típica de una muestra y de una población. La explicación detallada de todas las funciones se encuentra en este tutorial: Cómo calcular la desviación típica en Excel.
Así es como se hace la varianza en Excel. Para echar un vistazo más de cerca a las fórmulas tratadas en este tutorial, te invito a descargar nuestro libro de trabajo de ejemplo al final de este post. Te doy las gracias por leer y ¡espero verte en nuestro blog la semana que viene!
Cuaderno de prácticas
Calcular la varianza en Excel - ejemplos (.xlsx file)