Tabla de contenido
En este tutorial, aprenderás cómo hacer un diagrama de dispersión en Excel para crear una representación gráfica de dos conjuntos de datos correlacionados.
Cuando miras dos columnas de datos cuantitativos en tu hoja de cálculo Excel, ¿qué ves? Sólo dos conjuntos de números. ¿Quieres ver cómo se relacionan entre sí los dos conjuntos? El gráfico de dispersión es la opción gráfica ideal para ello.
Gráfico de dispersión en Excel
A diagrama de dispersión (también llamado Gráfico XY o diagrama de dispersión ) es un gráfico bidimensional que muestra la relación entre dos variables.
En un gráfico de dispersión, tanto el eje horizontal como el vertical son ejes de valores que trazan datos numéricos. Normalmente, la variable independiente se encuentra en el eje x, y la variable dependiente en el eje y. El gráfico muestra valores en la intersección de un eje x y un eje y, combinados en puntos de datos únicos.
El objetivo principal de un diagrama de dispersión es mostrar la intensidad de la relación, o correlación, entre las dos variables. Cuanto más ajustados estén los puntos de datos a lo largo de una línea recta, mayor será la correlación.
Cómo organizar los datos para un gráfico de dispersión
Con la gran variedad de plantillas de gráficos incorporadas que ofrece Excel, crear un diagrama de dispersión se convierte en una tarea de un par de clics. Pero primero, hay que organizar los datos de origen adecuadamente.
Como ya se ha mencionado, un gráfico de dispersión muestra dos variables cuantitativas interrelacionadas, por lo que se introducen dos conjuntos de datos numéricos en dos columnas separadas.
Para facilitar su uso, el independiente debe estar en la variable izquierda ya que esta columna se va a representar en el eje x. La columna dependiente (la que se ve afectada por la variable independiente) debe estar en el derecha y se representará en el eje Y.
Si la columna dependiente está antes que la independiente y no hay forma de cambiarla en una hoja de cálculo, puede intercambiar los ejes X e Y directamente en un gráfico.
En nuestro ejemplo, vamos a visualizar la relación entre el presupuesto publicitario de un determinado mes (variable independiente) y el número de artículos vendidos (variable dependiente), por lo que ordenamos los datos en consecuencia:
Cómo crear un gráfico de dispersión en Excel
Con los datos de origen correctamente organizados, para hacer un gráfico de dispersión en Excel basta con seguir estos dos rápidos pasos:
- Seleccione dos columnas con datos numéricos, incluidas las cabeceras de las columnas. En nuestro caso, se trata del rango C1:D13. No seleccione ninguna otra columna para no confundir a Excel.
- Ir a la Insertar tab> Chats haga clic en el botón Dispersión Para insertar un gráfico de dispersión clásico, haga clic en la primera miniatura:
El diagrama de dispersión se insertará inmediatamente en su hoja de cálculo:
Básicamente, puede considerar que el trabajo está hecho. O bien, puede personalizar algunos elementos de su gráfico para que tenga un aspecto más bonito y para transmitir más claramente la correlación entre las dos variables.
Tipos de gráficos de dispersión
Además del gráfico de dispersión clásico mostrado en el ejemplo anterior, existen algunas plantillas más:
- Dispersión con líneas suaves y marcadores
- Dispersión con líneas suaves
- Dispersión con líneas rectas y marcadores
- Dispersión con líneas rectas
Dispersión con líneas se utiliza mejor cuando se tienen pocos puntos de datos. Por ejemplo, así es como se pueden representar los datos de los cuatro primeros meses utilizando el gráfico de dispersión con líneas suaves y marcadores:
Las plantillas de gráficos XY de Excel también pueden dibujar cada variable por separado Para ello, debe seleccionar 3 columnas con datos: la columna de la izquierda con valores de texto (etiquetas) y las dos columnas con números.
En nuestro ejemplo, los puntos azules representan los costes de publicidad y los puntos naranjas los artículos vendidos:
Para ver todos los tipos de dispersión disponibles en un solo lugar, seleccione sus datos, haga clic en el botón Dispersión (X, Y) de la cinta y, a continuación, haga clic en Más gráficos de dispersión... Se abrirá la ventana Gráfico de inserción con el botón XY (Dispersión) y se cambia entre las distintas plantillas de la parte superior para ver cuál ofrece la mejor representación gráfica de los datos:
Diagrama de dispersión 3D
A diferencia de un gráfico de dispersión XY clásico, un gráfico de dispersión Gráfico de dispersión 3D muestra puntos de datos en tres ejes (x, y, y z) con el fin de mostrar la relación entre tres variables. Por lo tanto, a menudo se llama un Gráfico XYZ .
Lamentablemente, no hay forma de crear un gráfico de dispersión 3D en Excel, incluso en la nueva versión de Excel 2019. Si necesita fuertemente este tipo de gráfico para su análisis de datos, considere usar alguna herramienta de terceros, como plot.ly. La captura de pantalla a continuación muestra qué tipo de gráfico de dispersión 3D puede dibujar esta herramienta:
Gráfico de dispersión y correlación
Para interpretar correctamente el diagrama de dispersión, es necesario comprender cómo pueden relacionarse las variables entre sí. En general, existen tres tipos de correlación:
Correlación positiva - a medida que aumenta la variable x, también lo hace la variable y. Un ejemplo de correlación positiva fuerte es la cantidad de tiempo que los alumnos dedican a estudiar y sus calificaciones.
Correlación negativa - a medida que aumenta la variable x, disminuye la variable y. Las faltas a clase y las notas están negativamente correlacionadas: a medida que aumenta el número de faltas, disminuyen las notas de los exámenes.
Sin correlación - no hay ninguna relación evidente entre las dos variables; los puntos están dispersos por toda la zona del gráfico. Por ejemplo, la altura de los alumnos y sus notas no parecen tener ninguna correlación, ya que la primera no afecta en absoluto a las segundas.
Personalización del diagrama de dispersión XY en Excel
Al igual que con otros tipos de gráficos, casi todos los elementos de un gráfico de dispersión en Excel son personalizables. Puede cambiar fácilmente el título del gráfico, añadir títulos a los ejes, ocultar las líneas de la cuadrícula, elegir sus propios colores para el gráfico, etc.
A continuación nos centraremos en algunas personalizaciones específicas de un gráfico de dispersión.
Ajuste la escala de los ejes (reduzca el espacio en blanco)
En caso de que los puntos de datos estén agrupados en la parte superior, inferior, derecha o izquierda del gráfico, es posible que desee limpiar el espacio en blanco sobrante.
Para reducir el espacio entre el primer punto de datos y el eje vertical y/o entre el último punto de datos y el borde derecho del gráfico, realice estos pasos:
- Haga clic con el botón derecho en el eje x y haga clic en Formato Eje...
- En el Formato Eje configure el Mínimo y Máximo límites según proceda.
- Además, puede cambiar el Mayor unidades que controlan el espaciado entre las líneas de la cuadrícula.
La siguiente captura de pantalla muestra mi configuración:
Para eliminar el espacio entre los puntos de datos y los bordes superior e inferior del área de trazado, formatee el eje vertical y de manera similar.
Añadir etiquetas a los puntos de datos del diagrama de dispersión
Al crear un gráfico de dispersión con un número relativamente pequeño de puntos de datos, es posible que desees etiquetar los puntos por su nombre para que tu visual sea más comprensible. A continuación te explicamos cómo puedes hacerlo:
- Seleccione la parcela y haga clic en el botón Elementos del gráfico botón.
- Marque los Etiquetas de datos haga clic en la flecha negra situada junto a él y, a continuación, en Más opciones...
- En el Formatear etiquetas de datos pase al panel Opciones de etiquetado (la última), y configure así sus etiquetas de datos:
- Seleccione Valor de las celdas y, a continuación, seleccione el intervalo del que desea extraer las etiquetas de datos (B2:B6 en nuestro caso).
- Si desea mostrar sólo los nombres, desactive la casilla Valor X y/o Valor Y para eliminar los valores numéricos de las etiquetas.
- Especifique la posición de las etiquetas, Por encima de puntos de datos en nuestro ejemplo.
Todos los puntos de datos de nuestro gráfico de dispersión de Excel están ahora etiquetados por nombre:
Consejo: Cómo solucionar el solapamiento de etiquetas
Cuando dos o más puntos de datos están muy cerca el uno del otro, sus etiquetas pueden solaparse, como es el caso del Jan y Mar Para solucionarlo, haz clic en las etiquetas y, a continuación, haz clic en la que se superpone para que sólo se seleccione esa etiqueta. Apunta con el cursor del ratón a la etiqueta seleccionada hasta que el cursor cambie a la flecha de cuatro lados y, a continuación, arrastra la etiqueta a la posición deseada.
Como resultado, tendrá un bonito gráfico de dispersión de Excel con etiquetas perfectamente legibles:
Añadir una línea de tendencia y una ecuación
Para visualizar mejor la relación entre las dos variables, puede dibujar una línea de tendencia en su gráfico de dispersión de Excel, también llamado gráfico de línea de mejor ajuste .
Para ello, haga clic con el botón derecho del ratón en cualquier punto de datos y seleccione Añadir línea de tendencia... del menú contextual.
Excel trazará una línea lo más cerca posible de todos los puntos de datos, de forma que haya tantos puntos por encima de la línea como por debajo.
Además, puede mostrar el ecuación de la línea de tendencia que describa matemáticamente la relación entre las dos variables. Para ello, compruebe el Mostrar ecuación en gráfico en la casilla Formato Línea de tendencia que debería aparecer en la parte derecha de la ventana de Excel inmediatamente después de haber añadido una línea de tendencia. El resultado de estas manipulaciones tendrá un aspecto similar al siguiente:
Lo que se ve en la captura de pantalla anterior suele denominarse gráfico de regresión lineal y puede encontrar las directrices detalladas sobre cómo crearlo aquí: Cómo hacer un gráfico de regresión lineal en Excel.
Cómo cambiar los ejes X e Y en un gráfico de dispersión
Como ya se ha mencionado, un gráfico de dispersión suele mostrar la variable independiente en el eje horizontal y la variable dependiente en el eje vertical. Si el gráfico se representa de forma diferente, la solución más sencilla es intercambiar las columnas de origen en la hoja de cálculo y volver a dibujar el gráfico.
Si por alguna razón no es posible reordenar las columnas, puede cambiar las series de datos X e Y directamente en un gráfico. A continuación se explica cómo:
- Haga clic con el botón derecho en cualquier eje y pulse Seleccionar datos... en el menú contextual.
- En el Seleccionar fuente de datos haga clic en el botón Editar botón.
- Copia Valores de la serie X a la Valores de la serie Y y viceversa.
Consejo: para editar de forma segura el contenido de Serie sitúe el puntero del ratón en la casilla y pulse F2 .
- Haga clic en OK dos veces para cerrar ambas ventanas.
Como resultado, su gráfico de dispersión de Excel sufrirá esta transformación:
Sugerencia: si necesitas encontrar un punto de datos específico en un gráfico, este tutorial te enseñará a encontrar, resaltar y etiquetar un punto de datos en un gráfico de dispersión.
Así es como se crea un gráfico de dispersión en Excel. En nuestro próximo tutorial, continuaremos con este tema y mostraremos cómo encontrar y resaltar rápidamente un determinado punto de datos en un gráfico de dispersión. Permanezca atento!