Оглавление
В этом уроке вы узнаете, как построить диаграмму рассеяния в Excel для создания графического представления двух коррелирующих наборов данных.
Если посмотреть на два столбца количественных данных в таблице Excel, что вы увидите? Просто два набора чисел. Хотите посмотреть, как эти два набора связаны друг с другом? Для этого идеально подходит диаграмма рассеяния.
Диаграмма рассеяния в Excel
A диаграмма рассеяния (также называемый XY-график , или диаграмма рассеяния ) - это двухмерный график, который показывает взаимосвязь между двумя переменными.
В диаграмме рассеяния горизонтальная и вертикальная оси являются осями значений, по которым строятся числовые данные. Обычно независимая переменная находится на оси x, а зависимая - на оси y. На диаграмме отображаются значения на пересечении осей x и y, объединенные в отдельные точки данных.
Основная цель диаграммы рассеяния - показать, насколько сильна связь, или корреляция, между двумя переменными. Чем плотнее точки данных располагаются вдоль прямой линии, тем выше корреляция.
Как расположить данные для диаграммы разброса
Благодаря множеству встроенных шаблонов диаграмм, предоставляемых Excel, создание диаграммы разброса превращается в работу в пару кликов. Но сначала необходимо правильно расположить исходные данные.
Как уже упоминалось, диаграмма рассеяния отображает две взаимосвязанные количественные переменные. Поэтому вы вводите два набора числовых данных в два отдельных столбца.
Для удобства использования независимый переменная должна находиться в слева столбец, так как этот столбец будет откладываться на оси x. Столбец зависимый переменная (та, на которую влияет независимая переменная) должна находиться в правильно столбец, и он будет откладываться по оси y.
Совет. Если зависимый столбец находится перед независимым и нет возможности изменить это в рабочем листе, можно поменять местами оси x и y непосредственно на графике.
В нашем примере мы собираемся визуализировать взаимосвязь между рекламным бюджетом на определенный месяц (независимая переменная) и количеством проданных товаров (зависимая переменная), поэтому мы расположим данные соответствующим образом:
Как создать диаграмму рассеяния в Excel
При правильной организации исходных данных построение диаграммы рассеяния в Excel занимает всего два быстрых шага:
- Выберите два столбца с числовыми данными, включая заголовки столбцов. В нашем случае это диапазон C1:D13. Не выбирайте другие столбцы, чтобы не запутать Excel.
- Перейти к Вставка вкладка> Чаты группу, нажмите кнопку Разброс значок диаграммы и выберите нужный шаблон. Чтобы вставить классическую диаграмму рассеяния, щелкните первую миниатюру:
Диаграмма рассеяния будет немедленно вставлена в ваш рабочий лист:
В принципе, вы можете считать работу выполненной. Или же вы можете изменить некоторые элементы вашего графика, чтобы он выглядел более красиво и более четко передавал корреляцию между двумя переменными.
Типы диаграмм рассеяния
Помимо классической диаграммы рассеяния, показанной в приведенном выше примере, доступны еще несколько шаблонов:
- Рассеивание с помощью плавных линий и маркеров
- Разброс с плавными линиями
- Разброс с помощью прямых линий и маркеров
- Разброс с прямыми линиями
Разброс с линиями лучше всего использовать, когда у вас мало точек данных. Например, вот как можно представить данные за первые четыре месяца с помощью диаграммы рассеяния с плавными линиями и маркерами:
Шаблоны графиков XY в Excel также могут рисовать каждую переменную отдельно Для этого необходимо выбрать 3 столбца с данными - крайний левый столбец с текстовыми значениями (метками) и два столбца с числами.
В нашем примере синие точки представляют затраты на рекламу, а оранжевые - проданные товары:
Чтобы просмотреть все доступные типы разброса в одном месте, выберите данные, нажмите кнопку Разброс (X, Y) значок на ленте, а затем нажмите Больше диаграмм рассеяния... В результате откроется Врезная диаграмма диалоговое окно с XY (разброс) выбран тип, и вы переключаетесь между различными шаблонами в верхней части, чтобы увидеть, какой из них обеспечивает наилучшее графическое представление ваших данных:
3D диаграмма рассеяния
В отличие от классической диаграммы разброса XY, диаграмма разброса 3D диаграмма рассеяния отображает точки данных на трех осях (x, y и z), чтобы показать взаимосвязь между тремя переменными. Поэтому его часто называют графиком. XYZ-план .
К сожалению, в Excel нет возможности создать 3D диаграмму рассеяния, даже в новой версии Excel 2019. Если вам очень нужен этот тип диаграммы для анализа данных, воспользуйтесь сторонним инструментом, например plot.ly. На скриншоте ниже показано, какой вид 3D диаграммы рассеяния может нарисовать этот инструмент:
График рассеяния и корреляция
Чтобы правильно интерпретировать диаграмму рассеяния, необходимо понять, как переменные могут быть связаны друг с другом. В целом, существует три типа корреляции:
Положительная корреляция - С увеличением переменной x увеличивается и переменная y. Примером сильной положительной корреляции является количество времени, которое студенты тратят на учебу, и их оценки.
Отрицательная корреляция - По мере увеличения переменной x переменная y уменьшается. Прогулы занятий и оценки отрицательно коррелируют - по мере увеличения количества пропусков экзаменационные оценки снижаются.
Нет корреляции - нет очевидной связи между двумя переменными; точки разбросаны по всей площади графика. Например, рост и оценки учеников не имеют корреляции, так как первое никак не влияет на второе.
Настройка диаграммы рассеяния XY в Excel
Как и в других типах диаграмм, почти каждый элемент диаграммы рассеяния в Excel настраивается. Вы можете легко изменить заголовок диаграммы, добавить заголовки осей, скрыть линии сетки, выбрать собственные цвета диаграммы и многое другое.
Ниже мы остановимся на нескольких настройках, специфичных для диаграммы рассеяния.
Отрегулируйте масштаб оси (уменьшите белое пространство)
В случае если точки данных сгруппированы в верхней, нижней, правой или левой части графика, вам может понадобиться убрать лишнее белое пространство.
Чтобы уменьшить пространство между первой точкой данных и вертикальной осью и/или между последней точкой данных и правым краем графика, выполните следующие действия:
- Щелкните правой кнопкой мыши на оси x и нажмите Ось формата...
- На Ось формата на панели установите нужный Минимум и Максимальный границы по мере необходимости.
- Кроме того, вы можете изменить Главная единицы, которые управляют расстоянием между линиями сетки.
На скриншоте ниже показаны мои настройки:
Чтобы убрать пространство между точками данных и верхней/нижней границами области построения, отформатируйте вертикальную ось y аналогичным образом.
Добавление меток к точкам данных диаграммы рассеяния
При создании диаграммы рассеяния с относительно небольшим количеством точек данных вы можете пометить точки именами, чтобы сделать вашу визуальную картину более понятной. Вот как это можно сделать:
- Выберите участок и нажмите кнопку Элементы диаграммы кнопка.
- Отметьте Этикетки данных поле, нажмите на маленькую черную стрелку рядом с ним, а затем нажмите Больше вариантов...
- На Форматирование меток данных панели, переключитесь на Параметры этикетки вкладку (последнюю) и настройте метки данных таким образом:
- Выберите Значение из ячеек и выберите диапазон, из которого вы хотите извлечь метки данных (в нашем случае B2:B6).
- Если вы хотите отобразить только имена, очистите параметр X Значение и/или Y Значение чтобы удалить числовые значения из меток.
- Укажите положение меток, Выше точек данных в нашем примере.
Вот и все! Теперь все точки данных в нашей диаграмме рассеяния Excel обозначены именами:
Совет: Как исправить перекрывающиеся ярлыки
Когда две или более точек данных расположены очень близко друг к другу, их метки могут перекрываться, как в случае с Ян и Мар Чтобы исправить это, щелкните на метках, а затем щелкните на перекрывающейся метке, чтобы была выбрана только эта метка. Наведите курсор мыши на выбранную метку, пока курсор не изменится на четырехстороннюю стрелку, а затем перетащите метку в нужное положение.
В результате у вас получится красивая диаграмма рассеяния Excel с отлично читаемыми метками:
Добавьте линию тренда и уравнение
Чтобы лучше представить взаимосвязь между двумя переменными, вы можете нарисовать линию тренда на графике разброса в Excel, который также называется линия наилучшего соответствия .
Чтобы сделать это, щелкните правой кнопкой мыши на любой точке данных и выберите Добавить линию тренда... из контекстного меню.
Excel проведет линию как можно ближе ко всем точкам данных так, чтобы над линией было столько же точек, сколько и под ней.
Кроме того, вы можете показать уравнение для линии тренда которая математически описывает взаимосвязь между двумя переменными. Для этого проверьте Отображение уравнения на графике поле на Формат Линия тренда панель, которая должна появиться в правой части окна Excel сразу после добавления линии тренда. Результат этих манипуляций будет выглядеть примерно так:
То, что вы видите на скриншоте выше, часто называют график линейной регрессии , а подробное руководство по его созданию можно найти здесь: Как построить график линейной регрессии в Excel.
Как переключить оси X и Y в диаграмме рассеяния
Как уже упоминалось, диаграмма рассеяния обычно отображает независимую переменную на горизонтальной оси и зависимую переменную на вертикальной оси. Если ваш график строится иначе, самое простое решение - поменять местами исходные столбцы в рабочем листе, а затем построить график заново.
Если по каким-то причинам перестановка столбцов невозможна, можно поменять местами ряды данных X и Y прямо на графике. Вот как это сделать:
- Щелкните правой кнопкой мыши любую ось и нажмите Выберите данные... в контекстном меню.
- В Выберите источник данных диалогового окна, нажмите кнопку Редактировать кнопка.
- Копировать Значения серии X к Значения серии Y ящик и наоборот.
Совет. Для безопасного редактирования содержимого файла Серия поля, поместите указатель мыши в поле и нажмите F2 .
- Нажмите OK дважды, чтобы закрыть оба окна.
В результате ваша диаграмма рассеяния Excel претерпит такую трансформацию:
Совет. Если вам нужно найти конкретную точку данных на графике, в этом уроке вы узнаете, как найти, выделить и пометить точку данных на диаграмме рассеяния.
Вот как создать диаграмму рассеяния в Excel. В следующем уроке мы продолжим эту тему и покажем, как быстро найти и выделить определенную точку данных на диаграмме рассеяния. Пожалуйста, следите за новостями!