Зміст
У цьому уроці ви дізнаєтеся, як побудувати діаграму розсіювання в Excel для створення графічного представлення двох корельованих наборів даних.
Коли ви дивитеся на два стовпчики кількісних даних у вашій таблиці Excel, що ви бачите? Просто два набори чисел. Ви хочете побачити, як ці два набори пов'язані один з одним? Діаграма розсіювання є ідеальним вибором графіка для цього.
Діаграма розсіювання в Excel
A діаграма розсіювання (також називається XY графік або діаграма розсіювання ) - це двовимірний графік, який показує зв'язок між двома змінними.
На діаграмі розсіювання як горизонтальна, так і вертикальна осі є осями значень, на яких відкладаються числові дані. Як правило, незалежна змінна знаходиться на осі х, а залежна змінна - на осі у. На діаграмі відображаються значення на перетині осей х і у, об'єднані в окремі точки даних.
Основна мета діаграми розсіювання - показати, наскільки сильним є зв'язок або кореляція між двома змінними. Чим щільніше точки даних розташовані вздовж прямої лінії, тим вищою є кореляція.
Як розташувати дані для діаграми розсіювання
Завдяки різноманітним вбудованим шаблонам діаграм, які надає Excel, створення діаграми розсіювання перетворюється на роботу в пару кліків. Але спочатку потрібно правильно впорядкувати вихідні дані.
Як уже згадувалося, діаграма розсіювання відображає дві взаємопов'язані кількісні змінні. Отже, ви вводите два набори числових даних у дві окремі колонки.
Для зручності використання незалежний змінна повинна знаходитися в рядку лівий оскільки цей стовпчик буде побудовано на осі x. залежний змінна (та, на яку впливає незалежна змінна) повинна знаходитись в правильно і вона буде відкладена на осі y.
Порада: Якщо залежний стовпець стоїть перед незалежним і немає можливості змінити це на робочому аркуші, можна поміняти місцями осі x і y безпосередньо на діаграмі.
У нашому прикладі ми будемо візуалізувати залежність між рекламним бюджетом за певний місяць (незалежна змінна) та кількістю проданих товарів (залежна змінна), тому розташуємо дані відповідним чином:
Як створити діаграму розсіювання в Excel
Якщо вихідні дані правильно організовані, побудова діаграми розсіювання в Excel займає два швидких кроки:
- Виділіть два стовпці з числовими даними, включаючи заголовки стовпців. У нашому випадку це діапазон C1:D13. Не виділяйте інші стовпці, щоб не заплутати Excel.
- Перейдіть на сторінку Вставка вкладка> Чати у групі, натисніть на кнопку Розкид та виберіть потрібний шаблон. Щоб вставити класичну діаграму розсіювання, клацніть на першій мініатюрі:
Діаграма розсіювання буде негайно вставлена у ваш робочий аркуш:
В принципі, ви можете вважати роботу виконаною. Або ж ви можете налаштувати деякі елементи вашого графіка, щоб він виглядав красивіше і чіткіше передавав кореляцію між двома змінними.
Типи діаграм розсіювання
Крім класичної діаграми розсіювання, показаної в наведеному вище прикладі, доступні ще кілька шаблонів:
- Розкид плавними лініями та маркерами
- Розсіювання плавними лініями
- Розсіювання прямими лініями та маркерами
- Розсіювання прямими лініями
Розкид лініями найкраще використовувати, коли у вас мало точок даних. Наприклад, ось як можна представити дані за перші чотири місяці за допомогою діаграми розсіювання з плавними лініями та маркерами:
Шаблони графіків Excel XY також можуть малювати кожну змінну окремо Для цього необхідно вибрати 3 стовпчики з даними - крайній лівий стовпчик з текстовими значеннями (мітками), а два стовпчики з цифрами.
У нашому прикладі сині точки - це витрати на рекламу, а помаранчеві - продані товари:
Щоб переглянути всі доступні типи розсіювання в одному місці, виберіть свої дані, натисніть кнопку Розкид (X, Y) на стрічці, а потім натисніть Більше діаграм розсіювання... Це дозволить відкрити Вставна діаграма діалогове вікно з кнопкою XY (Scatter) і ви перемикаєтеся між різними шаблонами вгорі, щоб побачити, який з них забезпечує найкраще графічне представлення ваших даних:
3D діаграма розсіювання
На відміну від класичної XY діаграми розсіювання, діаграма 3D діаграма розсіювання відображає точки даних на трьох осях (x, y та z), щоб показати зв'язок між трьома змінними. Тому її часто називають XYZ-план .
На жаль, в Excel немає можливості створити 3D-діаграму розсіювання, навіть у новій версії Excel 2019. Якщо вам вкрай необхідний цей тип діаграми для аналізу даних, розгляньте можливість використання стороннього інструменту, наприклад, plot.ly. На скріншоті нижче показано, який вид 3D-діаграми розсіювання може побудувати цей інструмент:
Графік розсіювання та кореляція
Щоб правильно інтерпретувати діаграму розсіювання, потрібно розуміти, як змінні можуть бути пов'язані між собою. Загалом, існує три типи кореляції:
Позитивна кореляція - зі збільшенням змінної х зростає і змінна у. Прикладом сильної позитивної кореляції є кількість часу, яку студенти витрачають на навчання, та їхні оцінки.
Негативна кореляція - зі збільшенням змінної х змінна у зменшується. Пропуски занять та оцінки негативно корелюють між собою - зі збільшенням кількості пропусків зменшуються оцінки на іспитах.
Кореляція відсутня - між двома змінними немає очевидного зв'язку; точки розкидані по всій площі діаграми. Наприклад, зріст учнів та їхні оцінки, схоже, не пов'язані між собою, оскільки перший показник жодним чином не впливає на другий.
Налаштування діаграми розсіювання XY в Excel
Як і в інших типах діаграм, майже кожен елемент діаграми розсіювання в Excel налаштовується. Ви можете легко змінити заголовок діаграми, додати назви осей, приховати лінії сітки, вибрати власні кольори діаграми тощо.
Нижче ми зосередимося на деяких налаштуваннях, характерних для діаграми розсіювання.
Відрегулюйте масштаб осі (зменшіть пробіл)
Якщо точки даних згруповані у верхній, нижній, правій або лівій частині діаграми, можливо, ви захочете прибрати зайвий білий простір.
Щоб зменшити простір між першою точкою даних і вертикальною віссю та/або між останньою точкою даних і правим краєм графіка, виконайте такі дії:
- Клацніть правою кнопкою миші по осі х і виберіть Вісь формату...
- Про це йдеться на Вісь формату на панелі, встановіть потрібний Мінімальний і Максимальний межі у відповідних випадках.
- Додатково ви можете змінити Майор агрегати, які контролюють відстань між лініями сітки.
На скріншоті нижче показані мої налаштування:
Щоб видалити простір між точками даних і верхнім/нижнім краєм області побудови, відформатуйте вертикальну вісь y аналогічним чином.
Додавання міток до точок даних діаграми розсіювання
При створенні діаграми розсіювання з відносно невеликою кількістю точок даних, можливо, ви захочете позначити точки назвами, щоб зробити візуалізацію більш зрозумілою. Ось як ви можете це зробити:
- Виберіть ділянку та натисніть кнопку Елементи діаграми кнопку.
- Поставте галочку в полі Мітки даних клацніть маленьку чорну стрілку поруч з ним, а потім натисніть Більше опцій...
- Про це йдеться на Формат етикеток даних переключіться на панель Параметри етикетки (остання), і налаштуйте свої мітки даних таким чином:
- Виберіть пункт Значення з комірок а потім виберіть діапазон, з якого ви хочете витягнути мітки даних (у нашому випадку B2:B6).
- Якщо ви бажаєте відображати тільки імена, зніміть прапорець X Значення та/або Y Значення для видалення числових значень з міток.
- Вказати положення етикеток, Вище точок даних у нашому прикладі.
Все! Всі точки даних на нашій діаграмі розсіювання в Excel тепер позначені іменами:
Порада: Як виправити етикетки, що перекриваються
Коли дві або більше точок даних знаходяться дуже близько одна до одної, їх мітки можуть перекриватися, як у випадку з Ян і Березень Щоб виправити це, клацніть по мітках, а потім клацніть по тій, що перекривається, щоб виділити тільки цю мітку. Наведіть курсор миші на обрану мітку, поки курсор не зміниться на чотиристоронню стрілку, а потім перетягніть мітку в потрібне положення.
В результаті ви отримаєте гарну діаграму розсіювання в Excel з ідеально читабельними підписами:
Додавання лінії тренду і рівняння
Щоб краще візуалізувати взаємозв'язок між двома змінними, ви можете намалювати лінію тренду на діаграмі розсіювання в Excel, яка також називається лінія найкращого прилягання .
Для цього клацніть правою кнопкою миші по будь-якій точці даних і виберіть Додати Trendline... з контекстного меню.
Excel проведе лінію якомога ближче до всіх точок даних так, щоб над лінією було стільки ж точок, скільки і під нею.
Додатково можна показати рівняння лінії тренду яка математично описує зв'язок між двома змінними. Для цього перевірте Відобразити рівняння на графіку у вікні на сайті Формат Trendline яка повинна з'явитися в правій частині вікна Excel відразу після додавання лінії тренду. Результат цих маніпуляцій буде виглядати приблизно так:
Те, що ви бачите на скріншоті вище, часто називають графік лінійної регресії , а з детальною інструкцією по його створенню можна ознайомитися тут: Як побудувати графік лінійної регресії в Excel.
Як переключити осі X і Y на діаграмі розсіювання
Як уже згадувалося, діаграма розсіювання зазвичай відображає незалежну змінну на горизонтальній осі, а залежну змінну - на вертикальній осі. Якщо Ваш графік побудований інакше, найпростіше виправити це - поміняти місцями вихідні стовпці на робочому аркуші, а потім намалювати діаграму заново.
Якщо з якихось причин перестановка стовпчиків неможлива, можна поміняти місцями ряди даних X і Y безпосередньо на діаграмі. Ось як це зробити:
- Клацніть правою кнопкою миші по будь-якій осі і натисніть Виберіть "Дані"... в контекстному меню.
- В рамках проекту Виберіть джерело даних діалогового вікна, натисніть кнопку Редагувати кнопку.
- Прийом. Значення серії X до Значення серії Y і навпаки.
Порада. Щоб безпечно редагувати вміст Серія помістіть вказівник миші в поле і натисніть F2 .
- Натисніть ГАРАЗД. двічі закрити обидва вікна.
В результаті ваша діаграма розсіювання в Excel зазнає цієї трансформації:
Порада: Якщо вам потрібно знайти певну точку даних на графіку, цей посібник навчить вас, як знайти, виділити та позначити точку даних на діаграмі розсіювання.
Ось так створюється діаграма розсіювання в Excel. У наступному уроці ми продовжимо цю тему і покажемо, як швидко знайти і виділити певну точку даних на діаграмі розсіювання. Слідкуйте за нашими новинами!