Випадковий відбір в Excel: як отримати випадкову вибірку з набору даних

  • Поділитися Цим
Michael Brown

Цей підручник навчить вас декільком швидким способам випадкового вибору імен, чисел або будь-яких інших даних. Ви також дізнаєтеся, як отримати випадкову вибірку без дублікатів і як випадково вибрати задану кількість або відсоток клітинок, рядків або стовпців одним клацанням миші.

Незалежно від того, чи проводите ви дослідження ринку для запуску нового продукту, чи оцінюєте результати маркетингової кампанії, важливо, щоб для аналізу використовувалася неупереджена вибірка даних. І найпростіший спосіб досягти цього - отримати випадкову вибірку в Excel.

    Що таке випадкова вибірка?

    Перш ніж обговорювати методи вибірки, давайте надамо деяку довідкову інформацію про випадковий відбір і про те, коли ви можете захотіти його використати.

    У теорії ймовірностей та статистиці випадкова вибірка це підмножина даних, вибрана з більшого набору даних, так звана населення Кожен елемент випадкової вибірки обирається абсолютно випадково і має рівну ймовірність бути відібраним. Навіщо це потрібно? В основному, щоб отримати неупереджене представлення генеральної сукупності.

    Наприклад, ви хочете провести невелике опитування серед своїх клієнтів. Очевидно, що було б нерозумно розсилати анкети кожній людині з вашої багатотисячної бази даних. Отже, кого опитувати? Це будуть 100 найновіших клієнтів, або перші 100 клієнтів в алфавітному порядку, або 100 осіб з найкоротшими іменами? Жоден з цих підходів не відповідає вашим потребам, тому що вони за своєю природою не єДля того, щоб отримати неупереджену вибірку, в якій кожен має рівні можливості бути обраним, зробіть випадковий відбір, використовуючи один з методів, описаних нижче.

    Випадковий відбір Excel з формулами

    В Excel немає вбудованої функції для випадкового вибору клітинок, але ви можете використовувати одну з функцій для генерації випадкових чисел в якості обхідного шляху. Це, ймовірно, не можна назвати простими інтуїтивно зрозумілими формулами, але вони дійсно працюють.

    Як вибрати випадкову величину зі списку

    Припустимо, що у вас є список імен в комірках А2:А10 і ви хочете випадковим чином вибрати одне ім'я зі списку. Це можна зробити за допомогою однієї з наведених нижче формул:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    або

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Ось і все! Ваш генератор випадкових імен для Excel налаштований і готовий до роботи:

    Зверніть увагу, що RANDBETWEEN - це нестабільний тобто вона буде перераховуватися при кожній зміні, яку ви робите на аркуші. Як наслідок, ваш випадковий вибір також буде змінюватися. Щоб цього не сталося, ви можете скопіювати витягнуте ім'я і вставити його в якості значення в іншу комірку ( Паста спеціальна > Цінності Детальну інструкцію див. у розділі "Як замінити формули значеннями".

    Природно, що ці формули можуть вибирати не тільки випадкові імена, а й випадкові числа, дати або будь-які інші випадкові комірки.

    Як працюють ці формули

    У двох словах, ви використовуєте функцію ІНДЕКС для вилучення значення зі списку на основі випадкового номера рядка, повернутого функцією РАНДБЕТВЕН.

    Зокрема, функція RANDBETWEEN генерує випадкове ціле число між двома вказаними значеннями. Для нижнього значення ви вводите число 1. Для верхнього значення ви використовуєте COUNTA або ROWS, щоб отримати загальну кількість рядків. В результаті RANDBETWEEN повертає випадкове число між 1 і загальною кількістю рядків у вашому наборі даних. Це число потрапляє в поле row_num аргумент функції INDEX, який вказує їй, який рядок вибирати. Для функції column_num ми використовуємо 1, оскільки хочемо витягти значення з першого стовпчика.

    Примітка. Цей метод добре підходить для відбору одна випадкова комірка Якщо ваша вибірка повинна включати кілька клітинок, наведена вище формула може повернути кілька входжень одного і того ж значення, оскільки функція RANDBETWEEN не виключає дублікатів. Особливо це стосується випадків, коли ви вибираєте відносно велику вибірку з відносно невеликого списку. У наступному прикладі показано, як зробити випадковий вибір в Excel без дублікатів.

    Як випадково вибрати в Excel без дублікатів

    Існує кілька способів вибору випадкових даних без дублікатів в Excel. Як правило, ви використовуєте функцію RAND для присвоєння випадкового числа кожній комірці, а потім вибираєте кілька комірок за допомогою формули індексного рангу.

    Маючи список імен у комірках A2:A16, будь ласка, виконайте наступні кроки, щоб витягти кілька випадкових імен:

    1. Введіть формулу Ренда в комірку B2 і скопіюйте її вниз по стовпчику:

    =RAND()

  • Помістіть наведену нижче формулу в комірку C2, щоб витягти випадкове значення зі стовпчика A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Скопіюйте наведену вище формулу в стільки клітинок, скільки випадкових значень ви хочете вибрати. У нашому випадку ми копіюємо формулу ще в чотири клітинки (C2:C6).
  • Все, витягнуто п'ять випадкових прізвищ без дублікатів:

    Як працює ця формула

    Як і в попередньому прикладі, ви використовуєте функцію INDEX для вилучення значення зі стовпця A на основі випадкової координати рядка. У цьому випадку для отримання значення використовуються дві різні функції:

    • Формула RAND заповнює стовпець B випадковими числами.
    • Функція RANK повертає ранг випадкового числа в тому ж рядку. Наприклад, RANK(B2,$B$2:$B$16) в комірці C2 отримує ранг числа в комірці B2. При копіюванні в комірку C3 відносне посилання B2 змінюється на B3 і повертає ранг числа в комірці B3, і так далі.
    • Номер, що повертається RANK, передається до row_num аргумент функції INDEX, тому вона вибирає значення з цього рядка. В column_num ви вказуєте 1, тому що ви хочете отримати значення з першого стовпчика.

    Застереження! Як показано на скріншоті вище, наша випадкова вибірка в Excel містить тільки унікальні значення. Але теоретично існує невелика ймовірність того, що у вашій вибірці з'являться дублікати. Ось чому: на дуже великому наборі даних RAND може згенерувати дублікати випадкових чисел, і RANK поверне для них однаковий ранг. Особисто я жодного разу не отримував дублікатів під час своїх тестів, але теоретично така ймовірність існує.існує.

    Якщо ви шукаєте куленепробивну формулу для отримання випадкової вибірки з тільки унікальними значеннями, то використовуйте комбінацію RANK + COUNTIF або RANK.EQ + COUNTIF замість просто RANK. Для детального пояснення логіки, будь ласка, дивіться Унікальне ранжування в Excel.

    Повна формула є дещо громіздкою, але на 100% вільною від дублювань:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Нотатки:

    • Як і функція РАНДЗНАЧ, функція РАНД Excel також генерує нові випадкові числа при кожному перерахунку робочого аркуша, що призводить до зміни випадкового вибору. Щоб зберегти вибірку незмінною, скопіюйте її та вставте в інше місце у вигляді значень ( Паста Спеціальний > Цінності ).
    • Якщо одне й те саме ім'я (номер, дата або будь-яке інше значення) з'являється більше одного разу у вашому вихідному наборі даних, випадкова вибірка може також містити кілька входжень одного й того самого значення.

    Більше способів отримати випадкову вибірку без повторів в Excel 365 - 2010 описано тут: Як отримати випадкову вибірку в Excel без повторів.

    Як виділити випадкові рядки в Excel

    Якщо Ваш робочий аркуш містить більше одного стовпчика даних, Ви можете відібрати випадкову вибірку таким чином: присвоїти кожному рядку випадкове число, відсортувати ці числа та відібрати необхідну кількість рядків. Детальні кроки наведені нижче.

    1. Вставте новий стовпець праворуч або ліворуч від вашої таблиці (стовпець D у цьому прикладі).
    2. У першій комірці вставленого стовпця, не враховуючи заголовків стовпців, ввести формулу RAND: =RAND()
    3. Двічі клацніть ручку заповнення, щоб скопіювати формулу вниз по стовпчику. В результаті ви отримаєте випадкове число, присвоєне кожному рядку.
    4. Сортування випадкових чисел від найбільшого до найменшого (сортування за зростанням призведе до переміщення заголовків стовпців у нижній частині таблиці, тому обов'язково сортуйте за спаданням). Для цього перейдіть до розділу Дані вкладка> Сортування та фільтрація Excel автоматично розширить виділення і відсортує всі рядки у випадковому порядку.

      Якщо ви не зовсім задоволені тим, як ваша таблиця була впорядкована, натисніть кнопку сортування ще раз, щоб повторити його. Для отримання детальних інструкцій див. статтю Як виконати випадкове сортування в Excel.

    5. Нарешті, виберіть необхідну кількість рядків для вашого зразка, скопіюйте їх і вставте туди, де вам зручно.

    Щоб ближче познайомитися з формулами, розглянутими в цьому підручнику, ви можете завантажити наш зразок робочої книги в Excel Випадковий вибір.

    Як випадково вибрати в Excel за допомогою інструменту Randomize

    Тепер, коли ви знаєте кілька формул для отримання випадкової вибірки в Excel, давайте подивимося, як можна досягти того ж результату одним клацанням миші.

    З Генератором випадкових чисел для Excel, включеним до нашого Ultimate Suite, ось що вам потрібно зробити:

    1. Виберіть будь-яку комірку в таблиці.
    2. Перейдіть на сторінку Ablebits Tools вкладка> Комунальні послуги групу і натисніть Рандомізувати > Виберіть Випадково :

  • На панелі надбудови виберіть, що виділити: випадкові рядки, випадкові стовпці або випадкові клітинки.
  • Вкажіть число або відсоток для бажаного розміру вибірки.
  • Натисніть на кнопку Виберіть кнопку. Готово!
  • Наприклад, таким чином ми можемо вибрати 5 випадкових рядків з нашого вибіркового набору даних:

    І за секунду ви отримаєте випадковий вибір:

    Тепер ви можете натиснути Ctrl + C, щоб скопіювати випадковий зразок, а потім натиснути Ctrl + V, щоб вставити його в потрібне місце на тому ж або іншому аркуші.

    Якщо ви хочете протестувати інструмент Randomize на своїх робочих аркушах, просто завантажте пробну версію Ultimate Suite нижче. Якщо ви використовуєте електронні таблиці Google, вам може стати в нагоді наш Генератор випадкових чисел для таблиць Google.

    Доступні для завантаження

    Відбір випадкової вибірки - приклади формул (файл .xlsx)

    Ultimate Suite - пробна версія (файл .exe)

    Майкл Браун — відданий ентузіаст технологій із пристрастю до спрощення складних процесів за допомогою програмних засобів. Маючи понад десятирічний досвід роботи в технологічній індустрії, він відточив свої навички роботи з Microsoft Excel і Outlook, а також із Google Таблицями та Документами. Блог Майкла присвячений тому, щоб поділитися своїми знаннями та досвідом з іншими, надаючи прості поради та навчальні посібники для підвищення продуктивності та ефективності. Незалежно від того, чи є ви досвідченим професіоналом чи початківцем, блог Майкла пропонує цінну інформацію та практичні поради щодо отримання максимальної користі від цих основних програмних інструментів.