Случайный выбор в Excel: как получить случайную выборку из набора данных

  • Поделись Этим
Michael Brown

В этом учебнике вы узнаете несколько быстрых способов случайного выбора имен, чисел или любых других данных. Вы также узнаете, как получить случайную выборку без дубликатов и как случайным образом выбрать заданное количество или процент ячеек, строк или столбцов одним щелчком мыши.

Проводите ли вы маркетинговые исследования для запуска нового продукта или оцениваете результаты маркетинговой кампании, важно, чтобы для анализа использовалась непредвзятая выборка данных. И самый простой способ добиться этого - получить случайную выборку в Excel.

    Что такое случайная выборка?

    Прежде чем обсуждать методы выборки, давайте предоставим немного справочной информации о случайном отборе и о том, когда вы можете захотеть его использовать.

    В теории вероятностей и статистике случайная выборка это подмножество данных, выбранных из более крупного набора данных, а также население Каждый элемент случайной выборки выбирается совершенно случайно и имеет равную вероятность быть выбранным. Зачем вам нужна такая выборка? В основном, чтобы получить беспристрастное представление всей совокупности.

    Например, вы хотите провести небольшой опрос среди своих клиентов. Очевидно, что было бы неразумно рассылать анкету каждому человеку в вашей многотысячной базе данных. Итак, кого вы будете опрашивать? Это будут 100 самых новых клиентов, или 100 первых клиентов, перечисленных в алфавитном порядке, или 100 человек с самыми короткими именами? Ни один из этих подходов не подходит для ваших нужд, потому что они изначальнонеобъективный. чтобы получить беспристрастную выборку, в которой каждый имеет равную возможность быть выбранным, сделайте случайный отбор, используя один из методов, описанных ниже.

    Случайный выбор в Excel с помощью формул

    В Excel нет встроенной функции случайного выбора ячеек, но в качестве обходного пути можно использовать одну из функций для генерации случайных чисел. Вероятно, их нельзя назвать простыми интуитивными формулами, но они работают.

    Как выбрать случайное значение из списка

    Предположим, у вас есть список имен в ячейках A2:A10, и вы хотите случайным образом выбрать одно имя из списка. Это можно сделать с помощью одной из следующих формул:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    или

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Вот и все! Ваша программа случайного выбора имен для Excel настроена и готова к работе:

    Примечание. Пожалуйста, имейте в виду, что RANDBETWEEN - это летучий функция будет пересчитываться при каждом изменении рабочего листа. В результате ваш случайный выбор также изменится. Чтобы этого не произошло, вы можете скопировать извлеченное имя и вставить его в качестве значения в другую ячейку ( Специальная вставка > Значения ). Подробные инструкции см. в разделе Как заменить формулы значениями.

    Естественно, эти формулы могут выбирать не только случайные имена, но и случайные числа, даты или любые другие случайные ячейки.

    Как работают эти формулы

    В двух словах, вы используете функцию INDEX для извлечения значения из списка на основе случайного номера строки, возвращаемого функцией RANDBETWEEN.

    Более конкретно, функция RANDBETWEEN генерирует случайное целое число между двумя указанными вами значениями. Для нижнего значения вы задаете число 1. Для верхнего значения вы используете COUNTA или ROWS, чтобы получить общее количество строк. В результате RANDBETWEEN возвращает случайное число между 1 и общим количеством строк в вашем наборе данных. Это число переходит в значение row_num аргумент функции INDEX, указывающий ей, какую строку выбрать. Для номер_столбца аргумент, мы используем 1, так как хотим извлечь значение из первого столбца.

    Примечание. Этот метод хорошо подходит для выбора одна случайная клетка Если ваша выборка должна включать несколько ячеек, приведенная выше формула может вернуть несколько вхождений одного и того же значения, потому что функция RANDBETWEEN не свободна от дубликатов. Это особенно актуально, когда вы выбираете относительно большую выборку из относительно небольшого списка. Следующий пример показывает, как сделать случайный выбор в Excel без дубликатов.

    Как произвольно выбирать в Excel без дубликатов

    Существует несколько способов выбора случайных данных без дубликатов в Excel. Как правило, вы используете функцию RAND для присвоения случайного числа каждой ячейке, а затем выбираете несколько ячеек с помощью формулы Index Rank.

    Имея список имен в ячейках A2:A16, выполните следующие действия, чтобы извлечь несколько случайных имен:

    1. Введите формулу Rand в B2 и скопируйте ее вниз по столбцу:

    =RAND()

  • Вставьте приведенную ниже формулу в C2, чтобы извлечь случайное значение из столбца A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Скопируйте приведенную выше формулу в столько ячеек, сколько случайных значений вы хотите выбрать. В нашем случае мы скопируем формулу еще в четыре ячейки (C2:C6).
  • Вот и все! Пять случайных имен извлечены без дубликатов:

    Как работает эта формула

    Как и в предыдущем примере, вы используете функцию INDEX для извлечения значения из столбца A на основе координат случайной строки. В этом случае для его получения требуется две разные функции:

    • Формула RAND заполняет столбец B случайными числами.
    • Функция RANK возвращает ранг случайного числа в том же ряду. Например, RANK(B2,$B$2:$B$16) в ячейке C2 получает ранг числа в B2. При копировании в C3 относительная ссылка B2 меняется на B3 и возвращает ранг числа в B3, и так далее.
    • Число, возвращаемое RANK, передается в row_num аргумент функции INDEX, поэтому она выбирает значение из этого ряда. В номер_столбца аргумент, вы передаете 1, потому что хотите извлечь значение из первого столбца.

    Несколько слов предостережения! Как показано на скриншоте выше, наша случайная выборка Excel содержит только уникальные значения. Но теоретически существует небольшая вероятность появления дубликатов в вашей выборке. Вот почему: на очень большом наборе данных RAND может генерировать дубликаты случайных чисел, и RANK вернет одинаковый ранг для этих чисел. Лично я никогда не получал дубликатов во время своих тестов, но теоретически, такая вероятностьсуществует.

    Если вы ищете надежную формулу для получения случайного выбора только уникальных значений, то используйте комбинацию RANK + COUNTIF или RANK.EQ + COUNTIF вместо просто RANK. Подробное объяснение логики смотрите в статье Уникальное ранжирование в Excel.

    Полная формула немного громоздкая, но на 100% свободна от дубликатов:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Примечания:

    • Как и RANDBETWEEN, функция Excel RAND также генерирует новые случайные числа при каждом пересчете вашего рабочего листа, что приводит к изменению случайного выбора. Чтобы сохранить ваш образец неизменным, скопируйте его и вставьте в другое место как значения ( Паста Специальный > Значения ).
    • Если одно и то же имя (число, дата или любое другое значение) встречается более одного раза в исходном наборе данных, случайная выборка также может содержать несколько повторений одного и того же значения.

    Другие способы получения случайной выборки без повторений в Excel 365 - 2010 описаны здесь: Как получить случайную выборку в Excel без дубликатов.

    Как выбрать случайные строки в Excel

    В случае если ваш рабочий лист содержит более одного столбца данных, вы можете выбрать случайную выборку таким образом: присвойте каждой строке случайное число, отсортируйте эти числа и выберите необходимое количество строк. Подробные шаги следуют ниже.

    1. Вставьте новый столбец справа или слева от вашей таблицы (столбец D в данном примере).
    2. В первой ячейке вставленного столбца, исключая заголовки столбцов, введите формулу RAND: =RAND()
    3. Дважды щелкните по ручке заливки, чтобы скопировать формулу вниз по столбцу. В результате каждой строке будет присвоено случайное число.
    4. Сортировка случайных чисел от наибольшего к наименьшему (сортировка в порядке возрастания приведет к перемещению заголовков столбцов в нижнюю часть таблицы, поэтому обязательно сортируйте по убыванию). Для этого перейдите в раздел Данные вкладка> Сортировка и фильтр группу и нажмите кнопку ZA. Excel автоматически расширит выделение и отсортирует все строки в случайном порядке.

      Если вы не совсем удовлетворены тем, как рандомизирована ваша таблица, нажмите кнопку сортировки еще раз, чтобы изменить ее. Подробные инструкции см. в разделе Как произвольно сортировать в Excel.

    5. Наконец, выберите необходимое количество строк для образца, скопируйте их и вставьте в любое удобное для вас место.

    Чтобы более подробно рассмотреть формулы, обсуждаемые в этом учебнике, вы можете скачать наш образец рабочей книги в Excel "Случайный выбор".

    Как сделать случайный выбор в Excel с помощью инструмента Randomize

    Теперь, когда вы знаете несколько формул для получения случайной выборки в Excel, давайте посмотрим, как можно добиться того же результата одним щелчком мыши.

    Генератор случайных чисел для Excel входит в состав нашего пакета Ultimate Suite, вот что вы делаете:

    1. Выберите любую ячейку в таблице.
    2. Перейти к Инструменты Ablebits вкладка> Утилиты группу, и нажмите кнопку Рандомизировать > Выбрать случайным образом :

  • На панели надстройки выберите, что выбрать: случайные строки, случайные столбцы или случайные ячейки.
  • Укажите число или процент для желаемого размера выборки.
  • Нажмите кнопку Выберите Кнопка. Готово!
  • Например, вот как мы можем выбрать 5 случайных строк из нашего набора данных:

    И через секунду вы получите случайный выбор:

    Теперь вы можете нажать Ctrl + C, чтобы скопировать ваш случайный образец, а затем нажать Ctrl + V, чтобы вставить его на место в том же или другом листе.

    Если вы хотите протестировать инструмент Randomize в своих рабочих листах, просто возьмите пробную версию Ultimate Suite ниже. Если вы используете электронные таблицы Google, вам может пригодиться наш генератор случайных чисел для Google Sheets.

    Доступные загрузки

    Отбор случайной выборки - примеры формул (файл.xlsx)

    Ultimate Suite - пробная версия (файл .exe)

    Майкл Браун — увлеченный технологический энтузиаст, стремящийся упростить сложные процессы с помощью программных инструментов. Имея более чем десятилетний опыт работы в технологической отрасли, он отточил свои навыки в Microsoft Excel и Outlook, а также в Google Sheets и Docs. Блог Майкла посвящен тому, чтобы делиться своими знаниями и опытом с другими, предоставляя простые советы и учебные пособия для повышения производительности и эффективности. Являетесь ли вы опытным профессионалом или новичком, в блоге Майкла вы найдете ценную информацию и практические советы, которые помогут вам максимально эффективно использовать эти важные программные инструменты.