Случаен избор в Excel: как да получите случайна извадка от набор от данни

  • Споделя Това
Michael Brown

Този урок ще ви научи на няколко бързи начина за произволно избиране на имена, числа или други данни. Ще научите също как да получите случайна извадка без дубликати и как да изберете произволно определен брой или процент клетки, редове или колони с едно щракване на мишката.

Независимо дали правите пазарно проучване за пускане на нов продукт на пазара, или оценявате резултатите от маркетингова кампания, важно е да използвате безпристрастна извадка от данни за анализа си. А най-лесният начин да постигнете това е да направите случаен подбор в Excel.

    Какво е случайна извадка?

    Преди да обсъдим техниките за подбор на извадки, нека да предоставим малко информация за случайния подбор и кога може да искате да го използвате.

    В теорията на вероятностите и статистиката случайна извадка е подмножество от данни, избрани от по-голям набор от данни, известен още като население Всеки елемент от случайната извадка се избира напълно случайно и има еднаква вероятност да бъде избран. Защо ви е необходима такава извадка? По принцип, за да получите обективно представяне на цялата популация.

    Например искате да проведете малко проучване сред клиентите си. Очевидно не би било разумно да изпратите въпросник на всеки един човек от многохилядната си база данни. И така, кого да анкетирате? Дали това ще бъдат 100-те най-нови клиенти, или първите 100 клиенти, изброени по азбучен ред, или 100 души с най-кратки имена? Нито един от тези подходи не отговаря на нуждите ви, защото те са вътрешноЗа да получите безпристрастна извадка, в която всеки има равни възможности да бъде избран, направете случаен подбор, като използвате един от методите, описани по-долу.

    Случаен избор на Excel с формули

    В Excel няма вградена функция за случаен избор на клетки, но можете да използвате една от функциите за генериране на случайни числа като заобиколен вариант. Вероятно те не могат да се нарекат прости интуитивни формули, но работят.

    Как да изберем случайна стойност от списък

    Да предположим, че имате списък с имена в клетките A2:A10 и искате да изберете едно име от списъка на случаен принцип. Това може да стане с помощта на една от следните формули:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    или

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Това е всичко! Вашият инструмент за избор на случайни имена за Excel е настроен и готов за работа:

    Забележка. Моля, имайте предвид, че RANDBETWEEN е летливи За да предотвратите това, можете да копирате извлеченото име и да го поставите като стойност в друга клетка ( Специално поставяне > Стойности ). За подробни инструкции вижте Как да заменим формулите със стойности.

    Естествено, тези формули могат да избират не само произволни имена, но и произволни числа, дати или други произволни клетки.

    Как работят тези формули

    Накратко, използвате функцията INDEX, за да извлечете стойност от списъка въз основа на произволен номер на ред, върнат от RANDBETWEEN.

    По-конкретно, функцията RANDBETWEEN генерира случайно цяло число между двете посочени от вас стойности. За долната стойност посочвате числото 1. За горната стойност използвате COUNTA или ROWS, за да получите общия брой редове. В резултат на това RANDBETWEEN връща случайно число между 1 и общия брой редове в набора от данни. row_num аргумент на функцията INDEX, който указва кой ред да се избере. номер на колона използваме 1, тъй като искаме да извлечем стойност от първата колона.

    Забележка: Този метод работи добре за избор на една произволна клетка Ако извадката ви трябва да включва няколко клетки, горната формула може да върне няколко срещания на една и съща стойност, тъй като функцията RANDBETWEEN не е без дубликати. Това е особено характерно, когато избирате сравнително голяма извадка от сравнително малък списък. Следващият пример показва как да направите случаен избор в Excel без дубликати.

    Как да избирате на случаен принцип в Excel без дубликати

    Има няколко начина за избор на случайни данни без дублиране в Excel. Обикновено използвате функцията RAND, за да присвоите случайно число на всяка клетка, и след това избирате няколко клетки, като използвате формулата Index Rank.

    След като разполагате със списъка с имена в клетки A2:A16, следвайте следните стъпки, за да извлечете няколко произволни имена:

    1. Въведете формулата Rand в B2 и я копирайте надолу по колоната:

    =RAND()

  • Поставете следната формула в C2, за да извлечете случайна стойност от колона A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Копирайте горната формула в толкова клетки, колкото случайни стойности искате да изберете. В нашия случай копираме формулата в още четири клетки (C2:C6).
  • Това е всичко! Извличат се пет произволни имена без дубликати:

    Как работи тази формула

    Както и в предишния пример, използвате функцията INDEX, за да извлечете стойност от колона A въз основа на произволна координата на реда. В този случай са необходими две различни функции, за да я получите:

    • Формулата RAND попълва колона B със случайни числа.
    • Функцията RANK връща ранга на произволно число в същия ред. Например RANK(B2,$B$2:$B$16) в клетка C2 получава ранга на числото в B2. Когато се копира в C3, относителната референция B2 се променя на B3 и връща ранга на числото в B3 и т.н.
    • Числото, върнато от RANK, се подава към row_num аргумент на функцията INDEX, така че тя избира стойността от този ред. номер на колона (column_num) подавате 1, защото искате да извлечете стойност от първата колона.

    Едно предупреждение! Както е показано на снимката на екрана по-горе, нашата случайна селекция в Excel съдържа само уникални стойности. Но теоретично има малка вероятност в извадката ви да се появят дубликати. Ето защо: при много голям набор от данни RAND може да генерира дублиращи се случайни числа, а RANK ще върне един и същ ранг за тези числа. Лично аз никога не съм получавал дубликати по време на моите тестове, но на теория такава вероятностсъществува.

    Ако търсите надеждна формула за получаване на случаен избор само с уникални стойности, използвайте комбинацията RANK + COUNTIF или RANK.EQ + COUNTIF вместо само RANK. За подробно обяснение на логиката вижте раздел Уникално класиране в Excel.

    Пълната формула е малко тромава, но 100% без дубликати:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Забележки:

    • Подобно на RANDBETWEEN, функцията RAND на Excel също генерира нови случайни числа при всяко преизчисляване на работния лист, което води до промяна на случайния избор. За да запазите извадката непроменена, копирайте я и я поставете някъде другаде като стойности ( Паста Специален > Стойности ).
    • Ако едно и също име (число, дата или друга стойност) се появява повече от веднъж в първоначалния набор от данни, случайната извадка може да съдържа и няколко случая на една и съща стойност.

    Още начини за получаване на случайна извадка без повторения в Excel 365 - 2010 са описани тук: Как да получите случайна извадка в Excel без повторения.

    Как да изберете произволни редове в Excel

    В случай че работният ви лист съдържа повече от една колона с данни, можете да изберете случайна извадка по следния начин: задайте случайно число на всеки ред, подредете тези числа и изберете необходимия брой редове. Подробните стъпки следват по-долу.

    1. Вмъкнете нова колона вдясно или вляво от таблицата (колона D в този пример).
    2. В първата клетка на вмъкнатата колона, с изключение на заглавията на колоните, въведете формулата RAND: =RAND()
    3. Щракнете два пъти върху дръжката за запълване, за да копирате формулата надолу по колоната. В резултат на това на всеки ред ще бъде присвоено произволно число.
    4. Сортиране на случайните числа от най-голям до най-малък (сортирането във възходящ ред ще премести заглавията на колоните в долната част на таблицата, така че не забравяйте да сортирате в низходящ ред). За целта отидете в Данни tab> Сортиране и филтриране и щракнете върху бутона ZA. Excel автоматично ще разшири селекцията и ще подреди целите редове в произволен ред.

      Ако не сте напълно удовлетворени от начина, по който е подредена таблицата ви, натиснете отново бутона за сортиране, за да я промените. За подробни инструкции вижте Как да сортираме на случаен принцип в Excel.

    5. Накрая изберете необходимия брой редове за извадката, копирайте ги и ги поставете, където пожелаете.

    За да разгледате по-отблизо формулите, разгледани в този урок, можете да изтеглите нашата примерна работна книга за Excel Random Selection.

    Как да избирате на случаен принцип в Excel с инструмента Randomize

    След като вече знаете няколко формули за получаване на случайна извадка в Excel, нека видим как можете да постигнете същия резултат с едно кликване на мишката.

    С генератора на случайни числа за Excel, включен в нашия Ultimate Suite, можете да направите следното:

    1. Изберете която и да е клетка в таблицата.
    2. Отидете в Инструменти на Ablebits tab> Комунални услуги и щракнете върху Случайно > Изберете на случаен принцип :

  • В прозореца на добавката изберете какво да изберете: произволни редове, произволни колони или произволни клетки.
  • Посочете броя или процента за желания размер на извадката.
  • Щракнете върху Изберете бутон. Готово!
  • Например, така можем да изберем 5 произволни реда от нашия примерен набор от данни:

    И след секунда ще получите случаен избор:

    Сега можете да натиснете Ctrl + C, за да копирате случайната извадка, и след това да натиснете Ctrl + V, за да я поставите на място в същия или друг лист.

    Ако искате да изпробвате инструмента Randomize във вашите работни листове, просто вземете пробна версия на Ultimate Suite по-долу. Ако използвате електронни таблици на Google, може да ви бъде полезен нашият генератор на случайности за Google Sheets.

    Налични изтегляния

    Избор на случайна извадка - примери за формули (.xlsx файл)

    Ultimate Suite - пробна версия (.exe файл)

    Майкъл Браун е отдаден технологичен ентусиаст със страст към опростяване на сложни процеси с помощта на софтуерни инструменти. С повече от десетилетие опит в технологичната индустрия, той е усъвършенствал уменията си в Microsoft Excel и Outlook, както и в Google Sheets и Docs. Блогът на Майкъл е посветен на споделянето на неговите знания и опит с други, предоставяйки лесни за следване съвети и уроци за подобряване на продуктивността и ефективността. Независимо дали сте опитен професионалист или начинаещ, блогът на Michael предлага ценни прозрения и практически съвети за извличане на максимума от тези основни софтуерни инструменти.