Wybór losowy w Excelu: jak uzyskać losową próbkę z zestawu danych

  • Udostępnij To
Michael Brown

Ten tutorial nauczy Cię kilku szybkich sposobów na losowe wybieranie nazwisk, liczb lub dowolnych innych danych. Dowiesz się również, jak uzyskać losową próbkę bez duplikatów i jak losowo wybrać określoną liczbę lub procent komórek, wierszy lub kolumn za pomocą jednego kliknięcia myszką.

Niezależnie od tego, czy prowadzisz badania rynku w celu wprowadzenia nowego produktu, czy oceniasz wyniki kampanii marketingowej, ważne jest, abyś używał bezstronnej próbki danych do analizy. A najprostszym sposobem na osiągnięcie tego jest uzyskanie losowego wyboru w programie Excel.

    Co to jest próba losowa?

    Przed omówieniem technik próbkowania, przedstawmy trochę informacji o wyborze losowym i kiedy można chcieć go użyć.

    W teorii prawdopodobieństwa i statystyce próba losowa jest podzbiorem danych wybranych z większego zbioru danych, aka populacja Każdy element próby losowej jest wybierany całkowicie przypadkowo i ma równe prawdopodobieństwo bycia wybranym. Dlaczego potrzebujesz takiej próby? Zasadniczo, aby uzyskać nieobiektywną reprezentację całej populacji.

    Na przykład, chcesz przeprowadzić małą ankietę wśród swoich klientów. Oczywiście nierozsądne byłoby wysyłanie ankiety do każdej osoby z wielotysięcznej bazy danych. Więc kogo ankietować? Czy będzie to 100 najnowszych klientów, czy 100 pierwszych klientów uszeregowanych alfabetycznie, czy 100 osób o najkrótszych imionach? Żadne z tych podejść nie pasuje do Twoich potrzeb, ponieważ są one wrodzoneAby uzyskać bezstronną próbę, w której każdy ma równe szanse na bycie wybranym, należy dokonać losowego wyboru za pomocą jednej z metod opisanych poniżej.

    Excel losowy wybór z formułami

    Nie ma wbudowanej funkcji do losowego wybierania komórek w programie Excel, ale możesz użyć jednej z funkcji do generowania losowych liczb jako obejścia. Prawdopodobnie nie można ich nazwać prostymi intuicyjnymi formułami, ale działają.

    Jak wybrać losową wartość z listy

    Załóżmy, że masz listę nazwisk w komórkach A2:A10 i chcesz losowo wybrać jedno nazwisko z listy. Można to zrobić za pomocą jednej z poniższych formuł:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    lub

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    To jest to! Twój losowy wybieracz nazw dla Excela jest ustawiony i gotowy do obsługi:

    Uwaga. Proszę pamiętać, że RANDBETWEEN jest lotny Aby temu zapobiec, można skopiować wyodrębnioną nazwę i wkleić ją jako wartość do innej komórki ( Wklej Specjalnie > Wartości ). Szczegółowa instrukcja znajduje się w części Jak zastąpić formuły wartościami.

    Oczywiście te formuły mogą nie tylko wybrać losowe nazwy, ale także wybrać losowe liczby, daty lub dowolne inne losowe komórki.

    Jak działają te formuły

    W skrócie, używasz funkcji INDEX do wyodrębnienia wartości z listy na podstawie losowego numeru wiersza zwróconego przez RANDBETWEEN.

    Dokładniej mówiąc, funkcja RANDBETWEEN generuje losową liczbę całkowitą pomiędzy dwiema podanymi przez użytkownika wartościami. Dla dolnej wartości podajemy liczbę 1. Dla górnej wartości używamy COUNTA lub ROWS, aby uzyskać całkowitą liczbę wierszy. W rezultacie RANDBETWEEN zwraca losową liczbę pomiędzy 1 a całkowitą liczbą wierszy w zbiorze danych. Liczba ta trafia do suma wierszy argument funkcji INDEX mówiący o tym, który wiersz wybrać. Dla kolumna_num argument, używamy 1, ponieważ chcemy wyodrębnić wartość z pierwszej kolumny.

    Uwaga. Ta metoda sprawdza się przy wyborze jedna losowa komórka Jeśli Twoja próbka ma zawierać kilka komórek, to powyższa formuła może zwrócić kilka wystąpień tej samej wartości, ponieważ funkcja RANDBETWEEN nie jest wolna od duplikatów. Dzieje się tak zwłaszcza wtedy, gdy wybierasz stosunkowo dużą próbkę ze stosunkowo małej listy. Kolejny przykład pokazuje, jak dokonać losowego wyboru w Excelu bez duplikatów.

    Jak losowo wybrać w programie Excel bez duplikatów

    Istnieje kilka sposobów na wybranie losowych danych bez duplikatów w programie Excel. Ogólnie rzecz biorąc, użyłbyś funkcji RAND, aby przypisać losową liczbę do każdej komórki, a następnie wybierzesz kilka komórek za pomocą formuły Index Rank.

    Mając listę nazwisk w komórkach A2:A16, wykonaj poniższe kroki, aby wyodrębnić kilka losowych nazwisk:

    1. Wpisz formułę Rand w B2 i skopiuj ją w dół kolumny:

    =RAND()

  • Umieść poniższą formułę w C2, aby wyodrębnić losową wartość z kolumny A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Skopiuj powyższą formułę do tylu komórek, ile wartości losowych chcesz wybrać. W naszym przypadku kopiujemy formułę do czterech kolejnych komórek (C2:C6).
  • To jest to! Pięć losowych nazw jest wyodrębnionych bez duplikatów:

    Jak działa ta formuła

    Podobnie jak w poprzednim przykładzie, używasz funkcji INDEX do wyodrębnienia wartości z kolumny A na podstawie losowej współrzędnej wiersza. W tym przypadku potrzeba dwóch różnych funkcji, aby ją uzyskać:

    • Formuła RAND wypełnia kolumnę B liczbami losowymi.
    • Funkcja RANK zwraca rangę losowej liczby w tym samym wierszu. Na przykład RANK(B2,$B$2:$B$16) w komórce C2 uzyskuje rangę liczby w B2. Po skopiowaniu do C3 odniesienie względne B2 zmienia się na B3 i zwraca rangę liczby w B3 itd.
    • Liczba zwrócona przez RANK jest podawana do suma wierszy argumentu funkcji INDEX, więc wybiera wartość z tego wiersza.W kolumna_num argument, podajesz 1, ponieważ chcesz wyodrębnić wartość z pierwszej kolumny.

    Słowo ostrzeżenia! Jak widać na powyższym zrzucie ekranu, nasz losowy wybór w Excelu zawiera tylko unikalne wartości. Jednak teoretycznie istnieje niewielka szansa na pojawienie się duplikatów w twojej próbce. Oto dlaczego: na bardzo dużym zbiorze danych, RAND może wygenerować duplikaty liczb losowych, a RANK zwróci tę samą rangę dla tych liczb. Osobiście nigdy nie otrzymałem żadnych duplikatów podczas moich testów, ale w teorii takie prawdopodobieństwoistnieje.

    Jeśli szukasz kuloodpornej formuły, aby uzyskać losowy wybór z tylko unikalnymi wartościami, a następnie użyj kombinacji RANK + COUNTIF lub RANK.EQ + COUNTIF zamiast tylko RANK. Aby uzyskać szczegółowe wyjaśnienie logiki, zobacz Unikalny ranking w programie Excel.

    Pełna formuła jest nieco kłopotliwa, ale w 100% wolna od duplikatów:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Uwagi:

    • Podobnie jak RANDBETWEEN, funkcja Excel RAND również generuje nowe liczby losowe przy każdym przeliczeniu arkusza, powodując zmianę losowego wyboru. Aby zachować niezmienioną próbę, skopiuj ją i wklej gdzieś indziej jako wartości ( Pasta Specjalne > Wartości ).
    • Jeśli ta sama nazwa (liczba, data lub jakakolwiek inna wartość) pojawia się więcej niż raz w twoim oryginalnym zestawie danych, losowa próbka może również zawierać kilka wystąpień tej samej wartości.

    Więcej sposobów na uzyskanie losowego wyboru bez powtórzeń w Excelu 365 - 2010 opisałem tutaj: Jak uzyskać losową próbkę w Excelu bez duplikatów.

    Jak wybrać losowe wiersze w programie Excel

    W przypadku, gdy Twój arkusz zawiera więcej niż jedną kolumnę danych, możesz wybrać losową próbkę w ten sposób: przypisz losową liczbę do każdego wiersza, posortuj te liczby i wybierz wymaganą liczbę wierszy. Szczegółowe kroki znajdziesz poniżej.

    1. Wstaw nową kolumnę po prawej lub po lewej stronie swojej tabeli (w tym przykładzie kolumna D).
    2. W pierwszej komórce wstawionej kolumny, z pominięciem nagłówków kolumn, wprowadź formułę RAND: =RAND()
    3. Kliknij dwukrotnie uchwyt wypełnienia, aby skopiować formułę w dół kolumny. W rezultacie do każdego wiersza zostanie przypisana losowa liczba.
    4. Posortuj liczby losowe największy do najmniejszego (sortowanie rosnące spowodowałoby przesunięcie nagłówków kolumn na dół tabeli, więc upewnij się, że sortujesz malejąco). Aby to zrobić, przejdź do Dane tab> Sortowanie & Filtr grupę i kliknij przycisk ZA. Excel automatycznie rozszerzy zaznaczenie i posortuje całe wiersze w kolejności losowej.

      Jeśli nie jesteś całkiem zadowolony z tego, jak twoja tabela została randomizowana, uderz ponownie w przycisk sortowania, aby ją uciec. Szczegółowe instrukcje można znaleźć w sekcji Jak losowo sortować w programie Excel.

    5. Na koniec wybierz wymaganą liczbę wierszy dla swojej próbki, skopiuj je i wklej gdziekolwiek chcesz.

    Aby przyjrzeć się bliżej formułom omawianym w tym tutorialu, zapraszamy do pobrania naszego przykładowego skoroszytu do Excela Wybór losowy.

    Jak losowo wybrać w Excelu za pomocą narzędzia Randomize

    Teraz, gdy znasz garść formuł, aby uzyskać losową próbkę w programie Excel, zobaczmy, jak możesz osiągnąć ten sam wynik za pomocą kliknięcia myszą.

    Z Random Generator for Excel dołączony do naszego Ultimate Suite, oto co robisz:

    1. Zaznacz dowolną komórkę w swojej tabeli.
    2. Idź do Narzędzia Ablebits tab> Narzędzia grupę, a następnie kliknij Randomizuj > Wybierz losowo :

  • W okienku dodatku wybierz, co ma być wybrane: losowe wiersze, losowe kolumny lub losowe komórki.
  • Określ liczbę lub procent dla żądanej wielkości próbki.
  • Kliknij przycisk Wybierz Gotowe!
  • Na przykład, w ten sposób możemy wybrać 5 losowych wierszy z naszego przykładowego zestawu danych:

    I za sekundę otrzymasz losowy wybór:

    Teraz możesz nacisnąć Ctrl + C, aby skopiować swoją losową próbkę, a następnie nacisnąć Ctrl + V, aby wkleić ją do lokalizacji w tym samym lub innym arkuszu.

    Jeśli chcesz przetestować narzędzie Randomize w swoich arkuszach, pobierz poniżej wersję próbną Ultimate Suite. Jeśli korzystasz z arkuszy kalkulacyjnych Google, może przydać ci się nasz Generator Losowy dla arkuszy Google.

    Dostępne pliki do pobrania

    Wybór próby losowej - przykłady formuł (plik .xlsx)

    Ultimate Suite - wersja próbna (plik .exe)

    Michael Brown jest oddanym entuzjastą technologii z pasją do upraszczania złożonych procesów za pomocą narzędzi programowych. Dzięki ponad dziesięcioletniemu doświadczeniu w branży technologicznej doskonalił swoje umiejętności w programach Microsoft Excel i Outlook, a także w Arkuszach i Dokumentach Google. Blog Michaela jest poświęcony dzieleniu się swoją wiedzą i doświadczeniem z innymi, dostarczając łatwych do zastosowania wskazówek i samouczków w celu poprawy produktywności i wydajności. Niezależnie od tego, czy jesteś doświadczonym profesjonalistą, czy początkującym, blog Michaela oferuje cenne spostrzeżenia i praktyczne porady dotyczące maksymalnego wykorzystania tych niezbędnych narzędzi programowych.