Kako dobiti nasumični uzorak u Excelu bez duplikata

  • Podijeli Ovo
Michael Brown

Vodič se fokusira na to kako napraviti nasumično uzorkovanje u Excelu bez ponavljanja. Pronaći ćete rješenja za Excel 365, Excel 2021, Excel 2019 i starije verzije.

Prije smo opisali nekoliko različitih načina za nasumični odabir u Excelu. Većina tih rješenja oslanja se na funkcije RAND i RANDBETWEEN, koje mogu generirati duple brojeve. Shodno tome, vaš slučajni uzorak može sadržavati ponavljajuće vrijednosti. Ako vam je potreban nasumični odabir bez duplikata, onda koristite pristupe opisane u ovom vodiču.

    Excel slučajni odabir sa liste bez duplikata

    Radi samo u Excel 365 i Excel 2021 koji podržavaju dinamičke nizove.

    Da biste napravili nasumični odabir sa liste bez ponavljanja, koristite ovu generičku formulu:

    INDEX(SORTBY( podaci, RANDARRAY(ROWS( podaci))), SEQUENCE( n))

    Gdje je n željena veličina odabira.

    Na primjer, da biste dobili 5 jedinstvenih nasumičnih imena sa liste u A2:A10, evo formule koju treba koristiti:

    =INDEX(SORTBY(A2:A10, RANDARRAY(ROWS(A2:A10))), SEQUENCE(5))

    Radi praktičnosti, možete unijeti veličinu uzorka u unaprijed definiranu ćeliju, recimo C2, i dostaviti referencu ćelije funkciji SEQUENCE:

    =INDEX(SORTBY(A2:A10, RANDARRAY(ROWS(A2:A10))), SEQUENCE(C2))

    Kako ova formula funkcionira:

    Evo objašnjenja na visokoj razini logike formule: funkcija RANDARRAY kreira niz slučajnih brojeva, SORTBY sortira originalne vrijednosti prema tim brojevima, a INDEX dohvaća onoliko vrijednosti koliko jespecificirano SEQUENCE.

    Detaljna raščlamba slijedi u nastavku:

    Funkcija ROWS broji koliko redova sadrži vaš skup podataka i prosljeđuje brojanje funkciji RANDARRAY, tako da može generirati isti broj nasumične decimale:

    RANDARRAY(ROWS(A2:C10))

    Ovaj niz nasumičnih decimala se koristi kao niz "sortiraj po" funkcijom SORTBY. Kao rezultat, vaši originalni podaci se nasumično miješaju.

    Iz nasumično sortiranih podataka izdvajate uzorak određene veličine. Za ovo, isporučujete promiješani niz funkciji INDEX i zahtijevate dohvat prvih N vrijednosti uz pomoć SEQUENCE funkcije, koja proizvodi niz brojeva od 1 do N . Budući da su originalni podaci već sortirani nasumičnim redoslijedom, nije nas baš briga koje pozicije da dohvatimo, važna je samo količina.

    Odaberi nasumične redove u Excelu bez duplikata

    Radi samo u Excel 365 i Excel 2021 koji podržavaju dinamičke nizove.

    Da odaberete nasumične redove bez ponavljanja, napravite formulu na ovaj način:

    INDEX(SORTBY( podaci, RANDARRAY(ROWS( podaci))), SEQUENCE( n), {1,2,…})

    Gdje je n veličina uzorka i {1,2,…} su brojevi kolona za izdvajanje.

    Kao primjer, izaberimo nasumične redove iz A2:C10 bez duplih unosa, na osnovu veličine uzorka u F1. Pošto su naši podaci u 3 kolone, ovu konstantu niza unosimo u formulu:{1,2,3}

    =INDEX(SORTBY(A2:C10, RANDARRAY(ROWS(A2:C10))), SEQUENCE(F1), {1,2,3})

    I dobićete sljedeći rezultat:

    Kako ova formula funkcionira:

    Formula radi s potpuno istom logikom kao i prethodna. Mala promjena koja čini veliku razliku je ta što navedete i argumente broj_reda i broj_stupca za funkciju INDEX: broj_reda dostavlja SEQUENCE i column_num konstantom niza.

    Kako napraviti nasumično uzorkovanje u programu Excel 2010 - 2019

    Pošto samo Excel za Microsoft 365 i Excel 2021 podržava dinamičke nizove, funkcije dinamičkog niza koje se koriste u prethodni primjeri rade samo u Excelu 365. Za druge verzije, morat ćete izraditi drugačije rješenje.

    Pretpostavimo da želite nasumični odabir sa liste u A2:A10. To se može učiniti s 2 odvojene formule:

    1. Generirajte slučajne brojeve pomoću Rand formule. U našem slučaju, unosimo je u B2, a zatim kopiramo na B10:

      =RAND()

    2. Izdvoji prvu slučajnu vrijednost sa donjom formulom, koju unosite u E2:

      =INDEX($A$2:$A$10, RANK.EQ(B2, $B$2:$B$10) + COUNTIF($B$2:B2, B2) - 1)

    3. Kopirajte gornju formulu u onoliko ćelija koliko nasumičnih vrijednosti želite odabrati. U ovom primjeru želimo 4 imena, tako da kopiramo formulu od E2 do E5.

    Gotovo! Naš nasumični uzorak bez duplikata izgleda kako slijedi:

    Kako ova formula funkcionira:

    Kao u prvom primjeru, koristite Funkcija INDEX za dohvaćanje vrijednosti iz stupca A na temelju slučajnog redabrojevi. Razlika je u tome kako dobijate te brojeve:

    Funkcija RAND ispunjava raspon B2:B10 nasumičnim decimalama.

    Funkcija RANK.EQ izračunava rang slučajnog broja u datom red. Na primjer, u E2, RANK.EQ(B2, $B$2:$B$10) rangira broj u B2 u odnosu na sve brojeve u B2:B10. Kada se kopira u E3, relativna referenca B2 se mijenja u B3 i vraća rang broja u B3, i tako dalje.

    Funkcija COUNTIF pronalazi koliko pojavljivanja datog broja ima u gornjim ćelijama. Na primjer, u E2, COUNTIF($B$2:B2, B2) provjerava samo jednu ćeliju - samu B2, i vraća 1. U E5, formula se mijenja u COUNTIF($B$2:B5, B5) i vraća 2, jer B5 sadrži istu vrijednost kao i B2 (imajte na umu, ovo je samo radi boljeg objašnjenja logike formule; na malom skupu podataka, šanse za dobijanje duplikata slučajnih brojeva su blizu nuli).

    Kao rezultat, za sve 1. pojavljivanja, COUNTIF vraća 1, od čega oduzimate 1 da biste zadržali originalni rang. Za 2. pojavljivanja, COUNTIF vraća 2. Oduzimanjem 1 povećavate rangiranje za 1 i na taj način sprječavate duple rangove.

    Na primjer, za B2, RANK.EQ vraća 1. Pošto je ovo prvo pojavljivanje, COUNTIF također vraća 1. RANK.EQ + COUNTIF daje 2. I - 1 vraća rang 1.

    Sada pogledajte šta se dešava u slučaju 2. pojave. Za B5, RANK.EQ također vraća 1 dok COUNTIF vraća 2. Sabiranje ovih daje3, od čega oduzimate 1. Kao konačni rezultat, dobijate 2, što predstavlja rang broja u B5.

    Rang ide na row_num argument funkcije INDEX , i bira vrijednost iz odgovarajućeg reda (argument broj_stupca je izostavljen, tako da je zadana vrijednost 1). To je razlog zašto je toliko važno izbjeći dupliranje rangiranja. Da nije bilo funkcije COUNTIF, RANK.EQ bi dao 1 i za B2 i za B5, uzrokujući da INDEX vrati vrijednost iz prvog retka (Andrew) dvaput.

    Kako spriječiti promjenu slučajnog uzorka Excela

    Budući da su sve funkcije randomiziranja u Excelu, kao što su RAND, RANDBETWEEN i RANDARRAY, promjenjive, one se ponovo izračunavaju sa svakom promjenom na radnom listu. Kao rezultat, vaš slučajni uzorak će se stalno mijenjati. Da biste spriječili da se to dogodi, koristite opciju Paste Special > Funkcija vrijednosti za zamjenu formula statičkim vrijednostima. Za to izvršite ove korake:

    1. Izaberite sve ćelije sa svojom formulom (bilo koju formulu koja sadrži funkciju RAND, RANDBETWEEN ili RANDARRAY) i pritisnite Ctrl + C da ih kopirate.
    2. Desni klik na odabrani raspon i kliknite na Specijalno lijepljenje > Vrijednosti . Alternativno, pritisnite Shift + F10, a zatim V , što je prečica za gore spomenutu funkciju.

    Za detaljne korake pogledajte Kako pretvoriti formule u vrijednosti u Excel-u.

    Excel slučajni odabir: redovi, koloneili ćelije

    Radi u svim verzijama Excela 365 do Excel 2010.

    Ako imate naš Ultimate Suite instaliran u vašem Excelu, tada možete vršiti nasumično uzorkovanje pomoću klik mišem umjesto formule. Evo kako:

    1. Na kartici Alati Ablebits kliknite na Nasumično > Odaberi nasumično .
    2. Odaberi raspon iz kojeg želite odabrati uzorak.
    3. U oknu dodatka uradite sljedeće:
      • Odaberite da li želite da odaberete nasumične redove, stupce ili ćelije.
      • Definirajte veličinu uzorka: to može biti postotak ili broj.
      • Kliknite na dugme Odaberi .

    To je to! Kao što je prikazano na slici ispod, nasumični uzorak se bira direktno u vašem skupu podataka. Ako ga želite negdje kopirati, samo pritisnite običnu prečicu za kopiranje (Ctrl + C) .

    Tako možete odabrati nasumični uzorak u Excelu bez duplikata. Zahvaljujem vam na čitanju i nadam se da se vidimo na našem blogu sljedeće sedmice!

    Dostupna preuzimanja

    Slučajni uzorak bez duplikata - primjeri formula (.xlsx datoteka)

    Ultimate Suite 14-dnevna potpuno funkcionalna verzija (.exe datoteka)

    Michael Brown je posvećen tehnološki entuzijasta sa strašću za pojednostavljenje složenih procesa pomoću softverskih alata. Sa više od decenije iskustva u tehnološkoj industriji, usavršio je svoje vještine u Microsoft Excelu i Outlooku, kao i Google Sheets i Docs. Michaelov blog je posvećen dijeljenju svog znanja i stručnosti s drugima, pružajući jednostavne savjete i tutorijale za poboljšanje produktivnosti i efikasnosti. Bilo da ste iskusni profesionalac ili početnik, Michaelov blog nudi vrijedne uvide i praktične savjete za izvlačenje maksimuma iz ovih osnovnih softverskih alata.