Excel slučajni odabir: kako dobiti nasumični uzorak iz skupa podataka

  • Podijeli Ovo
Michael Brown

Ovaj vodič će vas naučiti nekoliko brzih načina da nasumično odaberete imena, brojeve ili bilo koje druge podatke. Također ćete naučiti kako dobiti nasumični uzorak bez duplikata i kako nasumično odabrati određeni broj ili postotak ćelija, redaka ili stupaca jednim klikom miša.

Bilo da radite istraživanje tržišta za novu lansiranje proizvoda ili procjenu rezultata vaše marketinške kampanje, važno je da koristite nepristrasan uzorak podataka za svoju analizu. A najlakši način da se to postigne je da dobijete nasumični odabir u Excel-u.

    Šta je slučajni uzorak?

    Prije razgovora o tehnikama uzorkovanja, pružimo malo osnovnih informacija o nasumičnom odabiru i kada biste ga mogli upotrijebiti.

    U teoriji vjerovatnoće i statistici, slučajni uzorak je podskup podataka odabranih iz većeg skupa podataka, odnosno populacija . Svaki element slučajnog uzorka odabran je sasvim slučajno i ima jednaku vjerovatnoću da bude izabran. Zašto bi ti trebao? U osnovi, da dobijete nepristrasan prikaz ukupne populacije.

    Na primjer, želite provesti malu anketu među svojim klijentima. Očigledno, ne bi bilo mudro slati upitnik svakoj pojedinoj osobi u vašoj bazi podataka od više hiljada. Dakle, koga ispitujete? Hoće li to biti 100 najnovijih kupaca, ili prvih 100 kupaca navedenih po abecednom redu, ili 100 ljudi s najkraćimimena? Nijedan od ovih pristupa ne odgovara vašim potrebama jer su urođeno pristrani. Da biste dobili nepristrasan uzorak u kojem svi imaju jednaku mogućnost da budu izabrani, izvršite nasumični odabir koristeći jednu od metoda opisanih u nastavku.

    Excel slučajni odabir sa formulama

    Nema ugrađenog funkciju za nasumično biranje ćelija u Excelu, ali možete koristiti jednu od funkcija za generiranje nasumičnih brojeva kao zaobilazno rješenje. Ove se vjerovatno ne mogu nazvati jednostavnim intuitivnim formulama, ali rade.

    Kako odabrati nasumične vrijednosti sa liste

    Pretpostavimo da imate listu imena u ćelijama A2:A10 i želite da nasumično odaberete jedno ime sa liste. To se može učiniti korištenjem jedne od sljedećih formula:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    ili

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    To je to! Vaš nasumični birač imena za Excel je postavljen i spreman za posluživanje:

    Napomena. Imajte na umu da je RANDBETWEEN promjenjiva funkcija, što znači da će se ponovo izračunavati sa svakom promjenom koju napravite na radnom listu. Kao rezultat toga, vaš slučajni odabir će se također promijeniti. Da biste spriječili da se to dogodi, možete kopirati izvučeno ime i zalijepiti ga kao vrijednost u drugu ćeliju ( Specijalno lijepljenje > Vrijednosti ). Za detaljne upute pogledajte Kako zamijeniti formule vrijednostima.

    Naravno, ove formule ne mogu samo odabrati nasumična imena, već i odabrati nasumične brojeve, datume ili bilo koje druge nasumičnećelije.

    Kako funkcioniraju ove formule

    Ukratko, koristite funkciju INDEX za izdvajanje vrijednosti iz liste na osnovu slučajnog broja reda koji vraća RANDBETWEEN.

    Konkretnije, funkcija RANDBETWEEN generira nasumični cijeli broj između dvije vrijednosti koje navedete. Za donju vrijednost dajete broj 1. Za gornju vrijednost koristite COUNTA ili ROWS da dobijete ukupan broj redova. Kao rezultat, RANDBETWEEN vraća nasumični broj između 1 i ukupnog broja redova u vašem skupu podataka. Ovaj broj ide u argument broj_reda funkcije INDEX govoreći joj koji red da izabere. Za argument broj_stupca koristimo 1 jer želimo izdvojiti vrijednost iz prve kolone.

    Napomena. Ova metoda dobro funkcionira za odabir jedne nasumične ćelije sa liste. Ako bi vaš uzorak trebao uključivati ​​nekoliko ćelija, gornja formula može vratiti nekoliko pojavljivanja iste vrijednosti jer funkcija RANDBETWEEN nije bez duplikata. To je posebno slučaj kada birate relativno veliki uzorak sa relativno male liste. Sljedeći primjer pokazuje kako napraviti nasumični odabir u Excelu bez duplikata.

    Kako nasumično odabrati u Excelu bez duplikata

    Postoji nekoliko načina za odabir nasumičnih podataka bez duplikata u Excelu. Općenito, koristite funkciju RAND da svakoj ćeliji dodijelite nasumični broj, a zatim odaberete nekoliko ćelija premakoristeći formulu indeksnog ranga.

    Sa listom imena u ćelijama A2:A16, slijedite ove korake da izdvojite nekoliko nasumičnih imena:

    1. Unesite Rand formulu u B2, i kopirajte je niz kolonu:

    =RAND()

  • Stavite formulu ispod u C2 da izvučete slučajnu vrijednost iz stupca A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Kopirajte gornju formulu u onoliko ćelija koliko nasumičnih vrijednosti želite odabrati. U našem slučaju, kopiramo formulu u još četiri ćelije (C2:C6).
  • To je to! Pet nasumičnih imena se izdvaja bez duplikata:

    Kako ova formula radi

    Kao u prethodnom primjeru, koristite funkciju INDEX za izdvajanje vrijednosti iz stupca A na osnovu nasumične koordinate reda. U ovom slučaju, potrebne su dvije različite funkcije da se to dobije:

    • Formula RAND popunjava stupac B slučajnim brojevima.
    • Funkcija RANK vraća rang kao slučajni broj u istom red. Na primjer, RANK(B2,$B$2:$B$16) u ćeliji C2 dobija rang broja u B2. Kada se kopira u C3, relativna referenca B2 se mijenja u B3 i vraća rang broja u B3, i tako dalje.
    • Broj koji vraća RANK se unosi u argument red_num argumenta funkciju INDEX, tako da bira vrijednost iz tog reda. U argumentu column_num dajete 1 jer želite da izdvojite vrijednost iz prve kolone.

    Upozorenje! Kao što je prikazano u snimak ekrana iznad, naš Excel nasumičnoodabir sadrži samo jedinstvene vrijednosti. Ali teoretski, male su šanse da se duplikati pojave u vašem uzorku. Evo zašto: na vrlo velikom skupu podataka, RAND može generirati duple nasumične brojeve, a RANK će vratiti isti rang za te brojeve. Lično, nikada nisam dobio nijedan duplikat tokom mojih testova, ali u teoriji takva vjerovatnoća postoji.

    Ako tražite formulu otpornu na metke da dobijete slučajni odabir samo sa jedinstvenim vrijednostima, onda koristite RANK + COUNTIF ili RANK.EQ + COUNTIF kombinacija umjesto samo RANK. Za detaljno objašnjenje logike pogledajte Jedinstveno rangiranje u Excelu.

    Kompletna formula je malo glomazna, ali 100% bez duplikata:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Napomene:

    • Poput RANDBETWEEN, Excel RAND funkcija također generiše nove nasumične brojeve sa svakim ponovnim izračunavanjem vašeg radnog lista, uzrokujući promjenu nasumične selekcije. Da vaš uzorak ostane nepromijenjen, kopirajte ga i zalijepite negdje drugdje kao vrijednosti ( Zalijepi Posebno > Vrijednosti ).
    • Ako isti naziv (broj, datum ili bilo koja druga vrijednost) se pojavljuje više puta u vašem izvornom skupu podataka, slučajni uzorak može također sadržavati nekoliko pojavljivanja iste vrijednosti.

    Više načina da dobijete nasumični odabir sa nema ponavljanja u Excelu 365 - 2010 ovdje je opisano: Kako dobiti nasumični uzorak u Excelu bez duplikata.

    Kako odabrati nasumične redove uExcel

    U slučaju da vaš radni list sadrži više od jedne kolone podataka, možete odabrati nasumični uzorak na ovaj način: svakom redu dodijeliti nasumični broj, sortirati te brojeve i odabrati potreban broj redova. Detaljni koraci slijede u nastavku.

    1. Umetnite novi stupac desno ili lijevo od vaše tabele (kolona D u ovom primjeru).
    2. U prvu ćeliju umetnutog kolonu, isključujući zaglavlja stupaca, unesite RAND formulu: =RAND()
    3. Dvaput kliknite na ručicu za popunjavanje da biste kopirali formulu niz kolonu. Kao rezultat, imat ćete nasumični broj dodijeljen svakom redu.
    4. Sortirajte nasumične brojeve najveći prema najmanjem (sortiranje u rastućem redoslijedu bi pomjerilo zaglavlja stupaca na dno tabele , pa svakako sortirajte opadajuće). Za ovo, prijeđite na karticu Podaci > Sort & Filter grupu i kliknite na dugme ZA. Excel će automatski proširiti izbor i sortirati cijele redove slučajnim redoslijedom.

      Ako niste sasvim zadovoljni načinom na koji je vaša tabela randomizirana, ponovo pritisnite tipku za sortiranje kako biste je iskoristili. Za detaljne upute pogledajte Kako nasumično sortirati u Excelu.

    5. Konačno, odaberite potreban broj redaka za svoj uzorak, kopirajte ih i zalijepite bilo gdje volite.

    Da biste bolje pogledali formule o kojima se raspravlja u ovom vodiču, dobrodošli ste da preuzmete naš uzorakradnu knjigu u Excel slučajni odabir.

    Kako nasumično odabrati u Excelu pomoću alata Randomize

    Sada kada znate pregršt formula za dobivanje slučajnog uzorka u Excelu, da vidimo kako možete postići isti rezultat klikom miša.

    Sa Random Generatorom za Excel uključenim u naš Ultimate Suite, evo što radite:

    1. Odaberite bilo koju ćeliju u svojoj tablici.
    2. Idite na karticu Ablebits Tools > Utilities grupu i kliknite na Randomize > Odaberi nasumično :

  • U oknu programskog dodatka odaberite šta želite odabrati: nasumične redove, nasumične kolone ili nasumične ćelije.
  • Odredite broj ili postotak za željenu veličinu uzorka.
  • Kliknite na dugme Odaberi . Gotovo!
  • Na primjer, ovako možemo odabrati 5 nasumičnih redova iz našeg skupa podataka uzorka:

    I dobićete nasumični odabir u drugo:

    Sada, možete pritisnuti Ctrl + C da kopirate svoj nasumični uzorak, a zatim pritisnuti Ctrl + V da ga zalijepite na lokaciju na istom ili drugom listu.

    Ako želite da testirate alat Randomize u svojim radnim listovima, samo uzmite probnu verziju Ultimate Suite ispod. U slučaju da koristite Google tabele, možda će vam biti od koristi naš Random Generator za Google Sheets.

    Dostupna preuzimanja

    Odabir slučajnog uzorka - primjeri formule (.xlsx fajl)

    Ultimate Suite - probna verzija (.exe fajl)

    Michael Brown je posvećen tehnološki entuzijasta sa strašću za pojednostavljenje složenih procesa pomoću softverskih alata. Sa više od decenije iskustva u tehnološkoj industriji, usavršio je svoje vještine u Microsoft Excelu i Outlooku, kao i Google Sheets i Docs. Michaelov blog je posvećen dijeljenju svog znanja i stručnosti s drugima, pružajući jednostavne savjete i tutorijale za poboljšanje produktivnosti i efikasnosti. Bilo da ste iskusni profesionalac ili početnik, Michaelov blog nudi vrijedne uvide i praktične savjete za izvlačenje maksimuma iz ovih osnovnih softverskih alata.