Excel slučajni odabir: kako dobiti slučajni uzorak iz skupa podataka

  • Podijeli Ovo
Michael Brown

Ovaj vodič će vas naučiti nekoliko brzih načina za nasumični odabir imena, brojeva ili bilo kojih drugih podataka. Također ćete naučiti kako dobiti nasumični uzorak bez duplikata i kako nasumično odabrati određeni broj ili postotak ćelija, redaka ili stupaca jednim klikom miša.

Bilo da radite istraživanje tržišta za novi lansiranje proizvoda ili procjena rezultata vaše marketinške kampanje, važno je da za analizu koristite nepristran uzorak podataka. A najlakši način da to postignete je dobivanje slučajnog odabira u Excelu.

    Što je slučajni uzorak?

    Prije rasprave o tehnikama uzorkovanja, dajmo malo pozadinskih informacija o slučajnom odabiru i kada biste ga mogli upotrijebiti.

    U teoriji vjerojatnosti i statistici, slučajni uzorak je podskup podataka odabranih iz većeg skupa podataka, tzv. populacija . Svaki element slučajnog uzorka odabran je potpuno slučajno i ima jednaku vjerojatnost da bude odabran. Zašto bi ti trebao? Uglavnom, da biste dobili nepristranu reprezentaciju ukupne populacije.

    Na primjer, želite provesti malu anketu među svojim kupcima. Očito, ne bi bilo mudro slati upitnik svakoj pojedinoj osobi u vašoj bazi podataka od više tisuća. Dakle, koga provodite u anketi? Hoće li to biti 100 najnovijih kupaca, ili prvih 100 kupaca poredanih abecednim redom, ili 100 ljudi s najkraćimimena? Nijedan od ovih pristupa ne odgovara vašim potrebama jer su urođeno pristrani. Da biste dobili nepristran uzorak gdje svatko ima jednaku priliku biti odabran, izvršite nasumični odabir pomoću jedne od dolje opisanih metoda.

    Excel nasumični odabir s formulama

    Nema ugrađenog funkciju za nasumično odabiranje ćelija u Excelu, ali možete upotrijebiti jednu od funkcija za generiranje nasumičnih brojeva kao zaobilazno rješenje. To se vjerojatno ne može nazvati jednostavnim intuitivnim formulama, ali rade.

    Kako odabrati slučajnu vrijednost s popisa

    Pretpostavimo da imate popis imena u ćelijama A2:A10 i želite da nasumično odaberete jedno ime s popisa. To se može učiniti pomoću jedne od sljedećih formula:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    ili

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    To je to! Vaš alat za odabir nasumičnog imena za Excel je postavljen i spreman za posluživanje:

    Napomena. Imajte na umu da je RANDBETWEEN nestalna funkcija, što znači da će se ponovno izračunati sa svakom promjenom koju napravite na radnom listu. Kao rezultat toga, promijenit će se i vaš slučajni odabir. Kako biste spriječili da se to dogodi, možete kopirati izdvojeni naziv i zalijepiti ga kao vrijednost u drugu ćeliju ( Posebno lijepljenje > Vrijednosti ). Za detaljne upute pogledajte Kako zamijeniti formule vrijednostima.

    Naravno, ove formule ne samo da mogu odabrati nasumična imena, već i odabrati nasumične brojeve, datume ili bilo koje druge slučajnećelije.

    Kako ove formule funkcioniraju

    Ukratko, koristite funkciju INDEX za izdvajanje vrijednosti s popisa na temelju nasumičnog broja retka koji vraća RANDBETWEEN.

    Točnije, funkcija RANDBETWEEN generira nasumični cijeli broj između dvije vrijednosti koje navedete. Za nižu vrijednost unosite broj 1. Za gornju vrijednost koristite ili COUNTA ili ROWS da biste dobili ukupan broj redaka. Kao rezultat, RANDBETWEEN vraća nasumični broj između 1 i ukupnog broja redaka u vašem skupu podataka. Ovaj broj ide u argument row_num funkcije INDEX govoreći joj koji redak odabrati. Za argument column_num koristimo 1 jer želimo izdvojiti vrijednost iz prvog stupca.

    Napomena. Ova metoda dobro funkcionira za odabir jedne nasumične ćelije s popisa. Ako vaš uzorak treba sadržavati nekoliko ćelija, gornja formula može vratiti nekoliko pojavljivanja iste vrijednosti jer funkcija RANDBETWEEN nije bez duplikata. To je posebno slučaj kada birate relativno veliki uzorak s relativno malog popisa. Sljedeći primjer pokazuje kako izvršiti nasumični odabir u Excelu bez duplikata.

    Kako nasumično odabrati u Excelu bez duplikata

    Postoji nekoliko načina odabira nasumičnih podataka bez duplikata u Excelu. Općenito, upotrijebite funkciju RAND za dodjelu nasumičnog broja svakoj ćeliji, a zatim odaberete nekoliko ćelijakoristeći formulu ranga indeksa.

    S popisom imena u ćelijama A2:A16, slijedite ove korake da izdvojite nekoliko nasumičnih imena:

    1. Unesite Rand formulu u B2, i kopirajte je u stupac:

    =RAND()

  • Stavite donju formulu u C2 da izvučete slučajnu vrijednost iz stupca A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Kopirajte gornju formulu u onoliko ćelija koliko nasumičnih vrijednosti želite odabrati. U našem slučaju, kopiramo formulu u još četiri ćelije (C2:C6).
  • To je to! Pet nasumičnih imena izdvojeno je bez duplikata:

    Kako ova formula radi

    Kao u prethodnom primjeru, koristite funkciju INDEX za izdvajanje vrijednosti iz stupca A na temelju slučajne koordinate retka. U ovom slučaju potrebne su dvije različite funkcije da bi se to dobilo:

    • Formula RAND popunjava stupac B nasumičnim brojevima.
    • Funkcija RANK vraća rang slučajni broj u istom red. Na primjer, RANK(B2,$B$2:$B$16) u ćeliji C2 dobiva rang broja u B2. Kada se kopira u C3, relativna referenca B2 mijenja se u B3 i vraća rang broja u B3, i tako dalje.
    • Broj koji vraća RANK šalje se argumentu row_num od funkciju INDEX, pa odabire vrijednost iz tog retka. U argumentu column_num dajete 1 jer želite izdvojiti vrijednost iz prvog stupca.

    Riječ opreza! Kao što je prikazano u snimak zaslona iznad, naš Excel slučajniodabir sadrži samo jedinstvene vrijednosti. Ali teoretski, mala je vjerojatnost da se duplikati pojave u vašem uzorku. Evo zašto: na vrlo velikom skupu podataka, RAND može generirati duple nasumične brojeve, a RANK će vratiti isti rang za te brojeve. Osobno, nikada nisam dobio nijedan duplikat tijekom svojih testova, ali u teoriji takva vjerojatnost postoji.

    Ako tražite neprobojnu formulu za dobivanje slučajnog odabira samo s jedinstvenim vrijednostima, tada koristite RANK + COUNTIF ili kombinacija RANK.EQ + COUNTIF umjesto samo RANK. Za detaljno objašnjenje logike pogledajte Jedinstveno rangiranje u Excelu.

    Kompletna formula je malo glomazna, ali 100% bez duplikata:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Napomene:

    • Kao RANDBETWEEN, funkcija Excel RAND također generira nove slučajne brojeve sa svakim ponovnim izračunom vašeg radnog lista, uzrokujući promjenu slučajnog odabira. Kako bi vaš uzorak ostao nepromijenjen, kopirajte ga i zalijepite negdje drugdje kao vrijednosti ( Zalijepi Posebne > Vrijednosti ).
    • Ako je isti naziv (broj, datum ili bilo koja druga vrijednost) pojavljuje više puta u vašem izvornom skupu podataka, nasumični uzorak također može sadržavati nekoliko pojavljivanja iste vrijednosti.

    Više načina za dobivanje slučajnog odabira s bez ponavljanja u programu Excel 365 - 2010 opisani su ovdje: Kako dobiti nasumični uzorak u programu Excel bez duplikata.

    Kako odabrati nasumične retke uExcel

    U slučaju da vaš radni list sadrži više od jednog stupca podataka, možete odabrati nasumični uzorak na ovaj način: dodijelite nasumični broj svakom retku, razvrstajte te brojeve i odaberite potreban broj redaka. Detaljni koraci slijede u nastavku.

    1. Umetnite novi stupac s desne ili lijeve strane svoje tablice (stupac D u ovom primjeru).
    2. U prvoj ćeliji umetnutog stupca, isključujući zaglavlja stupaca, unesite RAND formulu: =RAND()
    3. Dvaput kliknite ručicu za popunjavanje da kopirate formulu niz stupac. Kao rezultat toga, imat ćete nasumični broj dodijeljen svakom retku.
    4. Poređajte nasumične brojeve od najvećeg do najmanjeg (sortiranje uzlaznim redoslijedom premjestilo bi zaglavlja stupaca na dno tablice , pa svakako sortirajte silaznim redom). Za to idite na karticu Podaci > Sortiraj & Grupa Filter i kliknite gumb ZA. Excel će automatski proširiti odabir i sortirati cijele retke nasumičnim redoslijedom.

      Ako niste baš zadovoljni s načinom na koji je vaša tablica nasumično raspoređena, ponovno pritisnite gumb za sortiranje da biste to učinili. Za detaljne upute pogledajte Kako nasumično sortirati u Excelu.

    5. Na kraju odaberite potreban broj redaka za svoj uzorak, kopirajte ih i zalijepite gdje god želite želite.

    Da biste pobliže pogledali formule o kojima se govori u ovom vodiču, slobodno preuzmite naš uzorakradne knjige u Excel Nasumični odabir.

    Kako nasumično odabrati u Excelu s Randomize alatom

    Sada kada znate pregršt formula za dobivanje nasumičnog uzorka u Excelu, da vidimo kako možete postići isti rezultat klikom miša.

    S Random Generatorom za Excel uključenim u naš Ultimate Suite, evo što radite:

    1. Odaberite bilo koju ćeliju u svojoj tablici.
    2. Idite na karticu Alatebits Alati > Uslužni programi grupu, i kliknite Nasumično > Odaberi nasumično :

  • U oknu dodatka odaberite što odabrati: nasumične retke, nasumične stupce ili nasumične ćelije.
  • Odredite broj ili postotak za željenu veličinu uzorka.
  • Kliknite gumb Odaberi . Gotovo!
  • Na primjer, ovako možemo odabrati 5 nasumičnih redaka iz našeg uzorka skupa podataka:

    I dobit ćete nasumični odabir u drugo:

    Sada možete pritisnuti Ctrl + C da kopirate svoj slučajni uzorak, a zatim pritisnite Ctrl + V da ga zalijepite na mjesto na istom ili drugom listu.

    Ako želite testirati alat Randomize u svojim radnim listovima, jednostavno uzmite probnu verziju Ultimate Suite-a u nastavku. U slučaju da koristite Google proračunske tablice, naš Generator slučajnog odabira za Google tablice može vam biti koristan.

    Dostupna preuzimanja

    Odabir slučajnog uzorka - primjeri formula (.xlsx datoteka)

    Ultimate Suite - probna verzija (.exe datoteka)

    Michael Brown predani je tehnološki entuzijast sa strašću za pojednostavljivanjem složenih procesa pomoću softverskih alata. S više od desetljeća iskustva u tehnološkoj industriji, usavršio je svoje vještine u Microsoft Excelu i Outlooku, kao i Google tablicama i dokumentima. Michaelov blog posvećen je dijeljenju znanja i stručnosti s drugima, pružajući savjete i upute koje je lako slijediti za poboljšanje produktivnosti i učinkovitosti. Bez obzira jeste li iskusni profesionalac ili početnik, Michaelov blog nudi vrijedne uvide i praktične savjete za izvlačenje maksimuma iz ovih osnovnih softverskih alata.