Excelova naključna izbira: kako dobiti naključni vzorec iz podatkovne množice

  • Deliti To
Michael Brown

V tem učbeniku se boste naučili nekaj hitrih načinov za naključno izbiro imen, številk ali drugih podatkov. Naučili se boste tudi, kako dobiti naključni vzorec brez podvajanj in kako s klikom miške naključno izbrati določeno število ali odstotek celic, vrstic ali stolpcev.

Ne glede na to, ali izvajate tržno raziskavo za lansiranje novega izdelka ali ocenjujete rezultate svoje trženjske kampanje, je pomembno, da za analizo uporabite nepristranski vzorec podatkov. To najlažje dosežete tako, da v programu Excel pridobite naključni izbor.

    Kaj je naključni vzorec?

    Preden začnemo razpravljati o tehnikah vzorčenja, si poglejmo nekaj osnovnih informacij o naključni izbiri in o tem, kdaj jo boste morda želeli uporabiti.

    V teoriji verjetnosti in statistiki je naključni vzorec je podmnožica podatkov, izbrana iz večjega nabora podatkov. prebivalstvo Vsak element naključnega vzorca je izbran povsem naključno in ima enako verjetnost, da bo izbran. Zakaj bi ga potrebovali? Načeloma zato, da bi dobili nepristransko predstavitev celotne populacije.

    Očitno ne bi bilo pametno poslati vprašalnika vsaki posamezni osebi v vaši večtisočglavni zbirki podatkov. Torej, koga boste anketirali? Ali bo to 100 najnovejših strank, 100 prvih 100 strank po abecedi ali 100 oseb z najkrajšimi imeni? Nobeden od teh pristopov ne ustreza vašim potrebam, ker so po naravipristranski. Če želite dobiti nepristranski vzorec, v katerem imajo vsi enake možnosti, da bodo izbrani, opravite naključni izbor z uporabo ene od spodaj opisanih metod.

    Excelova naključna izbira s formulami

    V Excelu ni vgrajene funkcije za naključno izbiranje celic, vendar lahko kot rešitev uporabite eno od funkcij za generiranje naključnih številk. Teh formul verjetno ne moremo imenovati preproste intuitivne formule, vendar delujejo.

    Kako izbrati naključno vrednost s seznama

    Recimo, da imate v celicah A2:A10 seznam imen in želite naključno izbrati eno ime s seznama. To lahko storite z uporabo ene od naslednjih formul:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    ali

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    To je to! Vaš naključni izbirnik imen za Excel je nastavljen in pripravljen za uporabo:

    Opomba: Upoštevajte, da je RANDBETWEEN hlapljivi To pomeni, da se bo ob vsaki spremembi delovnega lista ponovno izračunala. Posledično se bo spremenil tudi naključni izbor. Da bi to preprečili, lahko kopirate izvlečeno ime in ga prilepite kot vrednost v drugo celico ( Posebna prilepitev > Vrednosti ). Za podrobna navodila glejte Kako zamenjati formule z vrednostmi.

    Te formule seveda ne morejo izbirati le naključnih imen, temveč tudi naključne številke, datume ali katere koli druge naključne celice.

    Kako te formule delujejo

    Na kratko, s funkcijo INDEX iz seznama izvlečete vrednost na podlagi naključne številke vrstice, ki jo vrne funkcija RANDBETWEEN.

    Natančneje, funkcija RANDBETWEEN ustvari naključno celo število med dvema vrednostma, ki ju določite. Za spodnjo vrednost navedete število 1. Za zgornjo vrednost uporabite COUNTA ali ROWS, da dobite skupno število vrstic. Kot rezultat funkcija RANDBETWEEN vrne naključno število med 1 in skupnim številom vrstic v zbirki podatkov. To število gre v polje vrstica_številka argument funkcije INDEX, ki ji pove, katero vrstico naj izbere. številka_stolpca uporabimo 1, saj želimo iz prvega stolpca pridobiti vrednost.

    Opomba: Ta metoda se dobro obnese pri izbiri ena naključna celica Če naj bi vaš vzorec vključeval več celic, lahko zgornja formula vrne več pojavitev iste vrednosti, ker funkcija RANDBETWEEN ne preprečuje podvajanja. To se zgodi zlasti v primeru, ko iz razmeroma majhnega seznama izbirate razmeroma velik vzorec. Naslednji primer prikazuje, kako v programu Excel opraviti naključno izbiro brez podvajanj.

    Kako naključno izbrati v Excelu brez podvojitev

    V Excelu obstaja več načinov za izbiro naključnih podatkov brez podvajanja. Na splošno uporabite funkcijo RAND, da vsaki celici dodelite naključno število, nato pa izberete nekaj celic z uporabo formule Index Rank.

    S seznamom imen v celicah A2:A16 sledite naslednjim korakom, da izluščite nekaj naključnih imen:

    1. Vnesite formulo Rand v B2 in jo kopirajte navzdol po stolpcu:

    =RAND()

  • V C2 vnesite spodnjo formulo, da iz stolpca A pridobite naključno vrednost:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Zgornjo formulo kopirajte v toliko celic, kolikor naključnih vrednosti želite izbrati. V našem primeru formulo kopiramo v štiri dodatne celice (C2:C6).
  • To je to! Izluščenih je pet naključnih imen brez podvajanj:

    Kako deluje ta formula

    Tako kot v prejšnjem primeru uporabite funkcijo INDEX za pridobitev vrednosti iz stolpca A na podlagi naključne koordinate vrstice. V tem primeru sta za pridobitev vrednosti potrebni dve različni funkciji:

    • Formula RAND izpolni stolpec B z naključnimi številkami.
    • Funkcija RANK vrne rang naključnega števila v isti vrstici. Na primer funkcija RANK(B2,$B$2:$B$16) v celici C2 dobi rang števila v celici B2. Pri kopiranju v celico C3 se relativna referenca B2 spremeni v B3 in vrne rang števila v B3 in tako naprej.
    • Številka, ki jo vrne RANK, se posreduje v vrstica_številka argumenta funkcije INDEX, zato izbere vrednost iz te vrstice. številka_stolpca navedete 1, ker želite iz prvega stolpca izpisati vrednost.

    Opozorilo! Kot je prikazano na zgornji sliki zaslona, naš naključni izbor v Excelu vsebuje samo edinstvene vrednosti. Toda teoretično obstaja majhna verjetnost, da se v vašem vzorcu pojavijo podvojene vrednosti. Zakaj: pri zelo velikem naboru podatkov lahko RAND ustvari podvojene naključne številke, RANK pa bo za te številke vrnil enak rang. Osebno med testiranjem nisem dobil nobenih podvojenih vrednosti, vendar je teoretično taka verjetnostobstaja.

    Če iščete neprebojno formulo za naključni izbor samo z edinstvenimi vrednostmi, potem uporabite kombinacijo RANK + COUNTIF ali RANK.EQ + COUNTIF namesto samo RANK. Za podrobno razlago logike glejte poglavje Edinstveno razvrščanje v Excelu.

    Celotna formula je nekoliko okorna, vendar je 100-odstotno brez dvojnikov:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Opombe:

    • Podobno kot funkcija RANDBETWEEN tudi Excelova funkcija RAND z vsakim ponovnim izračunom delovnega lista ustvari nova naključna števila, zaradi česar se naključni izbor spremeni. Če želite, da vaš vzorec ostane nespremenjen, ga kopirajte in prilepite nekam drugam kot vrednosti ( Paste Posebna > Vrednosti ).
    • Če se isto ime (številka, datum ali katera koli druga vrednost) v izvirnem nizu podatkov pojavi večkrat, lahko tudi naključni vzorec vsebuje več pojavitev iste vrednosti.

    Več načinov za pridobitev naključnega izbora brez ponovitev v Excelu 365 - 2010 je opisanih tukaj: Kako v Excelu pridobiti naključni vzorec brez ponovitev.

    Kako izbrati naključne vrstice v Excelu

    Če vaš delovni list vsebuje več stolpcev podatkov, lahko naključni vzorec izberete na naslednji način: vsaki vrstici dodelite naključno številko, razvrstite te številke in izberite zahtevano število vrstic. Podrobni koraki sledijo v nadaljevanju.

    1. Vstavite nov stolpec desno ali levo od tabele (v tem primeru stolpec D).
    2. V prvo celico vstavljenega stolpca, razen v glave stolpcev, vnesite formulo RAND: =RAND()
    3. Dvakrat kliknite ročaj za zapolnitev, da kopirate formulo navzdol po stolpcu. Rezultat bo naključna številka, dodeljena vsaki vrstici.
    4. Razvrsti naključne številke od največjega do najmanjšega (razvrščanje po naraščajočem vrstnem redu bi premaknilo glave stolpcev na dno tabele, zato se prepričajte, da razvrščate po padajočem vrstnem redu). Podatki zavihek> Razvrsti in filtriraj in kliknite gumb ZA. Excel bo samodejno razširil izbor in razvrstil celotne vrstice v naključnem vrstnem redu.

      Če niste povsem zadovoljni s tem, kako je bila vaša tabela naključno razvrščena, ponovno pritisnite gumb za razvrščanje, da jo spremenite. Za podrobna navodila glejte Kako naključno razvrščati v Excelu.

    5. Na koncu izberite zahtevano število vrstic za vzorec, jih kopirajte in prilepite, kamor koli želite.

    Če si želite podrobneje ogledati formule, obravnavane v tem vodniku, lahko prenesete naš vzorčni delovni zvezek za Excelovo naključno izbiro.

    Kako naključno izbrati v Excelu z orodjem Randomize

    Zdaj, ko poznate nekaj formul za pridobitev naključnega vzorca v programu Excel, si poglejmo, kako lahko enak rezultat dosežete z enim klikom miške.

    S programom Random Generator za Excel, ki je vključen v naš komplet Ultimate Suite, naredite naslednje:

    1. Izberite katero koli celico v tabeli.
    2. Pojdite na Orodja Ablebits zavihek> Storitve in kliknite Naključno > Izberite naključno :

  • V podoknu dodatka izberite, kaj želite izbrati: naključne vrstice, naključne stolpce ali naključne celice.
  • Določite število ali odstotek za želeno velikost vzorca.
  • Kliknite na Izberite gumb. Končano!
  • Tako lahko na primer izberemo 5 naključnih vrstic iz našega vzorčnega niza podatkov:

    V naslednjem trenutku boste dobili naključni izbor:

    Zdaj lahko pritisnete kombinacijo tipk Ctrl + C, da kopirate naključni vzorec, nato pa ga s kombinacijo tipk Ctrl + V prilepite na mesto v istem ali drugem listu.

    Če želite preizkusiti orodje Randomize v svojih delovnih listih, spodaj vzemite preizkusno različico paketa Ultimate Suite. Če uporabljate Googlove preglednice, vam bo morda koristil naš generator naključij za Googlove preglednice.

    Razpoložljivi prenosi

    Izbira naključnega vzorca - primeri formul (.xlsx datoteka)

    Ultimate Suite - preizkusna različica (.exe datoteka)

    Michael Brown je predan tehnološki navdušenec s strastjo do poenostavljanja kompleksnih procesov z uporabo programskih orodij. Z več kot desetletnimi izkušnjami v tehnološki industriji je svoje veščine izpopolnil v Microsoft Excelu in Outlooku ter Google Preglednicah in Dokumentih. Michaelov blog je namenjen deljenju svojega znanja in strokovnega znanja z drugimi ter ponuja preproste nasvete in vadnice za izboljšanje produktivnosti in učinkovitosti. Ne glede na to, ali ste izkušen strokovnjak ali začetnik, Michaelov blog ponuja dragocene vpoglede in praktične nasvete, kako kar najbolje izkoristiti ta osnovna programska orodja.