Náhodný výber v programe Excel: ako získať náhodnú vzorku zo súboru údajov

  • Zdieľajte To
Michael Brown

Tento návod vás naučí niekoľko rýchlych spôsobov náhodného výberu mien, čísel alebo akýchkoľvek iných údajov. Dozviete sa tiež, ako získať náhodnú vzorku bez duplikátov a ako náhodne vybrať určitý počet alebo percento buniek, riadkov alebo stĺpcov jedným kliknutím myšou.

Či už robíte prieskum trhu pre uvedenie nového produktu na trh alebo vyhodnocujete výsledky marketingovej kampane, je dôležité, aby ste na analýzu použili objektívnu vzorku údajov. A najjednoduchší spôsob, ako to dosiahnuť, je získať náhodný výber v programe Excel.

    Čo je to náhodná vzorka?

    Predtým, ako sa začneme zaoberať technikami výberu vzoriek, poskytneme vám niekoľko základných informácií o náhodnom výbere a o tom, kedy ho možno budete chcieť použiť.

    V teórii pravdepodobnosti a štatistike je náhodná vzorka je podmnožina údajov vybraná z väčšieho súboru údajov, tzv. populácia Každý prvok náhodnej vzorky je vybraný úplne náhodne a má rovnakú pravdepodobnosť, že bude vybraný. Prečo by ste ho potrebovali? V podstate preto, aby ste získali neskreslené zastúpenie celej populácie.

    Napríklad chcete uskutočniť malý prieskum medzi svojimi zákazníkmi. Samozrejme, nebolo by rozumné rozosielať dotazník každému jednotlivému človeku z vašej mnohotisícovej databázy. Koho teda budete skúmať? Bude to 100 najnovších zákazníkov, alebo prvých 100 zákazníkov uvedených v abecednom poradí, alebo 100 ľudí s najkratším menom? Žiadny z týchto prístupov nevyhovuje vašim potrebám, pretože sú v podstateAby ste získali nestrannú vzorku, v ktorej má každý rovnakú šancu byť vybraný, urobte náhodný výber pomocou jednej z metód opísaných nižšie.

    Náhodný výber v programe Excel pomocou vzorcov

    V programe Excel nie je zabudovaná funkcia na náhodný výber buniek, ale ako riešenie môžete použiť niektorú z funkcií na generovanie náhodných čísel. Tieto funkcie pravdepodobne nemožno nazvať jednoduchými intuitívnymi vzorcami, ale fungujú.

    Ako vybrať náhodnú hodnotu zo zoznamu

    Predpokladajme, že máte zoznam mien v bunkách A2:A10 a chcete náhodne vybrať jedno meno zo zoznamu. To môžete urobiť pomocou jedného z nasledujúcich vzorcov:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    alebo

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    A je to! Váš nástroj na výber náhodných názvov pre Excel je nastavený a pripravený na použitie:

    Upozorňujeme, že RANDBETWEEN je volatilné To znamená, že sa bude prepočítavať pri každej zmene, ktorú vykonáte v pracovnom hárku. V dôsledku toho sa zmení aj váš náhodný výber. Aby ste tomu zabránili, môžete skopírovať extrahovaný názov a vložiť ho ako hodnotu do inej bunky ( Vložiť špeciálne > Hodnoty ). Podrobné pokyny nájdete v časti Ako nahradiť vzorce hodnotami.

    Samozrejme, tieto vzorce môžu vyberať nielen náhodné názvy, ale aj náhodné čísla, dátumy alebo akékoľvek iné náhodné bunky.

    Ako tieto vzorce fungujú

    Stručne povedané, pomocou funkcie INDEX získate hodnotu zo zoznamu na základe náhodného čísla riadku vráteného funkciou RANDBETWEEN.

    Presnejšie, funkcia RANDBETWEEN generuje náhodné celé číslo medzi dvoma zadanými hodnotami. Pre dolnú hodnotu zadáte číslo 1. Pre hornú hodnotu použijete buď COUNTA, alebo ROWS, aby ste získali celkový počet riadkov. Výsledkom funkcie RANDBETWEEN je náhodné číslo medzi 1 a celkovým počtom riadkov vo vašom súbore údajov. Toto číslo sa dostane do číslo_riadku argument funkcie INDEX, ktorý jej hovorí, ktorý riadok má vybrať. column_num použijeme 1, pretože chceme získať hodnotu z prvého stĺpca.

    Poznámka: Táto metóda funguje aj pri výbere jedna náhodná bunka zo zoznamu. Ak má vaša vzorka obsahovať niekoľko buniek, uvedený vzorec môže vrátiť niekoľko výskytov rovnakej hodnoty, pretože funkcia RANDBETWEEN nie je bez duplikátov. Je to najmä v prípade, keď vyberáte pomerne veľkú vzorku z relatívne malého zoznamu. Ďalší príklad ukazuje, ako urobiť náhodný výber v programe Excel bez duplikátov.

    Ako náhodne vybrať v programe Excel bez duplikátov

    Existuje niekoľko spôsobov, ako v programe Excel vybrať náhodné údaje bez duplikátov. Vo všeobecnosti by ste mali použiť funkciu RAND na priradenie náhodného čísla každej bunke a potom vybrať niekoľko buniek pomocou vzorca Index Rank.

    Ak máte zoznam mien v bunkách A2:A16, postupujte podľa nasledujúcich krokov a vyberte niekoľko náhodných mien:

    1. Zadajte vzorec Rand do B2 a skopírujte ho do stĺpca:

    =RAND()

  • Vložte nasledujúci vzorec do C2, aby ste získali náhodnú hodnotu zo stĺpca A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Skopírujte uvedený vzorec do toľkých buniek, koľko náhodných hodnôt chcete vybrať. V našom prípade vzorec skopírujeme do ďalších štyroch buniek (C2:C6).
  • A je to! Päť náhodných mien je extrahovaných bez duplikátov:

    Ako tento vzorec funguje

    Podobne ako v predchádzajúcom príklade použijete funkciu INDEX na získanie hodnoty zo stĺpca A na základe náhodnej súradnice riadku. V tomto prípade sú na jej získanie potrebné dve rôzne funkcie:

    • Vzorec RAND vyplní stĺpec B náhodnými číslami.
    • Funkcia RANK vráti hodnosť náhodného čísla v tom istom riadku. Napríklad funkcia RANK(B2,$B$2:$B$16) v bunke C2 získa hodnosť čísla v bunke B2. Po skopírovaní do bunky C3 sa relatívny odkaz B2 zmení na B3 a vráti hodnosť čísla v bunke B3 atď.
    • Číslo vrátené funkciou RANK sa prenesie do číslo_riadku argument funkcie INDEX, takže vyberie hodnotu z tohto riadku. column_num zadáte 1, pretože chcete získať hodnotu z prvého stĺpca.

    Upozornenie! Ako je znázornené na obrázku vyššie, náš náhodný výber Excelu obsahuje len jedinečné hodnoty. Teoreticky však existuje malá pravdepodobnosť, že sa vo vašej vzorke objavia duplikáty. Tu je dôvod: pri veľmi veľkom súbore údajov môže RAND vygenerovať duplicitné náhodné čísla a RANK vráti rovnaké poradie týchto čísel. Osobne som počas testov nikdy nedostal žiadne duplikáty, ale teoreticky je takáto pravdepodobnosťexistuje.

    Ak hľadáte nepriestrelný vzorec na získanie náhodného výberu len s jedinečnými hodnotami, potom použite kombináciu RANK + COUNTIF alebo RANK.EQ + COUNTIF namiesto len RANK. Podrobné vysvetlenie logiky nájdete v časti Jedinečné poradie v programe Excel.

    Kompletný vzorec je trochu ťažkopádny, ale 100% bez duplikátov:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Poznámky:

    • Podobne ako funkcia RANDBETWEEN, aj funkcia Excel RAND generuje nové náhodné čísla pri každom prepočítaní vášho pracovného hárka, čím sa náhodný výber mení. Ak chcete, aby sa vaša vzorka nezmenila, skopírujte ju a vložte na iné miesto ako hodnoty ( Vložiť Špeciálne > Hodnoty ).
    • Ak sa ten istý názov (číslo, dátum alebo akákoľvek iná hodnota) vyskytuje v pôvodnom súbore údajov viackrát, náhodná vzorka môže obsahovať aj niekoľko výskytov tej istej hodnoty.

    Ďalšie spôsoby získania náhodného výberu bez opakovania v programe Excel 365 - 2010 sú opísané tu: Ako získať náhodnú vzorku v programe Excel bez duplikátov.

    Ako vybrať náhodné riadky v programe Excel

    V prípade, že váš pracovný hárok obsahuje viac ako jeden stĺpec údajov, môžete vybrať náhodnú vzorku týmto spôsobom: každému riadku priraďte náhodné číslo, tieto čísla zoraďte a vyberte požadovaný počet riadkov. Podrobný postup je uvedený nižšie.

    1. Vložte nový stĺpec napravo alebo naľavo od tabuľky (v tomto príklade stĺpec D).
    2. Do prvej bunky vloženého stĺpca, okrem záhlaví stĺpcov, zadajte vzorec RAND: =RAND()
    3. Dvojitým kliknutím na úchyt vyplnenia skopírujte vzorec smerom nadol do stĺpca. Výsledkom bude náhodné číslo priradené ku každému riadku.
    4. Triedenie náhodných čísel od najväčšieho po najmenší (zoradenie vo vzostupnom poradí by presunulo záhlavia stĺpcov na spodok tabuľky, preto sa uistite, že je zoradené zostupne). Na tento účel prejdite na Údaje karta> Triedenie & amp; Filter skupinu a kliknite na tlačidlo ZA. Excel automaticky rozšíri výber a zoradí celé riadky v náhodnom poradí.

      Ak nie ste úplne spokojní s tým, ako bola vaša tabuľka náhodne zoradená, stlačte tlačidlo triedenia znova, aby ste ju obnovili. Podrobné pokyny nájdete v časti Ako náhodne triediť v programe Excel.

    5. Nakoniec vyberte požadovaný počet riadkov pre vzorku, skopírujte ich a vložte kamkoľvek chcete.

    Ak sa chcete bližšie zoznámiť so vzorcami, o ktorých sa hovorí v tomto návode, môžete si stiahnuť náš vzorový zošit programu Excel Náhodný výber.

    Ako náhodne vybrať v programe Excel pomocou nástroja Randomize

    Teraz, keď už poznáte niekoľko vzorcov na získanie náhodnej vzorky v programe Excel, pozrime sa, ako môžete dosiahnuť rovnaký výsledok kliknutím myšou.

    Pomocou generátora náhodných čísel pre Excel, ktorý je súčasťou nášho balíka Ultimate Suite, môžete urobiť toto:

    1. Vyberte ľubovoľnú bunku v tabuľke.
    2. Prejdite na Nástroje Ablebits karta> Komunálne služby a kliknite na tlačidlo Náhodný výber > Náhodne vybrať :

  • Na paneli doplnku vyberte, čo chcete vybrať: náhodné riadky, náhodné stĺpce alebo náhodné bunky.
  • Zadajte počet alebo percento požadovanej veľkosti vzorky.
  • Kliknite na tlačidlo Vyberte Hotovo!
  • Takto môžeme napríklad vybrať 5 náhodných riadkov z našej vzorky údajov:

    A za chvíľu dostanete náhodný výber:

    Teraz môžete stlačením klávesovej skratky Ctrl + C skopírovať náhodnú vzorku a potom ju stlačením klávesovej skratky Ctrl + V vložiť na miesto v tom istom alebo inom hárku.

    Ak chcete vyskúšať nástroj Randomize vo svojich pracovných hárkoch, stačí si vziať skúšobnú verziu balíka Ultimate Suite nižšie. V prípade, že používate tabuľky Google, môže sa vám hodiť náš generátor náhodných čísel pre tabuľky Google.

    Dostupné súbory na stiahnutie

    Výber náhodnej vzorky - príklady vzorcov (.xlsx súbor)

    Ultimate Suite - skúšobná verzia (.exe súbor)

    Michael Brown je nadšený technologický nadšenec s vášňou pre zjednodušovanie zložitých procesov pomocou softvérových nástrojov. S viac ako desaťročnými skúsenosťami v technologickom priemysle si zdokonalil svoje zručnosti v programoch Microsoft Excel a Outlook, ako aj Tabuľky Google a Dokumenty. Michaelov blog je venovaný zdieľaniu svojich vedomostí a odborných znalostí s ostatnými a poskytuje jednoduché tipy a návody na zlepšenie produktivity a efektivity. Či už ste skúsený profesionál alebo začiatočník, Michaelov blog ponúka cenné poznatky a praktické rady, ako z týchto základných softvérových nástrojov vyťažiť maximum.