Náhodný výběr v aplikaci Excel: jak získat náhodný vzorek ze souboru dat

  • Sdílet Toto
Michael Brown

V tomto kurzu se naučíte několik rychlých způsobů náhodného výběru jmen, čísel nebo jiných dat. Dozvíte se také, jak získat náhodný vzorek bez duplicit a jak náhodně vybrat určitý počet nebo procento buněk, řádků nebo sloupců na jedno kliknutí myší.

Ať už provádíte průzkum trhu pro uvedení nového produktu na trh nebo vyhodnocujete výsledky marketingové kampaně, je důležité, abyste pro analýzu použili nezaujatý vzorek dat. A nejjednodušší způsob, jak toho dosáhnout, je získat náhodný výběr v aplikaci Excel.

    Co je to náhodný vzorek?

    Než začneme diskutovat o technikách výběru vzorků, poskytneme vám několik základních informací o náhodném výběru a o tom, kdy jej můžete chtít použít.

    V teorii pravděpodobnosti a statistice je náhodný vzorek je podmnožina dat vybraná z většího souboru dat, tzv. populace Každý prvek náhodného vzorku je vybrán zcela náhodně a má stejnou pravděpodobnost, že bude vybrán. Proč byste ho potřebovali? V podstatě proto, abyste získali nezkreslené zastoupení celé populace.

    Chcete například provést malý průzkum mezi svými zákazníky. Je zřejmé, že by nebylo moudré rozesílat dotazník každému jednotlivému člověku z vaší mnohatisícové databáze. Koho tedy budete dotazovat? Bude to 100 nejnovějších zákazníků, nebo prvních 100 zákazníků seřazených podle abecedy, nebo 100 lidí s nejkratším jménem? Žádný z těchto přístupů neodpovídá vašim potřebám, protože jsou ve své podstatěChcete-li získat nestranný vzorek, kde mají všichni stejnou šanci být vybráni, proveďte náhodný výběr pomocí jedné z níže popsaných metod.

    Náhodný výběr v aplikaci Excel pomocí vzorců

    V aplikaci Excel není k dispozici žádná vestavěná funkce pro náhodný výběr buněk, ale jako řešení můžete použít některou z funkcí pro generování náhodných čísel. Tyto funkce pravděpodobně nelze nazvat jednoduchými intuitivními vzorci, ale fungují.

    Jak vybrat náhodnou hodnotu ze seznamu

    Předpokládejme, že máte v buňkách A2:A10 seznam jmen a chcete z něj náhodně vybrat jedno jméno. To lze provést pomocí jednoho z následujících vzorců:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    nebo

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    A je to! Váš nástroj pro výběr náhodných jmen pro Excel je připraven k použití:

    Upozornění: Upozorňujeme, že RANDBETWEEN je těkavé To znamená, že se přepočítá při každé změně, kterou v listu provedete. V důsledku toho se změní i váš náhodný výběr. Abyste tomu zabránili, můžete vyjmutý název zkopírovat a vložit jako hodnotu do jiné buňky ( Vložit speciální > Hodnoty ). Podrobné pokyny naleznete v části Jak nahradit vzorce hodnotami.

    Tyto vzorce mohou samozřejmě vybírat nejen náhodné názvy, ale také náhodná čísla, data nebo jiné náhodné buňky.

    Jak tyto vzorce fungují

    Stručně řečeno, pomocí funkce INDEX získáte hodnotu ze seznamu na základě náhodného čísla řádku vráceného funkcí RANDBETWEEN.

    Konkrétně funkce RANDBETWEEN generuje náhodné celé číslo mezi dvěma zadanými hodnotami. Pro dolní hodnotu zadáte číslo 1. Pro horní hodnotu použijete buď COUNTA, nebo ROWS, abyste získali celkový počet řádků. Výsledkem funkce RANDBETWEEN je náhodné číslo mezi 1 a celkovým počtem řádků v datovém souboru. Toto číslo přejde do pole row_num argumentu funkce INDEX, který jí říká, který řádek má vybrat. column_num použijeme 1, protože chceme získat hodnotu z prvního sloupce.

    Poznámka: Tato metoda funguje dobře při výběru jedna náhodná buňka ze seznamu. Pokud má váš vzorek obsahovat několik buněk, může výše uvedený vzorec vrátit několik výskytů stejné hodnoty, protože funkce RANDBETWEEN není bez duplicit. To je zejména případ, kdy vybíráte poměrně velký vzorek z relativně malého seznamu. Další příklad ukazuje, jak provést náhodný výběr v aplikaci Excel bez duplicit.

    Jak náhodně vybrat v aplikaci Excel bez duplicit

    Existuje několik způsobů, jak v aplikaci Excel vybrat náhodná data bez duplicit. Obecně platí, že pomocí funkce RAND přiřadíte každé buňce náhodné číslo a poté vyberete několik buněk pomocí vzorce Index Rank.

    Pokud máte seznam jmen v buňkách A2:A16, vyberte podle následujících kroků několik náhodných jmen:

    1. Zadejte vzorec Rand do pole B2 a zkopírujte jej dolů do sloupce:

    =RAND()

  • Níže uvedený vzorec vložte do C2, abyste získali náhodnou hodnotu ze sloupce A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Zkopírujte výše uvedený vzorec do tolika buněk, kolik náhodných hodnot chcete vybrat. V našem případě vzorec zkopírujeme do dalších čtyř buněk (C2:C6).
  • A je to! Pět náhodných jmen je extrahováno bez duplicit:

    Jak tento vzorec funguje

    Stejně jako v předchozím příkladu použijete funkci INDEX k získání hodnoty ze sloupce A na základě náhodné souřadnice řádku. V tomto případě jsou k jejímu získání potřeba dvě různé funkce:

    • Vzorec RAND vyplní sloupec B náhodnými čísly.
    • Funkce RANK vrací hodnost náhodného čísla ve stejném řádku. Například RANK(B2,$B$2:$B$16) v buňce C2 získá hodnost čísla v B2. Při zkopírování do C3 se relativní odkaz B2 změní na B3 a vrátí hodnost čísla v B3 atd.
    • Číslo vrácené funkcí RANK se přenese do funkce row_num argumentu funkce INDEX, takže vybere hodnotu z tohoto řádku. column_num zadáte 1, protože chcete získat hodnotu z prvního sloupce.

    Upozornění! Jak je vidět na obrázku výše, náš náhodný výběr v Excelu obsahuje pouze jedinečné hodnoty. Teoreticky však existuje malá pravděpodobnost, že se ve vašem vzorku objeví duplikáty. Zde je důvod: u velmi rozsáhlého souboru dat může RAND vygenerovat duplicitní náhodná čísla a RANK vrátí pro tato čísla stejnou pozici. Osobně jsem během testů nikdy žádné duplikáty nezaznamenal, ale teoreticky taková pravděpodobnost existuje.existuje.

    Pokud hledáte neprůstřelný vzorec pro získání náhodného výběru pouze s jedinečnými hodnotami, použijte kombinaci RANK + COUNTIF nebo RANK.EQ + COUNTIF namísto pouhého RANK. Podrobné vysvětlení logiky naleznete v části Jedinečné pořadí v aplikaci Excel.

    Kompletní vzorec je trochu těžkopádný, ale 100% bez duplicit:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Poznámky:

    • Stejně jako funkce RANDBETWEEN i funkce RAND aplikace Excel generuje při každém přepočtu listu nová náhodná čísla, takže se náhodný výběr mění. Chcete-li, aby se váš vzorek nezměnil, zkopírujte jej a vložte jinam jako hodnoty ( Vložit Speciální > Hodnoty ).
    • Pokud se stejný název (číslo, datum nebo jiná hodnota) vyskytuje v původním souboru dat vícekrát, může náhodný vzorek obsahovat i několik výskytů stejné hodnoty.

    Další způsoby, jak získat náhodný výběr bez opakování v aplikaci Excel 365 - 2010, jsou popsány zde: Jak získat náhodný vzorek v aplikaci Excel bez duplicit.

    Jak vybrat náhodné řádky v aplikaci Excel

    V případě, že váš pracovní list obsahuje více než jeden sloupec dat, můžete vybrat náhodný vzorek tímto způsobem: každému řádku přiřaďte náhodné číslo, tato čísla seřaďte a vyberte požadovaný počet řádků. Podrobný postup je uveden níže.

    1. Vložte nový sloupec napravo nebo nalevo od tabulky (v tomto příkladu sloupec D).
    2. Do první buňky vloženého sloupce, kromě záhlaví sloupců, zadejte vzorec RAND: =RAND()
    3. Poklepáním na úchyt výplně zkopírujete vzorec dolů do sloupce. Výsledkem bude náhodné číslo přiřazené každému řádku.
    4. Třídění náhodných čísel od největšího po nejmenší (seřazení vzestupně by přesunulo záhlaví sloupců na konec tabulky, takže nezapomeňte seřadit sestupně). Pro tento účel přejděte na stránku Data karta> Třídit a filtrovat skupinu a klikněte na tlačítko ZA. Excel automaticky rozšíří výběr a seřadí celé řádky v náhodném pořadí.

      Pokud nejste zcela spokojeni s tím, jak byla vaše tabulka náhodně seřazena, stiskněte znovu tlačítko třídění, abyste ji změnili. Podrobné pokyny naleznete v části Jak náhodně seřadit v aplikaci Excel.

    5. Nakonec vyberte požadovaný počet řádků pro váš vzorek, zkopírujte je a vložte kamkoli chcete.

    Chcete-li se blíže seznámit se vzorci popsanými v tomto tutoriálu, můžete si stáhnout náš ukázkový sešit aplikace Excel Náhodný výběr.

    Jak náhodně vybrat v aplikaci Excel pomocí nástroje Náhodný výběr

    Nyní, když znáte několik vzorců pro získání náhodného vzorku v aplikaci Excel, se podíváme, jak můžete stejného výsledku dosáhnout jedním kliknutím myši.

    S generátorem náhodných čísel pro aplikaci Excel, který je součástí naší sady Ultimate Suite, uděláte následující:

    1. Vyberte libovolnou buňku v tabulce.
    2. Přejděte na Nástroje Ablebits karta> Komunální služby a klikněte na tlačítko Randomizace > Náhodně vybrat :

  • Na panelu doplňku vyberte, co chcete vybrat: náhodné řádky, náhodné sloupce nebo náhodné buňky.
  • Zadejte počet nebo procento požadované velikosti vzorku.
  • Klikněte na Vyberte Hotovo!
  • Takto můžeme například vybrat 5 náhodných řádků z našeho souboru vzorových dat:

    A za chvíli dostanete náhodný výběr:

    Nyní můžete náhodný vzorek zkopírovat stisknutím klávesové zkratky Ctrl + C a poté jej stisknutím klávesové zkratky Ctrl + V vložit do stejného nebo jiného listu.

    Pokud si chcete nástroj Randomize vyzkoušet ve svých pracovních listech, stačí si níže stáhnout zkušební verzi sady Ultimate Suite. Pokud používáte tabulky Google, může se vám hodit náš generátor náhodných čísel pro tabulky Google.

    Dostupné soubory ke stažení

    Výběr náhodného vzorku - příklady vzorců (.xlsx soubor)

    Ultimate Suite - zkušební verze (.exe soubor)

    Michael Brown je oddaný technologický nadšenec s vášní pro zjednodušování složitých procesů pomocí softwarových nástrojů. S více než desetiletými zkušenostmi v technologickém průmyslu zdokonalil své dovednosti v aplikacích Microsoft Excel a Outlook a také v Tabulkách a Dokumentech Google. Michaelův blog je věnován sdílení jeho znalostí a odborných znalostí s ostatními a poskytuje snadno pochopitelné tipy a návody pro zlepšení produktivity a efektivity. Ať už jste zkušený profesionál nebo začátečník, Michaelův blog nabízí cenné postřehy a praktické rady, jak tyto základní softwarové nástroje co nejlépe využít.