Excel willekeurige selectie: hoe willekeurige steekproef uit dataset te krijgen

  • Deel Dit
Michael Brown

Deze handleiding leert u een paar snelle manieren om willekeurig namen, getallen of andere gegevens te selecteren. U leert ook hoe u een willekeurige steekproef krijgt zonder duplicaten en hoe u met een muisklik willekeurig een bepaald aantal of percentage cellen, rijen of kolommen selecteert.

Of u nu marktonderzoek doet voor een nieuwe productlancering of de resultaten van uw marketingcampagne evalueert, het is belangrijk dat u een onbevooroordeelde steekproef van gegevens gebruikt voor uw analyse. En de gemakkelijkste manier om dit te bereiken is een willekeurige selectie in Excel.

    Wat is een willekeurige steekproef?

    Alvorens de steekproeftechnieken te bespreken, eerst wat achtergrondinformatie over willekeurige selectie en wanneer u die zou willen gebruiken.

    In kansrekening en statistiek is een willekeurig monster is een subset van gegevens geselecteerd uit een grotere gegevensverzameling, aka bevolking Elk element van een willekeurige steekproef wordt volledig toevallig gekozen en heeft een gelijke kans om gekozen te worden. Waarom heb je er een nodig? In principe om een niet-vertekende weergave van de totale populatie te krijgen.

    U wilt bijvoorbeeld een kleine enquête houden onder uw klanten. Het zou natuurlijk onverstandig zijn om een vragenlijst te sturen naar elke individuele persoon in uw multi-duizend database. Dus, wie doet uw enquête? Worden dat de 100 nieuwste klanten, of de eerste 100 alfabetisch gerangschikte klanten, of 100 mensen met de kortste namen? Geen van deze benaderingen past bij uw behoeften omdat ze van naturebevooroordeeld. Om een onpartijdige steekproef te krijgen waarbij iedereen een gelijke kans heeft om gekozen te worden, doet u een willekeurige selectie met behulp van een van de hieronder beschreven methoden.

    Excel willekeurige selectie met formules

    Er is geen ingebouwde functie om willekeurig cellen te kiezen in Excel, maar u kunt een van de functies gebruiken om willekeurige getallen te genereren als een workaround. Deze zijn waarschijnlijk niet eenvoudig intuïtief te noemen, maar ze werken wel.

    Hoe selecteer je een willekeurige waarde uit een lijst

    Stel, u hebt een lijst met namen in de cellen A2:A10 en u wilt willekeurig één naam uit de lijst selecteren. Dat kan met een van de volgende formules:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    of

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Dat is het! Uw willekeurige naamkiezer voor Excel is helemaal klaar voor gebruik:

    Let op. Wees u ervan bewust dat RANDBETWEEN een vluchtig functie, wat betekent dat deze bij elke wijziging die u in het werkblad aanbrengt opnieuw wordt berekend. Als gevolg daarvan zal ook uw willekeurige selectie veranderen. Om dit te voorkomen kunt u de geëxtraheerde naam kopiëren en als waarde in een andere cel plakken ( Speciaal plakken > Waarden ). Voor de gedetailleerde instructies, zie Hoe formules te vervangen door waarden.

    Uiteraard kunnen deze formules niet alleen willekeurige namen kiezen, maar ook willekeurige getallen, datums of andere willekeurige cellen.

    Hoe deze formules werken

    In een notendop gebruikt u de INDEX-functie om een waarde uit de lijst te halen op basis van een willekeurig rijnummer dat door RANDBETWEEN wordt teruggegeven.

    Meer bepaald genereert de functie RANDBETWEEN een willekeurig geheel getal tussen de twee waarden die u opgeeft. Voor de onderste waarde geeft u het getal 1. Voor de bovenste waarde gebruikt u COUNTA of ROWS om het totale aantal rijen op te vragen. Als resultaat geeft RANDBETWEEN een willekeurig getal tussen 1 en het totale aantal rijen in uw dataset. Dit getal gaat naar het rij_nummer argument van de INDEX-functie die aangeeft welke rij moet worden gekozen. Voor de kolom_nummer argument, gebruiken we 1 omdat we een waarde uit de eerste kolom willen halen.

    Opmerking. Deze methode werkt goed voor het selecteren van een willekeurige cel Indien uw steekproef meerdere cellen moet omvatten, kan de bovenstaande formule meerdere keren dezelfde waarde opleveren omdat de RANDBETWEEN-functie niet vrij is van duplicaten. Dit is vooral het geval wanneer u een relatief grote steekproef uit een relatief kleine lijst kiest. Het volgende voorbeeld toont hoe u in Excel een willekeurige selectie kunt maken zonder duplicaten.

    Hoe willekeurig selecteren in Excel zonder duplicaten

    Er zijn een paar manieren om in Excel willekeurige gegevens te selecteren zonder doublures. In het algemeen gebruikt u de RAND-functie om aan elke cel een willekeurig getal toe te kennen, en vervolgens kiest u een paar cellen met behulp van een Index Rangschikking-formule.

    Met de lijst van namen in de cellen A2:A16 volgt u deze stappen om er enkele willekeurige namen uit te halen:

    1. Voer de Rand-formule in B2 in, en kopieer deze naar beneden in de kolom:

    =RAND()

  • Zet de onderstaande formule in C2 om een willekeurige waarde uit kolom A te halen:
  • =INDEX($A$2:$A$16, RANG(B2,$B$2:$B$16), 1)

  • Kopieer de bovenstaande formule naar zoveel cellen als u willekeurige waarden wilt kiezen. In ons geval kopiëren we de formule naar nog eens vier cellen (C2:C6).
  • Dat is het! Vijf willekeurige namen zijn eruit gehaald zonder duplicaten:

    Hoe deze formule werkt

    Net als in het vorige voorbeeld gebruikt u de INDEX-functie om een waarde uit kolom A te halen op basis van een willekeurige rijcoördinaat. In dit geval zijn er twee verschillende functies voor nodig:

    • De RAND-formule vult kolom B met willekeurige getallen.
    • De RANK-functie geeft de rang van een willekeurig getal in dezelfde rij. Bijvoorbeeld, RANK(B2,$B$2:$B$16) in cel C2 geeft de rang van het getal in B2. Bij het kopiëren naar C3 verandert de relatieve verwijzing B2 in B3 en geeft de rang van het getal in B3, enzovoort.
    • Het getal dat door RANK wordt teruggegeven, wordt naar de rij_nummer argument van de INDEX-functie, zodat de waarde van die rij wordt gekozen. In de kolom_nummer argument levert u 1 omdat u een waarde uit de eerste kolom wilt halen.

    Een waarschuwing! Zoals in de schermafbeelding hierboven te zien is, bevat onze Excel willekeurige selectie alleen unieke waarden. Maar theoretisch is er een kleine kans dat er duplicaten in uw steekproef voorkomen. Hier is waarom: op een zeer grote dataset, kan RAND dubbele willekeurige getallen genereren, en RANK zal dezelfde rang teruggeven voor die getallen. Persoonlijk heb ik nooit duplicaten gevonden tijdens mijn tests, maar in theorie, is zo'n waarschijnlijkheidbestaat wel.

    Als u op zoek bent naar een kogelvrije formule om een willekeurige selectie te krijgen met alleen unieke waarden, gebruik dan de combinatie RANK + COUNTIF of RANK.EQ + COUNTIF in plaats van alleen RANK. Voor een gedetailleerde uitleg van de logica, zie Unieke rangschikking in Excel.

    De volledige formule is een beetje omslachtig, maar 100% duplicaatvrij:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Opmerkingen:

    • Net als RANDBETWEEN genereert ook de Excel RAND-functie nieuwe willekeurige getallen bij elke herberekening van uw werkblad, waardoor de willekeurige selectie verandert. Om uw steekproef ongewijzigd te laten, kunt u deze kopiëren en ergens anders plakken als waarden ( Plakken Speciaal > Waarden ).
    • Als dezelfde naam (getal, datum of een andere waarde) meer dan eens voorkomt in uw oorspronkelijke gegevensverzameling, kan een willekeurige steekproef ook verschillende keren dezelfde waarde bevatten.

    Meer manieren om een willekeurige selectie zonder herhalingen te krijgen in Excel 365 - 2010 worden hier beschreven: Hoe krijg ik een willekeurige steekproef in Excel zonder herhalingen.

    Hoe willekeurige rijen selecteren in Excel

    Als uw werkblad meer dan één kolom met gegevens bevat, kunt u op deze manier een willekeurige steekproef trekken: wijs aan elke rij een willekeurig getal toe, sorteer die getallen en selecteer het gewenste aantal rijen. De gedetailleerde stappen volgen hieronder.

    1. Voeg rechts of links van uw tabel een nieuwe kolom in (kolom D in dit voorbeeld).
    2. Voer in de eerste cel van de ingevoegde kolom, exclusief de kolomkoppen, de formule RAND in: =RAND()
    3. Dubbelklik op de vulgreep om de formule naar beneden in de kolom te kopiëren. Als resultaat krijgt u een willekeurig getal toegewezen aan elke rij.
    4. De willekeurige getallen sorteren grootste naar kleinste (sorteren in oplopende volgorde zou de kolomkoppen onderaan de tabel verplaatsen, dus zorg ervoor dat u aflopend sorteert). Ga hiervoor naar de Gegevens tab> Sorteren en filteren Excel zal automatisch de selectie uitbreiden en de volledige rijen in willekeurige volgorde sorteren.

      Als u niet helemaal tevreden bent met hoe uw tabel gerandomiseerd is, druk dan nogmaals op de sorteerknop om de tabel te rangschikken. Voor de gedetailleerde instructies, zie Hoe willekeurig sorteren in Excel.

    5. Selecteer tenslotte het gewenste aantal rijen voor uw monster, kopieer ze en plak ze op een willekeurige plaats.

    Om de in deze handleiding besproken formules nader te bekijken, kunt u onze voorbeeldwerkmap Excel willekeurige selectie downloaden.

    Hoe willekeurig selecteren in Excel met Randomize tool

    Nu u een handvol formules kent om een willekeurige steekproef in Excel te verkrijgen, laten we eens kijken hoe u hetzelfde resultaat kunt bereiken met een muisklik.

    Met Random Generator for Excel in onze Ultimate Suite doet u het volgende:

    1. Selecteer een willekeurige cel in uw tabel.
    2. Ga naar de Ablebits Gereedschap tab> Nutsbedrijven groep, en klik op Randomiseer > Selecteer willekeurig :

  • Kies in het deelvenster van de invoegtoepassing wat u wilt selecteren: willekeurige rijen, willekeurige kolommen of willekeurige cellen.
  • Geef het aantal of percentage voor de gewenste steekproefgrootte.
  • Klik op de Selecteer knop. Klaar!
  • Zo kunnen we bijvoorbeeld 5 willekeurige rijen selecteren uit onze steekproef:

    En je krijgt een willekeurige selectie in een seconde:

    Nu kunt u op Ctrl + C drukken om uw willekeurige monster te kopiëren, en vervolgens op Ctrl + V om het te plakken op een plaats in hetzelfde of een ander blad.

    Als u de Randomize tool in uw werkbladen wilt testen, pak dan hieronder een proefversie van Ultimate Suite. Als u Google spreadsheets gebruikt, vindt u onze Random Generator voor Google Sheets misschien handig.

    Beschikbare downloads

    Aselecte steekproef selecteren - formulevoorbeelden (.xlsx-bestand)

    Ultimate Suite - proefversie (.exe bestand)

    Michael Brown is een toegewijde technologieliefhebber met een passie voor het vereenvoudigen van complexe processen met behulp van softwaretools. Met meer dan tien jaar ervaring in de technische industrie heeft hij zijn vaardigheden in Microsoft Excel en Outlook, evenals Google Spreadsheets en Documenten aangescherpt. Michael's blog is gewijd aan het delen van zijn kennis en expertise met anderen, met eenvoudig te volgen tips en tutorials voor het verbeteren van de productiviteit en efficiëntie. Of je nu een doorgewinterde professional of een beginner bent, Michaels blog biedt waardevolle inzichten en praktisch advies om het meeste uit deze essentiële softwaretools te halen.