Excel tilfældig udvælgelse: hvordan du får en tilfældig prøve fra datasæt

  • Del Dette
Michael Brown

I denne vejledning lærer du et par hurtige måder at vælge navne, tal eller andre data tilfældigt på. Du lærer også, hvordan du får en tilfældig prøve uden dubletter, og hvordan du tilfældigt vælger et bestemt antal eller en bestemt procentdel af celler, rækker eller kolonner med et museklik.

Uanset om du laver markedsundersøgelser i forbindelse med lanceringen af et nyt produkt eller evaluerer resultaterne af din markedsføringskampagne, er det vigtigt, at du bruger en uvildig stikprøve af data til din analyse. Og den nemmeste måde at opnå dette på er at få et tilfældigt udvalg i Excel.

    Hvad er en stikprøve?

    Før vi diskuterer stikprøveteknikkerne, skal vi give lidt baggrundsinformation om tilfældig udvælgelse, og hvornår du måske ønsker at bruge den.

    I sandsynlighedsregning og statistik er en stikprøve er en delmængde af data udvalgt fra et større datasæt, også kaldet befolkning Hvert element i en tilfældig stikprøve er valgt helt tilfældigt og har samme sandsynlighed for at blive udvalgt. Hvorfor har du brug for en stikprøve? Dybest set for at få en ikke-forkert repræsentation af den samlede population.

    Du ønsker f.eks. at foretage en lille undersøgelse blandt dine kunder. Det ville naturligvis være uklogt at sende et spørgeskema ud til hver enkelt person i din database på flere tusinde. Så hvem skal du spørge? Skal det være de 100 nyeste kunder, de første 100 kunder i alfabetisk rækkefølge eller de 100 personer med de korteste navne? Ingen af disse fremgangsmåder passer til dine behov, fordi de i sagens natur erFor at få en upartisk stikprøve, hvor alle har lige store chancer for at blive udvalgt, skal du foretage en tilfældig udvælgelse ved hjælp af en af de metoder, der er beskrevet nedenfor.

    Excel tilfældigt valg med formler

    Der er ingen indbygget funktion til at vælge celler tilfældigt i Excel, men du kan bruge en af funktionerne til at generere tilfældige tal som en løsning. Disse formler kan nok ikke kaldes enkle intuitive formler, men de virker.

    Sådan vælges en tilfældig værdi fra en liste

    Hvis du har en liste med navne i cellerne A2:A10, og du ønsker at vælge et navn tilfældigt fra listen, kan du gøre dette ved at bruge en af følgende formler:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    eller

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Det er det! Din tilfældige navnevælger til Excel er klar og klar til brug:

    Bemærk. Vær opmærksom på, at RANDBETWEEN er en flygtige funktionen, hvilket betyder, at den vil blive genberegnet ved hver ændring, du foretager i regnearket. Som følge heraf vil dit tilfældige valg også ændre sig. For at forhindre dette kan du kopiere det udtrukne navn og indsætte det som værdi i en anden celle ( Indsæt specielt > Værdier ). Du kan finde en detaljeret vejledning i Hvordan man erstatter formler med værdier.

    Disse formler kan naturligvis ikke kun vælge tilfældige navne, men også tilfældige tal, datoer eller andre tilfældige celler.

    Sådan fungerer disse formler

    Kort fortalt bruger du INDEX-funktionen til at udtrække en værdi fra listen baseret på et tilfældigt rækketal, der er returneret af RANDBETWEEN.

    Mere specifikt genererer funktionen RANDBETWEEN et tilfældigt heltal mellem de to værdier, du angiver. For den nederste værdi angiver du tallet 1. For den øverste værdi bruger du enten COUNTA eller ROWS for at få det samlede antal rækker. Som resultat returnerer RANDBETWEEN et tilfældigt tal mellem 1 og det samlede antal rækker i dit datasæt. Dette tal går til row_num argument i INDEX-funktionen, der fortæller den, hvilken række den skal vælge. For INDEX-funktionen kolonne_nummer argumentet, bruger vi 1, da vi ønsker at udtrække en værdi fra den første kolonne.

    Bemærk. Denne metode fungerer godt til udvælgelse af en tilfældig celle fra en liste. Hvis din stikprøve skal omfatte flere celler, kan ovenstående formel give flere forekomster af den samme værdi, fordi funktionen RANDBETWEEN ikke er dubletterfri. Det er især tilfældet, når du vælger en relativt stor stikprøve fra en relativt lille liste. Det næste eksempel viser, hvordan du kan foretage tilfældig udvælgelse i Excel uden dubletter.

    Sådan vælger du tilfældigt i Excel uden dubletter

    Der er et par måder at vælge tilfældige data uden dubletter i Excel på. Generelt bruger du funktionen RAND til at tildele et tilfældigt tal til hver celle, og derefter vælger du nogle få celler ved hjælp af en indeksrangformel.

    Med listen over navne i cellerne A2:A16 skal du følge disse trin for at udtrække nogle få tilfældige navne:

    1. Indtast Rand-formlen i B2, og kopier den ned i kolonnen:

    =RAND()

  • Indsæt nedenstående formel i C2 for at udtrække en tilfældig værdi fra kolonne A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Kopier ovenstående formel til lige så mange celler, som du vil vælge tilfældige værdier. I vores tilfælde kopierer vi formlen til fire celler mere (C2:C6).
  • Så er det nok! Fem tilfældige navne udvindes uden dubletter:

    Sådan fungerer denne formel

    Ligesom i det foregående eksempel bruger du INDEX-funktionen til at udtrække en værdi fra kolonne A baseret på en tilfældig rækkekoordinat. I dette tilfælde skal der to forskellige funktioner til for at få den:

    • RAND-formlen udfylder kolonne B med tilfældige tal.
    • Funktionen RANK returnerer rang et tilfældigt tal i samme række. F.eks. får RANK(B2,$B$2:$B$16) i celle C2 rang af tallet i B2. Når den kopieres til C3, ændres den relative reference B2 til B3 og returnerer rang af tallet i B3, osv.
    • Det tal, der returneres af RANK, føres til row_num argumentet i INDEX-funktionen, så den vælger værdien fra den pågældende række. I kolonne_nummer argumentet angiver du 1, fordi du ønsker at udtrække en værdi fra den første kolonne.

    Et ord af forsigtighed! Som vist i skærmbilledet ovenfor indeholder vores tilfældige Excel-udvalg kun unikke værdier. Men teoretisk set er der en lille chance for, at der kan forekomme dubletter i din prøve. Her er grunden: På et meget stort datasæt kan RAND generere dubletter af tilfældige tal, og RANK vil returnere den samme rang for disse tal. Personligt har jeg aldrig fået dubletter under mine tests, men i teorien er der en sådan sandsynlighed for, atfindes.

    Hvis du leder efter en skudsikker formel til at få et tilfældigt valg med kun unikke værdier, skal du bruge kombinationen RANK + COUNTIF eller RANK.EQ + COUNTIF i stedet for bare RANK. Du kan finde en detaljeret forklaring på logikken under Unik rangordning i Excel.

    Den komplette formel er lidt besværlig, men 100 % fri for dubletter:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Bemærkninger:

    • Ligesom RANDBETWEEN genererer Excel RAND-funktionen også nye tilfældige tal ved hver genberegning af regnearket, hvilket medfører, at det tilfældige valg ændres. Hvis du vil beholde din prøve uændret, skal du kopiere den og indsætte den et andet sted som værdier ( Indsæt Særligt > Værdier ).
    • Hvis det samme navn (tal, dato eller en anden værdi) optræder mere end én gang i dit oprindelige datasæt, kan en tilfældig stikprøve også indeholde flere forekomster af den samme værdi.

    Flere måder at få et tilfældigt udvalg uden gentagelser i Excel 365 - 2010 er beskrevet her: Sådan får du en tilfældig stikprøve i Excel uden dubletter.

    Sådan vælger du tilfældige rækker i Excel

    Hvis dit regneark indeholder mere end én datakolonne, kan du vælge en tilfældig stikprøve på denne måde: tildel et tilfældigt tal til hver række, sorter disse tal, og vælg det ønskede antal rækker. De detaljerede trin følger nedenfor.

    1. Indsæt en ny kolonne til højre eller venstre for din tabel (kolonne D i dette eksempel).
    2. Indtast formlen RAND i den første celle i den indsatte kolonne, bortset fra kolonneoverskrifterne, i den første celle i den indsatte kolonne: =RAND()
    3. Dobbeltklik på udfyldningshåndtaget for at kopiere formlen ned i kolonnen. Resultatet er, at du får tildelt et tilfældigt tal til hver række.
    4. Sortere de tilfældige tal største til mindste (hvis du sorterer i stigende rækkefølge, vil kolonneoverskrifterne blive flyttet til bunden af tabellen, så sørg for at sortere i faldende rækkefølge). Gå derfor over til Data faneblad> Sortere & Filtrere gruppe, og klik på knappen ZA. Excel udvider automatisk markeringen og sorterer alle rækkerne i tilfældig rækkefølge.

      Hvis du ikke er helt tilfreds med den tilfældige sortering af din tabel, kan du trykke på sorteringsknappen igen for at sortere den. Du kan finde en detaljeret vejledning i Sådan sorterer du tilfældigt i Excel.

    5. Endelig skal du vælge det nødvendige antal rækker til din prøve, kopiere dem og indsætte dem hvor du vil.

    Hvis du vil se nærmere på de formler, der behandles i denne vejledning, er du velkommen til at downloade vores prøvearbejdsbog til Excel Random Selection.

    Sådan vælges tilfældigt i Excel med Randomize-værktøjet

    Nu hvor du kender en håndfuld formler til at få en tilfældig stikprøve i Excel, skal vi se, hvordan du kan opnå det samme resultat med et museklik.

    Med Random Generator for Excel, der er inkluderet i vores Ultimate Suite, kan du gøre følgende:

    1. Vælg en vilkårlig celle i din tabel.
    2. Gå til Ablebits-værktøjer faneblad> Hjælpeprogrammer gruppe, og klik på Randomiser > Vælg tilfældigt :

  • Vælg, hvad du vil vælge i tilføjelsesprogrammet: tilfældige rækker, tilfældige kolonner eller tilfældige celler.
  • Angiv antallet eller procentdelen for den ønskede stikprøvestørrelse.
  • Klik på den Vælg knappen. Færdig!
  • Sådan kan vi f.eks. vælge 5 tilfældige rækker fra vores eksempeldatasæt:

    Og du får et tilfældigt valg om et øjeblik:

    Nu kan du trykke på Ctrl + C for at kopiere din tilfældige prøve og derefter trykke på Ctrl + V for at indsætte den på det samme eller et andet ark.

    Hvis du gerne vil teste værktøjet Randomize i dine regneark, skal du bare hente en prøveversion af Ultimate Suite nedenfor. Hvis du bruger Google-regneark, kan du måske finde vores Random Generator for Google Sheets nyttig.

    Tilgængelige downloads

    Udvælgelse af tilfældige stikprøver - eksempler på formler (.xlsx-fil)

    Ultimate Suite - prøveversion (.exe-fil)

    Michael Brown er en dedikeret teknologientusiast med en passion for at forenkle komplekse processer ved hjælp af softwareværktøjer. Med mere end ti års erfaring i teknologibranchen har han finpudset sine færdigheder i Microsoft Excel og Outlook samt Google Sheets og Docs. Michaels blog er dedikeret til at dele sin viden og ekspertise med andre og giver nemme at følge tips og vejledninger til at forbedre produktiviteten og effektiviteten. Uanset om du er en erfaren professionel eller nybegynder, tilbyder Michaels blog værdifuld indsigt og praktiske råd til at få mest muligt ud af disse vigtige softwareværktøjer.