Excel slumpmässigt urval: hur du får ett slumpmässigt urval från datasetet

  • Dela Detta
Michael Brown

I den här handledningen lär du dig några snabba sätt att slumpmässigt välja namn, siffror eller andra data. Du lär dig också hur du får ett slumpmässigt urval utan dubbletter och hur du slumpmässigt väljer ett visst antal eller en viss procentandel av celler, rader eller kolumner med ett musklick.

Oavsett om du gör marknadsundersökningar inför en ny produktlansering eller utvärderar resultaten av din marknadsföringskampanj är det viktigt att du använder ett opartiskt urval av data för din analys. Och det enklaste sättet att uppnå detta är att göra ett slumpmässigt urval i Excel.

    Vad är ett slumpmässigt urval?

    Innan vi diskuterar provtagningsmetoderna ska vi ge lite bakgrundsinformation om slumpmässigt urval och när du vill använda det.

    Inom sannolikhetslära och statistik är en slumpmässigt urval är en delmängd av data som valts ut från en större datamängd, dvs. Befolkning Varje element i ett slumpmässigt urval väljs helt slumpmässigt och har lika stor sannolikhet att väljas ut. Varför behöver man ett slumpmässigt urval? I princip för att få en opartisk representation av den totala populationen.

    Du vill till exempel göra en liten undersökning bland dina kunder. Det skulle naturligtvis vara oklokt att skicka ut ett frågeformulär till varje enskild person i din databas med flera tusen personer. Så vem ska du undersöka? Blir det de 100 nyaste kunderna, eller de 100 första kunderna i alfabetisk ordning, eller 100 personer med de kortaste namnen? Ingen av dessa metoder passar dina behov eftersom de ärFör att få ett opartiskt urval där alla har lika stor chans att bli utvalda, gör ett slumpmässigt urval genom att använda någon av de metoder som beskrivs nedan.

    Excel slumpmässigt urval med formler

    Det finns ingen inbyggd funktion för att slumpmässigt välja celler i Excel, men du kan använda en av funktionerna för att generera slumpmässiga tal som en lösning. Dessa kan förmodligen inte kallas enkla intuitiva formler, men de fungerar.

    Hur man väljer ett slumpmässigt värde från en lista

    Anta att du har en lista med namn i cellerna A2:A10 och att du vill slumpmässigt välja ett namn från listan. Detta kan göras med hjälp av en av följande formler:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    eller .

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Så är det! Din slumpmässiga namnplockare för Excel är klar och redo att användas:

    Observera att RANDBETWEEN är en flyktiga funktionen, vilket innebär att den kommer att räknas om vid varje ändring som du gör i kalkylbladet. Som ett resultat kommer ditt slumpmässiga urval också att ändras. För att förhindra detta kan du kopiera det extraherade namnet och klistra in det som värde i en annan cell ( Klistra in speciellt > Värden ). Detaljerade instruktioner finns i Hur man ersätter formler med värden.

    Naturligtvis kan dessa formler inte bara välja slumpmässiga namn, utan även slumpmässiga nummer, datum eller andra slumpmässiga celler.

    Hur dessa formler fungerar

    Kort sagt använder du INDEX-funktionen för att hämta ett värde från listan baserat på ett slumpmässigt radnummer som returneras av RANDBETWEEN.

    Mer specifikt genererar funktionen RANDBETWEEN ett slumpmässigt heltal mellan de två värden som du anger. För det lägre värdet anger du siffran 1. För det högre värdet använder du antingen COUNTA eller ROWS för att få fram det totala antalet rader. Som resultat returnerar RANDBETWEEN ett slumpmässigt tal mellan 1 och det totala antalet rader i ditt dataset. Detta tal går till row_num argumentet i INDEX-funktionen som talar om vilken rad som ska väljas. För kolumn_nummer använder vi 1 eftersom vi vill hämta ett värde från den första kolumnen.

    Observera: Denna metod fungerar bra för att välja en slumpmässig cell från en lista. Om urvalet ska omfatta flera celler kan formeln ovan ge flera förekomster av samma värde eftersom funktionen RANDBETWEEN inte är fri från dubbletter. Det är särskilt fallet när du väljer ett relativt stort urval från en relativt liten lista. Nästa exempel visar hur du gör ett slumpmässigt urval i Excel utan dubbletter.

    Hur man slumpmässigt väljer i Excel utan dubbletter

    Det finns några sätt att välja slumpmässiga data utan dubbletter i Excel. I allmänhet använder du funktionen RAND för att tilldela varje cell ett slumpmässigt nummer och sedan väljer du några celler med hjälp av en formel för indexrankning.

    Med listan med namn i cellerna A2:A16 följer du de här stegen för att extrahera några slumpmässiga namn:

    1. Skriv in Rand-formeln i B2 och kopiera den ner i kolumnen:

    =RAND()

  • Använd nedanstående formel i C2 för att ta ut ett slumpmässigt värde från kolumn A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Kopiera formeln ovan till så många celler som du vill välja slumpmässiga värden. I vårt fall kopierar vi formeln till ytterligare fyra celler (C2:C6).
  • Så är det! Fem slumpmässiga namn har tagits fram utan dubbletter:

    Hur denna formel fungerar

    Precis som i det föregående exemplet använder du INDEX-funktionen för att hämta ett värde från kolumn A baserat på en slumpmässig radkoordinat. I det här fallet krävs det två olika funktioner för att få fram det:

    • Formeln RAND fyller kolumn B med slumpmässiga tal.
    • Funktionen RANK returnerar rangordningen för ett slumpmässigt tal i samma rad. Till exempel, RANK(B2,$B$2:$B$16) i cell C2 returnerar rangordningen för talet i B2. När den relativa referensen B2 kopieras till C3 ändras den till B3 och returnerar rangordningen för talet i B3, och så vidare.
    • Det nummer som returneras av RANK matas in i row_num argumentet i INDEX-funktionen, så den väljer värdet från den raden. I kolumn_nummer argumentet anger du 1 eftersom du vill hämta ett värde från den första kolumnen.

    Ett ord av försiktighet! Som framgår av skärmdumpen ovan innehåller vårt Excel-slumpmässiga urval endast unika värden. Men teoretiskt sett finns det en liten chans att dubbletter dyker upp i ditt urval. Här är anledningen: på en mycket stor datamängd kan RAND generera dubbla slumpmässiga nummer, och RANK kommer att återge samma rangordning för dessa nummer. Personligen har jag aldrig fått några dubbletter under mina tester, men teoretiskt sett kan en sådan sannolikhetexisterar.

    Om du letar efter en skottsäker formel för att få ett slumpmässigt urval med endast unika värden, använd då kombinationen RANK + COUNTIF eller RANK.EQ + COUNTIF i stället för bara RANK. För en detaljerad förklaring av logiken, se Unik ranking i Excel.

    Den fullständiga formeln är lite besvärlig, men 100 % fri från kopior:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Anteckningar:

    • Precis som RANDBETWEEN genererar Excel-funktionen RAND också nya slumpmässiga tal vid varje ny beräkning av kalkylbladet, vilket gör att det slumpmässiga urvalet ändras. För att behålla urvalet oförändrat kan du kopiera det och klistra in det någon annanstans som värden ( Klistra in Särskilt > Värden ).
    • Om samma namn (nummer, datum eller något annat värde) förekommer mer än en gång i din ursprungliga datamängd kan ett slumpmässigt urval också innehålla flera förekomster av samma värde.

    Fler sätt att få ett slumpmässigt urval utan upprepningar i Excel 365 - 2010 beskrivs här: Hur man får ett slumpmässigt urval i Excel utan dubbletter.

    Hur man väljer slumpmässiga rader i Excel

    Om arbetsbladet innehåller mer än en kolumn med data kan du välja ett slumpmässigt urval på följande sätt: tilldela varje rad ett slumpmässigt nummer, sortera dessa nummer och välj det antal rader som behövs.

    1. Infoga en ny kolumn till höger eller vänster om tabellen (kolumn D i det här exemplet).
    2. Ange formeln RAND i den första cellen i den infogade kolumnen, exklusive kolumnrubrikerna: =RAND()
    3. Dubbelklicka på fyllningshandtaget för att kopiera formeln nedåt i kolumnen. Resultatet blir att du får ett slumpmässigt nummer tilldelat varje rad.
    4. Sortera de slumpmässiga numren största till minsta (om du sorterar i stigande ordning kommer kolumnrubrikerna att hamna längst ner i tabellen, så se till att du sorterar i fallande ordning). För att göra detta går du till Uppgifter flik> Sortera & Filtrera och klicka på knappen ZA. Excel utökar automatiskt urvalet och sorterar hela raderna i slumpmässig ordning.

      Om du inte är helt nöjd med hur tabellen har sorterats slumpmässigt trycker du på sorteringsknappen igen för att sortera den. Detaljerade instruktioner finns i Hur man sorterar slumpmässigt i Excel.

    5. Slutligen väljer du det antal rader som krävs för ditt prov, kopierar dem och klistrar in dem var du vill.

    Om du vill titta närmare på de formler som diskuteras i den här handledningen är du välkommen att ladda ner vår exempelarbetsbok för Excel Random Selection.

    Hur du väljer slumpmässigt i Excel med Randomize-verktyget

    Nu när du känner till en handfull formler för att få ett slumpmässigt urval i Excel, ska vi se hur du kan uppnå samma resultat med ett musklick.

    Med Random Generator for Excel som ingår i vår Ultimate Suite gör du så här:

    1. Välj en valfri cell i tabellen.
    2. Gå till Verktyg för Ablebits flik> Verktyg grupp och klicka på Randomisera > Välj slumpmässigt :

  • I tilläggsrutan väljer du vad som ska väljas: slumpmässiga rader, slumpmässiga kolumner eller slumpmässiga celler.
  • Ange antal eller procenttal för önskad provstorlek.
  • Klicka på Välj knappen. Klart!
  • Så här kan vi till exempel välja 5 slumpmässiga rader från vårt datamaterial:

    Du kommer att få ett slumpmässigt urval på en sekund:

    Nu kan du trycka på Ctrl + C för att kopiera ditt slumpmässiga prov och sedan trycka på Ctrl + V för att klistra in det på samma eller ett annat ark.

    Om du vill testa Randomize-verktyget i dina kalkylblad är det bara att hämta en testversion av Ultimate Suite nedan. Om du använder Google-kalkylblad kan vår Random Generator for Google Sheets vara användbar.

    Tillgängliga nedladdningar

    Urval av slumpmässigt urval - exempel på formler (.xlsx-fil)

    Ultimate Suite - testversion (.exe-fil)

    Michael Brown är en hängiven teknikentusiast med en passion för att förenkla komplexa processer med hjälp av mjukvaruverktyg. Med mer än ett decenniums erfarenhet inom teknikbranschen har han finslipat sina kunskaper i Microsoft Excel och Outlook, samt Google Sheets och Docs. Michaels blogg är tillägnad att dela med sig av sin kunskap och expertis med andra, och tillhandahåller lätta att följa tips och handledningar för att förbättra produktiviteten och effektiviteten. Oavsett om du är en erfaren proffs eller nybörjare, erbjuder Michaels blogg värdefulla insikter och praktiska råd för att få ut det mesta av dessa viktiga programvaruverktyg.