Selección aleatoria de Excel: como obter mostra aleatoria do conxunto de datos

  • Comparte Isto
Michael Brown

Este titorial ensinarache algunhas formas rápidas de seleccionar ao azar nomes, números ou calquera outro dato. Tamén aprenderá a obter unha mostra aleatoria sen duplicados e a seleccionar aleatoriamente un número ou porcentaxe especificados de celas, filas ou columnas cun clic do rato.

Se realiza unha investigación de mercado para un novo o lanzamento do produto ou a avaliación dos resultados da súa campaña de mercadotecnia, é importante que utilice unha mostra imparcial de datos para a súa análise. E o xeito máis sinxelo de conseguir isto é obter unha selección aleatoria en Excel.

    Que é a mostra aleatoria?

    Antes de falar sobre as técnicas de mostraxe, proporcionemos un pouco de información básica sobre a selección aleatoria e cando pode querer usala.

    En teoría da probabilidade e estatística, unha mostra aleatoria é un subconxunto de datos seleccionados dun conxunto de datos máis amplo, tamén coñecido como poboación. . Cada elemento dunha mostra aleatoria elíxese totalmente por casualidade e ten a mesma probabilidade de ser seleccionado. Por que necesitarías un? Basicamente, para obter unha representación non sesgada da poboación total.

    Por exemplo, queres realizar unha pequena enquisa entre os teus clientes. Obviamente, non sería prudente enviar un cuestionario a cada persoa na súa base de datos de miles de persoas. Entón, a quen fai a túa enquisa? Serán 100 clientes máis novos, ou os 100 primeiros listados alfabeticamente, ou 100 persoas co menornomes? Ningún destes enfoques se axusta ás túas necesidades porque son innatamente tendenciosos. Para obter unha mostra imparcial na que todos teñan a mesma oportunidade de ser elixidos, fai unha selección aleatoria mediante un dos métodos descritos a continuación.

    Selección aleatoria Excel con fórmulas

    Non hai incorporado función para escoller celas aleatoriamente en Excel, pero pode usar unha das funcións para xerar números aleatorios como solución. Probablemente non se lles poida chamar fórmulas intuitivas simples, pero funcionan.

    Como seleccionar un valor aleatorio dunha lista

    Supoño que tes unha lista de nomes nas celas A2:A10 e queres para seleccionar aleatoriamente un nome da lista. Isto pódese facer usando unha das seguintes fórmulas:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    ou

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Isto é! O teu selector de nomes aleatorio para Excel está todo configurado e listo para servir:

    Nota. Ten en conta que RANDBETWEEN é unha función volátil , o que significa que se volverá a calcular con cada cambio que fagas na folla de traballo. Como resultado, a túa selección aleatoria tamén cambiará. Para evitar que isto ocorra, pode copiar o nome extraído e pegalo como valor noutra cela ( Pegar especial > Valores ). Para obter instrucións detalladas, consulte Como substituír fórmulas por valores.

    Naturalmente, estas fórmulas non só poden escoller nomes aleatorios, senón tamén seleccionar números aleatorios, datas ou calquera outro tipo aleatorio.celas.

    Como funcionan estas fórmulas

    En poucas palabras, usa a función INDEX para extraer un valor da lista en base a un número de fila aleatorio devolto por RANDBETWEEN.

    Máis concretamente, a función RANDBETWEEN xera un número enteiro aleatorio entre os dous valores que especificas. Para o valor inferior, proporciona o número 1. Para o valor superior, utiliza COUNTA ou ROWS para obter o reconto total de filas. Como resultado, RANDBETWEEN devolve un número aleatorio entre 1 e o reconto total de filas do seu conxunto de datos. Este número vai ao argumento núm_fila da función INDEX que lle indica que fila escoller. Para o argumento número_columna , usamos 1 xa que queremos extraer un valor da primeira columna.

    Nota. Este método funciona ben para seleccionar unha cela aleatoria dunha lista. Se se supón que a túa mostra inclúe varias celas, a fórmula anterior pode devolver varias ocorrencias do mesmo valor porque a función RANDBETWEEN non está libre de duplicados. É especialmente o caso cando estás escollendo unha mostra relativamente grande dunha lista relativamente pequena. O seguinte exemplo mostra como facer unha selección aleatoria en Excel sen duplicados.

    Como seleccionar aleatoriamente en Excel sen duplicados

    Hai algunhas formas de seleccionar datos aleatorios sen duplicados en Excel. Xeralmente, usarías a función RAND para asignar un número aleatorio a cada cela e, a continuación, seleccionas algunhas celas porusando unha fórmula de clasificación de índice.

    Coa lista de nomes nas celas A2:A16, siga estes pasos para extraer algúns nomes aleatorios:

    1. Introduza a fórmula Rand en B2, e cópiao na columna:

    =RAND()

  • Pon a seguinte fórmula en C2 para extraer un valor aleatorio da columna A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Copia a fórmula anterior a tantas celas como tantos valores aleatorios queiras escoller. No noso caso, copiamos a fórmula a catro celas máis (C2:C6).
  • Isto é! Extráense cinco nomes aleatorios sen duplicados:

    Como funciona esta fórmula

    Como no exemplo anterior, usa a función INDEX para extraer un valor da columna A baseado nunha coordenada de fila aleatoria. Neste caso, son necesarias dúas funcións diferentes para obtelo:

    • A fórmula RAND enche a columna B con números aleatorios.
    • A función RANK devolve a clasificación un número aleatorio no mesmo fila. Por exemplo, RANK(B2,$B$2:$B$16) na cela C2 obtén a clasificación do número en B2. Cando se copia en C3, a referencia relativa B2 cambia a B3 e devolve o rango do número en B3, e así por diante.
    • O número devolto por RANK entrégase ao argumento número_fila de a función INDEX, polo que elixe o valor desa fila. No argumento número_columna , proporciona 1 porque quere extraer un valor da primeira columna.

    Unha palabra de precaución! Como se mostra no captura de pantalla anterior, o noso Excel aleatorioselección só contén valores únicos. Pero, en teoría, hai poucas posibilidades de que aparezan duplicados na túa mostra. Este é o motivo: nun conxunto de datos moi grande, RAND pode xerar números aleatorios duplicados e RANK devolverá o mesmo rango para eses números. Persoalmente, nunca tiven duplicados durante as miñas probas, pero en teoría, esa probabilidade existe.

    Se estás a buscar unha fórmula a proba de balas para obter unha selección aleatoria con só valores únicos, utiliza RANK + COUNTIF ou RANK.EQ + COUNTIF combinación en lugar de só RANK. Para obter unha explicación detallada da lóxica, consulte Clasificación única en Excel.

    A fórmula completa é un pouco complicada, pero 100 % sen duplicados:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Notas:

    • Como RANDBETWEEN, a función RAND de Excel tamén xera novos números aleatorios con cada recálculo da túa folla de traballo, facendo que a selección aleatoria cambie. Para manter a mostra sen cambios, cópiaa e pégaa noutro lugar como valores ( Pegar Especial > Valores ).
    • Se o mesmo nome (número, data ou calquera outro valor) aparece máis dunha vez no seu conxunto de datos orixinal, unha mostra aleatoria tamén pode conter varias ocorrencias do mesmo valor.

    Máis formas de obter unha selección aleatoria con aquí se describen sen repeticións en Excel 365 - 2010: Como obter mostra aleatoria en Excel sen duplicados.

    Como seleccionar filas aleatorias enExcel

    No caso de que a súa folla de traballo conteña máis dunha columna de datos, pode seleccionar unha mostra aleatoria deste xeito: asigne un número aleatorio a cada fila, ordene eses números e seleccione o número de filas necesario. Os pasos detallados seguen a continuación.

    1. Insira unha nova columna á dereita ou á esquerda da táboa (columna D neste exemplo).
    2. Na primeira cela do elemento inserido. columna, excluíndo as cabeceiras das columnas, introduza a fórmula RAND: =RAND()
    3. Faga dobre clic no controlador de recheo para copiar a fórmula na columna. Como resultado, terás un número aleatorio asignado a cada fila.
    4. Ordena os números aleatorios de maior a menor (ordenar en orde ascendente movería as cabeceiras das columnas na parte inferior da táboa). , así que asegúrate de ordenar descendente). Para iso, vai á pestana Datos > Ordenar & Filtra e fai clic no botón ZA. Excel expandirá automaticamente a selección e ordenará as filas enteiras en orde aleatoria.

      Se non estás moi satisfeito coa asignación aleatoria da túa táboa, preme de novo o botón de ordenación para recurrir a ela. Para obter instrucións detalladas, consulta Como ordenar aleatoriamente en Excel.

    5. Finalmente, selecciona o número de filas necesario para a túa mostra, cópiaas e pégaas onde sexa. che gusta.

    Para ver as fórmulas que se comentan neste tutorial, podes descargar a nosa mostralibro de traballo a Selección aleatoria de Excel.

    Como seleccionar aleatoriamente en Excel coa ferramenta Aleatorizar

    Agora que coñeces un puñado de fórmulas para obter unha mostra aleatoria en Excel, vexamos como podes conseguir o mesmo resultado cun clic do rato.

    Con Random Generator for Excel incluído na nosa Ultimate Suite, isto é o que fai:

    1. Seleccione calquera cela da súa táboa.
    2. Vaia á pestana Ferramentas Ablebits > Utilidades grupo e faga clic en Aleatoriar > Seleccionar aleatoriamente :

  • No panel do complemento, escolla o que quere seleccionar: filas aleatorias, columnas aleatorias ou celas aleatorias.
  • Especifique o número ou a porcentaxe para o tamaño da mostra desexado.
  • Fai clic no botón Seleccionar . Feito!
  • Por exemplo, así é como podemos seleccionar 5 filas aleatorias do noso conxunto de datos de mostra:

    E obterás unha selección aleatoria nun segundo:

    Agora podes premer Ctrl + C para copiar a túa mostra aleatoria e, a continuación, premer Ctrl + V para pegala na localización da mesma ou doutra folla.

    Se queres probar a ferramenta Randomize nas túas follas de traballo, só tes que coller unha versión de proba de Ultimate Suite a continuación. No caso de que esteas a usar follas de cálculo de Google, podes considerar útil o noso xerador aleatorio para follas de cálculo de Google.

    Descargas dispoñibles

    Seleccionar mostras aleatorias: exemplos de fórmulas (ficheiro .xlsx)

    Ultimate Suite: versión de proba (ficheiro .exe)

    Michael Brown é un entusiasta da tecnoloxía dedicada á súa paixón por simplificar procesos complexos mediante ferramentas de software. Con máis dunha década de experiencia na industria tecnolóxica, perfeccionou as súas habilidades en Microsoft Excel e Outlook, así como en Follas de cálculo e Documentos de Google. O blog de Michael está dedicado a compartir o seu coñecemento e experiencia con outros, proporcionando consellos e titoriais fáciles de seguir para mellorar a produtividade e a eficiencia. Tanto se es un profesional experimentado como un principiante, o blog de Michael ofrece valiosas ideas e consellos prácticos para sacar o máximo proveito destas ferramentas de software esenciais.