Selección aleatoria en Excel: cómo obtener una muestra aleatoria de un conjunto de datos

  • Compartir Este
Michael Brown

Este tutorial le enseñará algunas formas rápidas de seleccionar aleatoriamente nombres, números o cualquier otro dato. También aprenderá cómo obtener una muestra aleatoria sin duplicados y cómo seleccionar aleatoriamente un número o porcentaje específico de celdas, filas o columnas en un clic del ratón.

Tanto si realiza un estudio de mercado para el lanzamiento de un nuevo producto como si evalúa los resultados de su campaña de marketing, es importante que utilice una muestra de datos imparcial para su análisis. Y la forma más sencilla de conseguirlo es mediante una selección aleatoria en Excel.

    ¿Qué es una muestra aleatoria?

    Antes de hablar de las técnicas de muestreo, vamos a proporcionar un poco de información general sobre la selección aleatoria y cuándo puede ser conveniente utilizarla.

    En teoría de la probabilidad y estadística, un muestra aleatoria es un subconjunto de datos seleccionados de un conjunto de datos mayor, también conocido como población Cada elemento de una muestra aleatoria se elige al azar y tiene la misma probabilidad de ser seleccionado. ¿Para qué se necesita una muestra aleatoria? Básicamente, para obtener una representación no sesgada de la población total.

    Por ejemplo, quiere realizar una pequeña encuesta entre sus clientes. Obviamente, no sería prudente enviar un cuestionario a cada una de las personas de su base de datos de varios miles. Entonces, ¿a quién va a encuestar? ¿Serán los 100 clientes más nuevos, o los 100 primeros clientes ordenados alfabéticamente, o las 100 personas con los nombres más cortos? Ninguno de estos enfoques se ajusta a sus necesidades porque son innatamentePara obtener una muestra imparcial en la que todos tengan las mismas oportunidades de ser elegidos, realice una selección aleatoria utilizando uno de los métodos que se describen a continuación.

    Excel selección aleatoria con fórmulas

    No hay ninguna función incorporada para elegir celdas aleatoriamente en Excel, pero puedes usar una de las funciones para generar números aleatorios como solución. Probablemente no se puedan llamar fórmulas intuitivas simples, pero funcionan.

    Cómo seleccionar un valor aleatorio de una lista

    Supongamos que tienes una lista de nombres en las celdas A2:A10 y quieres seleccionar al azar un nombre de la lista. Esto se puede hacer utilizando una de las siguientes fórmulas:

    =INDEX($A$2:$A$10,RANDBETWEEN(1,COUNTA($A$2:$A$10)),1)

    o

    =INDEX($A$2:$A$10,RANDBETWEEN(1,ROWS($A$2:$A$10)),1)

    Su selector de nombres aleatorios para Excel está listo para funcionar:

    Nota: tenga en cuenta que RANDBETWEEN es un volátil lo que significa que se recalculará con cada cambio que realice en la hoja de cálculo. Como resultado, su selección aleatoria también cambiará. Para evitar que esto ocurra, puede copiar el nombre extraído y pegarlo como valor en otra celda ( Pegado especial > Valores Para obtener instrucciones detalladas, consulte Cómo sustituir fórmulas por valores.

    Naturalmente, estas fórmulas no sólo pueden elegir nombres al azar, sino también seleccionar números al azar, fechas o cualquier otra celda aleatoria.

    Cómo funcionan estas fórmulas

    En pocas palabras, se utiliza la función INDEX para extraer un valor de la lista basándose en un número de fila aleatorio devuelto por RANDBETWEEN.

    Más concretamente, la función RANDBETWEEN genera un número entero aleatorio entre los dos valores que especifique. Para el valor inferior, se proporciona el número 1. Para el valor superior, se utiliza COUNTA o ROWS para obtener el recuento total de filas. Como resultado, RANDBETWEEN devuelve un número aleatorio entre 1 y el recuento total de filas del conjunto de datos. Este número va a parar al número_de_fila de la función INDEX que le indica qué fila debe elegir. Para la función columna_num utilizamos 1, ya que queremos extraer un valor de la primera columna.

    Nota: este método funciona bien para seleccionar una celda aleatoria de una lista. Si se supone que su muestra incluye varias celdas, la fórmula anterior puede devolver varias ocurrencias del mismo valor porque la función RANDBETWEEN no está libre de duplicados. Es especialmente el caso cuando está escogiendo una muestra relativamente grande de una lista relativamente pequeña. El siguiente ejemplo muestra cómo hacer una selección aleatoria en Excel sin duplicados.

    Cómo seleccionar aleatoriamente en Excel sin duplicados

    Existen varias formas de seleccionar datos aleatorios sin duplicados en Excel. Generalmente, se utilizaría la función RAND para asignar un número aleatorio a cada celda y, a continuación, se seleccionarían algunas celdas utilizando una fórmula de Rango de índice.

    Con la lista de nombres en las celdas A2:A16, siga estos pasos para extraer algunos nombres al azar:

    1. Introduzca la fórmula Rand en B2 y cópiela en la columna:

    =RAND()

  • Pon la siguiente fórmula en C2 para extraer un valor aleatorio de la columna A:
  • =INDEX($A$2:$A$16, RANK(B2,$B$2:$B$16), 1)

  • Copia la fórmula anterior en tantas celdas como valores aleatorios quieras elegir. En nuestro caso, copiamos la fórmula en cuatro celdas más (C2:C6).
  • ¡Ya está! Se extraen cinco nombres aleatorios sin duplicados:

    Cómo funciona esta fórmula

    Como en el ejemplo anterior, se utiliza la función INDEX para extraer un valor de la columna A basado en una coordenada de fila aleatoria. En este caso, se necesitan dos funciones diferentes para obtenerlo:

    • La fórmula RAND rellena la columna B con números aleatorios.
    • La función RANK devuelve el rango de un número aleatorio en la misma fila. Por ejemplo, RANK(B2,$B$2:$B$16) en la celda C2 obtiene el rango del número en B2. Cuando se copia a C3, la referencia relativa B2 cambia a B3 y devuelve el rango del número en B3, y así sucesivamente.
    • El número devuelto por RANK se introduce en la función número_de_fila de la función INDEX, por lo que elige el valor de esa fila. En la función columna_num se proporciona 1 porque se desea extraer un valor de la primera columna.

    Una advertencia Como se muestra en la captura de pantalla anterior, nuestra selección aleatoria de Excel sólo contiene valores únicos. Pero teóricamente, hay una pequeña posibilidad de que aparezcan duplicados en su muestra. He aquí por qué: en un conjunto de datos muy grande, RAND podría generar números aleatorios duplicados, y RANK devolverá el mismo rango para esos números. Personalmente, nunca he obtenido ningún duplicado durante mis pruebas, pero en teoría, tal probabilidadexiste.

    Si está buscando una fórmula a prueba de balas para obtener una selección aleatoria con sólo valores únicos, entonces use la combinación RANK + COUNTIF o RANK.EQ + COUNTIF en lugar de sólo RANK. Para una explicación detallada de la lógica, por favor vea Clasificación única en Excel.

    La fórmula completa es un poco engorrosa, pero 100% libre de duplicados:

    =INDEX($A$2:$A$16, RANK.EQ(B2, $B$2:$B$16) + COUNTIF($B$2:B2, B2) - 1, 1)

    Notas:

    • Al igual que RANDBETWEEN, la función RAND de Excel también genera nuevos números aleatorios con cada recálculo de su hoja de cálculo, haciendo que la selección aleatoria cambie. Para mantener su muestra sin cambios, cópiela y péguela en otro lugar como valores ( Pegar Especial > Valores ).
    • Si el mismo nombre (número, fecha o cualquier otro valor) aparece más de una vez en el conjunto de datos original, una muestra aleatoria también podría contener varias apariciones del mismo valor.

    Más formas de obtener una selección aleatoria sin repeticiones en Excel 365 - 2010 se describen aquí: Cómo obtener una muestra aleatoria en Excel sin duplicados.

    Cómo seleccionar filas aleatorias en Excel

    En caso de que su hoja de cálculo contenga más de una columna de datos, puede seleccionar una muestra aleatoria de la siguiente manera: asigne un número aleatorio a cada fila, ordene esos números y seleccione el número necesario de filas. A continuación se detallan los pasos a seguir.

    1. Inserte una nueva columna a la derecha o a la izquierda de su tabla (columna D en este ejemplo).
    2. En la primera celda de la columna insertada, excluyendo las cabeceras de columna, introduzca la fórmula RAND: =RAND()
    3. Haga doble clic en el manejador de relleno para copiar la fórmula por la columna. Como resultado, tendrá un número aleatorio asignado a cada fila.
    4. Ordenar los números aleatorios de mayor a menor (si se ordena en orden ascendente, las cabeceras de las columnas se moverán a la parte inferior de la tabla, así que asegúrese de hacerlo en orden descendente). Para ello, diríjase a la sección Datos tab> Ordenar y filtrar Excel ampliará automáticamente la selección y ordenará todas las filas en orden aleatorio.

      Si no estás del todo satisfecho con cómo se ha ordenado aleatoriamente tu tabla, pulsa de nuevo el botón ordenar para recurrir. Para obtener instrucciones detalladas, consulta Cómo ordenar aleatoriamente en Excel.

    5. Por último, selecciona el número necesario de filas para tu muestra, cópialas y pégalas donde quieras.

    Para echar un vistazo más de cerca a las fórmulas discutidas en este tutorial, le invitamos a descargar nuestro libro de ejemplo para Excel Selección Aleatoria.

    Cómo seleccionar aleatoriamente en Excel con la herramienta Aleatorizar

    Ahora que ya conoce un puñado de fórmulas para obtener una muestra aleatoria en Excel, veamos cómo puede conseguir el mismo resultado con un clic del ratón.

    Con el Generador aleatorio para Excel incluido en nuestra Ultimate Suite, esto es lo que debe hacer:

    1. Seleccione cualquier celda de la tabla.
    2. Ir a la Herramientas Ablebits tab> Servicios y haga clic en Aleatorizar > Seleccionar aleatoriamente :

  • En el panel del complemento, elija qué seleccionar: filas aleatorias, columnas aleatorias o celdas aleatorias.
  • Especifique el número o porcentaje para el tamaño de muestra deseado.
  • Haga clic en el botón Seleccione botón. ¡Hecho!
  • Por ejemplo, así es como podemos seleccionar 5 filas aleatorias de nuestro conjunto de datos de muestra:

    Y obtendrás una selección aleatoria en un segundo:

    Ahora, puede pulsar Ctrl + C para copiar su muestra aleatoria y, a continuación, pulsar Ctrl + V para pegarla en la misma hoja o en otra.

    Si quieres probar la herramienta Aleatorizar en tus hojas de cálculo, hazte con una versión de prueba de Ultimate Suite a continuación. En caso de que utilices hojas de cálculo de Google, puede que te resulte útil nuestro Generador aleatorio para hojas de cálculo de Google.

    Descargas disponibles

    Selección de una muestra aleatoria: ejemplos de fórmulas (archivo .xlsx)

    Ultimate Suite - versión de prueba (archivo .exe)

    Michael Brown es un entusiasta de la tecnología dedicado y apasionado por simplificar procesos complejos utilizando herramientas de software. Con más de una década de experiencia en la industria de la tecnología, ha perfeccionado sus habilidades en Microsoft Excel y Outlook, así como en Google Sheets y Docs. El blog de Michael está dedicado a compartir su conocimiento y experiencia con otros, brindando consejos y tutoriales fáciles de seguir para mejorar la productividad y la eficiencia. Ya sea un profesional experimentado o un principiante, el blog de Michael ofrece información valiosa y consejos prácticos para aprovechar al máximo estas herramientas de software esenciales.