Comparar dos columnas y eliminar duplicados en Excel

  • Compartir Este
Michael Brown

Tardarás unos 10 minutos en leer este artículo y en los próximos 5 minutos (o incluso más rápido si eliges la 2ª solución descrita en el artículo) compararás fácilmente dos columnas de Excel en busca de duplicados y eliminarás o resaltarás los duplicados encontrados. Bien, ¡empieza la cuenta atrás!

Excel es una aplicación muy potente y realmente genial para crear y procesar grandes conjuntos de datos. Ahora que tiene muchos libros de trabajo con un conjunto de datos, o tal vez sólo una tabla enorme, es posible que desee comparar 2 columnas en busca de duplicados y luego hacer algo con las entradas encontradas, por ejemplo, eliminar filas duplicadas, colorear duplicados o borrar el contenido de las celdas duplicadas. Estas dos columnas pueden sersituadas en una tabla, contiguas o no contiguas, o pueden residir en 2 hojas de cálculo diferentes o incluso en libros de trabajo.

Digamos que tiene 2 columnas con nombres de personas: 5 nombres en la columna A y 3 nombres en la columna B, y desea comparar los datos entre estas dos columnas para encontrar duplicados. Como comprenderá, se trata de datos falsos sólo para un ejemplo rápido; en las hojas de cálculo reales suele haber miles y decenas de miles de entradas.

Variante A : Ambas columnas se encuentran en una hoja, en una única tabla: Columna A y Columna B

Variante B : Dos columnas están situadas en hojas diferentes: Columna A en Hoja2 y Columna A de la hoja 3

La herramienta integrada Eliminar duplicados disponible en Excel 2016, Excel 2013 y 2010 no puede manejar este escenario porque no puede comparar datos entre 2 columnas. Además, solo puede eliminar duplicados, ninguna otra opción como resaltar o colorear está disponible, por desgracia :-(.

Más adelante, voy a describir 2 posibles formas de comparar dos columnas de Excel que le permiten encontrar y eliminar entradas duplicadas:

    Comparar 2 columnas para encontrar duplicados mediante fórmulas de Excel

    Variante A: ambas columnas están en la misma lista

    1. En la primera celda vacía, que en nuestro ejemplo es la celda C1, escribe la siguiente fórmula:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Único", "Duplicado")

      En nuestra fórmula, A1 es la primera celda de la primera columna que queremos utilizar para la comparación. $B$1 y $B$10000 son las direcciones de la primera y la última celda de la 2ª columna con las que quieres comparar.Presta atención a la referencia absoluta de celda - signos de dólar ($) que preceden a las letras de columna y a los números de fila. Utilizo la referencia absoluta a propósito, para que las direcciones de celda no cambien al copiar la fórmula.

      Si desea encontrar duplicados en la columna B, intercambie los nombres de las columnas para que la fórmula tenga este aspecto:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Único", "Duplicado")

      En lugar de " Único "/" Duplicar " puedes escribir tus propias etiquetas, por ejemplo " No se ha encontrado "/" Encontrado ", o dejar sólo " Duplicar " y escriba "" en lugar de "Único". En este último caso, tendrá celdas vacías junto a las celdas para las que no se encontraron duplicados, creo que esta presentación es más conveniente para el análisis de datos.

    2. Ahora copiemos la fórmula en todas las celdas de columna C hasta la última fila que contiene datos en la columna A. Para ello, coloque el cursor en la esquina inferior derecha de la celda C1 y el cursor cambiará a una cruz negra, como se muestra en la siguiente imagen:

      Haga clic con el botón izquierdo del ratón y, manteniéndolo pulsado, arrastre el borde hacia abajo seleccionando todas las celdas en las que desee copiar la fórmula. Cuando estén seleccionadas todas las celdas necesarias, suelte el botón izquierdo del ratón:

      Consejo: En tablas grandes, es más rápido copiar la fórmula utilizando atajos. Haga clic en la celda C1 para seleccionarla y pulsa Ctrl + C (para copiar la fórmula al portapapeles), luego pulsa Ctrl + Mayús + Fin (para seleccionar todas las celdas no vacías de la columna C) y, por último, pulsa Ctrl + V (para pegar la fórmula en todas las celdas seleccionadas).

    3. Impresionante, todas las celdas duplicadas se marcan como "Duplicado":

    Variante B: las dos columnas están en hojas de cálculo diferentes (libros de trabajo)

    1. En la 1ª celda de la 1ª columna vacía de la Hoja2 (columna B en nuestro caso), escribe la fórmula:

      =IF(ISERROR(MATCH(A1,Hoja3!$A$1:$A$10000,0)),"", "Duplicado")

      Dónde Hoja3 es el nombre de la hoja en la que se encuentra la 2ª columna, y $A$1:$A$10000 son las direcciones de la primera y última celda de esa 2ª columna.

    2. Similar a la variante A.
    3. Tenemos el siguiente resultado:

    Haga clic para descargar la hoja de cálculo con los ejemplos anteriores y la fórmula para comparar 2 columnas y encontrar duplicados.

    Trabajar con duplicados encontrados

    Perfecto, hemos encontrado las entradas de la primera columna (Columna A) que también existen en la segunda columna (Columna B). Ahora tenemos que hacer algo con ellas :)

    Sería bastante ineficaz y llevaría demasiado tiempo buscar en toda la tabla y revisar manualmente las entradas duplicadas. Hay formas mucho mejores.

    Mostrar sólo las filas duplicadas en la columna A

    Si sus columnas no tienen cabeceras, deberá añadirlas. Para ello, ponga el cursor sobre el número que indica la 1ª fila y cambiará a un flecha negra como se muestra en la captura de pantalla:

    Haga clic con el botón derecho en la fila seleccionada y elija " Inserte " en el menú contextual:

    Dé nombres a sus columnas, por ejemplo " Nombre " y " ¿Duplicado? ". A continuación, cambie a la Datos y haga clic en Filtro :

    A continuación, haga clic en la pequeña flecha gris situada junto a " ¿Duplicado? " para abrir una lista desplegable, desmarque todos los elementos que no sean Duplicar en esa lista y haga clic en OK :

    Eso es todo, ahora sólo ves las celdas de la Columna A que tienen valores duplicados en la Columna B. Sólo hay tres celdas de este tipo en nuestra hoja de cálculo de prueba, como comprenderás en las hojas reales es probable que haya más, muchas más:

    Para volver a mostrar todas las filas de la columna A, haga clic en el símbolo de filtro de la columna B, que ahora parece un embudo con una flecha diminuta y marque "Seleccionar todo". Alternativamente, puede hacer lo mismo mediante Ficha Datos -> Seleccionar & Filtrar -> Claro como se muestra en la captura de pantalla:

    Colorear o resaltar los duplicados encontrados

    Si el " Duplicar " no es suficiente para sus propósitos y desea marcar las celdas duplicadas por color de fuente o color de relleno o de alguna otra manera...

    A continuación, filtre los duplicados como se ha explicado anteriormente, seleccione todas las celdas filtradas y pulse Ctrl + F1 para abrir la función Formatear celdas Como ejemplo, cambiemos el color de fondo de las filas duplicadas a amarillo brillante. Por supuesto, puede cambiar el color de fondo de las celdas utilizando la función Color de relleno en el Inicio pero la ventaja del cuadro de diálogo Formato de celdas es que le permite realizar todos los cambios de formato a la vez:

    Ahora no echará de menos ni una sola célula duplicada:

    Eliminar duplicados de la primera columna

    Filtra tu tabla para que sólo aparezcan las celdas con valores duplicados y selecciona todas esas celdas.

    Si las dos columnas que desea comparar se encuentran en hojas de cálculo diferentes es decir, en tablas separadas, haga clic con el botón derecho en el intervalo seleccionado y elija " Borrar fila " en el menú contextual:

    Haga clic en OK cuando Excel le pida que confirme que realmente desea "Eliminar toda la fila de la hoja" y, a continuación, borre el filtro. Como puede ver, sólo quedan las filas con valores únicos:

    Si hay 2 columnas en una hoja de cálculo Si las celdas de la columna A están una al lado de la otra (adyacentes) o no se tocan (no adyacentes), la eliminación de duplicados es un poco más compleja. No podemos eliminar filas enteras que contengan valores duplicados porque esto eliminaría también las celdas correspondientes de la 2ª columna. Por lo tanto, para dejar sólo entradas únicas en la columna A, haga lo siguiente:

    1. Filtra la tabla para que sólo se muestren las celdas duplicadas y selecciona todas esas celdas. Haz clic con el botón derecho en la selección y elige " Contenido claro ":
    2. Borra el filtro.
    3. Selecciona todas las celdas de la Columna A empezando por la celda A1 hasta la última celda que contenga datos.
    4. Ir a la Datos y haga clic en Ordenar de la A a la Z En la ventana de diálogo que se abre, seleccione " Continuar con la selección actual "y haga clic en Ordenar :
    5. Elimine la columna que contiene la fórmula porque ya no la necesita, sólo "Uniques" quedan allí por ahora.
    6. Eso es todo, ahora la columna A sólo contiene datos únicos que no existen en la columna B :

    Como ves, no es tan difícil eliminar duplicados entre dos columnas de Excel utilizando fórmulas. Aunque es un proceso muy lento y aburrido escribir y copiar la fórmula, aplicar y borrar el filtro cada vez que necesites comparar 2 columnas en tus hojas de cálculo. La otra solución que voy a poner en tu conocimiento es mucho más sencilla y te llevará sólo una fracción del tiempo que hemos empleado en el proceso deprimer método. Creo que encontrarás cosas más agradables en las que emplear el tiempo ahorrado ;)

    Compare 2 columnas de Excel en busca de duplicados mediante un asistente visual

    Y ahora déjeme mostrarle cómo comparar dos columnas en busca de duplicados utilizando nuestras herramientas Dedupe para Excel.

    1. Abra la hoja de cálculo (u hojas de cálculo) donde se encuentran las columnas que desea comparar.
    2. Seleccione cualquier celda de la 1ª columna, cambie a la celda Datos de Ablebits y haga clic en el botón Comparar tablas botón:
    3. En paso 1 del asistente, verá que su primera columna ya está seleccionada, así que simplemente haga clic en Siguiente .

      Nota: si desea comparar no sólo 2 columnas, sino 2 tablas, deberá seleccionar toda la primera tabla en este paso.

    4. En paso 2 del asistente, seleccione la 2ª columna con la que desea comparar. Elegimos Hoja2 en el mismo libro de trabajo. En la mayoría de los casos, el asistente inteligente selecciona la 2ª columna automáticamente, si por alguna razón esto no ocurre, seleccione la columna de destino utilizando el ratón. Si está comparando tablas completas, seleccione toda la 2ª tabla.
    5. Elija encontrar Valores duplicados :
    6. Elija el par de columnas que desea comparar:

      Sugerencia. Si está comparando tablas, puede elegir varios pares de columnas para la comparación, por ejemplo, nombre y apellidos. Para obtener más detalles, consulte Cómo eliminar duplicados de dos hojas de cálculo de Excel.

    7. Por último, debe decidir qué desea hacer con los duplicados encontrados. Puede elegir entre eliminar las entradas duplicadas, moverlas o copiarlas a otra hoja de cálculo, añadir una columna de estado (el resultado será similar a nuestra primera solución con fórmulas de Excel), resaltar los duplicados o simplemente seleccionar todas las celdas con valores duplicados:

      Consejo: no elija la opción de eliminar duplicados, sobre todo si es la primera vez que utiliza la herramienta, sino la de mover duplicados a otra hoja de cálculo Esto eliminará los duplicados de la primera tabla, pero le dará la oportunidad de revisar la lista de entradas reconocidas como duplicados. Al comparar por varias columnas coincidentes en tablas grandes, puede ocurrir que olvide accidentalmente seleccionar una columna clave con datos únicos, y mover los duplicados evitará una pérdida irrecuperable de datos.

    8. Haga clic en Acabado Lo que tenemos ahora es una tabla limpia y sin duplicados:

    Recuerde la solución anterior y note la diferencia :) Es rápido y sencillo desduplicar sus hojas de cálculo con Comparar dos tablas De hecho, le llevará menos tiempo del que ha empleado en leer este artículo.

    Actualmente, Comparar tablas forma parte de nuestra Ultimate Suite para Excel, una colección de más de 70 herramientas profesionales que cubren más de 300 casos de uso. El tiempo corre, así que ¡date prisa y descárgatela ahora mismo!

    Si tiene alguna pregunta o algo no le ha quedado claro, por favor, déjeme un comentario y con mucho gusto se lo explicaré con más detalle ¡Gracias por leer!

    Michael Brown es un entusiasta de la tecnología dedicado y apasionado por simplificar procesos complejos utilizando herramientas de software. Con más de una década de experiencia en la industria de la tecnología, ha perfeccionado sus habilidades en Microsoft Excel y Outlook, así como en Google Sheets y Docs. El blog de Michael está dedicado a compartir su conocimiento y experiencia con otros, brindando consejos y tutoriales fáciles de seguir para mejorar la productividad y la eficiencia. Ya sea un profesional experimentado o un principiante, el blog de Michael ofrece información valiosa y consejos prácticos para aprovechar al máximo estas herramientas de software esenciales.