Comparer deux colonnes et supprimer les doublons dans Excel

  • Partage Ça
Michael Brown

Il vous faudra environ 10 minutes pour lire cet article et dans les 5 minutes qui suivent (ou encore plus rapidement si vous choisissez la deuxième solution décrite dans l'article), vous pourrez facilement comparer deux colonnes Excel à la recherche de doublons et supprimer ou mettre en évidence les doublons trouvés. Bon, le compte à rebours est lancé !

Excel est une application très puissante et vraiment cool pour créer et traiter de grands tableaux de données. Maintenant que vous avez beaucoup de classeurs avec un pool de données, ou peut-être juste un énorme tableau, vous pouvez vouloir comparer 2 colonnes pour les doublons et ensuite faire quelque chose avec les entrées trouvées, par exemple supprimer les lignes en double, colorer les doublons ou effacer le contenu des cellules en double. Ces deux colonnes peuvent êtresitués dans une seule table, de manière contiguë ou non, ou ils peuvent résider dans 2 feuilles de calcul ou même des classeurs différents.

Supposons que vous ayez deux colonnes contenant des noms de personnes - 5 noms dans la colonne A et 3 noms dans la colonne B, et que vous vouliez comparer les données entre ces deux colonnes pour trouver les doublons. Comme vous le comprenez, il s'agit de données fictives, juste pour un exemple rapide ; dans les feuilles de calcul réelles, vous avez généralement des milliers et des dizaines de milliers d'entrées.

Variante A Les deux colonnes sont situées sur une seule feuille, dans un seul tableau : Colonne A et Colonne B

Variante B : Deux colonnes sont situées sur des feuilles différentes : Colonne A de la feuille 2 et Colonne A de la feuille 3

L'outil intégré de suppression des doublons disponible dans Excel 2016, Excel 2013 et 2010 ne peut pas gérer ce scénario car il ne peut pas comparer les données entre 2 colonnes. De plus, il ne peut que supprimer les doublons, aucun autre choix tel que la mise en évidence ou la coloration n'est disponible, hélas :-(.

Plus loin, je vais décrire 2 méthodes possibles de comparaison de deux colonnes Excel qui vous permettent de trouver et de supprimer les entrées en double :

    Comparer 2 colonnes pour trouver les doublons à l'aide de formules Excel

    Variante A : les deux colonnes sont sur la même liste

    1. Dans la première cellule vide, dans notre exemple il s'agit de la cellule C1, écrivez la formule suivante :

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unique", "Duplicate")

      Dans notre formule, A1 est la première cellule de la première colonne que nous voulons utiliser pour la comparaison. $B$1 et $B$10000 sont les adresses de la première et de la dernière cellule de la deuxième colonne que vous voulez comparer.Faites attention à la référence absolue de la cellule - les signes de dollar ($) précédant les lettres de la colonne et les numéros de ligne. J'utilise la référence absolue à dessein, afin que les adresses de cellule restent inchangées lors de la copie de la formule.

      Si vous voulez trouver les doublons dans la colonne B, intervertissez les noms des colonnes pour que la formule ressemble à ceci :

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unique", "Duplicate")

      Au lieu de " Unique en son genre "/" Duplicate "vous pouvez écrire vos propres étiquettes, par exemple " Non trouvé "/" Trouvé ", ou laisser seulement " Duplicate "Dans ce dernier cas, vous aurez des cellules vides à côté des cellules pour lesquelles aucun doublon n'a été trouvé, je pense que cette présentation est plus pratique pour l'analyse des données.

    2. Maintenant, copions la formule dans toutes les cellules du tableau suivant colonne C jusqu'à la dernière ligne qui contient des données dans la colonne A. Pour ce faire, placez le curseur dans le coin inférieur droit de la cellule C1 et le curseur se transforme en une croix noire, comme le montre l'image ci-dessous :

      Cliquez sur le bouton gauche de la souris et, tout en le maintenant enfoncé, faites glisser la bordure vers le bas en sélectionnant toutes les cellules où vous souhaitez copier la formule. Lorsque toutes les cellules nécessaires sont sélectionnées, relâchez le bouton gauche de la souris :

      Conseil : dans les grands tableaux, il est plus rapide de copier la formule en utilisant des raccourcis. Cliquez sur la cellule C1 pour la sélectionner et appuyez sur Ctrl + C (pour copier la formule dans le presse-papiers), puis appuyez sur Ctrl + Shift + End (pour sélectionner toutes les cellules non vides de la colonne C), et enfin appuyez sur Ctrl + V (pour coller la formule dans toutes les cellules sélectionnées).

    3. Génial, toutes les cellules dupliquées sont marquées comme "Duplicate" :

    Variante B : deux colonnes se trouvent sur des feuilles de calcul (classeurs) différentes.

    1. Dans la 1ère cellule de la 1ère colonne vide de Sheet2 (colonne B dans notre cas), écrivez la formule :

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Duplicate")

      Feuille 3 est le nom de la feuille sur laquelle se trouve la 2ème colonne, et $A$1:$A$10000 sont les adresses de la première et de la dernière cellule de cette deuxième colonne.

    2. Similaire à la variante A.
    3. Nous avons le résultat suivant :

    Cliquez pour télécharger la feuille de calcul avec les exemples ci-dessus et la formule permettant de comparer 2 colonnes pour trouver les doublons.

    Travailler avec des doublons trouvés

    Parfait, nous avons trouvé les entrées de la première colonne (Colonne A) qui existent également dans la deuxième colonne (Colonne B). Maintenant, nous devons faire quelque chose avec elles :)

    Il serait plutôt inefficace et prendrait trop de temps de parcourir l'ensemble de la table et d'examiner manuellement les entrées en double. Il existe de bien meilleures méthodes.

    Afficher uniquement les lignes dupliquées dans la colonne A

    Si vos colonnes n'ont pas d'en-tête, vous devez en ajouter. Pour ce faire, placez le curseur sur le numéro indiquant la première ligne et il se transformera en un flèche noire comme indiqué dans la capture d'écran :

    Cliquez avec le bouton droit de la souris sur la ligne sélectionnée et choisissez " Insérer "dans le menu contextuel :

    Donnez des noms à vos colonnes, par exemple " Nom " et " Duplicata ? "Ensuite, passez à la Données et cliquez sur Filtre :

    Après cela, cliquez sur une petite flèche grise à côté de " Duplicata ? "pour ouvrir une liste déroulante, décochez tous les éléments autres que Duplicate dans cette liste, puis cliquez sur OK :

    Voilà, maintenant vous ne voyez que les cellules de la colonne A qui ont des valeurs dupliquées dans la colonne B. Il n'y a que trois cellules de ce type dans notre feuille de calcul de test, comme vous le comprenez dans les feuilles réelles, il y en a probablement plus, beaucoup plus :

    Pour afficher à nouveau toutes les lignes de la colonne A, cliquez sur le symbole du filtre dans la colonne B, qui ressemble maintenant à un entonnoir avec une petite flèche. et cochez "Sélectionner tout". Vous pouvez également faire de même via Onglet Données -> ; Sélectionner et filtrer -> ; Clair comme le montre la capture d'écran :

    Colorer ou mettre en évidence les doublons trouvés

    Si le " Duplicate Le drapeau " " ne suffit pas pour vos besoins et vous voulez marquer les cellules dupliquées par la couleur de la police ou la couleur de remplissage ou d'une autre manière...

    Ensuite, filtrez les doublons comme expliqué ci-dessus, sélectionnez toutes les cellules filtrées et appuyez sur Ctrl + F1 pour ouvrir la fenêtre de l'outil d'analyse. Formatage des cellules À titre d'exemple, changeons la couleur d'arrière-plan des rangées dupliquées en jaune vif. Bien entendu, vous pouvez modifier la couleur d'arrière-plan des cellules à l'aide de la commande Couleur de remplissage de l'option Accueil mais l'avantage de la boîte de dialogue Format des cellules est qu'elle vous permet d'effectuer toutes les modifications de formatage en une seule fois :

    Maintenant, vous ne manquerez certainement pas une seule cellule dupliquée :

    Supprimer les doublons de la première colonne

    Filtrez votre tableau pour que seules les cellules contenant des valeurs dupliquées apparaissent, puis sélectionnez toutes ces cellules.

    Si les deux colonnes que vous comparez sont situées sur des feuilles de calcul différentes. c'est-à-dire dans des tableaux séparés, cliquez avec le bouton droit de la souris sur la plage sélectionnée et choisissez " Supprimer la rangée "dans le menu contextuel :

    Cliquez sur OK Excel vous demandera alors de confirmer que vous souhaitez réellement "Supprimer une ligne entière de la feuille", puis effacera le filtre. Comme vous pouvez le constater, seules les lignes contenant des valeurs uniques sont conservées :

    Si 2 colonnes sont situées sur une même feuille de calcul En effet, nous ne pouvons pas supprimer des lignes entières contenant des valeurs en double, car cela supprimerait également les cellules correspondantes de la deuxième colonne. Ainsi, pour ne laisser que des entrées uniques dans la colonne A, vous procédez comme suit :

    1. Filtrez le tableau pour que seules les cellules dupliquées soient affichées et sélectionnez toutes ces cellules. Cliquez avec le bouton droit de la souris sur la sélection et choisissez " Contenu clair " :
    2. Effacer le filtre.
    3. Sélectionnez toutes les cellules de la colonne A en partant de la cellule A1 jusqu'à la dernière cellule qui contient des données.
    4. Allez à la Données et cliquez sur Trier de A à Z Dans la fenêtre de dialogue qui s'ouvre, sélectionnez " Continuer avec la sélection actuelle "et cliquez sur Trier :
    5. Supprimez la colonne contenant la formule car vous n'en avez plus besoin, il n'y a plus que des "Uniques".
    6. C'est tout, maintenant la colonne A ne contient que des données uniques qui n'existent pas dans la colonne B :

    Comme vous le voyez, il n'est pas si difficile de supprimer les doublons entre deux colonnes Excel à l'aide de formules. Cependant, il est très long et ennuyeux d'écrire et de copier la formule, d'appliquer et d'effacer le filtre chaque fois que vous avez besoin de comparer deux colonnes dans vos feuilles de calcul. L'autre solution que je vais vous présenter est beaucoup plus simple et ne prendra qu'une fraction du temps que nous avons passé sur l'outilpremière méthode. Je pense que vous trouverez des choses plus agréables pour dépenser le temps gagné ;)

    Comparer 2 colonnes Excel pour détecter les doublons à l'aide d'un assistant visuel

    Et maintenant, laissez-moi vous montrer comment comparer deux colonnes pour détecter les doublons en utilisant nos outils de déduplication pour Excel.

    1. Ouvrez la (ou les) feuille(s) de calcul où se trouvent les colonnes que vous voulez comparer.
    2. Sélectionnez n'importe quelle cellule dans la 1ère colonne, passez à la fonction Ablebits Data et cliquez sur l'onglet Comparer les tableaux bouton :
    3. Sur étape 1 de l'assistant, vous verrez que votre première colonne est déjà sélectionnée, alors cliquez simplement sur Suivant .

      Remarque : si vous souhaitez comparer non seulement 2 colonnes, mais aussi 2 tableaux, vous devez sélectionner l'intégralité du premier tableau dans cette étape.

    4. Sur étape 2 de l'assistant, sélectionnez la 2ème colonne à laquelle vous voulez comparer. Nous choisissons Feuille 2 dans le même classeur. Dans la plupart des cas, l'assistant intelligent sélectionne automatiquement la 2ème colonne, si pour une raison quelconque cela ne se produit pas, sélectionnez la colonne cible à l'aide de la souris. Si vous comparez des tableaux entiers, sélectionnez le 2ème tableau entier.
    5. Choisir pour trouver Valeurs en double :
    6. Choisissez la paire de colonnes que vous voulez comparer :

      Conseil : si vous comparez des tableaux, vous pouvez choisir plusieurs paires de colonnes pour la comparaison, par exemple, le prénom et le nom de famille. Pour plus de détails, veuillez consulter la section Comment supprimer les doublons de deux feuilles de calcul Excel.

    7. Vous pouvez choisir de supprimer les entrées en double, de les déplacer ou de les copier dans une autre feuille de calcul, d'ajouter une colonne d'état (le résultat sera similaire à notre première solution avec des formules Excel), de mettre en évidence les doublons ou de sélectionner simplement toutes les cellules contenant des valeurs en double :

      Conseil : ne choisissez pas de supprimer les doublons, surtout si vous utilisez l'outil pour la première fois, mais choisissez plutôt de déplacer les doublons vers une autre feuille de calcul Cette opération supprime les doublons de la première table, mais vous donne la possibilité de revoir la liste des entrées reconnues comme des doublons. Lors de la comparaison de plusieurs colonnes correspondantes dans de grandes tables, il peut arriver que vous ayez accidentellement oublié de sélectionner une colonne clé contenant des données uniques, et le déplacement des doublons permet d'éviter une perte irrémédiable de données.

    8. Cliquez sur Finition et appréciez le résultat. Ce que nous avons maintenant est une belle table, propre, sans doublons :

    Souvenez-vous de la solution précédente et sentez la différence :) Il est en effet rapide et facile de déduire vos feuilles de calcul avec Comparer deux tableaux En fait, cela vous prendra moins de temps que vous n'en avez passé à lire cet article.

    Actuellement, Comparer les tableaux fait partie de notre Ultimate Suite for Excel, une collection de plus de 70 outils professionnels qui couvrent plus de 300 cas d'utilisation. L'heure tourne, alors dépêchez-vous de le télécharger dès maintenant !

    Si vous avez des questions ou si quelque chose n'est pas clair, n'hésitez pas à me laisser un commentaire et je serai heureux de vous donner plus de détails. Merci de nous lire !

    Michael Brown est un passionné de technologie passionné par la simplification de processus complexes à l'aide d'outils logiciels. Avec plus d'une décennie d'expérience dans l'industrie de la technologie, il a perfectionné ses compétences dans Microsoft Excel et Outlook, ainsi que dans Google Sheets et Docs. Le blog de Michael est dédié au partage de ses connaissances et de son expertise avec les autres, en fournissant des conseils et des tutoriels faciles à suivre pour améliorer la productivité et l'efficacité. Que vous soyez un professionnel chevronné ou un débutant, le blog de Michael offre des informations précieuses et des conseils pratiques pour tirer le meilleur parti de ces outils logiciels essentiels.