Table des matières
Vous cherchez un moyen simple de trouver les doublons dans Google Sheets ? 7 façons :) C'est tout ce dont vous avez besoin pour de nombreux cas d'utilisation :) Je vous montrerai comment utiliser des outils sans formule (pas de codage - promis !), le formatage conditionnel et quelques fonctions faciles pour les fans de formules.
Quelle que soit la fréquence à laquelle vous utilisez Google Sheets, il y a de fortes chances que vous soyez confronté à des données dupliquées. Ces enregistrements peuvent apparaître dans une colonne ou occuper des lignes entières.
A la fin de cet article, vous saurez tout ce dont vous avez besoin pour supprimer les doublons, les compter, les mettre en évidence et les identifier par un statut. Je vais montrer quelques exemples de formules et partager différents outils. L'un d'entre eux trouve et supprime même les doublons dans vos Google Sheets en temps voulu ! Le formatage conditionnel sera également utile.
Choisissez votre poison et c'est parti :)
Comment trouver les doublons dans Google Sheets à l'aide de formules
Traditionnellement, je commence par les formules. Leur principal avantage est que votre tableau d'origine reste intact. Les formules identifient les doublons et renvoient le résultat à un autre endroit de vos Google Sheets. Et en fonction du résultat souhaité, différentes fonctions font l'affaire.
Comment supprimer les doublons dans Google Sheets à l'aide de la fonction UNIQUE
La fonction UNIQUE analyse vos données, supprime les doublons et renvoie exactement ce que son nom indique : des valeurs/rangs uniques.
Voici un petit échantillon de tableau où différentes lignes reviennent :
Exemple 1 : Suppression des lignes en double, maintien des premières occurrences.
D'une part, vous pouvez avoir besoin de supprimer toutes les lignes en double de ce tableau Google Sheets et ne conserver que les premières entrées.
Pour ce faire, il suffit d'entrer la plage de vos données dans UNIQUE :
=UNIQUE(A1:C10)
Cette petite formule renvoie toutes les lignes uniques et toutes les 1ères occurrences, en ignorant les 2èmes, 3èmes, etc.
Exemple 2 : Supprimez toutes les lignes en double, même les premières occurrences.
D'un autre côté, il se peut que vous ne souhaitiez obtenir que les "vraies" lignes uniques. Par "vraies", j'entends celles qui ne se répètent pas, pas même une fois. Que faites-vous alors ?
Prenons un moment et examinons tous les arguments UNIQUES :
UNIQUE(plage, [by_column], [exactly_once])- gamme - est la donnée que vous voulez traiter.
- [by_column] - indique si vous vérifiez si les lignes ou les cellules des colonnes individuelles correspondent complètement. Si c'est les colonnes, entrez VRAI. Si c'est les lignes, entrez FAUX ou ignorez l'argument.
- [exactement_une fois] - celui-ci indique à la fonction de supprimer non seulement les doublons dans Google Sheets, mais aussi leurs premières entrées. Ou, en d'autres termes, de ne renvoyer que les enregistrements ne contenant aucun doublon. Pour cela, vous mettez VRAI, sinon FAUX ou vous ignorez l'argument.
Ce dernier argument est votre levier ici.
Par conséquent, pour supprimer complètement toutes les lignes en double de vos Google Sheets (ainsi que leur premier argument), ne tenez pas compte du deuxième argument de la formule, mais ajoutez le troisième :
=UNIQUE(A1:C10,,TRUE)
Vous voyez que le tableau de droite est beaucoup plus court ? C'est parce que UNIQUE a trouvé et supprimé les lignes en double ainsi que leurs premières occurrences du tableau Google Sheets original. Il ne reste plus que les lignes uniques.
Identifier les doublons à l'aide de la fonction COUNTIF de Google Sheets
Si vous n'avez pas l'intention d'occuper de l'espace avec un autre ensemble de données, vous pouvez compter les doublons dans Google Sheets (puis les supprimer manuellement). Il suffit d'une colonne supplémentaire et la fonction COUNTIF vous aidera.
Conseil : si vous n'êtes pas familier avec cette fonction, nous avons un article de blog entier à son sujet, n'hésitez pas à y jeter un coup d'œil.
Exemple 1 : Obtenir le nombre total d'occurrences
Identifions tous les doublons avec leurs 1ères occurrences dans Google Sheets et vérifions le nombre total de chaque baie apparaissant dans la liste. Je vais utiliser la formule suivante en D2 et la copier ensuite dans la colonne :
=COUNTIF($B$2:$B$10,$B2)
Astuce : pour que cette formule traite automatiquement chaque ligne de la colonne, intégrez le tout dans ArrayFormula et modifiez $B2 à $B2:$B10 (Ainsi, vous n'aurez pas besoin de copier la formule vers le bas :
Si vous filtrez ensuite cet ensemble de données en fonction des chiffres, vous serez en mesure de voir et même de supprimer manuellement toutes les lignes en double en excès dans votre tableau Google Sheets :
Exemple 2 : Recherche et énumération de tous les doublons dans Google Sheets
Si le nombre total d'occurrences n'est pas votre objectif et que vous préférez savoir si cet enregistrement particulier dans cette ligne particulière est la 1ère, 2ème, etc. entrée, vous devrez faire un léger ajustement à la formule.
Changez la plage de la colonne entière ($B$2:$B$10) à une seule cellule ($B$2:$B2) .
Remarque : faites attention à l'utilisation des références absolues.
=COUNTIF($B$2:$B2,$B2)
Cette fois, la suppression de tous les doublons de ce tableau Google Sheets sera encore plus facile car vous pourrez masquer toutes les entrées sauf les premières :
Exemple 3 : Compter les lignes en double dans Google Sheets
Alors que les formules ci-dessus comptent les doublons dans une seule colonne de Google Sheets, vous pouvez avoir besoin d'une formule qui prenne en compte toutes les colonnes et identifie ainsi les lignes en double.
Dans ce cas, COUNTIFS convient mieux, il suffit de lister chaque colonne de votre tableau avec les critères correspondants :
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
Astuce : il existe une autre façon de calculer les doublons - sans formules - qui implique un tableau croisé dynamique et que je décris plus loin.
Marquer les doublons dans une colonne d'état - fonction IF
Parfois, les chiffres ne suffisent pas. Il est parfois préférable de trouver les doublons et de les marquer dans une colonne d'état. Encore une fois : en filtrant vos données Google Sheets par cette colonne ultérieurement, vous pourrez supprimer les doublons dont vous n'avez plus besoin.
Exemple 1 : Recherche de doublons dans une colonne Google Sheets
Pour cette tâche, vous aurez besoin de la même fonction COUNTIF mais cette fois-ci enveloppée dans la fonction IF. Comme ceci :
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate", "Unique")
Voyons ce qui se passe dans cette formule :
- Tout d'abord, le COUNTIF recherche la baie de B2 dans toute la colonne B. Une fois trouvée, il les additionne.
- Ensuite, IF vérifie ce total, et s'il est supérieur à 1, il dit Duplicate sinon, Unique en son genre .
Bien sûr, vous pouvez obtenir la formule pour renvoyer vos propres statuts, ou, par exemple, trouver & ; identifier uniquement les doublons dans vos données Google Sheets :
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate","")
Astuce : dès que vous trouvez ces doublons, vous pouvez filtrer le tableau par la colonne d'état. Cette méthode vous permet de masquer les enregistrements répétés ou uniques, et même de sélectionner des lignes entières & ; supprimer complètement ces doublons de vos Google Sheets :
Exemple 2 : Identifier les rangées dupliquées
De même, vous pouvez marquer les lignes de doublons absolus - des lignes où tous les enregistrements de toutes les colonnes apparaissent plusieurs fois dans le tableau :
- Commencez avec le même COUNTIFS que précédemment - celui qui scanne chaque colonne pour sa première valeur et ne compte que les lignes où les 3 enregistrements dans les 3 colonnes se répètent :
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
- Il vérifie le nombre de lignes répétées et s'il est supérieur à 1, la formule désigne la ligne comme un doublon :
=IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate","")
Il n'y a maintenant que 2 doublons car même si cherry apparaît 3 fois dans un tableau, seuls deux d'entre eux ont les 3 colonnes identiques.
Exemple 3 : Trouver les lignes dupliquées, ignorer les premières entrées.
Pour ignorer la 1ère occurrence et ne marquer que la 2ème et les autres, référez-vous aux premières cellules du tableau plutôt qu'aux colonnes entières :
=IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicate",")
Conseil : si vous utilisez Microsoft Excel, les exemples suivants peuvent vous être utiles : Comment trouver les doublons dans Excel.
Identifier et mettre en évidence les doublons dans Google Sheets à l'aide de règles de formatage conditionnel
Il est possible de traiter des données répétées de telle manière qu'un simple coup d'œil à votre tableau vous permette de savoir s'il s'agit d'un enregistrement double.
Je parle de mettre en évidence les doublons dans Google Sheets. La mise en forme conditionnelle vous aidera à le faire.
Conseil : vous n'avez jamais essayé le formatage conditionnel ? Pas d'inquiétude, nous vous expliquons comment il fonctionne dans cet article.
Voici ce que vous devez faire :
- Ouvrez les paramètres de mise en forme conditionnelle : Format> ; Mise en forme conditionnelle .
- Assurez-vous que le Appliquer à la gamme contient la plage dans laquelle vous souhaitez mettre en évidence les doublons. Pour cet exemple, je commencerai par la colonne B.
- Sur Règles de format choisir La formule personnalisée est et entrez le même COUNTIF que celui que j'ai présenté ci-dessus :
=COUNTIF($B$2:$B$10,$B2)>1
Une fois qu'il aura repéré les enregistrements qui apparaissent au moins deux fois dans la colonne B, ils seront colorés avec la teinte de votre choix :
Une autre option serait de mettre en évidence les lignes en double, en ajustant simplement la plage à laquelle appliquer la règle :
Conseil : une fois que vous avez mis en évidence les doublons dans vos Google Sheets, vous pouvez filtrer les données par couleur :
- D'une part, vous pouvez filtrer la colonne de manière à ce que seules les cellules dont la couleur de remplissage est le blanc restent visibles, ce qui vous permettra de supprimer les doublons de la vue :
- D'autre part, vous pouvez ne garder visibles que les cellules colorées :
puis sélectionnez ces lignes et supprimez complètement ces doublons de vos Google Sheets :
Conseil : consultez ce tutoriel pour découvrir d'autres formules permettant de mettre en évidence les doublons dans Google Sheets.
Des moyens sans formule pour trouver et supprimer les doublons dans Google Sheets
Les formules et le formatage conditionnel sont utiles, mais il existe d'autres outils qui vous aideront à trouver les doublons, dont deux ont été conçus pour ce problème particulier.
Identifier les doublons avec le tableau croisé dynamique pour Google Sheets
Le tableau croisé dynamique est utilisé dans les feuilles de calcul pour retourner vos données et rendre vos tableaux faciles à lire & ; comprendre. C'est en quelque sorte une manière alternative de présenter vos ensembles de données.
Ce qui est le plus intéressant ici, c'est que vos données d'origine ne changent pas. Le tableau croisé dynamique les utilise comme référence et fournit le résultat dans un onglet séparé.
Ce résultat, soit dit en passant, changera de façon dynamique en fonction des paramètres que vous pouvez modifier en cours de route.
Dans le cas d'enregistrements répétés, le tableau croisé dynamique vous aidera à compter et à supprimer les doublons dans Google Sheets.
Exemple 1 : Comment le tableau croisé dynamique compte les doublons dans Google Sheets.
- Aller à Insérer> ; Tableau croisé dynamique spécifiez votre plage de données et un emplacement pour le tableau croisé dynamique :
- Dans l'éditeur de tableaux croisés dynamiques, ajoutez une colonne avec vos doublons ( Nom dans mon exemple) pour Rangs et pour Valeurs .
Si votre colonne contient des enregistrements numériques, choisissez COUNT comme fonction de récapitulation pour Valeurs pour compter les doublons dans Google Sheets. Si vous avez du texte, sélectionnez COUNTA à la place :
Si vous faites tout correctement, le tableau croisé dynamique présentera chaque élément de votre liste et vous donnera le nombre de fois qu'il y apparaît :
Comme vous pouvez le voir, ce tableau croisé dynamique montre que seules la mûre et la cerise réapparaissent dans mon ensemble de données.
Exemple 2 : Suppression des doublons dans Google Sheets à l'aide d'un tableau croisé dynamique
Pour supprimer les doublons en utilisant le tableau croisé dynamique, vous devez ajouter le reste de vos colonnes (2 dans mon exemple) en tant que Rangs pour votre tableau croisé dynamique :
Vous verrez le tableau avec des lignes en double, mais les numéros vous diront lesquelles se retrouvent dans l'ensemble de données d'origine :
Conseil : si vous n'avez plus besoin des chiffres, fermez simplement la fenêtre Valeurs dans le tableau croisé dynamique en appuyant sur l'icône correspondante dans son coin supérieur droit :
Voici à quoi ressemblera votre tableau croisé dynamique au final :
Pas de doublons, pas de calculs supplémentaires, il n'y a que des enregistrements uniques triés dans une seule table.
Suppression des doublons - outil standard de nettoyage des données
Google Sheets dispose d'un petit outil simple et peu compliqué pour supprimer les doublons. Il porte le nom de son fonctionnement et se trouve sous l'onglet "Suppression des doublons". Data> ; Nettoyage des données onglet :
Il suffit de préciser si votre tableau a une ligne d'en-tête et de sélectionner toutes les colonnes qui doivent être vérifiées pour les doublons :
Une fois que vous êtes prêt, cliquez sur ce gros bouton vert et l'outil trouvera et supprimera les lignes en double de votre tableau Google Sheets et indiquera le nombre de lignes uniques restantes :
Hélas, cet outil ne va pas plus loin. Chaque fois que vous aurez besoin de traiter des doublons, vous devrez exécuter cet utilitaire manuellement. En outre, c'est tout ce qu'il fait : supprimer les doublons. Il n'y a pas d'option pour les traiter différemment.
Heureusement, tous ces inconvénients ont été résolus dans le module complémentaire Remove Duplicates pour Google Sheets d'Ablebits.
Module complémentaire de suppression des doublons pour Google Sheets
Le module complémentaire Supprimer les doublons est un véritable outil qui change la donne. Pour commencer, il contient 5 outils différents permettant d'identifier les doublons dans Google Sheets. Mais pour aujourd'hui, jetons un coup d'œil sur les éléments suivants Recherche de lignes dupliquées ou uniques .
À lui seul, il propose 7 façons différentes de traiter les doublons et il ne se contente pas d'accélérer l'ensemble du processus, il sait comment l'automatiser entièrement.
Une fois que vous l'aurez installé à partir de Google Workspace Marketplace, il apparaîtra sous l'onglet Extensions :
Comme l'outil standard de Google Sheets, il vous permet également de sélectionner la plage et les colonnes à traiter, mais de manière plus élégante :)
Tous les paramètres sont divisés en 4 étapes conviviales que vous devez sélectionner :
- la gamme
- ce qu'il faut trouver : dupes ou uniques
- les colonnes
- ce qu'il faut faire avec les documents trouvés
Vous pouvez même jeter un coup d'œil à des images spéciales pour savoir ce qu'il faut faire :
Et bien, contrairement à l'outil standard, ce module complémentaire offre beaucoup plus :
- trouver les doublons ainsi que uniques incluant ou excluant les 1ères occurrences
- mettre en évidence doublons dans Google Sheets
- ajouter une colonne d'état
- copier/déplacer les résultats vers une nouvelle feuille/feuille de calcul ou tout autre endroit spécifique de votre feuille de calcul
- clair trouvé valeurs à partir de cellules
- supprimer les rangs dupliqués de votre feuille Google complètement
Il suffit de choisir la méthode qui vous convient le mieux, de sélectionner les options et de laisser le module complémentaire faire le travail.
Cette vidéo est peut-être un peu ancienne, mais elle montre parfaitement à quel point il est facile de travailler avec cet add-on :
Faire en sorte que le module complémentaire supprime automatiquement les doublons
Cerise sur le gâteau, vous pourrez enregistrer tous les paramètres des 4 étapes dans des scénarios et les exécuter ultérieurement sur n'importe quelle table en un seul clic.
Ou, mieux encore, programmez ces scénarios pour qu'ils démarrent automatiquement à une certaine heure chaque jour :
Votre présence n'est pas nécessaire, et l'extension supprimera automatiquement les doublons même si le fichier est fermé ou si vous êtes hors ligne. Pour en savoir plus, consultez ce tutoriel détaillé et regardez cette vidéo de démonstration :
Je vous encourage à installer le module complémentaire à partir de la boutique Google Sheets et à vous y promener. Vous verrez à quel point il est facile de trouver, de supprimer et de mettre en évidence les doublons sans formules en quelques clics seulement.
Feuille de calcul avec exemples de formules
Rechercher et supprimer les doublons dans Google Sheets - exemples de formules (faites une copie de la feuille de calcul)