Twee kolommen vergelijken en doublures verwijderen in Excel

  • Deel Dit
Michael Brown

Het kost u ongeveer 10 minuten om dit artikel te lezen en in de volgende 5 minuten (of nog sneller als u de 2e oplossing kiest die in het artikel wordt beschreven) kunt u gemakkelijk twee Excel-kolommen vergelijken op doublures en de gevonden doublures verwijderen of markeren. Oké, het aftellen is begonnen!

Excel is een zeer krachtige en echt coole toepassing voor het maken en verwerken van grote reeksen gegevens. Nu u veel werkmappen hebt met een pool van gegevens, of misschien slechts één grote tabel, wilt u misschien 2 kolommen vergelijken op doublures en vervolgens iets doen met gevonden items, bijvoorbeeld dubbele rijen verwijderen, doublures kleuren of de inhoud van dubbele cellen wissen. Deze twee kolommen kunnen zijnin één tabel, al dan niet aaneengesloten, of ze kunnen in twee verschillende werkbladen of zelfs werkmappen staan.

Stel, je hebt 2 kolommen met namen van mensen - 5 namen in kolom A en 3 namen in kolom B, en je wilt gegevens tussen deze twee kolommen vergelijken om duplicaten te vinden. Zoals je begrijpt, zijn dit nepgegevens voor een snel voorbeeld; in echte werkbladen heb je meestal duizenden en tienduizenden ingangen.

Variant A Beide kolommen staan op één blad, in één tabel: Kolom A en Kolom B

Variant B : Twee kolommen staan op verschillende bladen: Kolom A in blad2 en Kolom A in blad3

De ingebouwde tool Duplicaten verwijderen die beschikbaar is in Excel 2016, Excel 2013 en 2010 kan dit scenario niet aan omdat het geen gegevens tussen 2 kolommen kan vergelijken. Bovendien kan het alleen doublures verwijderen, geen andere keuze zoals markeren of kleuren is beschikbaar, helaas :-(.

Verderop ga ik 2 mogelijke manieren beschrijven om twee Excel-kolommen te vergelijken waarmee u dubbele vermeldingen kunt vinden en verwijderen:

    Vergelijk 2 kolommen om duplicaten te vinden met behulp van Excel-formules

    Variant A: beide kolommen staan op dezelfde lijst

    1. In de eerste lege cel, in ons voorbeeld is dat cel C1, schrijft u de volgende formule:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),"Unique","Duplicate")

      In onze formule, A1 is de eerste cel van de eerste kolom die we voor de vergelijking willen gebruiken. $B$1 en $B$10000 zijn de adressen van de eerste en de laatste cel van de tweede kolom waarmee u wilt vergelijken.Let op de absolute celverwijzing - dollartekens ($) vóór de kolomletters en rijnummers. Ik gebruik de absolute verwijzing met opzet, zodat de celadressen ongewijzigd blijven bij het kopiëren van de formule.

      Als u doublures wilt vinden in kolom B, verwisselt u de kolomnamen zodat de formule er zo uitziet:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),"Unique","Duplicate")

      In plaats van " Uniek "/" Dubbele " kunt u uw eigen labels schrijven, bijv. Niet gevonden. "/" Gevonden ", of laat alleen " Dubbele " en typ "" in plaats van "Uniek". In het laatste geval krijgt u lege cellen naast de cellen waarvoor geen duplicaten zijn gevonden, ik denk dat een dergelijke presentatie handiger is voor de gegevensanalyse.

    2. Laten we nu de formule kopiëren naar alle cellen van kolom C tot aan de laatste rij die gegevens bevat in kolom A. Plaats daartoe de cursor in de rechterbenedenhoek van cel C1 en de cursor verandert in een zwart kruis, zoals in de onderstaande afbeelding:

      Klik op de linkermuisknop en houd deze ingedrukt om de rand naar beneden te slepen en zo alle cellen te selecteren waar u de formule wilt kopiëren. Wanneer alle benodigde cellen zijn geselecteerd, laat u de linkermuisknop los:

      Tip: In grote tabellen is het sneller om de formule te kopiëren met behulp van sneltoetsen. Klik op cel C1 om het te selecteren en druk op Ctrl + C (om de formule naar het klembord te kopiëren), druk dan op Ctrl + Shift + End (om alle niet-lege cellen in kolom C te selecteren), en druk tenslotte op Ctrl + V (om de formule in alle geselecteerde cellen te plakken).

    3. Geweldig, alle gedupliceerde cellen worden gemarkeerd als "Duplicaat":

    Variant B: twee kolommen staan op verschillende werkbladen (werkmappen)

    1. Schrijf de formule in de 1e cel van de 1e lege kolom in Blad2 (kolom B in ons geval):

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"","Duplicate")

      Waar Blad3 is de naam van het blad waarop de 2e kolom staat, en $A$1:$A$10000 zijn de adressen van de eerste en de laatste cel van die 2e kolom.

    2. Lijkt op variant A.
    3. We hebben het volgende resultaat:

    Klik om het werkblad met de bovenstaande voorbeelden en de formule om 2 kolommen te vergelijken om duplicaten te vinden, te downloaden.

    Werken met gevonden duplicaten

    Perfect, we hebben de items in de eerste kolom (kolom A) gevonden die ook bestaan in de tweede kolom (kolom B). Nu moeten we er iets mee doen :)

    Het zou nogal inefficiënt zijn en te veel tijd kosten om de hele tabel door te nemen en de dubbele vermeldingen handmatig te bekijken. Er zijn veel betere manieren.

    Toon alleen dubbele rijen in kolom A

    Als uw kolommen geen koppen hebben, moet u die toevoegen. Zet daarvoor de cursor op het getal dat de 1e rij aangeeft en het zal veranderen in een zwarte pijl zoals in de schermafbeelding:

    Klik met de rechter muisknop op de geselecteerde rij en kies " Plaats " uit het contextmenu:

    Geef uw kolommen namen, bijv. Naam " en " Duplicaat? "schakel dan over naar de Gegevens tabblad en klik op Filter :

    Klik daarna op een kleine grijze pijl naast " Duplicaat? " om een keuzelijst te openen, vink alle items behalve Duplicaat in die lijst uit, en klik op OK :

    Dat is het, nu zie je alleen die cellen van kolom A die dubbele waarden hebben in kolom B. Er zijn slechts drie van zulke cellen in ons testwerkblad, zoals je begrijpt zijn er in echte bladen waarschijnlijk meer, veel meer:

    Om alle rijen van kolom A weer te geven, klikt u op het filtersymbool in kolom B dat er nu uitziet als een trechter met een klein pijltje en vink "Alles selecteren" aan. U kunt ook hetzelfde doen via Tabblad gegevens -> Selecteer & Filter -> Duidelijk zoals in de schermafbeelding:

    Kleur of markeer gevonden duplicaten

    Als de " Dubbele " vlag niet volstaat voor uw doeleinden en u gedupliceerde cellen wilt markeren door middel van letterkleur of vulkleur of op een andere manier...

    Filter dan de duplicaten zoals hierboven uitgelegd, selecteer alle gefilterde cellen en druk op Ctrl + F1 om de Cellen opmaken Laten we als voorbeeld de achtergrondkleur van gedupliceerde rijen veranderen in helder geel. Natuurlijk kunt u de achtergrondkleur van cellen veranderen met de Vulkleur optie op de Home tabblad, maar het voordeel van het dialoogvenster Cellen opmaken is dat je alle opmaakwijzigingen in één keer kunt maken:

    Nu zul je zeker geen enkele dubbele cel missen:

    Verwijder duplicaten uit de eerste kolom

    Filter je tabel zodat alleen cellen met dubbele waarden verschijnen, en selecteer al die cellen.

    Als 2 kolommen die u vergelijkt zich op verschillende werkbladen bevinden , d.w.z. in afzonderlijke tabellen, klik met de rechtermuisknop op het geselecteerde bereik en kies " Rij verwijderen " uit het contextmenu:

    Klik op OK wanneer Excel u vraagt te bevestigen dat u werkelijk "Gehele bladrij verwijderen" wilt en vervolgens het filter wist. Zoals u ziet, blijven alleen de rijen met unieke waarden over:

    Als 2 kolommen op één werkblad staan naast elkaar liggen (adjacent) of elkaar niet raken (nonadjacent), is het verwijderen van duplicaten een beetje ingewikkelder. We kunnen niet hele rijen verwijderen die dubbele waarden bevatten, omdat dit ook corresponderende cellen in de 2e kolom zou verwijderen. Dus, om alleen unieke vermeldingen in kolom A over te houden, doe je het volgende:

    1. Filter de tabel zodat alleen gedupliceerde cellen worden weergegeven en selecteer al die cellen. Klik met de rechtermuisknop op de selectie en kies " Duidelijke inhoud ":
    2. Wis het filter.
    3. Selecteer alle cellen in kolom A vanaf cel A1 tot de laatste cel die gegevens bevat.
    4. Ga naar de Gegevens tabblad en klik op Sorteer A tot Z In het dialoogvenster dat wordt geopend, kiest u " Doorgaan met de huidige selectie " en klik op Sorteer :
    5. Verwijder de kolom met de formule omdat je die niet meer nodig hebt, alleen "Uniques" staan er nu nog.
    6. Dat is alles, nu bevat kolom A alleen unieke gegevens die niet bestaan in kolom B :

    Zoals u ziet, is het niet zo moeilijk om doublures tussen twee Excel-kolommen te verwijderen met behulp van formules. Hoewel het erg tijdrovend en saai is om de formule te schrijven en te kopiëren, het filter toe te passen en te wissen elke keer dat u twee kolommen in uw werkbladen moet vergelijken. De andere oplossing die ik onder uw aandacht ga brengen is veel eenvoudiger en kost slechts een fractie van de tijd die we hebben besteed aan deeerste methode. Ik denk dat je leukere dingen zult vinden om de bespaarde tijd aan te besteden ;)

    Vergelijk 2 Excel kolommen op duplicaten met behulp van een visuele wizard

    En nu laat ik u zien hoe u twee kolommen kunt vergelijken op duplicaten met behulp van onze Dedupe tools voor Excel.

    1. Open het werkblad (of de werkbladen) waarin de kolommen staan die u wilt vergelijken.
    2. Selecteer een willekeurige cel in de 1e kolom, schakel over naar de Ablebits gegevens tabblad en klik op de Tabellen vergelijken knop:
    3. Op stap 1 van de wizard zult u zien dat uw eerste kolom al geselecteerd is, dus klik gewoon op Volgende .

      Opmerking. Als u niet slechts 2 kolommen, maar 2 tabellen wilt vergelijken, moet u in deze stap de hele eerste tabel selecteren.

    4. Op stap 2 van de wizard selecteert u de 2e kolom waarmee u wilt vergelijken. Wij kiezen voor Sheet2 in dezelfde werkmap. In de meeste gevallen selecteert de slimme wizard automatisch de 2e kolom, als dit om een of andere reden niet gebeurt, selecteer dan de doelkolom met de muis. Als u hele tabellen vergelijkt, selecteer dan de hele 2e tabel.
    5. Kies om te vinden Dubbele waarden :
    6. Kies het paar kolommen dat u wilt vergelijken:

      Tip. Als u tabellen vergelijkt, kunt u verschillende kolomparen kiezen om te vergelijken, bijvoorbeeld voor- en achternaam. Zie voor meer details Hoe verwijder ik duplicaten uit twee Excel-spreadsheets?

    7. En tenslotte moet u beslissen wat u met de gevonden doublures wilt doen. U kunt ervoor kiezen de doublures te verwijderen, ze te verplaatsen of te kopiëren naar een ander werkblad, een statuskolom toe te voegen (het resultaat zal vergelijkbaar zijn met onze eerste oplossing met Excel-formules), doublures te markeren, of gewoon alle cellen met dubbele waarden te selecteren:

      Tip: kies niet voor het verwijderen van duplicaten, zeker niet als u de tool voor het eerst gebruikt. Kies in plaats daarvan voor dupes verplaatsen naar een ander werkblad Dit zal duplicaten uit de eerste tabel verwijderen, maar geeft u een kans om de lijst met entries die als duplicaten zijn herkend te herzien. Bij het vergelijken op meerdere overeenkomende kolommen in grote tabellen kan het gebeuren dat u per ongeluk vergeten bent een sleutelkolom met unieke gegevens te selecteren, en het verplaatsen van duplicaten voorkomt een onherstelbaar verlies van gegevens.

    8. Klik op Afwerking en geniet van het resultaat. Wat we nu hebben is een mooie, schone tabel zonder duplicaten:

    Denk aan de vorige oplossing en voel het verschil :) Het is inderdaad snel en gemakkelijk om uw werkbladen te ontdubbelen met Twee tabellen vergelijken In feite kost het u minder tijd dan het lezen van dit artikel.

    Op dit moment, Tabellen vergelijken maakt deel uit van onze Ultimate Suite for Excel, een verzameling van 70+ professionele tools die meer dan 300 use cases dekken. De klok tikt door, dus haast je en download het nu!

    Als je vragen hebt of als er iets onduidelijk is, stuur me dan een reactie en ik werk graag verder uit. Bedankt voor het lezen!

    Michael Brown is een toegewijde technologieliefhebber met een passie voor het vereenvoudigen van complexe processen met behulp van softwaretools. Met meer dan tien jaar ervaring in de technische industrie heeft hij zijn vaardigheden in Microsoft Excel en Outlook, evenals Google Spreadsheets en Documenten aangescherpt. Michael's blog is gewijd aan het delen van zijn kennis en expertise met anderen, met eenvoudig te volgen tips en tutorials voor het verbeteren van de productiviteit en efficiëntie. Of je nu een doorgewinterde professional of een beginner bent, Michaels blog biedt waardevolle inzichten en praktisch advies om het meeste uit deze essentiële softwaretools te halen.