Sammenlign to kolonner og fjern dubletter i Excel

  • Del Dette
Michael Brown

Det vil tage dig ca. 10 minutter at læse denne artikel, og i løbet af de næste 5 minutter (eller endnu hurtigere, hvis du vælger den anden løsning, der er beskrevet i artiklen) vil du nemt kunne sammenligne to Excel-kolonner for dubletter og fjerne eller fremhæve de fundne dubletter. Okay, nedtællingen er begyndt!

Excel er et meget kraftfuldt og virkelig fedt program til at oprette og behandle store datamængder. Nu hvor du har mange arbejdsmapper med en pulje af data, eller måske bare én stor tabel, vil du måske sammenligne 2 kolonner for dubletter og derefter gøre noget med de fundne poster, f.eks. slette dubletter i rækker, farve dubletter eller slette indholdet af dubletterede celler. Disse to kolonner kan værevære placeret i én tabel, sammenhængende eller ikke sammenhængende, eller de kan være placeret i to forskellige regneark eller endda arbejdsmapper.

Lad os sige, at du har 2 kolonner med personnavne - 5 navne i kolonne A og 3 navne i kolonne B, og du ønsker at sammenligne data mellem disse to kolonner for at finde dubletter. Som du forstår, er dette falske data blot for et hurtigt eksempel; i rigtige regneark har du normalt tusindvis og titusindvis af poster.

Variant A : Begge kolonner er placeret på ét ark i en enkelt tabel: Kolonne A og Kolonne B

Variant B : To kolonner er placeret på forskellige ark: Kolonne A i ark2 og Kolonne A i ark3

Det indbyggede værktøj til fjernelse af dubletter i Excel 2016, Excel 2013 og 2010 kan ikke håndtere dette scenario, da det ikke kan sammenligne data mellem 2 kolonner. Desuden kan det kun fjerne dubletter, og der er desværre ikke andre muligheder såsom fremhævning eller farvning :-(.

I det følgende vil jeg beskrive 2 mulige måder at sammenligne to Excel-kolonner på, så du kan finde og fjerne dobbelte poster:

    Sammenlign 2 kolonner for at finde dubletter ved hjælp af Excel-formler

    Variant A: begge kolonner er på den samme liste

    1. I den første tomme celle, i vores eksempel er det celle C1, skal du skrive følgende formel:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unik", "Duplikat")

      I vores formel, A1 er den første celle i den første kolonne, som vi ønsker at bruge til sammenligning. $B$1 og $B$10000 er adresserne for den første og den sidste celle i den anden kolonne, som du vil sammenligne med.Vær opmærksom på den absolutte cellehenvisning - dollartegn ($) foran kolonne- og rækketallene. Jeg bruger den absolutte henvisning med vilje, så celleadresserne forbliver uændrede, når jeg kopierer formlen.

      Hvis du vil finde dubletter i kolonne B, skal du bytte om på kolonnenavnene, så formlen ser således ud:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unik", "Duplikat")

      I stedet for " Unik "/" Duplikat " kan du skrive dine egne etiketter, f.eks. " Ikke fundet "/" Fundet ", eller kun efterlade " Duplikat "I sidstnævnte tilfælde vil du få tomme celler ved siden af de celler, hvor der ikke er fundet dubletter, og jeg mener, at en sådan præsentation er mere praktisk til dataanalyse.

    2. Lad os nu kopiere formlen til alle cellerne i kolonne C , op til den sidste række, der indeholder data i kolonne A. For at gøre dette skal du placere markøren i det nederste højre hjørne af celle C1 , og markøren ændres til et sort kryds, som vist på billedet nedenfor:

      Klik på venstre museknap og hold den nede, og træk grænsen nedad for at vælge alle de celler, hvor du vil kopiere formlen. Når alle de nødvendige celler er valgt, slipper du venstre museknap:

      Tip: I store tabeller er det hurtigere at kopiere formlen ved hjælp af genveje. Klik på celle C1 for at markere den og tryk på Ctrl + C (for at kopiere formlen til udklipsholderen), tryk derefter på Ctrl + Shift + End (for at markere alle ikke-tomme celler i kolonne C), og tryk til sidst på Ctrl + V (for at indsætte formlen i alle de markerede celler).

    3. Alle duplikerede celler markeres som "Duplikat":

    Variant B: to kolonner er på forskellige regneark (arbejdsbøger)

    1. Skriv formlen i den første celle i den første tomme kolonne i ark2 (kolonne B i vores tilfælde):

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),""", "Duplikat")

      Hvor Ark3 er navnet på det ark, hvor den anden kolonne er placeret, og $A$1:$A$10000 er adresserne for den første og sidste celle i den anden kolonne.

    2. Svarende til variant A.
    3. Vi har følgende resultat:

    Klik for at downloade regnearket med ovenstående eksempler og formlen til at sammenligne 2 kolonner for at finde dubletter.

    Arbejde med fundne dubletter

    Perfekt, vi har fundet de poster i den første kolonne (kolonne A), som også findes i den anden kolonne (kolonne B). Nu skal vi gøre noget med dem :)

    Det ville være temmelig ineffektivt og ville tage for lang tid at gennemgå hele tabellen og gennemgå de dobbelte poster manuelt. Der findes langt bedre metoder.

    Vis kun duplikerede rækker i kolonne A

    Hvis dine kolonner ikke har overskrifter, skal du tilføje dem. For at gøre dette skal du sætte markøren på det tal, der angiver den første række, og det vil ændre sig til et sort pil som vist i skærmbilledet:

    Højreklik på den valgte række, og vælg " Indsæt " fra kontekstmenuen:

    Giv navne til dine kolonner, f.eks. " Navn " og " Duplikat? ". Derefter skifter du til den Data og klik på Filter :

    Klik derefter på en lille grå pil ud for " Duplikat? " for at åbne en rulleliste, fjern markeringen af alle andre elementer end Duplikat på listen, og klik på OK :

    Det var det, nu ser du kun de celler i kolonne A, der har dublerede værdier i kolonne B. Der er kun tre sådanne celler i vores testark, men som du forstår, er der sandsynligvis langt flere i rigtige ark:

    For at få vist alle rækker i kolonne A igen, skal du klikke på filtersymbolet i kolonne B, der nu ligner en tragt med en lille pil og marker "Vælg alle". Alternativt kan du gøre det samme via fanen Data -> Vælg & Filter -> Klar , som vist i skærmbilledet:

    Farve eller fremhæve fundne dubletter

    Hvis " Duplikat " ikke er tilstrækkeligt til dine formål, og du ønsker at markere dublerede celler ved hjælp af skrifttypefarve eller fyldfarve eller på anden måde...

    Filtrer derefter dubletterne som forklaret ovenfor, vælg alle de filtrerede celler og tryk på Ctrl + F1 for at åbne Formater celler Som eksempel kan vi ændre baggrundsfarven for duplikerede rækker til lysegul. Du kan naturligvis ændre baggrundsfarven for celler ved hjælp af Fyld farve Hjem fanen, men fordelen ved dialogboksen Formatér celler er, at du kan foretage alle formateringsændringer på én gang:

    Nu vil du helt sikkert ikke gå glip af en eneste duplikeret celle:

    Fjern dubletter fra den første kolonne

    Filtrer din tabel, så kun celler med duplikerede værdier vises, og vælg alle disse celler.

    Hvis de 2 kolonner, du sammenligner, er placeret på forskellige regneark , dvs. i separate tabeller, skal du højreklikke på det valgte område og vælge " Slet række " fra kontekstmenuen:

    Klik på OK når Excel beder dig om at bekræfte, at du virkelig ønsker at "Slet hele arkrækken", og derefter rydder du filteret. Som du kan se, er kun de rækker med unikke værdier tilbage:

    Hvis 2 kolonner er placeret på ét regneark , ved siden af hinanden (tilstødende) eller ikke rører hinanden (ikke tilstødende), er det lidt mere kompliceret at fjerne dubletter. Vi kan ikke slette hele rækker, der indeholder dubletter, fordi det også ville slette de tilsvarende celler i kolonne 2. Så for kun at efterlade unikke poster i kolonne A, gør du følgende:

    1. Filtrer tabellen, så kun duplikerede celler vises, og vælg alle disse celler. Højreklik på markeringen, og vælg " Ryd indhold ":
    2. Ryd filteret.
    3. Vælg alle celler i kolonne A fra celle A1 og frem til den sidste celle, der indeholder data.
    4. Gå til Data og klik på Sortere fra A til Z I det dialogvindue, der åbnes, skal du vælge " Fortsæt med det aktuelle valg ", og klik på Sortere :
    5. Slet kolonnen med formlen, da du ikke længere har brug for den, kun "Uniques" er der nu tilbage.
    6. Det er det hele, nu indeholder kolonne A kun unikke data, som ikke findes i kolonne B :

    Som du kan se, er det ikke så svært at fjerne dubletter mellem to Excel-kolonner ved hjælp af formler. Selvom det er en meget tidskrævende og kedelig proces at skrive og kopiere formlen, anvende og rydde filteret hver gang du skal sammenligne 2 kolonner i dine regneark. Den anden løsning, som jeg vil gøre dig opmærksom på, er meget mere enkel og vil kun tage en brøkdel af den tid, vi har brugt på denJeg tror, at du vil finde mere behagelige ting at bruge den sparede tid på ;)

    Sammenlign 2 Excel-kolonner for dubletter ved hjælp af en visuel guide

    Lad mig nu vise dig, hvordan du kan sammenligne to kolonner for dubletter ved hjælp af vores Dedupe-værktøjer til Excel.

    1. Åbn det regneark (eller de regneark), hvor de kolonner, du vil sammenligne, er placeret.
    2. Vælg en vilkårlig celle i den 1. kolonne, skift til den Ablebits Data og klik på fanen Sammenlign tabeller knap:
    3. trin 1 af guiden, vil du se, at din første kolonne allerede er valgt, så du skal blot klikke på Næste .

      Bemærk: Hvis du ikke blot vil sammenligne 2 kolonner, men 2 tabeller, skal du vælge hele den første tabel i dette trin.

    4. trin 2 i guiden skal du vælge den 2. kolonne, som du vil sammenligne med. Vi vælger Ark2 i samme arbejdsbog. I de fleste tilfælde vælger smart-guiden den 2. kolonne automatisk, men hvis dette af en eller anden grund ikke sker, skal du vælge målkolonnen med musen. Hvis du sammenligner hele tabeller, skal du vælge hele den 2. tabel.
    5. Vælg at finde Dobbelte værdier :
    6. Vælg det kolonnepar, du vil sammenligne:

      Tip. Hvis du sammenligner tabeller, kan du vælge flere kolonnepar til sammenligning, f.eks. for- og efternavn. Du kan finde flere oplysninger i Sådan fjerner du dubletter fra to Excel-regneark.

    7. Og endelig skal du beslutte, hvad du vil gøre med de fundne dubletter. Du kan vælge at slette de dubletter, flytte eller kopiere dem til et andet regneark, tilføje en statuskolonne (resultatet vil ligne vores første løsning med Excel-formler), fremhæve dubletter eller bare vælge alle celler med dubletter:

      Tip. Vælg ikke at slette dubletter, især ikke hvis du bruger værktøjet for første gang. Vælg i stedet at flytte dubler til et andet regneark Dette vil fjerne dubletter fra den første tabel, men giver dig mulighed for at gennemgå listen over de poster, der er anerkendt som dubletter. Når du sammenligner ved hjælp af flere matchende kolonner i store tabeller, kan det ske, at du ved et uheld glemmer at vælge en nøglekolonne med unikke data, og ved at flytte dubletter forhindrer du et uopretteligt tab af data.

    8. Klik på Færdig og nyd resultatet. Nu har vi en fin, ren tabel uden dubletter:

    Husk den tidligere løsning, og mærk forskellen :) Det er hurtigt og nemt at afpudse dine regneark med Sammenligne to tabeller Det vil faktisk tage mindre tid, end du har brugt på at læse denne artikel.

    I øjeblikket, Sammenlign tabeller er en del af vores Ultimate Suite for Excel, en samling af 70+ professionelle værktøjer, der dækker over 300 anvendelsesområder. Uret tikker, så skynd dig at downloade den nu!

    Hvis du har spørgsmål, eller hvis noget er uklart, så skriv en kommentar, og jeg vil med glæde uddybe det nærmere. Tak for at du læste med!

    Michael Brown er en dedikeret teknologientusiast med en passion for at forenkle komplekse processer ved hjælp af softwareværktøjer. Med mere end ti års erfaring i teknologibranchen har han finpudset sine færdigheder i Microsoft Excel og Outlook samt Google Sheets og Docs. Michaels blog er dedikeret til at dele sin viden og ekspertise med andre og giver nemme at følge tips og vejledninger til at forbedre produktiviteten og effektiviteten. Uanset om du er en erfaren professionel eller nybegynder, tilbyder Michaels blog værdifuld indsigt og praktiske råd til at få mest muligt ud af disse vigtige softwareværktøjer.