Sammenlign to kolonner og fjern duplikater i Excel

  • Dele Denne
Michael Brown

Det vil ta deg omtrent 10 minutter å lese denne artikkelen, og i løpet av de neste 5 minuttene (eller enda raskere hvis du velger den andre løsningen beskrevet i artikkelen) vil du enkelt sammenligne to Excel-kolonner for duplikater og fjerne eller fremheve duper som ble funnet. Ok, nedtellingen er i gang!

Excel er en veldig kraftig og veldig kul applikasjon for å lage og behandle store arrays av data. Nå som du har mange arbeidsbøker med en samling av data, eller kanskje bare én stor tabell, kan det være lurt å sammenligne 2 kolonner for duplikater og deretter gjøre noe med funnet oppføringer, for eksempel slette dupliserte rader, fargeduper eller slette innholdet i dupliserte celler. Disse to kolonnene kan være plassert i én tabell, sammenhengende eller ikke-sammenhengende, eller de kan ligge i 2 forskjellige regneark eller til og med arbeidsbøker.

Si at du har 2 kolonner med personnavn - 5 navn i kolonne A og 3 navn i kolonne B, og du ønsker å sammenligne data mellom disse to kolonnene for å finne duplikater. Som du forstår, er dette falske data bare for et raskt eksempel; i ekte regneark har du vanligvis tusenvis og titusenvis av oppføringer.

Variant A : Begge kolonnene er plassert på ett ark, i en enkelt tabell: Kolonne A og Kolonne B

Variant B : To kolonner er plassert på forskjellige ark: Kolonne A i Ark2 og Kolonne A i Ark3

Den innebygde Remove Duplicateverktøyet tilgjengelig i Excel 2016, Excel 2013 og 2010 kan ikke håndtere dette scenariet fordi det ikke kan sammenligne data mellom 2 kolonner. Videre kan den bare fjerne duper, ingen andre valg som utheving eller fargelegging er tilgjengelig, dessverre :-(.

Videre kommer jeg til å beskrive 2 mulige måter å sammenligne to Excel-kolonner på som lar deg finne og fjern dupliserte oppføringer:

Sammenlign 2 kolonner for å finne duplikater ved hjelp av Excel-formler

Variant A: begge kolonnene er på samme liste

  1. I den første tomme cellen, i vårt eksempel er dette celle C1, skriv følgende formel:

    =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),"Unique","Duplicate")

    I formelen vår er A1 den første cellen i den første kolonnen som vi ønsker å bruke for sammenligning $B$1 og $B$10000 er adressene til den første og den siste cellen i den andre kolonnen som du vil sammenligne med. Vær oppmerksom på den absolutte cellereferansen - dollartegn ($) foran kolonnebokstavene og radtall. Jeg bruker den absolutte referansen med vilje, for at celleadressene skal forbli uendret når du kopierer formelen.

    Hvis du vil finn duper i kolonne B, bytt kolonne navn slik at formelen ser slik ut:

    =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),"Unique","Duplicate")

    I stedet for " Unik "/" Duplicate " kan du skrive dine egne etiketter, f.eks. " Ikke funnet "/" Funnet ", eller la bare " Duplikat " og skriv "" i stedet for "Unik". I sistnevnte tilfelle vil du hatomme celler ved siden av celler som duplikater ikke ble funnet for, tror jeg en slik presentasjon er mer praktisk for dataanalyse.

  2. La oss nå kopiere formelen til alle cellene i kolonne C , opp til den siste raden som inneholder data i kolonne A. For å gjøre dette, sett markøren til det nedre høyre hjørnet av celle C1 , og markøren vil endres til et svart kryss, som vist på bildet nedenfor:

    Klikk venstre museknapp og hold den nede og dra rammen nedover velge alle cellene der du vil kopiere formelen. Når alle nødvendige celler er valgt, slipper du venstre museknapp:

    Tips: I store tabeller er det raskere å kopiere formelen ved hjelp av snarveier. Klikk på celle C1 for å velge den og trykk Ctrl + C (for å kopiere formelen til utklippstavlen), trykk deretter Ctrl + Shift + End (for å velge alle ikke-tomme celler i kolonne C), og trykk til slutt Ctrl + V (for å lime inn formelen i alle valgte celler).

  3. Fantastisk, alle dupliserte celler er flagget som "Duplikat":

Variant B: to kolonner er på forskjellige regneark (arbeidsbøker)

  1. I den første cellen i den første tomme kolonnen i Ark2 (kolonne B i vårt tilfelle), skriv formelen:

    =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"","Duplicate")

    Hvor Ark3 er navnet på arket der den andre kolonnen er plassert, og $A$1:$A$10000 er adressene til den første og siste cellen til den andre kolonnen.

  2. Lignende variant A.
  3. Vihar følgende resultat:

Klikk for å laste ned regnearket med eksemplene ovenfor og formelen for å sammenligne 2 kolonner for å finne duplikater.

Arbeid med funnet duplikater

Perfekt, vi har funnet oppføringene i den første kolonnen (kolonne A) som også finnes i den andre kolonnen (kolonne B). Nå må vi gjøre noe med dem :)

Det ville være ganske ineffektivt og ville ta for mye tid å se gjennom hele tabellen og gjennomgå de dupliserte oppføringene manuelt. Det finnes mye bedre måter.

Vis bare dupliserte rader i kolonne A

Hvis kolonnene dine ikke har overskrifter, må du legge dem til. For å gjøre dette, sett markøren på tallet som indikerer den første raden, og den vil endres til en svart pil som vist på skjermbildet:

Høyreklikk på den valgte raden og velg " Sett inn " fra kontekstmenyen:

Gi navn til kolonnene dine, f.eks. " Navn " og " Dupliser? ". Bytt deretter til kategorien Data og klikk Filter :

Klikk deretter på en liten grå pil ved siden av " Dupliser? " for å åpne en rullegardinlisten, fjern merket for alle andre elementer enn Dupliser i den listen, og klikk OK :

Det er det, nå ser du bare de cellene i kolonne A som har dupliserte verdier i kolonne B. Det er bare tre slike celler i testarbeidsarket vårt, som du forstår i ekte ark vil det sannsynligvis være flere, langt flere av dem:

IFor å vise alle radene i kolonne A igjen, klikk på filtersymbolet i kolonne B som nå ser ut som en trakt med en liten pil og merk av for "Velg alle". Alternativt kan du gjøre det samme via Data-fanen -> Velg & Filter -> Tøm , som vist på skjermbildet:

Farge eller markering funnet duplikater

Hvis flagget Dupliser er ikke tilstrekkelig for dine formål, og du vil merke dupliserte celler etter skriftfarge eller fyllfarge eller på annen måte...

Siltre deretter duplikatene som forklart ovenfor, velg alle filtrerte celler og trykk Ctrl + F1 for å åpne dialogboksen Formater celler . Som et eksempel, la oss endre bakgrunnsfargen på dupliserte rader til knallgul. Selvfølgelig kan du endre bakgrunnsfargen til celler ved å bruke Fyllfarge -alternativet på Hjem -fanen, men fordelen med dialogboksen Formater celler er at den lar deg gjøre all formatering endringer om gangen:

Nå vil du definitivt ikke gå glipp av en enkelt duplisert celle:

Fjern duplikater fra den første kolonnen

Filtrer tabellen slik at bare celler med dupliserte verdier vises, og velg alle disse cellene.

Hvis 2 kolonner du sammenligner er plassert på forskjellige regneark , dvs. i separate tabeller, høyreklikker du det valgte området og velger " Slett rad " fra hurtigmenyen:

Klikk OK når Excel vil be deg om å bekrefteat du virkelig vil "Slette hele arkraden" og deretter tømme filteret. Som du kan se, er bare radene med unike verdier igjen:

Hvis 2 kolonner er plassert på ett regneark , ved siden av hverandre (tilstøtende) eller ikke berører hverandre (ikke tilstøtende) , fjerning av duplikater er litt mer komplisert. Vi kan ikke slette hele rader som inneholder dupliserte verdier fordi dette også vil slette tilsvarende celler i den andre kolonnen. Så for å la bare være unike oppføringer i kolonne A, gjør du følgende:

  1. Filtrer tabellen slik at bare dupliserte celler vises og velg alle disse cellene. Høyreklikk på utvalget og velg " Slett innhold ":
  2. Tøm filteret.
  3. Velg alle cellene i kolonne A fra celle A1 til den siste celle som inneholder data.
  4. Gå til kategorien Data og klikk Sorter A til Å . I dialogvinduet som åpnes velger du " Fortsett med gjeldende valg " og klikker Sorter :
  5. Slett kolonnen som inneholder formelen fordi du ikke trenger det lenger, bare "Unik" er igjen der nå.
  6. Det er alt, nå inneholder kolonne A bare unike data som ikke finnes i kolonne B :

Som du ser, er det ikke så vanskelig å fjerne duplikater mellom to Excel-kolonner ved hjelp av formler. Selv om det er en veldig tidkrevende og kjedelig prosess å skrive og kopiere formelen, bruk ogtøm filteret hver gang du trenger å sammenligne to kolonner i regnearkene dine. Den andre løsningen jeg skal gjøre deg oppmerksom på er mye enklere og vil ta bare en brøkdel av tiden vi har brukt på den første metoden. Jeg tror du vil finne mer hyggelige ting å bruke den sparte tiden på ;)

Sammenlign 2 Excel-kolonner for duplikater ved hjelp av en visuell veiviser

Og la meg nå vise deg hvordan du sammenligner to kolonner for duplikater ved å bruke våre Dedupe-verktøy for Excel.

  1. Åpne regnearket (eller regnearkene) der kolonnene du vil sammenligne er plassert.
  2. Velg en hvilken som helst celle i den første kolonnen, bytt til Ablebits Data -fanen og klikk Sammenlign tabeller -knappen:
  3. trinn 1 i veiviseren vil du se at den første kolonnen din er allerede valgt, så klikk på Neste .

    Merk. Hvis du ikke bare vil sammenligne 2 kolonner, men 2 tabeller, må du velge hele den første tabellen i dette trinnet.

  4. trinn 2 i veiviseren velger du 2. kolonne som du ønsker å sammenligne mot. Vi velger Ark2 i samme arbeidsbok. I de fleste tilfeller velger smartveiviseren den andre kolonnen automatisk, hvis dette av en eller annen grunn ikke skjer, velg målkolonnen med musen. Hvis du sammenligner hele tabeller, velg hele den andre tabellen.
  5. Velg å finne Dupliserte verdier :
  6. Velg kolonneparet duønsker å sammenligne:

    Tips. Hvis du sammenligner tabeller, kan du velge flere kolonnepar for sammenligning, for eksempel for- og etternavn. For flere detaljer, se Hvordan fjerne duplikater fra to Excel-regneark.

  7. Og til slutt må du bestemme deg for hva du vil gjøre med funnet duper. Du kan velge å slette de dupliserte oppføringene, flytte eller kopiere dem til et annet regneark, legge til en statuskolonne (resultatet vil være lik vår første løsning med Excel-formler), markere duplikater, eller bare velge alle celler med dupliserte verdier:

    Tips. Ikke velg å slette duplikater, spesielt hvis du bruker verktøyet for første gang. Velg i stedet å flytte duper til et annet regneark . Dette vil fjerne duplikater fra den første tabellen, men gir deg en sjanse til å se gjennom listen over oppføringer som er gjenkjent som duplikater. Når du sammenligner med flere samsvarende kolonner i store tabeller, kan det hende at du ved et uhell har glemt å velge en nøkkelkolonne med unike data, og flytting av duplikater vil forhindre et uopprettelig tap av data.

  8. Klikk Fullfør og nyt resultatet. Det vi har nå er et pent, rent bord uten duplikater:

Husk den forrige løsningen og kjenn forskjellen :) Det er raskt og enkelt å dedupere arbeidsarkene dine med Sammenlign to tabeller . Faktisk vil det ta deg mindre tid enn du har brukt på å lesedenne artikkelen.

Foreløpig er Sammenlign tabeller en del av Ultimate Suite for Excel, en samling av 70+ profesjonelle verktøy som dekker over 300 brukstilfeller. Klokken tikker, så skynd deg å laste den ned med en gang!

Hvis du har spørsmål eller noe er uklart, vennligst send meg en kommentar, så utdyper jeg gjerne videre. Takk for at du leste!

Michael Brown er en dedikert teknologientusiast med en lidenskap for å forenkle komplekse prosesser ved hjelp av programvareverktøy. Med mer enn ti års erfaring i teknologibransjen, har han forbedret ferdighetene sine i Microsoft Excel og Outlook, samt Google Sheets og Docs. Michaels blogg er dedikert til å dele sin kunnskap og ekspertise med andre, og gir enkle å følge tips og veiledninger for å forbedre produktivitet og effektivitet. Enten du er en erfaren profesjonell eller nybegynner, tilbyr Michaels blogg verdifull innsikt og praktiske råd for å få mest mulig ut av disse viktige programvareverktøyene.