Comparați două coloane și eliminați duplicatele în Excel

  • Imparte Asta
Michael Brown

Îți va lua aproximativ 10 minute să citești acest articol și în următoarele 5 minute (sau chiar mai repede dacă alegi a 2-a soluție descrisă în articol) vei compara cu ușurință două coloane Excel pentru duplicate și vei elimina sau evidenția dublurile găsite. Bine, a început numărătoarea inversă!

Excel este o aplicație foarte puternică și foarte mișto pentru crearea și procesarea unor matrici mari de date. Acum că aveți o mulțime de registre de lucru cu un fond de date, sau poate doar un singur tabel imens, poate doriți să comparați 2 coloane pentru duplicate și apoi să faceți ceva cu intrările găsite, de exemplu să ștergeți rândurile duplicate, să colorați dublurile sau să ștergeți conținutul celulelor duplicate. Aceste două coloane pot fisituate într-un singur tabel, în mod contiguu sau necontiguu, sau pot fi localizate în două foi de calcul sau chiar registre de lucru diferite.

Să zicem că aveți 2 coloane cu nume de persoane - 5 nume în coloana A și 3 nume în coloana B și doriți să comparați datele între aceste două coloane pentru a găsi duplicate. După cum înțelegeți, acestea sunt date fictive doar pentru un exemplu rapid; în foile de lucru reale aveți de obicei mii și zeci de mii de intrări.

Varianta A : Ambele coloane se află pe o singură foaie, într-un singur tabel: Coloana A și Coloana B

Varianta B : Două coloane sunt situate pe foi diferite: Coloana A din foaia 2 și Coloana A din foaia3

Instrumentul încorporat Remove Duplicate disponibil în Excel 2016, Excel 2013 și 2010 nu poate gestiona acest scenariu, deoarece nu poate compara datele între 2 coloane. În plus, poate elimina doar dublurile, nu este disponibilă nicio altă opțiune, cum ar fi evidențierea sau colorarea, din păcate :-(.

În continuare, voi descrie 2 modalități posibile de comparare a două coloane Excel care vă permit să găsiți și să eliminați intrările duplicate:

    Comparați 2 coloane pentru a găsi duplicate folosind formule Excel

    Varianta A: ambele coloane sunt pe aceeași listă

    1. În prima celulă goală, care în exemplul nostru este celula C1, scrieți următoarea formulă:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unique", "Duplicate")

      În formula noastră, A1 este prima celulă din prima coloană pe care dorim să o folosim pentru comparație. $B$1 și $B$10000 sunt adresele primei și ultimei celule din cea de-a doua coloană cu care doriți să faceți comparația.Fiți atenți la referința absolută a celulei - semnele de dolar ($) care preced literele coloanelor și numerele rândurilor. Folosesc referința absolută în mod intenționat, pentru ca adresele celulelor să rămână neschimbate atunci când copiați formula.

      Dacă doriți să găsiți dubluri în coloana B, schimbați numele coloanelor astfel încât formula să arate astfel:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unic", "Duplicat")

      În loc de " Unic "/" Duplicat ", puteți scrie propriile etichete, de exemplu " Nu a fost găsit "/" Găsit ", sau lăsați doar " Duplicat " și tastați "" în loc de "Unique". În acest din urmă caz, veți avea celule goale lângă celulele pentru care nu au fost găsite duplicate, cred că o astfel de prezentare este mai convenabilă pentru analiza datelor.

    2. Acum să copiem formula în toate celulele din coloana C , până la ultimul rând care conține date din coloana A. Pentru a face acest lucru, plasați cursorul în colțul din dreapta jos al celulei C1 , iar cursorul se va transforma într-o cruce neagră, așa cum se arată în imaginea de mai jos:

      Faceți clic pe butonul stâng al mouse-ului și, menținându-l apăsat, trageți marginea în jos, selectând toate celulele în care doriți să copiați formula. Când toate celulele necesare sunt selectate, eliberați butonul stâng al mouse-ului:

      Sfat: În tabelele mari, este mai rapid să copiați formula folosind scurtături. Faceți clic pe celula C1 pentru a o selecta și apăsați Ctrl + C (pentru a copia formula în clipboard), apoi apăsați Ctrl + Shift + End (pentru a selecta toate celulele care nu sunt goale din coloana C) și, în final, apăsați Ctrl + V (pentru a lipi formula în toate celulele selectate).

    3. Minunat, toate celulele duplicate sunt marcate ca fiind "Duplicat":

    Varianta B: două coloane se află pe foi de calcul diferite (cărți de lucru)

    1. În prima celulă a primei coloane goale din Sheet2 (coloana B în cazul nostru), scrieți formula:

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),""", "Duplicate")

      Unde Foaie3 este numele foii pe care se află cea de-a doua coloană, iar $A$1:$A$10000 sunt adresele primei și ultimei celule din cea de-a doua coloană.

    2. Similar cu Varianta A.
    3. Avem următorul rezultat:

    Faceți clic pentru a descărca foaia de lucru cu exemplele de mai sus și formula de comparare a 2 coloane pentru a găsi duplicate.

    Lucrul cu duplicatele găsite

    Perfect, am găsit intrările din prima coloană (coloana A) care există și în a doua coloană (coloana B). Acum trebuie să facem ceva cu ele :)

    Ar fi mai degrabă ineficient și ar dura prea mult timp să se examineze manual întregul tabel și să se revizuiască intrările duplicate. Există metode mult mai bune.

    Afișați numai rândurile duplicate din coloana A

    Dacă coloanele dvs. nu au anteturi, trebuie să le adăugați. Pentru a face acest lucru, puneți cursorul pe numărul care indică primul rând și acesta se va schimba în săgeată neagră așa cum se arată în captura de ecran:

    Faceți clic dreapta pe rândul selectat și alegeți " Introduceți " din meniul contextual:

    Dați nume coloanelor dumneavoastră, de exemplu, " Nume " și " Duplicat? ". Apoi treceți la Date și faceți clic pe Filtru :

    După aceea, faceți clic pe o mică săgeată gri de lângă " Duplicat? " pentru a deschide o listă derulantă, debifați toate elementele din acea listă, cu excepția Duplicate, și faceți clic pe OK :

    Gata, acum vedeți doar acele celule din coloana A care au valori duplicate în coloana B. Există doar trei astfel de celule în foaia noastră de lucru de test; după cum înțelegeți, în foile de lucru reale este posibil să fie mai multe, mult mai multe:

    Pentru a afișa din nou toate rândurile din coloana A, faceți clic pe simbolul de filtrare din coloana B, care acum arată ca o pâlnie cu o săgeată mică. și bifați "Select all". Alternativ, puteți face același lucru prin fila Date -> Selectați & Filtru -> Clar , așa cum se arată în captura de ecran:

    Culoarea sau evidențierea duplicatelor găsite

    În cazul în care " Duplicat " nu este suficient pentru scopurile dvs. și doriți să marcați celulele duplicate prin culoarea fontului sau a umpluturii sau în alt mod...

    Apoi filtrați duplicatele așa cum am explicat mai sus, selectați toate celulele filtrate și apăsați Ctrl + F1 pentru a deschide fereastra Formatarea celulelor Ca exemplu, să schimbăm culoarea de fundal a rândurilor duplicate în galben strălucitor. Desigur, puteți schimba culoarea de fundal a celulelor folosind funcția Culoare de umplere de la opțiunea Acasă dar avantajul casetei de dialog Format Cells este că vă permite să efectuați toate modificările de formatare deodată:

    Acum, cu siguranță nu veți pierde nici măcar o singură celulă duplicată:

    Eliminarea duplicatelor din prima coloană

    Filtrați tabelul astfel încât să apară numai celulele cu valori duplicate și selectați toate aceste celule.

    Dacă cele 2 coloane pe care le comparați se află pe foi de calcul diferite , adică în tabele separate, faceți clic dreapta pe intervalul selectat și alegeți " Ștergeți rândul " din meniul contextual:

    Faceți clic pe OK când Excel vă va cere să confirmați că doriți cu adevărat să "Ștergeți întregul rând al foii" și apoi ștergeți filtrul. După cum puteți vedea, rămân doar rândurile cu valori unice:

    Dacă 2 coloane se află pe o foaie de calcul , una lângă alta (adiacente) sau care nu se ating (neadiacente), eliminarea duplicatelor este puțin mai complexă. Nu putem șterge rânduri întregi care conțin valori duplicate, deoarece acest lucru ar șterge și celulele corespunzătoare din a 2-a coloană. Astfel, pentru a lăsa doar intrări unice în coloana A, faceți următoarele:

    1. Filtrați tabelul astfel încât să fie afișate numai celulele duplicate și selectați toate aceste celule. Faceți clic dreapta pe selecție și alegeți " Conținutul clar ":
    2. Eliberați filtrul.
    3. Selectați toate celulele din coloana A începând cu celula A1 până la ultima celulă care conține date.
    4. Mergeți la Date și faceți clic pe Sortare de la A la Z În fereastra de dialog care se deschide, alegeți " Continuați cu selecția curentă " și faceți clic pe Sortare :
    5. Ștergeți coloana care conține formula, deoarece nu mai aveți nevoie de ea, deocamdată au rămas acolo doar "Uniques".
    6. Asta e tot, acum coloana A conține numai date unice care nu există în coloana B :

    După cum vedeți, nu este atât de dificil să eliminați duplicatele dintre două coloane Excel folosind formule. Deși este un proces foarte consumator de timp și plictisitor să scrieți și să copiați formula, să aplicați și să ștergeți filtrul de fiecare dată când trebuie să comparați 2 coloane din foile de calcul. Cealaltă soluție pe care o voi aduce în atenția dvs. este mult mai simplă și va dura doar o fracțiune din timpul pe care l-am petrecut peprima metodă. cred că veți găsi lucruri mai plăcute pentru care să vă petreceți timpul economisit ;)

    Comparați 2 coloane Excel pentru duplicate utilizând un asistent vizual

    Și acum permiteți-mi să vă arăt cum să comparați două coloane pentru duplicat utilizând instrumentele noastre Dedupe pentru Excel.

    1. Deschideți foaia de calcul (sau foile de calcul) în care se află coloanele pe care doriți să le comparați.
    2. Selectați orice celulă din prima coloană, treceți la Date Ablebits și faceți clic pe butonul Comparați tabelele buton:
    3. Pe pasul 1 a expertului, veți vedea că prima coloană este deja selectată, așa că trebuie doar să faceți clic pe Următorul .

      Notă: Dacă doriți să comparați nu doar 2 coloane, ci 2 tabele, trebuie să selectați întregul prim tabel în acest pas.

    4. Pe pasul 2 a expertului, selectați cea de-a doua coloană cu care doriți să faceți comparația. Noi alegem Foaie2 în același registru de lucru. În cele mai multe cazuri, asistentul inteligent selectează automat cea de-a 2-a coloană, dacă, din anumite motive, acest lucru nu se întâmplă, selectați coloana țintă cu ajutorul mouse-ului. Dacă comparați tabele întregi, selectați întregul al 2-lea tabel.
    5. Alegeți să găsiți Valori duplicate :
    6. Alegeți perechea de coloane pe care doriți să o comparați:

      Sfat. Dacă comparați tabele, puteți alege mai multe perechi de coloane pentru comparație, de exemplu, numele și prenumele. Pentru mai multe detalii, consultați Cum să eliminați duplicatele din două foi de calcul Excel.

    7. Și, în cele din urmă, trebuie să decideți ce doriți să faceți cu dublurile găsite. Puteți alege să ștergeți intrările duplicate, să le mutați sau să le copiați într-o altă foaie de calcul, să adăugați o coloană de stare (rezultatul va fi similar cu prima noastră soluție cu formule Excel), să evidențiați dublurile sau doar să selectați toate celulele cu valori duplicate:

      Sfat: Nu alegeți să ștergeți duplicatele, mai ales dacă utilizați instrumentul pentru prima dată. În schimb, alegeți să muta dublurile către o altă foaie de lucru Acest lucru va elimina duplicatele din primul tabel, dar vă oferă posibilitatea de a revizui lista de intrări recunoscute ca fiind duplicate. Atunci când comparați după mai multe coloane corespondente în tabele mari, se poate întâmpla să uitați din greșeală să selectați o coloană cheie cu date unice, iar mutarea duplicatelor va preveni o pierdere irecuperabilă de date.

    8. Faceți clic pe Finisaj Ceea ce avem acum este un tabel frumos, curat, fără duplicate:

    Amintiți-vă de soluția anterioară și simțiți diferența :) Este rapid și ușor să vă deduplicați foile de lucru cu Comparați două tabele De fapt, vă va lua mai puțin timp decât ați petrecut pentru a citi acest articol.

    În prezent, Comparați tabelele face parte din suita noastră Ultimate Suite for Excel, o colecție de peste 70 de instrumente profesionale care acoperă peste 300 de cazuri de utilizare. Timpul trece, așa că grăbește-te și descarcă-l chiar acum!

    Dacă aveți întrebări sau dacă ceva a rămas neclar, vă rog să îmi scrieți un comentariu și voi detalia cu plăcere. Vă mulțumesc pentru lectură!

    Michael Brown este un pasionat de tehnologie dedicat, cu o pasiune pentru simplificarea proceselor complexe folosind instrumente software. Cu mai mult de un deceniu de experiență în industria tehnologiei, el și-a perfecționat abilitățile în Microsoft Excel și Outlook, precum și în Google Sheets și Docs. Blogul lui Michael este dedicat împărtășirii cunoștințelor și experienței sale cu alții, oferind sfaturi și tutoriale ușor de urmat pentru îmbunătățirea productivității și eficienței. Indiferent dacă sunteți un profesionist experimentat sau un începător, blogul lui Michael oferă informații valoroase și sfaturi practice pentru a profita la maximum de aceste instrumente software esențiale.