Porovnanie dvoch stĺpcov a odstránenie duplicít v programe Excel

  • Zdieľajte To
Michael Brown

Prečítanie tohto článku vám zaberie približne 10 minút a za ďalších 5 minút (alebo ešte rýchlejšie, ak si vyberiete 2. riešenie opísané v článku) ľahko porovnáte dva stĺpce programu Excel na duplicity a odstránite alebo zvýrazníte nájdené duplicity. Dobre, odpočítavanie sa začalo!

Excel je veľmi výkonná a naozaj skvelá aplikácia na vytváranie a spracovanie veľkých polí údajov. Teraz, keď máte veľa zošitov so súborom údajov alebo možno len jednu obrovskú tabuľku, možno budete chcieť porovnať 2 stĺpce na duplicity a potom niečo urobiť s nájdenými záznamami, napríklad odstrániť duplicitné riadky, vyfarbiť duplicity alebo vymazať obsah duplicitných buniek. Tieto dva stĺpce môžu byťsa môžu nachádzať v jednej tabuľke, súvisle alebo nesúvisle, alebo sa môžu nachádzať v 2 rôznych hárkoch alebo dokonca zošitoch.

Povedzme, že máte 2 stĺpce s menami ľudí - 5 mien v stĺpci A a 3 mená v stĺpci B a chcete porovnať údaje medzi týmito dvoma stĺpcami, aby ste našli duplicity. Ako iste chápete, ide o fiktívne údaje len pre rýchly príklad; v skutočných pracovných listoch máte zvyčajne tisíce a desaťtisíce záznamov.

Variant A : Oba stĺpce sa nachádzajú na jednom liste v jednej tabuľke: Stĺpec A a Stĺpec B

Variant B : Dva stĺpce sa nachádzajú na rôznych listoch: Stĺpec A v hárku2 a Stĺpec A v hárku3

Zabudovaný nástroj Odstrániť duplicitu, ktorý je k dispozícii v aplikáciách Excel 2016, Excel 2013 a 2010, si s týmto scenárom neporadí, pretože nedokáže porovnať údaje medzi 2 stĺpcami. Okrem toho dokáže odstrániť iba duplicity, žiadna iná možnosť, ako napríklad zvýraznenie alebo zafarbenie, nie je k dispozícii, bohužiaľ :-(.

Ďalej popíšem 2 možné spôsoby porovnania dvoch stĺpcov programu Excel, ktoré vám umožnia nájsť a odstrániť duplicitné položky:

    Porovnanie 2 stĺpcov na nájdenie duplicít pomocou vzorcov programu Excel

    Variant A: oba stĺpce sú v tom istom zozname

    1. Do prvej prázdnej bunky, v našom príklade je to bunka C1, napíšte nasledujúci vzorec:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unikátne", "Duplicitné")

      V našom vzorci, A1 je prvá bunka prvého stĺpca, ktorú chceme použiť na porovnanie. $B$1 a $B$10000 sú adresy prvej a poslednej bunky 2. stĺpca, s ktorými chcete porovnávať.Dávajte pozor na absolútny odkaz na bunku - znaky dolára ($) pred písmenami stĺpcov a číslami riadkov. Absolútny odkaz používam zámerne, aby sa adresy buniek pri kopírovaní vzorca nezmenili.

      Ak chcete nájsť duplikáty v stĺpci B, prehoďte názvy stĺpcov tak, aby vzorec vyzeral takto:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unikátne", "Duplicitné")

      Namiesto " Jedinečné "/" Duplikát " môžete napísať vlastné štítky, napr. " Nenájdené "/" Nájdené ", alebo nechajte len " Duplikát " a namiesto "Unikátne" zadajte "". V druhom prípade budete mať prázdne bunky vedľa buniek, pre ktoré sa nenašli duplikáty, verím, že takéto zobrazenie je pre analýzu údajov vhodnejšie.

    2. Teraz skopírujme vzorec do všetkých buniek stĺpec C , až po posledný riadok, ktorý obsahuje údaje v stĺpci A. Ak to chcete urobiť, umiestnite kurzor do pravého dolného rohu bunky C1 a kurzor sa zmení na čierny krížik, ako je znázornené na obrázku nižšie:

      Kliknite na ľavé tlačidlo myši a držiac ho stlačené potiahnite okraj smerom nadol, čím vyberiete všetky bunky, do ktorých chcete vzorec skopírovať. Keď sú vybrané všetky potrebné bunky, uvoľnite ľavé tlačidlo myši:

      Tip: Vo veľkých tabuľkách je rýchlejšie skopírovať vzorec pomocou klávesových skratiek. Kliknite na bunku C1 vyberte ho a stlačte klávesovú skratku Ctrl + C (pre skopírovanie vzorca do schránky), potom stlačte klávesovú skratku Ctrl + Shift + End (pre výber všetkých neprázdnych buniek v stĺpci C) a nakoniec stlačte klávesovú skratku Ctrl + V (pre vloženie vzorca do všetkých vybraných buniek).

    3. Úžasné, všetky duplicitné bunky sú označené ako "Duplicitné":

    Variant B: dva stĺpce sú na rôznych hárkoch (zošitoch)

    1. Do 1. bunky 1. prázdneho stĺpca v hárku 2 (v našom prípade stĺpec B) napíšte vzorec:

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Duplikát")

      Kde List3 je názov listu, v ktorom sa nachádza druhý stĺpec, a $A$1:$A$10000 sú adresy prvej a poslednej bunky tohto druhého stĺpca.

    2. Podobne ako variant A.
    3. Máme nasledujúci výsledok:

    Kliknutím si stiahnite pracovný hárok s uvedenými príkladmi a vzorcom na porovnanie 2 stĺpcov na nájdenie duplicít.

    Práca s nájdenými duplikátmi

    Perfektné, našli sme záznamy v prvom stĺpci (stĺpec A), ktoré existujú aj v druhom stĺpci (stĺpec B). Teraz s nimi musíme niečo urobiť :)

    Bolo by to dosť neefektívne a zabralo by príliš veľa času na to, aby ste prechádzali celú tabuľku a ručne kontrolovali duplicitné záznamy. Existujú oveľa lepšie spôsoby.

    Zobraziť iba duplicitné riadky v stĺpci A

    Ak vaše stĺpce nemajú hlavičky, musíte ich pridať. Ak to chcete urobiť, umiestnite kurzor na číslo označujúce 1. riadok a zmení sa na čierna šípka ako je znázornené na snímke obrazovky:

    Kliknite pravým tlačidlom myši na vybraný riadok a vyberte položku " Vložte " z kontextového menu:

    Pomenujte stĺpce, napr. " Názov " a " Duplikát? ". Potom prepnite na Údaje a kliknite na kartu Filter :

    Potom kliknite na malú sivú šípku vedľa položky " Duplikát? " otvorte rozbaľovací zoznam, zrušte v ňom začiarknutie všetkých položiek okrem Duplikát a kliknite na tlačidlo OK :

    To je všetko, teraz vidíte len tie bunky stĺpca A, ktoré majú duplicitné hodnoty v stĺpci B. V našom testovacom hárku sú len tri takéto bunky, ako iste chápete, v skutočných hárkoch ich bude pravdepodobne viac, oveľa viac:

    Ak chcete opäť zobraziť všetky riadky stĺpca A, kliknite na symbol filtra v stĺpci B, ktorý teraz vyzerá ako lievik s malou šípkou. a začiarknite políčko "Vybrať všetko". To isté môžete urobiť aj prostredníctvom Karta Údaje -> Vybrať & Filter -> Jasné , ako je znázornené na snímke obrazovky:

    Vyfarbenie alebo zvýraznenie nájdených duplikátov

    Ak je " Duplikát " nestačí pre vaše účely a chcete duplicitné bunky označiť farbou písma alebo farbou výplne alebo iným spôsobom...

    Potom vyfiltrujte duplikáty, ako je vysvetlené vyššie, vyberte všetky vyfiltrované bunky a stlačením klávesovej skratky Ctrl + F1 otvorte Formátovanie buniek Ako príklad si zmeňte farbu pozadia duplikovaných riadkov na jasne žltú. Samozrejme, farbu pozadia buniek môžete zmeniť pomocou Farba výplne možnosť na Domov karta, ale výhodou dialógového okna Formát buniek je, že umožňuje vykonať všetky zmeny formátovania naraz:

    Teraz vám už určite neunikne ani jedna duplikovaná bunka:

    Odstránenie duplikátov z prvého stĺpca

    Filtrujte tabuľku tak, aby sa zobrazovali len bunky s duplicitnými hodnotami, a vyberte všetky tieto bunky.

    Ak sa 2 porovnávané stĺpce nachádzajú na rôznych hárkoch , t. j. v samostatných tabuľkách, kliknite pravým tlačidlom myši na vybraný rozsah a vyberte položku " Odstrániť riadok " z kontextového menu:

    Kliknite na . OK keď vás Excel požiada o potvrdenie, že naozaj chcete "Odstrániť celý riadok hárku" a potom filter zruší. Ako vidíte, zostanú len riadky s jedinečnými hodnotami:

    Ak sa na jednom hárku nachádzajú 2 stĺpce , ktoré sú vedľa seba (susedné) alebo sa navzájom nedotýkajú (nesusedné), je odstraňovanie duplicít trochu zložitejšie. Nemôžeme odstrániť celé riadky, ktoré obsahujú duplicitné hodnoty, pretože by sme tým odstránili aj zodpovedajúce bunky v 2. stĺpci. Aby sme teda v stĺpci A ponechali len jedinečné záznamy, postupujeme nasledovne:

    1. Filtrujte tabuľku tak, aby sa zobrazovali iba duplicitné bunky, a vyberte všetky tieto bunky. Kliknite pravým tlačidlom myši na výber a vyberte položku " Jasný obsah ":
    2. Vymažte filter.
    3. Vyberte všetky bunky v stĺpci A počnúc bunkou A1 až po poslednú bunku, ktorá obsahuje údaje.
    4. Prejdite na Údaje a kliknite na kartu Triediť od A do Z V otvorenom dialógovom okne vyberte položku " Pokračovať v aktuálnom výbere " a kliknite na tlačidlo Triediť :
    5. Odstráňte stĺpec obsahujúci vzorec, pretože ho už nepotrebujete, zostanú v ňom len "Uniques".
    6. To je všetko, teraz stĺpec A obsahuje iba jedinečné údaje, ktoré neexistujú v stĺpci B :

    Ako vidíte, odstrániť duplicity medzi dvoma stĺpcami Excelu pomocou vzorcov nie je až také zložité. Aj keď je to veľmi zdĺhavý a nudný proces, napísať a skopírovať vzorec, aplikovať a vymazať filter zakaždým, keď potrebujete porovnať 2 stĺpce vo vašich pracovných hárkoch. Druhé riešenie, na ktoré vás upozorním, je oveľa jednoduchšie a zaberie len zlomok času, ktorý sme strávili nadverím, že si nájdete príjemnejšie veci, na ktoré môžete stráviť ušetrený čas ;)

    Porovnanie 2 stĺpcov programu Excel na duplicity pomocou vizuálneho sprievodcu

    A teraz vám ukážem, ako porovnať dva stĺpce na duplicity pomocou našich nástrojov Dedupe pre Excel.

    1. Otvorte pracovný hárok (alebo hárky), v ktorom sa nachádzajú stĺpce, ktoré chcete porovnať.
    2. Vyberte ľubovoľnú bunku v 1. stĺpci, prepnite na Údaje Ablebits a kliknite na kartu Porovnanie tabuliek tlačidlo:
    3. Na stránke krok 1 sprievodcu uvidíte, že prvý stĺpec je už vybraný, takže jednoducho kliknite na tlačidlo Ďalšie .

      Poznámka: Ak chcete porovnať nielen 2 stĺpce, ale 2 tabuľky, musíte v tomto kroku vybrať celú prvú tabuľku.

    4. Na stránke krok 2 sprievodcu vyberte 2. stĺpec, s ktorým chcete porovnávať. Vyberieme List2 v tom istom zošite. Vo väčšine prípadov inteligentný sprievodca automaticky vyberie 2. stĺpec, ak sa tak z nejakého dôvodu nestane, vyberte cieľový stĺpec pomocou myši. Ak porovnávate celé tabuľky, vyberte celú 2. tabuľku.
    5. Vyberte si, či chcete nájsť Duplicitné hodnoty :
    6. Vyberte dvojicu stĺpcov, ktoré chcete porovnať:

      Tip. Ak porovnávate tabuľky, môžete na porovnanie vybrať niekoľko dvojíc stĺpcov, napríklad meno a priezvisko. Podrobnejšie informácie nájdete v časti Ako odstrániť duplicity z dvoch tabuliek programu Excel.

    7. A nakoniec sa máte rozhodnúť, čo chcete s nájdenými duplikátmi urobiť. Môžete si vybrať, či chcete duplicitné položky odstrániť, presunúť alebo skopírovať do iného hárka, pridať stĺpec so stavom (výsledok bude podobný nášmu prvému riešeniu so vzorcami Excelu), zvýrazniť duplikáty alebo jednoducho vybrať všetky bunky s duplicitnými hodnotami:

      Tip. Nevyberajte možnosť odstránenia duplikátov, najmä ak nástroj používate prvýkrát. Namiesto toho vyberte možnosť presunúť duplikáty do iného pracovného hárka . Tým sa odstránia duplikáty z prvej tabuľky, ale máte možnosť skontrolovať zoznam záznamov rozpoznaných ako duplikáty. Pri porovnávaní podľa viacerých zhodných stĺpcov vo veľkých tabuľkách sa môže stať, že ste omylom zabudli vybrať kľúčový stĺpec s jedinečnými údajmi a presunutím duplikátov sa zabráni nenávratnej strate údajov.

    8. Kliknite na . Dokončenie a vychutnajte si výsledok. Teraz máme peknú, čistú tabuľku bez duplikátov:

    Spomeňte si na predchádzajúce riešenie a pocítite rozdiel :) Odčítanie hárkov je skutočne rýchle a jednoduché pomocou Porovnanie dvoch tabuliek V skutočnosti vám to zaberie menej času, ako ste strávili čítaním tohto článku.

    V súčasnosti, Porovnanie tabuliek je súčasťou nášho balíka Ultimate Suite pre Excel, ktorý obsahuje viac ako 70 profesionálnych nástrojov, ktoré pokrývajú viac ako 300 prípadov použitia. Čas beží, preto si ho urýchlene stiahnite hneď teraz!

    Ak máte otázky alebo vám niečo nie je jasné, napíšte mi, prosím, komentár a ja vám to rada bližšie vysvetlím. Ďakujem za prečítanie!

    Michael Brown je nadšený technologický nadšenec s vášňou pre zjednodušovanie zložitých procesov pomocou softvérových nástrojov. S viac ako desaťročnými skúsenosťami v technologickom priemysle si zdokonalil svoje zručnosti v programoch Microsoft Excel a Outlook, ako aj Tabuľky Google a Dokumenty. Michaelov blog je venovaný zdieľaniu svojich vedomostí a odborných znalostí s ostatnými a poskytuje jednoduché tipy a návody na zlepšenie produktivity a efektivity. Či už ste skúsený profesionál alebo začiatočník, Michaelov blog ponúka cenné poznatky a praktické rady, ako z týchto základných softvérových nástrojov vyťažiť maximum.