Porovnání dvou sloupců a odstranění duplicit v aplikaci Excel

  • Sdílet Toto
Michael Brown

Přečtení tohoto článku vám zabere asi 10 minut a za dalších 5 minut (nebo ještě rychleji, pokud zvolíte 2. řešení popsané v článku) snadno porovnáte dva sloupce Excelu na duplicity a nalezené duplicity odstraníte nebo zvýrazníte. Dobře, odpočítávání začalo!

Excel je velmi výkonná a opravdu skvělá aplikace pro vytváření a zpracování velkých datových polí. Nyní, když máte spoustu sešitů s hromadou dat nebo třeba jen jednu velkou tabulku, můžete chtít porovnat 2 sloupce na duplicity a pak s nalezenými záznamy něco udělat, například odstranit duplicitní řádky, obarvit duplicity nebo vymazat obsah duplicitních buněk. Tyto dva sloupce mohou býtse mohou nacházet v jedné tabulce, a to souvisle nebo nesouvisle, nebo mohou být umístěny ve 2 různých sešitech nebo dokonce sešitech.

Řekněme, že máte 2 sloupce se jmény lidí - 5 jmen ve sloupci A a 3 jména ve sloupci B, a chcete porovnat data mezi těmito dvěma sloupci a najít duplicity. Jak jistě chápete, jedná se o fiktivní data jen pro rychlý příklad; ve skutečných pracovních listech máte obvykle tisíce a desetitisíce záznamů.

Varianta A : Oba sloupce jsou umístěny na jednom listu v jedné tabulce: Sloupec A a Sloupec B

Varianta B : Dva sloupce jsou umístěny na různých listech: Sloupec A v listu2 a Sloupec A v listu3

Vestavěný nástroj Odstranit duplicitu dostupný v Excelu 2016, Excelu 2013 a 2010 si s tímto scénářem neporadí, protože nedokáže porovnat data mezi 2 sloupci. Navíc dokáže pouze odstranit duplicity, žádné další možnosti, jako je zvýraznění nebo obarvení, bohužel nejsou k dispozici :-(.

Dále popíšu 2 možné způsoby porovnání dvou sloupců aplikace Excel, které vám umožní najít a odstranit duplicitní položky:

    Porovnání 2 sloupců pro nalezení duplicit pomocí vzorců aplikace Excel

    Varianta A: oba sloupce jsou na stejném seznamu

    1. Do první prázdné buňky, v našem příkladu je to buňka C1, napište následující vzorec:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unikátní", "Duplicitní")

      V našem vzorci, A1 je první buňka prvního sloupce, kterou chceme použít pro porovnání. $B$1 a $B$10000 jsou adresy první a poslední buňky 2. sloupce, se kterými chcete porovnávat.Dávejte pozor na absolutní odkaz na buňku - znaky dolaru ($) před písmeny sloupce a čísly řádků. Absolutní odkaz používám záměrně, aby adresy buněk zůstaly při kopírování vzorce nezměněny.

      Pokud chcete najít duplicity ve sloupci B, prohoďte názvy sloupců tak, aby vzorec vypadal takto:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unikátní", "Duplicitní")

      Místo " Unikátní "/" Duplikát " můžete napsat vlastní štítky, např. " Nenalezeno "/" Nalezeno ", nebo ponechat pouze " Duplikát " a místo "Unikátní" zadejte "". V druhém případě budete mít prázdné buňky vedle buněk, pro které nebyly nalezeny duplikáty, domnívám se, že taková prezentace je pro analýzu dat vhodnější.

    2. Nyní zkopírujme vzorec do všech buněk pole sloupec C , a to až do posledního řádku, který obsahuje údaje ve sloupci A. Za tímto účelem umístěte kurzor do pravého dolního rohu buňky C1 a kurzor se změní na černý křížek, jak je znázorněno na obrázku níže:

      Klikněte na levé tlačítko myši a držte jej stisknuté, tažením okraje směrem dolů vyberte všechny buňky, do kterých chcete vzorec zkopírovat. Jakmile jsou vybrány všechny potřebné buňky, uvolněte levé tlačítko myši:

      Tip: V rozsáhlých tabulkách je rychlejší zkopírovat vzorec pomocí klávesových zkratek. Klikněte na buňku. C1 a stiskněte klávesy Ctrl + C (pro zkopírování vzorce do schránky), poté stiskněte klávesy Ctrl + Shift + End (pro výběr všech neprázdných buněk ve sloupci C) a nakonec stiskněte klávesy Ctrl + V (pro vložení vzorce do všech vybraných buněk).

    3. Úžasné, všechny duplicitní buňky jsou označeny jako "Duplicitní":

    Varianta B: dva sloupce jsou na různých listech (sešitech)

    1. Do 1. buňky 1. prázdného sloupce listu 2 (v našem případě sloupce B) napište vzorec:

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Duplicitní")

      Kde: List3 je název listu, na kterém se nachází druhý sloupec, a $A$1:$A$10000 jsou adresy první a poslední buňky tohoto druhého sloupce.

    2. Podobně jako varianta A.
    3. Máme následující výsledek:

    Klepnutím na tlačítko stáhnete pracovní list s výše uvedenými příklady a vzorcem pro porovnání 2 sloupců a nalezení duplicit.

    Práce s nalezenými duplicitami

    Perfektní, našli jsme záznamy v prvním sloupci (sloupec A), které existují i ve druhém sloupci (sloupec B). Nyní s nimi musíme něco udělat :)

    Procházení celé tabulky a ruční kontrola duplicitních záznamů by bylo poměrně neefektivní a zabralo by příliš mnoho času. Existují mnohem lepší způsoby.

    Zobrazit pouze duplicitní řádky ve sloupci A

    Pokud vaše sloupce nemají záhlaví, musíte je přidat. To provedete tak, že umístíte kurzor na číslo označující 1. řádek a změní se na černá šipka jak je znázorněno na obrázku:

    Klikněte pravým tlačítkem myši na vybraný řádek a vyberte možnost " Vložte " z kontextové nabídky:

    Pojmenujte sloupce, např. " Název " a " Duplikát? ". Pak přepněte na Data a klikněte na kartu Filtr :

    Poté klikněte na malou šedou šipku vedle položky " Duplikát? " otevřete rozevírací seznam, zrušte v něm zaškrtnutí všech položek kromě Duplikát a klikněte na tlačítko . OK :

    To je vše, nyní vidíte pouze ty buňky sloupce A, které mají duplicitní hodnoty ve sloupci B. V našem testovacím listu jsou pouze tři takové buňky, jak jistě chápete, ve skutečných listech jich bude pravděpodobně více, mnohem více:

    Chcete-li znovu zobrazit všechny řádky sloupce A, klikněte na symbol filtru ve sloupci B, který nyní vypadá jako trychtýř s malou šipkou. a zaškrtněte políčko "Vybrat vše". Totéž můžete udělat i pomocí tlačítka Karta Data -> Výběr & Filtr -> Přehledně , jak je znázorněno na snímku obrazovky:

    Vybarvení nebo zvýraznění nalezených duplikátů

    Pokud je " Duplikát " pro vaše účely nestačí a chcete duplicitní buňky označit barvou písma nebo barvou výplně nebo jiným způsobem...

    Poté vyfiltrujte duplikáty, jak je vysvětleno výše, vyberte všechny vyfiltrované buňky a stisknutím klávesové zkratky Ctrl + F1 otevřete okno Formátování buněk Jako příklad uveďme změnu barvy pozadí duplikovaných řádků na jasně žlutou. Barvu pozadí buněk můžete samozřejmě změnit pomocí příkazu Barva výplně možnost na Home Výhodou dialogového okna Formátovat buňky je, že umožňuje provádět všechny změny formátování najednou:

    Nyní vám rozhodně neunikne jediná duplikovaná buňka:

    Odstranění duplicit z prvního sloupce

    Vyfiltrujte tabulku tak, aby se zobrazovaly pouze buňky s duplicitními hodnotami, a vyberte všechny tyto buňky.

    Pokud se 2 porovnávané sloupce nacházejí na různých listech. , tj. v samostatných tabulkách, klikněte pravým tlačítkem myši na vybraný rozsah a vyberte možnost " Odstranit řádek " z kontextové nabídky:

    Klikněte na OK kdy vás Excel požádá o potvrzení, že opravdu chcete "Odstranit celý řádek listu", a poté filtr zruší. Jak vidíte, zůstanou pouze řádky s jedinečnými hodnotami:

    Pokud se na jednom pracovním listu nacházejí 2 sloupce. , vedle sebe (sousední) nebo se vzájemně nedotýkají (nesousední), je odstranění duplicit trochu složitější. Nemůžeme odstranit celé řádky, které obsahují duplicitní hodnoty, protože bychom tím odstranili i odpovídající buňky ve 2. sloupci. Abychom tedy ve sloupci A ponechali pouze jedinečné záznamy, provedeme následující postup:

    1. Vyfiltrujte tabulku tak, aby se zobrazily pouze duplicitní buňky, a vyberte všechny tyto buňky. Klikněte na výběr pravým tlačítkem myši a vyberte možnost " Vymazat obsah ":
    2. Vymažte filtr.
    3. Vyberte všechny buňky ve sloupci A počínaje buňkou A1 až po poslední buňku, která obsahuje data.
    4. Přejděte na Data a klikněte na kartu Třídit od A do Z V otevřeném dialogovém okně vyberte možnost " Pokračovat v aktuálním výběru " a klikněte na tlačítko Třídit :
    5. Sloupec obsahující vzorec smažte, protože jej již nepotřebujete, zůstaly v něm pouze "Unikáty".
    6. To je vše, nyní sloupec A obsahuje pouze jedinečné údaje, které neexistují ve sloupci B. :

    Jak vidíte, odstranit duplicity mezi dvěma sloupci Excelu pomocí vzorců není tak složité. I když je to velmi zdlouhavý a nudný proces, psát a kopírovat vzorec, aplikovat a vymazat filtr pokaždé, když potřebujete porovnat 2 sloupce v pracovních listech. Druhé řešení, na které vás upozorním, je mnohem jednodušší a zabere jen zlomek času, který jsme strávili nadprvní metoda. Věřím, že si najdete příjemnější věci, na které ušetřený čas můžete využít ;)

    Porovnání 2 sloupců aplikace Excel na duplicity pomocí vizuálního průvodce

    A nyní vám ukážu, jak porovnat dva sloupce na duplicity pomocí našich nástrojů Dedupe pro Excel.

    1. Otevřete pracovní list (nebo listy), ve kterém se nacházejí sloupce, které chcete porovnat.
    2. Vyberte libovolnou buňku v 1. sloupci, přepněte se do pole Data Ablebits a klikněte na kartu Porovnání tabulek tlačítko:
    3. Na adrese krok 1 průvodce, uvidíte, že první sloupec je již vybrán, takže jednoduše klikněte na tlačítko Další .

      Poznámka: Pokud chcete porovnat nejen 2 sloupce, ale 2 tabulky, musíte v tomto kroku vybrat celou první tabulku.

    4. Na adrese krok 2 průvodce vyberte 2. sloupec, se kterým chcete porovnávat. Zvolíme List2 ve stejném sešitě. Ve většině případů vybere inteligentní průvodce 2. sloupec automaticky, pokud se tak z nějakého důvodu nestane, vyberte cílový sloupec pomocí myši. Pokud porovnáváte celé tabulky, vyberte celou 2. tabulku.
    5. Vyberte si, zda chcete najít Duplicitní hodnoty :
    6. Vyberte dvojici sloupců, které chcete porovnat:

      Tip: Pokud porovnáváte tabulky, můžete pro porovnání vybrat několik dvojic sloupců, například jméno a příjmení. Další podrobnosti naleznete v části Jak odstranit duplicity ze dvou tabulek aplikace Excel.

    7. A nakonec se musíte rozhodnout, co s nalezenými duplicitami uděláte. Můžete se rozhodnout, zda duplicitní položky odstraníte, přesunete nebo zkopírujete na jiný list, přidáte stavový sloupec (výsledek bude podobný našemu prvnímu řešení se vzorci Excelu), zvýrazníte duplicity nebo jen vyberete všechny buňky s duplicitními hodnotami:

      Tip: Nezvolte možnost odstranění duplicit, zejména pokud nástroj používáte poprvé. Místo toho zvolte možnost. přesunout duplikáty do jiného pracovního listu . Tím se odstraní duplicity z první tabulky, ale máte možnost zkontrolovat seznam záznamů rozpoznaných jako duplicity. Při porovnávání podle několika shodných sloupců v rozsáhlých tabulkách se může stát, že jste omylem zapomněli vybrat klíčový sloupec s jedinečnými údaji, a přesunutím duplicit zabráníte nenávratné ztrátě dat.

    8. Klikněte na Dokončení a vychutnejte si výsledek. Nyní máme pěknou, čistou tabulku bez duplicit:

    Vzpomeňte si na předchozí řešení a pocítíte rozdíl :) Odřádkování pracovních listů je skutečně rychlé a snadné. Porovnání dvou tabulek Ve skutečnosti vám to zabere méně času, než jste strávili čtením tohoto článku.

    V současné době, Porovnání tabulek je součástí naší sady Ultimate Suite pro Excel, což je kolekce více než 70 profesionálních nástrojů, které pokrývají více než 300 případů použití. Čas běží, takže si pospěšte a stáhněte si ji právě teď!

    Pokud máte dotazy nebo vám něco zůstalo nejasné, napište mi prosím komentář a já vám to ráda upřesním. Děkuji za přečtení!

    Michael Brown je oddaný technologický nadšenec s vášní pro zjednodušování složitých procesů pomocí softwarových nástrojů. S více než desetiletými zkušenostmi v technologickém průmyslu zdokonalil své dovednosti v aplikacích Microsoft Excel a Outlook a také v Tabulkách a Dokumentech Google. Michaelův blog je věnován sdílení jeho znalostí a odborných znalostí s ostatními a poskytuje snadno pochopitelné tipy a návody pro zlepšení produktivity a efektivity. Ať už jste zkušený profesionál nebo začátečník, Michaelův blog nabízí cenné postřehy a praktické rady, jak tyto základní softwarové nástroje co nejlépe využít.