7 snadných způsobů vyhledávání a odstraňování duplicit v tabulkách Google

  • Sdílet Toto
Michael Brown

Hledáte jednoduchý způsob, jak najít duplicity v tabulkách Google? Co takhle 7 způsobů? :) To je vše, co potřebujete pro řadu případů použití :) Ukážu vám, jak používat nástroje bez vzorců (žádné kódování - slibuji!), podmíněné formátování a několik jednoduchých funkcí pro zapálené fanoušky vzorců.

Bez ohledu na to, jak často používáte Tabulky Google, je pravděpodobné, že se setkáte s duplicitními daty. Takové záznamy se mohou objevit v jednom sloupci nebo zabírat celé řádky.

Na konci tohoto článku budete vědět. vše, co potřebujete k odstranění duplicit, jejich počítání, zvýraznění a identifikaci se stavem. Ukážu několik příkladů vzorců a podělím se o různé nástroje. Jeden z nich dokonce najde a odstraní duplicity v tabulkách Google podle plánu! Hodit se bude i podmíněné formátování.

Prostě si vyberte svůj jed a jedeme :)

    Jak najít duplicity v tabulkách Google pomocí vzorců

    Tradičně začnu vzorci. Jejich hlavní výhodou je, že vaše původní tabulka zůstane nedotčena. Vzorce identifikují duplicity a výsledek vrátí na nějaké jiné místo v tabulkách Google. A na základě požadovaného výsledku provedou různé funkce.

    Jak odstranit duplicity v tabulkách Google pomocí funkce UNIQUE

    Funkce UNIQUE prohledá vaše data, odstraní duplicity a vrátí přesně to, co říká její název - jedinečné hodnoty/řádky.

    Zde je malá ukázka tabulky, kde se opakují různé řádky:

    Příklad 1. Odstranění duplicitních řádků, ponechání 1. výskytu

    Na jedné straně můžete potřebovat odstranit všechny duplicitní řádky z této tabulky v tabulkách Google Sheets a ponechat pouze první záznamy.

    K tomu stačí zadat rozsah dat uvnitř UNIQUE:

    =UNIQUE(A1:C10)

    Tento malý vzorec vrátí všechny jedinečné řádky a všechny 1. výskyty, přičemž ignoruje 2., 3. atd.

    Příklad 2. Odstranění všech duplicitních řádků, dokonce i 1. výskytu

    Na druhou stranu můžete chtít získat pouze "skutečné" jedinečné řádky. Tím "skutečné" myslím ty, které se neopakují - ani jednou. Co tedy uděláte?

    Podívejme se na chvíli na všechny UNIKÁTNÍ argumenty:

    UNIQUE(range,[by_column],[exactly_once])
    • rozsah - jsou data, která chcete zpracovat.
    • [by_column] - říká, zda se kontrolují zcela shodné řádky nebo buňky v jednotlivých sloupcích. Pokud se jedná o sloupce, zadejte TRUE. Pokud se jedná o řádky, zadejte FALSE nebo argument prostě vynechejte.
    • [exactly_once] - tento říká funkci, aby v Google Sheets mazala nejen duplicity, ale také jejich 1. záznamy. Nebo jinak řečeno, aby vracela pouze záznamy bez jakýchkoli duplicit. Pro tento účel se zadává TRUE, jinak FALSE nebo se argument vynechá.

    Tento poslední argument je vaší pákou.

    Chcete-li tedy z tabulek Google zcela odstranit všechny duplicitní řádky (spolu s jejich 1. řádkem), vynechejte ve vzorci druhý argument, ale přidejte třetí:

    =UNIQUE(A1:C10,,TRUE)

    Vidíte, že tabulka vpravo je mnohem kratší? Je to proto, že funkce UNIQUE našla a odstranila duplicitní řádky i jejich 1. výskyty z původní tabulky v tabulkách Google Sheets. Nyní zůstaly pouze jedinečné řádky.

    Identifikace duplicit pomocí funkce COUNTIF v Tabulkách Google

    Pokud není součástí vašeho plánu zabírání místa další datovou sadou, můžete místo toho spočítat duplicity v tabulkách Google (a pak je ručně odstranit). Stačí k tomu jeden sloupec navíc a pomůže vám funkce COUNTIF.

    Tip: Pokud tuto funkci neznáte, máme o ní celý příspěvek na blogu, neváhejte se na něj podívat.

    Příklad 1. Získejte celkový počet výskytů

    Identifikujme všechny duplicity s jejich 1. výskytem v Listech Google a zkontrolujme celkový počet jednotlivých bobulí vyskytujících se v seznamu. V D2 použiji následující vzorec a poté jej zkopíruji dolů do sloupce:

    =COUNTIF($B$2:$B$10,$B2)

    Tip: Chcete-li, aby tento vzorec automaticky zpracovával každý řádek ve sloupci, zabalte vše do pole ArrayFormula a změňte hodnotu $B2 na $B2:$B10 (celý sloupec). Nebudete tedy muset vzorec kopírovat dolů:

    Pokud poté tuto datovou sadu vyfiltrujete podle čísel, budete moci z tabulky Tabulky Google Sheets zobrazit a dokonce i ručně odstranit všechny nadbytečné duplicitní řádky:

    Příklad 2. Vyhledání a vyčíslení všech duplicit v tabulkách Google

    V případě, že celkový počet výskytů není vaším cílem a raději byste věděli, zda je tento konkrétní záznam v tomto konkrétním řádku 1., 2. atd. záznamem, budete muset vzorec mírně upravit.

    Změna rozsahu z celého sloupce ($B$2:$B$10) pouze na jednu buňku ($B$2:$B2) .

    Poznámka: Dávejte pozor na používání absolutních odkazů.

    =COUNTIF($B$2:$B2,$B2)

    Tentokrát bude odstranění všech duplicit z této tabulky v tabulkách Google Sheets ještě snazší, protože budete moci skrýt všechny záznamy kromě těch prvních:

    Příklad 3. Počítání duplicitních řádků v Tabulkách Google

    Zatímco výše uvedené vzorce počítají duplicity pouze v jednom sloupci Tabulky Google, můžete potřebovat vzorec, který zohledňuje všechny sloupce, a identifikuje tak duplicitní řádky.

    V tomto případě bude lépe vyhovovat COUNTIFS. Stačí vypsat každý sloupec vaší tabulky spolu s odpovídajícími kritérii:

    =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    Tip: K dispozici je ještě jeden způsob výpočtu duplicit - bez vzorců. Zahrnuje tabulku Pivot a popisuji jej dále.

    Označení duplicit ve stavovém sloupci - funkce IF

    Někdy čísla prostě nestačí. Někdy je lepší najít duplicity a označit je ve stavovém sloupci. Opět: pozdější filtrování dat v tabulkách Google podle tohoto sloupce vám umožní odstranit ty duplicity, které již nepotřebujete.

    Příklad 1. Vyhledání duplicit v 1 sloupci Tabulky Google

    Pro tento úkol budete potřebovat stejnou funkci COUNTIF, ale tentokrát zabalenou do funkce IF. Přesně takto:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicitní", "Unikátní")

    Podívejme se, co se stane v tomto vzorci:

    1. Nejprve COUNTIF vyhledá v celém sloupci B bobule z B2. Jakmile je najde, sečte je.
    2. Pak IF zkontroluje tento součet, a pokud je větší než 1, řekne. Duplikát , v opačném případě, Unikátní .

    Samozřejmě můžete vzorec upravit tak, aby vracel vlastní stavy nebo například vyhledával & v datech v tabulkách Google můžete identifikovat pouze duplicity:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicitní",")

    Tip: Jakmile tyto duplikáty najdete, můžete tabulku filtrovat podle sloupce stavu. Tento způsob vám umožní skrýt opakující se nebo jedinečné záznamy a dokonce vybrat celé řádky & tyto duplikáty z Tabulky Google zcela odstraníte:

    Příklad 2. Identifikace duplicitních řádků

    Podobně můžete označit absolutně duplicitní řádky - řádky, kde se všechny záznamy ve všech sloupcích vyskytují v tabulce několikrát:

    1. Začněte se stejným COUNTIFS jako dříve - tím, který prohledává každý sloupec pro jeho první hodnotu a počítá pouze ty řádky, kde se opakují všechny 3 záznamy ve všech 3 sloupcích:

      =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    2. Pak tento vzorec uzavřete do IF. Zkontroluje se počet opakujících se řádků, a pokud je větší než 1, vzorec pojmenuje řádek jako duplicitní:

      =IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicitní",")

    Nyní existují pouze 2 duplicity, protože i když se třešeň vyskytuje v tabulce třikrát, pouze dvě z nich mají všechny 3 sloupce shodné.

    Příklad 3. Najděte duplicitní řádky, 1. položky ignorujte

    Chcete-li ignorovat 1. výskyt a označit pouze 2. a další, odkazujete na první buňky tabulky místo na celé sloupce:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicitní",")

    Tip: Pokud používáte aplikaci Microsoft Excel, mohly by vám pomoci následující příklady: Jak najít duplicity v aplikaci Excel.

    Identifikace a zvýraznění duplicit v tabulkách Google pomocí pravidel podmíněného formátování

    Existuje možnost zpracovat opakující se data tak, abyste pouhým pohledem do tabulky jasně zjistili, zda se jedná o duplicitní záznam.

    Mluvím o zvýrazňování duplicit v tabulkách Google. Pomůže vám s tím podmíněné formátování.

    Tip: Nikdy jste nevyzkoušeli podmíněné formátování? Žádný strach, v tomto článku jsme vysvětlili, jak funguje.

    Zde je návod, co musíte udělat:

    1. Otevřete nastavení podmíněného formátování: Format> Podmíněné formátování .
    2. Ujistěte se, že Použít pro rozsah pole obsahuje rozsah, ve kterém chcete zvýraznit duplicity. Pro tento příklad začnu sloupcem B.
    3. Na adrese Pravidla formátu vybrat Vlastní vzorec je a zadejte stejný COUNTIF, který jsem uvedl výše:

      =COUNTIF($B$2:$B$10,$B2)>1

    Jakmile vyhledá záznamy, které se ve sloupci B vyskytují alespoň dvakrát, obarví je vybraným odstínem:

    Další možností by bylo zvýraznění duplicitních řádků. Stačí upravit rozsah, na který se má pravidlo použít:

    Tip: Jakmile v tabulkách Google zvýrazníte duplicity, můžete data filtrovat podle barev:

    • Na jedné straně můžete sloupec filtrovat tak, aby zůstaly viditelné pouze buňky s bílou barvou výplně. Tímto způsobem odstraníte ze zobrazení duplicity:

    • Na druhou stranu můžete ponechat viditelné pouze barevné buňky:

    a poté tyto řádky vyberte a duplikáty z Tabulky Google zcela odstraňte:

    Tip: Další vzorce pro zvýraznění duplicit v tabulkách Google najdete v tomto návodu.

    Způsoby vyhledávání a odstraňování duplicit v tabulkách Google bez použití vzorců

    Vzorce a podmíněné formátování jsou dobré, ale existují i další nástroje, které vám pomohou najít duplicity. Dva z nich byly navrženy právě pro tento problém.

    Identifikace duplicit pomocí tabulky Pivot pro Tabulky Google

    Pivot tabulka se používá v tabulkových procesorech k otočení dat a usnadnění čtení a pochopení tabulek. Je to jakýsi alternativní způsob prezentace datových souborů.

    Nejpřitažlivější na tom je, že se vaše původní data nemění. Pivot table je používá jako referenční a výsledek poskytuje na samostatné kartě.

    Tento výsledek se mimochodem dynamicky mění v závislosti na nastavení, které můžete upravovat za chodu.

    V případě opakujících se záznamů vám otočná tabulka pomůže spočítat a odstranit duplicity v tabulkách Google.

    Příklad 1. Jak se v tabulce Pivot počítají duplicity v tabulkách Google Sheets

    1. Přejít na Vložit> Pivot tabulka , zadejte rozsah dat a místo pro otočnou tabulku:

    2. V editoru otočné tabulky přidejte sloupec s duplicitami ( Název v mém příkladu) pro Řádky a pro Hodnoty .

      Pokud sloupec obsahuje číselné záznamy, zvolte jako souhrnnou funkci COUNT. Hodnoty pro počítání duplicit v Tabulkách Google. Pokud máte text, vyberte místo toho možnost COUNTA:

    Pokud vše provedete správně, v otočné tabulce se zobrazí každá položka ze seznamu a počet výskytů:

    Jak vidíte, tato otočná tabulka ukazuje, že se v mém souboru dat opakovaně vyskytují pouze ostružiny a třešně.

    Příklad 2. Odstranění duplicit v tabulkách Google pomocí otočné tabulky

    Chcete-li odstranit duplicity pomocí otočné tabulky, musíte přidat zbytek sloupců (v mém příkladu 2) jako Řádky pro vaši otočnou tabulku:

    Uvidíte tabulku s duplicitními řádky, ale čísla vám řeknou, které z nich se v původním souboru dat opakují:

    Tip: Pokud už čísla nepotřebujete, zavřete okno. Hodnoty v tabulce Pivot stisknutím příslušné ikony v pravém horním rohu:

    Takto bude nakonec vypadat vaše otočná tabulka:

    Žádné duplicity, žádné výpočty navíc. V jedné tabulce jsou jen seřazeny jedinečné záznamy.

    Odstranění duplicit - standardní nástroj pro čištění dat

    Tabulky Google mají svůj malý, jednoduchý a nenáročný nástroj na odstranění duplicit. Jmenuje se podle své operace a nachází se pod položkou Data> Čištění dat tab:

    Nenajdete zde nic náročného, vše je velmi jednoduché. Stačí zadat, zda má vaše tabulka řádek se záhlavím, a vybrat všechny sloupce, které mají být kontrolovány na duplicity:

    Jakmile budete připraveni, klikněte na velké zelené tlačítko a nástroj vyhledá a odstraní duplicitní řádky z tabulky Tabulky Google a uvede, kolik jedinečných řádků zbývá:

    Bohužel to je vše, co tento nástroj umí. Pokaždé, když se budete potřebovat vypořádat s duplicitami, budete muset tento nástroj spustit ručně. Také to je vše, co umí: odstranit duplikáty. Není zde žádná možnost jejich jiného zpracování.

    Všechny tyto nevýhody naštěstí řeší doplněk Remove Duplicates pro Google Sheets od společnosti Ablebits.

    Doplněk Odstranit duplikáty pro Tabulky Google

    Doplněk Odstranit duplicity je skutečným převratným nástrojem. Pro začátek obsahuje 5 různých nástrojů pro identifikaci duplicit v tabulkách Google. Pro dnešek se však podíváme na. Vyhledání duplicitních nebo jedinečných řádků .

    Sám nabízí 7 různých způsobů, jak zacházet s duplicitami, a nejenže celý proces urychluje. Umí jej zcela automatizovat.

    Po instalaci z tržiště Google Workspace Marketplace se objeví pod položkou Rozšíření :

    Stejně jako standardní nástroj Tabulky Google umožňuje také vybrat rozsah a sloupce ke zpracování, ale elegantněji :)

    Všechna nastavení jsou rozdělena do 4 uživatelsky přívětivých kroků, ve kterých je třeba vybrat:

    1. rozsah
    2. Co hledat: duplikáty nebo unikáty
    3. sloupce
    4. jak naložit s nalezenými záznamy

    Můžete se dokonce podívat na speciální obrázky, abyste vždy věděli, co máte dělat:

    Možná si říkáte, k čemu to je? Na rozdíl od standardního nástroje nabízí tento doplněk mnohem více:

    • najít duplikáty a také unikáty včetně nebo bez 1. výskytu
    • zvýraznění duplikáty v tabulkách Google
    • přidat stavový sloupec
    • kopírovat/přesunout výsledky do nového listu/rozložky. nebo na libovolném konkrétním místě v tabulce.
    • přehledně nalezeno hodnoty z buněk
    • odstranit duplicitní řádky z listu Google zcela

    Stačí si vybrat způsob, který vám nejlépe vyhovuje, zvolit možnosti a nechat doplněk, aby se o to postaral.

    Tip: Toto video je sice trochu starší, ale dokonale ukazuje, jak snadno se s doplňkem pracuje:

    Automatické odstraňování duplicit v doplňku

    Jako třešničku na dortu si budete moci všechna nastavení ze všech 4 kroků uložit do scénářů a později je pouhým kliknutím spustit na libovolném stole.

    Nebo - ještě lépe - naplánujte tyto scénáře tak, aby se automaticky spouštěly v určitý čas každý den:

    Vaše přítomnost není nutná a doplněk odstraní duplikáty automaticky, i když je soubor zavřený nebo jste offline. Chcete-li se o něm dozvědět více, navštivte tento podrobný návod a podívejte se na ukázkové video:

    Doporučuji vám nainstalovat si doplněk z obchodu Tabulky Google a prohlédnout si ho. Uvidíte, jak snadno lze najít, odstranit a zvýraznit duplicity bez vzorců na několik kliknutí.

    Tabulkový procesor s příklady vzorců

    Vyhledání & odstranění duplicit v tabulkách Google - příklady vzorců (vytvořte si kopii tabulky)

    Michael Brown je oddaný technologický nadšenec s vášní pro zjednodušování složitých procesů pomocí softwarových nástrojů. S více než desetiletými zkušenostmi v technologickém průmyslu zdokonalil své dovednosti v aplikacích Microsoft Excel a Outlook a také v Tabulkách a Dokumentech Google. Michaelův blog je věnován sdílení jeho znalostí a odborných znalostí s ostatními a poskytuje snadno pochopitelné tipy a návody pro zlepšení produktivity a efektivity. Ať už jste zkušený profesionál nebo začátečník, Michaelův blog nabízí cenné postřehy a praktické rady, jak tyto základní softwarové nástroje co nejlépe využít.