7 jednoduchých spôsobov, ako nájsť a odstrániť duplikáty v hárkoch Google

  • Zdieľajte To
Michael Brown

Hľadáte jednoduchý spôsob, ako nájsť duplikáty v tabuľkách Google? Čo tak 7 spôsobov? :) To je všetko, čo potrebujete pre množstvo prípadov použitia :) Ukážem vám, ako používať nástroje bez vzorcov (žiadne kódovanie - sľubujem!), podmienené formátovanie a niekoľko jednoduchých funkcií pre vášnivých fanúšikov vzorcov.

Bez ohľadu na to, ako často používate hárky Google, je pravdepodobné, že sa stretávate s duplicitnými údajmi. Takéto záznamy sa môžu vyskytovať v jednom stĺpci alebo zaberať celé riadky.

Na konci tohto článku budete vedieť. všetko, čo potrebujete na odstránenie duplicít, ich spočítanie, zvýraznenie a identifikáciu so stavom. Ukážem niekoľko príkladov vzorcov a podelím sa o rôzne nástroje. Jeden z nich dokonca nájde a odstráni duplikáty v hárkoch Google podľa plánu! Hodiť sa bude aj podmienené formátovanie.

Vyberte si jed a poďme na to :)

    Ako nájsť duplikáty v hárkoch Google pomocou vzorcov

    Tradične začnem vzorcami. Ich hlavnou výhodou je, že vaša pôvodná tabuľka zostáva nedotknutá. Vzorce identifikujú duplikáty a vrátia výsledok na iné miesto vo vašich listoch Google. A na základe požadovaného výsledku vykonajú rôzne funkcie.

    Ako odstrániť duplikáty v hárkoch Google pomocou funkcie UNIQUE

    Funkcia UNIQUE prehľadá vaše údaje, odstráni duplikáty a vráti presne to, čo hovorí jej názov - jedinečné hodnoty/riadky.

    Tu je malá ukážka tabuľky, v ktorej sa opakujú rôzne riadky:

    Príklad 1. Odstránenie duplicitných riadkov, ponechanie 1. výskytu

    Na jednej strane možno budete potrebovať odstrániť všetky duplicitné riadky z tejto tabuľky hárkov Google a ponechať len prvé záznamy.

    Ak to chcete urobiť, stačí zadať rozsah údajov vo vnútri UNIQUE:

    =UNIQUE(A1:C10)

    Tento malý vzorec vráti všetky jedinečné riadky a všetky prvé výskyty, pričom ignoruje druhý, tretí atď.

    Príklad 2. Odstránenie všetkých duplicitných riadkov, dokonca aj 1. výskytu

    Na druhej strane môžete chcieť získať len "skutočné" jedinečné riadky. Pod pojmom "skutočné" mám na mysli tie, ktoré sa neopakujú - ani raz. Čo teda urobíte?

    Venujme chvíľu času a preskúmajme všetky UNIKÁTNE argumenty:

    UNIQUE(range,[by_column],[exactly_once])
    • rozsah - sú údaje, ktoré chcete spracovať.
    • [by_column] - hovorí, či sa kontrolujú úplne zhodné riadky alebo bunky v jednotlivých stĺpcoch. Ak sú to stĺpce, zadajte TRUE. Ak sú to riadky, zadajte FALSE alebo argument jednoducho vynechajte.
    • [exact_once] - tento hovorí funkcii, aby vymazala nielen duplikáty v Google Sheets, ale aj ich 1. záznamy. Alebo inými slovami, aby vrátila len záznamy bez akýchkoľvek duplikátov. Na tento účel vložíte TRUE, inak FALSE alebo argument preskočíte.

    Tento posledný argument je vašou pákou.

    Ak teda chcete úplne odstrániť všetky duplicitné riadky z hárkov Google (spolu s ich 1. riadkom), vynechajte druhý argument vo vzorci, ale pridajte tretí:

    =UNIQUE(A1:C10,,TRUE)

    Vidíte, že tabuľka vpravo je oveľa kratšia? Je to preto, že funkcia UNIQUE našla a odstránila duplicitné riadky, ako aj ich 1. výskyty z pôvodnej tabuľky hárkov Google. Teraz zostávajú len jedinečné riadky.

    Identifikácia duplikátov pomocou funkcie COUNTIF v tabuľkách Google

    Ak nie je súčasťou vášho plánu zaberať miesto ďalším súborom údajov, môžete namiesto toho spočítať duplikáty v tabuľkách Google (a potom ich ručne odstrániť). Zaberie to len jeden stĺpec navyše a pomôže vám funkcia COUNTIF.

    Tip: Ak túto funkciu nepoznáte, máme o nej celý príspevok na blogu, neváhajte si ho pozrieť.

    Príklad 1. Získajte celkový počet výskytov

    Identifikujme všetky duplikáty s ich 1. výskytom v listoch Google a skontrolujme celkový počet jednotlivých bobúľ vyskytujúcich sa v zozname. V D2 použijem nasledujúci vzorec a potom ho skopírujem do stĺpca:

    =COUNTIF($B$2:$B$10,$B2)

    Tip. Ak chcete, aby tento vzorec automaticky spracoval každý riadok v stĺpci, zabaľte všetko do ArrayFormula a zmeňte $B2 na $B2:$B10 (celý stĺpec). Nebudete teda musieť vzorec kopírovať nadol:

    Ak potom tento súbor údajov vyfiltrujete podľa čísel, budete môcť vidieť a dokonca aj ručne odstrániť všetky nadbytočné duplicitné riadky z tabuľky hárkov Google:

    Príklad 2. Vyhľadanie a vyčíslenie všetkých duplikátov v hárkoch Google

    V prípade, že celkový počet výskytov nie je vaším cieľom a radšej by ste vedeli, či je tento konkrétny záznam v tomto konkrétnom riadku 1., 2. atď. záznamom, budete musieť vzorec mierne upraviť.

    Zmena rozsahu z celého stĺpca ($B$2:$B$10) len na jednu bunku ($B$2:$B2) .

    Poznámka: Dávajte pozor na používanie absolútnych odkazov.

    =COUNTIF($B$2:$B2,$B2)

    Tentoraz bude odstránenie všetkých duplikátov z tejto tabuľky hárkov Google ešte jednoduchšie, pretože budete môcť skryť všetky záznamy okrem prvého:

    Príklad 3. Počítanie duplicitných riadkov v hárkoch Google

    Zatiaľ čo vyššie uvedené vzorce počítajú duplicity len v jednom stĺpci hárkov Google, možno budete potrebovať vzorec, ktorý zohľadňuje všetky stĺpce a identifikuje tak duplicitné riadky.

    V tomto prípade bude lepšie vyhovovať COUNTIFS. Stačí uviesť každý stĺpec vašej tabuľky spolu s príslušnými kritériami:

    =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    Tip. Na výpočet duplikátov je k dispozícii aj iný spôsob - bez vzorcov. Zahŕňa tabuľku Pivot a popisujem ho ďalej.

    Označenie duplikátov v stĺpci stavu - funkcia IF

    Niekedy čísla jednoducho nestačia. Niekedy je lepšie nájsť duplicity a označiť ich v stĺpci stavu. Opäť: filtrovanie údajov v tabuľkách Google podľa tohto stĺpca vám neskôr umožní odstrániť tie duplicity, ktoré už nepotrebujete.

    Príklad 1. Vyhľadanie duplikátov v 1 stĺpci hárkov Google

    Na túto úlohu budete potrebovať rovnakú funkciu COUNTIF, ale tentoraz zabalenú do funkcie IF. Presne takto:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicitné", "Jedinečné")

    Pozrime sa, čo sa stane v tomto vzorci:

    1. Najprv COUNTIF vyhľadá v celom stĺpci B bobule z B2. Po nájdení ich spočíta.
    2. Potom IF skontroluje tento súčet, a ak je väčší ako 1, povie Duplikát , v opačnom prípade, Jedinečné .

    Samozrejme, vzorec môžete použiť na vrátenie vlastných stavov alebo napríklad na nájdenie & identifikovať iba duplikáty vo vašich údajoch v tabuľkách Google:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate","")

    Tip. Hneď ako nájdete tieto duplikáty, môžete tabuľku filtrovať podľa stĺpca stavu. Tento spôsob vám umožní skryť opakujúce sa alebo jedinečné záznamy a dokonca vybrať celé riadky & úplne odstrániť tieto duplikáty z hárkov Google:

    Príklad 2. Identifikácia duplicitných riadkov

    Podobne môžete označiť absolútne duplicitné riadky - riadky, v ktorých sa všetky záznamy vo všetkých stĺpcoch vyskytujú v tabuľke niekoľkokrát:

    1. Začnite s tým istým COUNTIFS ako predtým - s tým, ktorý prehľadáva každý stĺpec pre jeho prvú hodnotu a počíta len tie riadky, v ktorých sa opakujú všetky 3 záznamy vo všetkých 3 stĺpcoch:

      =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    2. Potom tento vzorec uzavrite do IF. Skontroluje sa počet opakujúcich sa riadkov a ak je vyšší ako 1, vzorec pomenuje riadok ako duplicitný:

      =IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate",")

    Teraz existujú len 2 duplicity, pretože hoci sa čerešňa v tabuľke vyskytuje 3-krát, len dve z nich majú všetky 3 stĺpce rovnaké.

    Príklad 3. Nájdite duplicitné riadky, 1. záznamy ignorujte

    Ak chcete ignorovať 1. výskyt a označiť len 2. a ďalšie, namiesto celých stĺpcov sa obráťte na prvé bunky tabuľky:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicate",")

    Tip. Ak používate program Microsoft Excel, môžu vám pomôcť nasledujúce príklady: Ako nájsť duplikáty v programe Excel.

    Identifikácia a zvýraznenie duplicít v hárkoch Google pomocou pravidiel podmieneného formátovania

    Existuje možnosť spracovať opakujúce sa údaje takým spôsobom, že jediným pohľadom na tabuľku jasne zistíte, či ide o duplicitný záznam.

    Hovorím o zvýrazňovaní duplicít v hárkoch Google. Pomôže vám s tým podmienené formátovanie.

    Tip. Nikdy ste neskúšali podmienené formátovanie? Nemusíte sa obávať, v tomto článku sme vysvetlili, ako funguje.

    Tu je návod, čo musíte urobiť:

    1. Otvorte nastavenia podmieneného formátovania: Formát> Podmienené formátovanie .
    2. Uistite sa, že Aplikovať na rozsah pole obsahuje rozsah, v ktorom chcete zvýrazniť duplicity. V tomto príklade začnem stĺpcom B.
    3. Na stránke Pravidlá formátu vybrať Vlastný vzorec je a zadajte ten istý COUNTIF, ktorý som uviedol vyššie:

      =COUNTIF($B$2:$B$10,$B2)>1

    Keď vyhľadá záznamy, ktoré sa v stĺpci B vyskytujú aspoň dvakrát, zafarbí ich vami zvoleným odtieňom:

    Ďalšou možnosťou by bolo zvýraznenie duplicitných riadkov. Stačí upraviť rozsah, na ktorý sa má pravidlo použiť:

    Tip. Po zvýraznení duplikátov v hárkoch Google môžete údaje filtrovať podľa farby:

    • Na jednej strane môžete stĺpec filtrovať tak, aby zostali viditeľné len bunky s bielou farbou výplne. Týmto spôsobom odstránite zo zobrazenia duplikáty:

    • Na druhej strane môžete ponechať viditeľné len farebné bunky:

    a potom vyberte tieto riadky a úplne odstráňte tieto duplikáty z hárkov Google:

    Tip: Ďalšie vzorce na zvýraznenie duplicít v hárkoch Google nájdete v tomto návode.

    Spôsoby vyhľadávania a odstraňovania duplicít v hárkoch Google bez použitia vzorcov

    Vzorce a podmienené formátovanie sú dobré, ale existujú aj iné nástroje, ktoré vám pomôžu nájsť duplikáty. Dva z nich boli navrhnuté práve na tento problém.

    Identifikácia duplicít pomocou pivotnej tabuľky pre hárky Google

    Pivotná tabuľka sa používa v tabuľkových procesoroch na otáčanie údajov a uľahčenie čítania a pochopenia tabuliek. Je to akýsi alternatívny spôsob prezentácie súborov údajov.

    Najatraktívnejšie je, že sa tu vaše pôvodné údaje nemenia. Pivot table ich používa ako referenciu a výsledok poskytuje na samostatnej karte.

    Tento výsledok sa mimochodom dynamicky mení v závislosti od nastavení, ktoré môžete upravovať za chodu.

    V prípade opakujúcich sa záznamov vám otočná tabuľka pomôže spočítať a odstrániť duplikáty v hárkoch Google.

    Príklad 1. Ako Pivot table počíta duplikáty v hárkoch Google

    1. Prejsť na Vložiť> Pivot tabuľka , zadajte rozsah údajov a miesto pre otočnú tabuľku:

    2. V editore otočnej tabuľky pridajte stĺpec s duplikátmi ( Názov v mojom príklade) pre Riadky a pre Hodnoty .

      Ak stĺpec obsahuje číselné záznamy, vyberte ako súhrnnú funkciu COUNT pre Hodnoty na počítanie duplikátov v hárkoch Google. Ak máte text, vyberte namiesto toho položku COUNTA:

    Ak všetko urobíte správne, otočná tabuľka bude obsahovať každú položku zo zoznamu a zobrazí vám počet jej výskytov:

    Ako vidíte, táto otočná tabuľka ukazuje, že v mojom súbore údajov sa opakovane vyskytujú len ostružiny a čerešne.

    Príklad 2. Odstránenie duplicít v hárkoch Google pomocou pivotnej tabuľky

    Ak chcete odstrániť duplicity pomocou otočnej tabuľky, musíte pridať zvyšné stĺpce (v mojom príklade 2) ako Riadky pre vašu otočnú tabuľku:

    Uvidíte tabuľku s duplicitnými riadkami, ale čísla vám povedia, ktoré z nich sa opakujú v pôvodnom súbore údajov:

    Tip. Ak už čísla nepotrebujete, jednoducho zatvorte Hodnoty v tabuľke Pivot stlačením príslušnej ikony v jej pravom hornom rohu:

    Takto bude nakoniec vyzerať vaša otočná tabuľka:

    Žiadne duplicity, žiadne dodatočné výpočty. V jednej tabuľke sú len zoradené jedinečné záznamy.

    Odstránenie duplikátov - štandardný nástroj na čistenie údajov

    Tabuľky Google majú svoj malý, jednoduchý a nenáročný nástroj na odstránenie duplikátov. Nazýva sa podľa svojej operácie a nachádza sa v časti Údaje> Čistenie údajov tab:

    Nenájdete tu nič zložité, všetko je veľmi jednoduché. Stačí určiť, či má vaša tabuľka riadok záhlavia, a vybrať všetky stĺpce, ktoré sa majú skontrolovať na duplicity:

    Keď ste pripravení, kliknite na veľké zelené tlačidlo a nástroj nájde a odstráni duplicitné riadky z tabuľky hárkov Google a povie, koľko jedinečných riadkov zostalo:

    Bohužiaľ, to je všetko, čo tento nástroj dokáže. Zakaždým, keď sa budete musieť vysporiadať s duplikátmi, budete musieť tento nástroj spustiť ručne. Okrem toho je to všetko, čo robí: odstraňuje duplikáty. Neexistuje žiadna možnosť spracovať ich inak.

    Našťastie všetky tieto nevýhody vyriešil doplnok Remove Duplicates (Odstrániť duplikáty) pre tabuľky Google od spoločnosti Ablebits.

    Odstránenie duplikátov - doplnok pre hárky Google

    Doplnok Remove Duplicates (Odstrániť duplikáty) je skutočným nástrojom, ktorý mení pravidlá hry. Na začiatok obsahuje 5 rôznych nástrojov na identifikáciu duplikátov v tabuľkách Google. Dnes sa však pozrieme na Vyhľadanie duplicitných alebo jedinečných riadkov .

    Sám ponúka 7 rôznych spôsobov spracovania duplikátov a celý proces nielen urýchľuje. Vie ho úplne automatizovať.

    Po inštalácii z trhoviska Google Workspace Marketplace sa zobrazí v časti Rozšírenia :

    Rovnako ako štandardný nástroj Google Sheets umožňuje vybrať rozsah a stĺpce na spracovanie, ale elegantnejšie :)

    Všetky nastavenia sú rozdelené do 4 používateľsky prívetivých krokov, v ktorých musíte vybrať:

    1. rozsah
    2. čo nájsť: duplikáty alebo unikáty
    3. stĺpce
    4. čo robiť s nájdenými záznamami

    Môžete dokonca nahliadnuť na špeciálne obrázky, aby vám bolo vždy jasné, čo máte robiť:

    Možno si hovoríte, že na rozdiel od štandardného nástroja ponúka tento doplnok oveľa viac:

    • nájsť duplikáty ako aj unikáty vrátane alebo bez 1. výskytu
    • zvýraznenie duplikáty v hárkoch Google
    • pridať stĺpec stavu
    • kopírovať/presúvať výsledky na nový hárok/rozložený hárok alebo na ľubovoľnom konkrétnom mieste vo vašej tabuľke
    • prehľadne nájdené na hodnoty z buniek
    • odstrániť duplicitné riadky z vášho hárku Google úplne

    Stačí si vybrať spôsob, ktorý vám najviac vyhovuje, vybrať možnosti a nechať doplnok vykonať svoju prácu.

    Tip: Toto video je síce trochu staršie, ale dokonale ukazuje, ako jednoducho sa s doplnkom pracuje:

    Zabezpečte, aby doplnok automaticky odstraňoval duplikáty

    Ako čerešničku na torte si budete môcť všetky nastavenia zo všetkých 4 krokov uložiť do scenárov a neskôr ich spustiť na ľubovoľnom stole jediným kliknutím.

    Alebo - ešte lepšie - naplánujte tieto scenáre tak, aby sa automaticky spúšťali v určitom čase denne:

    Vaša prítomnosť nie je potrebná a doplnok automaticky odstráni duplikáty, aj keď je súbor zatvorený alebo ste v režime offline. Ak sa chcete dozvedieť viac, navštívte tento podrobný návod a pozrite si toto demonštračné video:

    Odporúčam vám, aby ste si nainštalovali doplnok z obchodu Google Sheets a porozhliadli sa po ňom. Uvidíte, aké jednoduché je nájsť, odstrániť a zvýrazniť duplikáty bez vzorcov len niekoľkými kliknutiami.

    Tabuľkový procesor s príkladmi vzorcov

    Nájsť & odstrániť duplikáty v hárkoch Google - príklady vzorcov (vytvorte si kópiu tabuľky)

    Michael Brown je nadšený technologický nadšenec s vášňou pre zjednodušovanie zložitých procesov pomocou softvérových nástrojov. S viac ako desaťročnými skúsenosťami v technologickom priemysle si zdokonalil svoje zručnosti v programoch Microsoft Excel a Outlook, ako aj Tabuľky Google a Dokumenty. Michaelov blog je venovaný zdieľaniu svojich vedomostí a odborných znalostí s ostatnými a poskytuje jednoduché tipy a návody na zlepšenie produktivity a efektivity. Či už ste skúsený profesionál alebo začiatočník, Michaelov blog ponúka cenné poznatky a praktické rady, ako z týchto základných softvérových nástrojov vyťažiť maximum.