7 egyszerű módszer a duplikátumok keresésére és eltávolítására a Google Sheetsben

  • Ossza Meg Ezt
Michael Brown

Tartalomjegyzék

Egy egyszerű módszert keresel a duplikátumok keresésére a Google Sheetsben? Mit szólnál 7 módhoz? :) Ennyi elég számos felhasználási esethez :) Megmutatom, hogyan használhatsz képletmentes eszközöket (nincs kódolás - ígérem!), feltételes formázást és néhány egyszerű függvényt a lelkes képletrajongóknak.

Nem számít, milyen gyakran használja a Google Sheets alkalmazást, jó eséllyel találkozik duplikált adatokkal. Az ilyen rekordok megjelenhetnek egy oszlopban vagy egész sorokat foglalhatnak el.

A cikk végére tudni fogod, hogy minden, amire szüksége van a duplikátumok eltávolításához, számolásához, kiemeléséhez és státusszal való azonosításához. Mutatok néhány képletpéldát és megosztom a különböző eszközöket. Az egyik még a duplikátumokat is megtalálja és ütemezetten eltávolítja a Google Sheetsben! A feltételes formázás is jól fog jönni.

Válassza ki a méreg, és induljon a játék :)

    Hogyan találhat duplikátumokat a Google Sheetsben képletek segítségével

    Hagyományosan a képletekkel kezdem. Fő előnyük, hogy az eredeti táblázatod érintetlen marad. A képletek azonosítják a duplikátumokat, és az eredményt a Google Sheets valamelyik másik helyére adják vissza. A kívánt eredmény alapján pedig különböző függvények végzik a dolgukat.

    Hogyan távolítsuk el a duplikátumokat a Google Sheetsben az UNIQUE funkció segítségével?

    Az UNIQUE függvény átvizsgálja az adatokat, törli a duplikátumokat, és pontosan azt adja vissza, amit a neve mond - egyedi értékeket/sorokat.

    Íme egy kis mintatáblázat, ahol különböző sorok ismétlődnek:

    Példa 1. A duplikált sorok törlése, az 1. előfordulások megtartása

    Egyrészt szükség lehet arra, hogy eltávolítson minden duplikált sort ebből a Google Sheets táblázatból, és csak az első bejegyzéseket tartsa meg.

    Ehhez csak adja meg az adatok tartományát az UNIQUE-on belül:

    =UNIQUE(A1:C10)

    Ez a kis formula visszaadja az összes egyedi sort és az összes 1. előfordulást, figyelmen kívül hagyva a 2., 3. stb. előfordulást.

    Példa 2. Törölje az összes duplikált sort, még az első előfordulásokat is.

    Másrészt viszont lehet, hogy csak az "igazi" egyedi sorokat szeretné megkapni. Az "igazi" alatt azokat értem, amelyek nem ismétlődnek - még egyszer sem. Mit tegyen?

    Szánjunk egy pillanatot, és nézzük át az összes EGYEDÜLálló érvet:

    UNIQUE(range,[by_column],[exactly_once])
    • tartomány - a feldolgozni kívánt adatok.
    • [by_column] - megmondja, hogy a teljesen egyező sorokat vagy az egyes oszlopok celláit keresi-e. Ha oszlopokat, akkor TRUE-t írja be, ha sorokat, akkor FALSE-t, vagy egyszerűen hagyja ki az argumentumot.
    • [exactly_once] - ez azt mondja a függvénynek, hogy ne csak a duplikátumokat törölje a Google Sheetsben, hanem az 1. bejegyzésüket is. Vagy más szóval, csak olyan rekordokat adjon vissza, amelyekben egyáltalán nincs duplikátum. Ehhez TRUE-t, egyébként FALSE-t vagy kihagyja az argumentumot.

    Ez az utolsó érv az önök előnye.

    Ezért, ha teljesen el akarja távolítani az összes duplikált sort a Google Sheetsből (az 1. sorral együtt), hagyja ki a második argumentumot a képletben, de adja hozzá a harmadikat:

    =UNIQUE(A1:C10,,TRUE)

    Látja, hogy a jobb oldali táblázat sokkal rövidebb? Ez azért van, mert az UNIQUE megtalálta és eltávolította a duplikált sorokat, valamint azok első előfordulásait az eredeti Google Sheets táblázatból. Most már csak az egyedi sorok maradtak.

    Duplikátumok azonosítása a Google Sheets COUNTIF funkciójának használatával

    Ha a helyfoglalás egy másik adatkészlettel nem része a tervednek, akkor helyette a Google Sheetsben megszámolhatod a duplikátumokat (majd manuálisan törölheted őket). Csak egy extra oszlopot vesz igénybe, és a COUNTIF funkció segít.

    Tipp: Ha nem ismeri ezt a funkciót, egy egész blogbejegyzést írtunk róla, nézze meg bátran.

    Példa 1. Az előfordulások teljes számának lekérdezése

    Azonosítsuk az összes duplikátumot az 1. előfordulásukkal a Google Sheetsben, és ellenőrizzük a listában megjelenő egyes bogyók összesített számát. A következő képletet fogom használni a D2-ben, majd lemásolom az oszlopba:

    =COUNTIF($B$2:$B$10,$B2)

    Tipp: Ahhoz, hogy ez a képlet automatikusan kezelje az oszlop minden sorát, tekerjen mindent ArrayFormulába, és változtassa meg a $B2 a címre. $B2:$B10 (az egész oszlopot), így nem kell a képletet lemásolnia:

    Ha ezt követően ezt az adathalmazt a számok alapján szűrjük, akkor láthatjuk és akár kézzel is eltávolíthatjuk a felesleges duplikált sorokat a Google Sheets táblázatból:

    Példa 2. Az összes duplikátum keresése és felsorolása a Google Sheetsben

    Ha nem a teljes előfordulási szám a cél, és inkább azt szeretné tudni, hogy az adott sorban az adott rekord az 1., 2. stb. bejegyzés-e, akkor a képletet kissé módosítani kell.

    A tartomány módosítása a teljes oszlopból ($B$2:$B$10) csak egy cellára ($B$2:$B2) .

    Megjegyzés: Figyeljen az abszolút hivatkozások használatára.

    =COUNTIF($B$2:$B2,$B2)

    Ezúttal a Google Sheets táblázatból a duplikátumok törlése még egyszerűbb lesz, mivel az 1. bejegyzés kivételével az összes bejegyzést elrejtheti:

    Példa 3. Duplikált sorok számolása a Google Sheetsben

    Míg a fenti képletek csak egy Google Sheets-oszlopban lévő duplikátumokat számolják, szükség lehet egy olyan képletre, amely az összes oszlopot figyelembe veszi, és így azonosítja a duplikált sorokat.

    Ebben az esetben a COUNTIFS jobban megfelel. Csak sorolja fel a táblázat minden oszlopát a megfelelő kritériumokkal együtt:

    =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    Tipp. A duplikátumok kiszámítására - képletek nélkül - egy másik módszer is rendelkezésre áll. Ez egy Pivot táblázatot foglal magában, és ezt a továbbiakban leírom.

    Duplikátumok jelölése egy státusz oszlopban - IF funkció

    Néha a számok egyszerűen nem elegendőek. Néha jobb, ha megkeresi a duplikátumokat, és egy státusz oszlopban jelöli őket. Ismétlem: a Google Sheets adatainak ezen oszlop szerinti szűrése később lehetővé teszi, hogy eltávolítsa azokat a duplikátumokat, amelyekre már nincs szüksége.

    Példa 1. Duplikátumok keresése 1 Google Sheets oszlopban

    Ehhez a feladathoz ugyanarra a COUNTIF függvényre lesz szükséged, de ezúttal az IF függvénybe csomagolva. Csak így:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplikátum", "Egyedi")

    Lássuk, mi történik ebben a képletben:

    1. Először a COUNTIF a teljes B oszlopban keresi a B2-ből származó bogyót. Ha megtalálta, összegzi őket.
    2. Ezután az IF ellenőrzi ezt az összeget, és ha nagyobb, mint 1, akkor azt mondja, hogy Duplikátum , egyébként, Egyedi .

    Természetesen a képletet úgy is megkaphatja, hogy saját állapotokat adjon vissza, vagy például megtalálja a & csak a duplikátumokat azonosítja a Google Sheets adataiban:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplikátum","")

    Tipp: Amint megtalálja ezeket a duplikátumokat, szűrheti a táblázatot a státusz oszlop alapján. Így elrejtheti az ismétlődő vagy egyedi rekordokat, sőt egész sorokat is kijelölhet & törölheti ezeket a duplikátumokat a Google Sheetsből teljesen:

    Példa 2. Duplikált sorok azonosítása

    Hasonlóképpen jelölheti az abszolút duplikált sorokat is, vagyis azokat a sorokat, amelyekben az összes oszlopban lévő összes rekord többször is szerepel a táblázatban:

    1. Kezdje ugyanazzal a COUNTIFS-sel, mint korábban - azzal, amelyik minden oszlopot az első értékére vizsgál, és csak azokat a sorokat számolja, ahol mindhárom oszlopban mind a 3 rekord ismétli magát:

      =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    2. Ezután zárja be a képletet IF-be. Ellenőrzi az ismétlődő sorok számát, és ha az meghaladja az 1-et, a képlet duplikátumnak nevezi a sort:

      =IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplikátum","")

    Most már csak 2 duplikátum van, mert bár a cseresznye háromszor fordul elő a táblázatban, csak kettőnek mind a három oszlopa azonos.

    Példa 3. Duplikált sorok keresése, az 1. bejegyzések figyelmen kívül hagyása

    Ha figyelmen kívül akarja hagyni az 1. előfordulást, és csak a 2. és a többi előfordulást szeretné megjelölni, akkor a táblázat első celláira hivatkozzon a teljes oszlopok helyett:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$B2,$C$2:$C2,$C2)>1, "Duplikátum","")

    Tipp. Ha Microsoft Excel programot használ, a következő példák hasznosak lehetnek: Hogyan találhat duplikátumokat az Excelben.

    Duplikátumok azonosítása és kiemelése a Google Sheetsben feltételes formázási szabályokkal

    Lehetőség van az ismétlődő adatok olyan módon történő feldolgozására, hogy egyetlen pillantás a táblázatra egyértelművé tegye, hogy ez egy dupe rekord.

    A duplikációk kiemeléséről beszélek a Google Sheetsben. A feltételes formázás segít ebben.

    Tipp: Még sosem próbálta a feltételes formázást? Ne aggódjon, ebben a cikkben elmagyarázzuk, hogyan működik.

    A következőket kell tennie:

    1. A feltételes formázási beállítások megnyitása: Format> Feltételes formázás .
    2. Győződjön meg róla, hogy a Alkalmazás a tartományra mező tartalmazza azt a tartományt, ahol a duplikátumokat ki akarja emelni. Ebben a példában hadd kezdjem a B oszlopnál.
    3. A oldalon. Formázási szabályok válasszon Egyéni formula és írja be ugyanazt a COUNTIF-ot, amelyet fentebb bemutattam:

      =COUNTIF($B$2:$B$10,$B2)>1

    Amint megtalálja azokat a rekordokat, amelyek legalább kétszer szerepelnek a B oszlopban, azokat az Ön által választott színárnyalattal színezi ki:

    Egy másik lehetőség a duplikált sorok kiemelése lenne. Egyszerűen állítsa be a tartományt, amelyre a szabályt alkalmazni szeretné:

    Tipp: Miután a Google Sheetsben kiemelte a duplikátumokat, szín szerint szűrheti az adatokat:

    • Egyrészt szűrheti az oszlopot úgy, hogy csak a fehér kitöltőszínnel rendelkező cellák maradjanak láthatóak. Így a duplikátumokat törli a nézetből:

    • Másrészt, csak a színes cellák maradhatnak láthatóak:

    majd válassza ki ezeket a sorokat, és törölje ezeket a duplikátumokat a Google Sheetsből teljesen:

    Tipp: Látogasson el erre a bemutatóra, ahol további képleteket talál a duplikációk kiemeléséhez a Google Sheetsben.

    Formulamentes módszerek a duplikátumok keresésére és eltávolítására a Google Sheetsben

    A képletek és a feltételes formázás jók, de vannak más eszközök is, amelyek segítenek a duplikációk megtalálásában. Ezek közül kettőt éppen erre a problémára terveztek.

    Duplikátumok azonosítása Pivot táblázat a Google Sheets számára

    A Pivot táblázatot a táblázatokban arra használják, hogy az adatokat megfordítsa, és a táblázatokat könnyen olvashatóvá és érthetővé tegye. Ez egyfajta alternatív módja az adatkészletek bemutatásának.

    Ami itt a legvonzóbb, hogy az eredeti adatai nem változnak. A Pivot tábla referenciaként használja, és az eredményt egy külön lapon adja meg.

    Ez az eredmény egyébként dinamikusan változik a beállításoktól függően, amelyeket menet közben is módosíthat.

    Ismételt rekordok esetén a pivot-táblázat segít a duplikátumok számolásában és eltávolításában a Google Sheetsben.

    Példa 1. Hogyan számolja a Pivot tábla a duplikátumokat a Google Sheetsben?

    1. Menjen a Beszúrás> Pivot táblázat , adja meg az adattartományt és a pivot-tábla helyét:

    2. A pivot tábla szerkesztőjében adjunk hozzá egy oszlopot a duplikátumokkal ( Név az én példámban) a Sorok és a Értékek .

      Ha az oszlop numerikus rekordokat tartalmaz, válassza a COUNT-ot összefoglaló függvényként a következőhöz Értékek a duplikátumok számolásához a Google Sheetsben. Ha van szöveg, válassza helyette a COUNTA lehetőséget:

    Ha mindent helyesen csinálsz, akkor a pivot táblázatban minden egyes elem a listádról megjelenik, és megkapod, hogy hányszor szerepelnek ott:

    Mint látható, ez a pivot-táblázat azt mutatja, hogy csak a szeder és a cseresznye fordul elő újra az adathalmazomban.

    Példa 2. Duplikátumok eltávolítása a Google Sheetsben Pivot tábla segítségével

    A duplikátumok törléséhez a pivot-táblázat segítségével hozzá kell adnia a többi oszlopot (példámban 2), mint Sorok a pivot táblához:

    Látni fogja a táblázatot a duplikált sorokkal, de a számok megmondják, hogy melyikük fordul elő újra az eredeti adathalmazban:

    Tipp: Ha már nincs szüksége a számokra, egyszerűen zárja be a Értékek mezőt a Pivot táblázatban a jobb felső sarokban lévő megfelelő ikon megnyomásával:

    Végül így fog kinézni a pivot táblázata:

    Nincsenek duplikációk, nincsenek extra számítások, csak egyedi rekordok vannak egy táblázatba rendezve.

    Duplikátumok eltávolítása - standard adattisztító eszköz

    A Google Sheets rendelkezik a duplikátumok eltávolítására szolgáló kis, egyszerű és nem kényes eszközükkel. Működése után hívják és a Adatok> Adattisztítás tab:

    Itt nem találsz semmi különöset, minden szuper egyszerű. Csak megadod, hogy a táblázatodnak van-e fejléc sora, és kiválasztod azokat az oszlopokat, amelyeket duplikátumokra kell ellenőrizni:

    Ha készen áll, kattintson a nagy zöld gombra, és az eszköz megkeresi és törli a duplikált sorokat a Google Sheets táblázatából, és megmondja, hány egyedi sor marad:

    Sajnos, ez az eszköz csak ennyire képes. Minden alkalommal, amikor duplikátumokkal kell foglalkoznia, manuálisan kell futtatnia ezt a segédprogramot. Továbbá, ez minden, amit csinál: törli a duplikátumokat. Nincs lehetőség arra, hogy másképp dolgozza fel őket.

    Szerencsére mindezeket a hátrányokat megoldotta az Ablebits Remove Duplicates add-on for Google Sheets.

    Duplikátumok eltávolítása bővítmény a Google Sheets számára

    A Remove Duplicates bővítmény egy igazi játékváltó. Kezdetnek 5 különböző eszközt tartalmaz a Google Sheetsben lévő duplikátumok azonosítására. De ma nézzük meg a következőket. Duplikált vagy egyedi sorok keresése .

    Egyedül 7 különböző módot kínál a duplikációk kezelésére, és nem csak felgyorsítja az egész folyamatot, hanem teljesen automatizálni is tudja.

    Miután telepítette a Google Workspace Marketplace-ről, megjelenik a Bővítések :

    Mint a Google Sheets standard eszköze, ez is lehetővé teszi a tartomány és az oszlopok kiválasztását a feldolgozáshoz, de elegánsabban :)

    Minden beállítás 4 felhasználóbarát lépésre van osztva, ahol ki kell választania:

    1. a tartomány
    2. mit kell találni: duplikátumok vagy unikumok
    3. az oszlopok
    4. mi a teendő a talált rekordokkal

    Különleges képeket is megnézhet, így mindig világos, hogy mit kell tennie:

    Mi értelme, gondolhatod? Nos, a standard eszközzel ellentétben ez a bővítmény sokkal többet kínál:

    • duplikátumok keresése valamint egyedi példányok, beleértve vagy kizárva az 1. előfordulást
    • kiemelni duplikátumok a Google Sheetsben
    • státusz oszlop hozzáadása
    • másolás/mozgatás az eredmények egy új lapra/táblázatra vagy a táblázatkezelő táblázatokon belül egy adott helyen
    • tiszta talált értékek sejtekből
    • duplikált sorok törlése a Google Sheetből teljesen

    Csak válassza ki azt a módot, amelyik a legjobban megfelel Önnek, válassza ki az opciókat, és hagyja, hogy a bővítmény elvégezze a munkát.

    Tipp: Lehet, hogy ez a videó már egy kicsit régi, de tökéletesen bemutatja, milyen egyszerű a munka a kiegészítővel:

    A bővítmény automatikusan eltávolítja a duplikátumokat

    A hab a tortán, hogy mind a 4 lépés összes beállítását elmentheti forgatókönyvekbe, és később egy kattintással bármelyik asztalon futtathatja őket.

    Vagy - ami még jobb - ütemezze be ezeket a forgatókönyveket úgy, hogy naponta egy bizonyos időpontban automatikusan elinduljanak:

    Az Ön jelenléte nem szükséges, és a bővítmény automatikusan törli a duplikátumokat, még akkor is, ha a fájl le van zárva, vagy Ön offline van. Ha többet szeretne megtudni róla, kérjük, látogasson el erre a részletes bemutatóra, és nézze meg ezt a demóvideót:

    Arra bátorítom Önt, hogy telepítse a kiegészítőt a Google Sheets áruházból, és böngésszen benne. Meglátja majd, hogy milyen könnyű megtalálni, eltávolítani és kiemelni a duplikátumokat képletek nélkül, néhány kattintással.

    Táblázat képlet példákkal

    Duplikátumok keresése és eltávolítása a Google Sheetsben - képletpéldák (készítsen egy másolatot a táblázatról)

    Michael Brown elkötelezett technológiai rajongó, aki szenvedélyesen egyszerűsíti a bonyolult folyamatokat szoftvereszközök segítségével. A technológiai iparban szerzett több mint egy évtizedes tapasztalatával a Microsoft Excel és az Outlook, valamint a Google Táblázatok és a Dokumentumok területén fejlesztette tudását. Michael blogja célja, hogy megossza tudását és szakértelmét másokkal, könnyen követhető tippeket és oktatóanyagokat adva a termelékenység és a hatékonyság javításához. Akár tapasztalt szakember, akár kezdő, Michael blogja értékes betekintést és gyakorlati tanácsokat kínál, amelyek segítségével a legtöbbet hozhatja ki ezekből az alapvető szoftvereszközökből.