7 moduri simple de a găsi și elimina duplicatele în Google Sheets

  • Imparte Asta
Michael Brown

Căutați o modalitate simplă de a găsi duplicate în Google Sheets? Ce ziceți de 7 moduri? :) Este tot ce aveți nevoie pentru numeroase cazuri de utilizare :) Vă voi arăta cum să utilizați instrumente fără formule (fără codificare - promit!), formatare condiționată și câteva funcții simple pentru fanii avizi de formule.

Indiferent cât de des utilizați Google Sheets, există șanse să aveți de-a face cu date duplicate. Astfel de înregistrări pot apărea într-o coloană sau pot ocupa rânduri întregi.

Până la sfârșitul acestui articol, veți ști tot ce aveți nevoie pentru a elimina duplicatele, a le număra, a le evidenția și a le identifica cu un statut. Voi arăta câteva exemple de formule și voi împărtăși diferite instrumente. Unul dintre ele chiar găsește și elimină duplicatele din Google Sheets în funcție de program! Formatarea condiționată va fi, de asemenea, utilă.

Alege-ți otrava și hai să mergem :)

    Cum să găsiți duplicate în Google Sheets folosind formule

    În mod tradițional, voi începe cu formulele. Principalul lor avantaj este că tabelul original rămâne intact. Formulele identifică duplicatele și returnează rezultatul într-un alt loc din Google Sheets. Și în funcție de rezultatul dorit, diferite funcții fac treaba.

    Cum să eliminați duplicatele în Google Sheets utilizând funcția UNIQUE

    Funcția UNIQUE vă scanează datele, elimină dublurile și returnează exact ceea ce îi spune numele - valori/ rânduri unice.

    Iată un mic exemplu de tabel în care se repetă diferite rânduri:

    Exemplul 1. Ștergeți rândurile duplicate, păstrați primele apariții

    Pe de o parte, este posibil să aveți nevoie să eliminați toate rândurile duplicate din acest tabel Google Sheets și să păstrați doar primele intrări.

    Pentru a face acest lucru, introduceți intervalul pentru datele dvs. în UNIQUE:

    =UNIQUE(A1:C10)

    Această mică formulă returnează toate rândurile unice și toate primele apariții, ignorând a doua, a treia, etc.

    Exemplul 2. Ștergeți toate rândurile duplicate, chiar și primele apariții

    Pe de altă parte, este posibil să doriți să obțineți doar rândurile unice "reale". Prin "reale" înțeleg cele care nu se repetă - nici măcar o dată. Deci, ce faceți?

    Să ne oprim puțin și să analizăm toate argumentele UNIQUE:

    UNIQUE(range,[by_column],[exactly_once])
    • gama - sunt datele pe care doriți să le procesați.
    • [by_column] - indică dacă se verifică dacă se verifică dacă există rânduri sau celule care se potrivesc complet în coloane individuale. Dacă este vorba de coloane, introduceți TRUE. Dacă este vorba de rânduri, introduceți FALSE sau ignorați argumentul.
    • [exact_o dată] - acesta îi spune funcției să șteargă nu numai dublurile din Google Sheets, ci și primele înregistrări ale acestora. Sau, cu alte cuvinte, să returneze numai înregistrări fără niciun fel de dubluri. Pentru aceasta, se pune TRUE, altfel FALSE sau se sare peste argument.

    Acest ultim argument este pârghia dumneavoastră aici.

    Prin urmare, pentru a elimina complet toate rândurile duplicate din Google Sheets (împreună cu primul rând), săriți peste al doilea argument din formulă, dar adăugați-l pe al treilea:

    =UNIQUE(A1:C10,,TRUE)

    Vedeți cum tabelul din dreapta este mult mai scurt? Acest lucru se datorează faptului că UNIQUE a găsit și a eliminat rândurile duplicate, precum și primele apariții ale acestora din tabelul original din Google Sheets. Acum rămân doar rândurile unice.

    Identificarea duplicatelor utilizând funcția COUNTIF din Google Sheets

    Dacă ocuparea spațiului cu un alt set de date nu face parte din planul dvs., puteți număra duplicatele în Google Sheets în schimb (și apoi să le ștergeți manual). Va fi nevoie doar de o coloană suplimentară, iar funcția COUNTIF vă va ajuta.

    Sfat. Dacă nu sunteți familiarizat cu această funcție, avem o întreagă postare pe blog despre ea, nu ezitați să aruncați o privire.

    Exemplul 1. Obțineți numărul total de apariții

    Să identificăm toate duplicatele cu prima lor apariție în Google Sheets și să verificăm numărul total al fiecărei boabe care apare în listă. Voi folosi următoarea formulă în D2 și apoi o voi copia pe coloană:

    =COUNTIF($B$2:$B$10,$B2)

    Sfat: Pentru ca această formulă să gestioneze automat fiecare rând din coloană, înfășurați totul în ArrayFormula și modificați $B2 la $B2:$B10 (întreaga coloană). Astfel, nu va fi nevoie să copiați formula în jos:

    Dacă ulterior filtrați acest set de date în funcție de numere, veți putea vedea și chiar elimina manual toate rândurile duplicate în exces din tabelul Google Sheets:

    Exemplul 2. Găsiți și enumerați toate duplicatele în Google Sheets

    În cazul în care numărul total de apariții nu este obiectivul dvs. și ați prefera să știți dacă această înregistrare particulară din acest rând este prima, a doua, etc. intrare, va trebui să faceți o mică ajustare a formulei.

    Modificarea intervalului din întreaga coloană ($B$2:$B$10) la o singură celulă ($B$2:$B2) .

    Notă: Fiți atenți la utilizarea referințelor absolute.

    =COUNTIF($B$2:$B2,$B2)

    De data aceasta, ștergerea oricărui sau a tuturor duplicatelor din acest tabel Google Sheets va fi chiar mai ușoară, deoarece veți putea ascunde toate intrările, cu excepția celor din primul rând:

    Exemplul 3. Numărați rândurile duplicate în Google Sheets

    În timp ce formulele de mai sus numără duplicatele dintr-o singură coloană Google Sheets, este posibil să aveți nevoie de o formulă care să ia în considerare toate coloanele și astfel să identifice rândurile duplicate.

    În acest caz, COUNTIFS se va potrivi mai bine. Trebuie doar să enumerați fiecare coloană a tabelului dvs. împreună cu criteriile corespunzătoare:

    =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    Sfat. Există o altă modalitate de calculare a duplicatelor - fără formule. Aceasta implică un tabel pivot și o descriu în continuare.

    Marcați dublurile într-o coloană de stare - Funcția IF

    Uneori, cifrele nu sunt suficiente. Uneori este mai bine să găsiți dublurile și să le marcați într-o coloană de stare. Din nou: filtrarea ulterioară a datelor din Google Sheets după această coloană vă va permite să eliminați acele dubluri de care nu mai aveți nevoie.

    Exemplul 1. Găsiți duplicate în 1 coloană Google Sheets

    Pentru această sarcină, veți avea nevoie de aceeași funcție COUNTIF, dar de data aceasta înfășurată în funcția IF. Exact așa:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate", "Unique")

    Să vedem ce se întâmplă în această formulă:

    1. Mai întâi, COUNTIF caută în întreaga coloană B boabele din B2. Odată găsite, le însumează.
    2. Apoi, IF verifică acest total, iar dacă este mai mare decât 1, spune Duplicat , în caz contrar, Unic .

    Bineînțeles, puteți obține formula pentru a returna propriile statusuri sau, de exemplu, pentru a găsi & identificați doar duplicatele în datele din Google Sheets:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate","")

    Sfat: De îndată ce găsiți aceste duplicate, puteți filtra tabelul după coloana de stare. În acest fel, puteți ascunde înregistrările repetate sau unice și chiar selecta rânduri întregi & ștergeți complet aceste duplicate din Google Sheets:

    Exemplul 2. Identificarea rândurilor duplicate

    În mod similar, puteți marca rândurile duplicate absolute - rânduri în care toate înregistrările din toate coloanele apar de mai multe ori în tabel:

    1. Începeți cu aceeași COUNTIFS de mai înainte - cea care scanează fiecare coloană pentru prima sa valoare și numără numai acele rânduri în care toate cele 3 înregistrări din toate cele 3 coloane se repetă:

      =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    2. Apoi includeți formula respectivă în IF. Aceasta verifică numărul de rânduri repetate și, dacă acesta depășește 1, formula numește rândul ca fiind duplicat:

      =IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate","")

    Acum există doar 2 dubluri, deoarece, chiar dacă cireașa apare de 3 ori într-un tabel, doar două dintre ele au toate cele 3 coloane identice.

    Exemplul 3. Găsiți rândurile duplicate, ignorați primele intrări

    Pentru a ignora prima apariție și a o marca doar pe a doua și pe celelalte, faceți referire la primele celule ale tabelului în loc de toate coloanele:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicate","")

    Sfat: Dacă utilizați Microsoft Excel, următoarele exemple ar putea fi utile: Cum să găsiți duplicate în Excel.

    Identificarea și evidențierea duplicatelor în Google Sheets cu reguli de formatare condiționată

    Există posibilitatea de a procesa datele repetate în așa fel încât o singură privire aruncată în tabel vă va permite să înțelegeți clar dacă este vorba de o înregistrare dublă.

    Mă refer la evidențierea duplicatelor în Google Sheets. Formatarea condiționată vă va ajuta în acest sens.

    Sfat: Nu ați încercat niciodată formatarea condiționată? Nu vă faceți griji, v-am explicat cum funcționează în acest articol.

    Iată ce trebuie să faceți:

    1. Deschideți setările de formatare condiționată: Format> Formatare condiționată .
    2. Asigurați-vă că Aplicați la gamă conține intervalul în care doriți să evidențiați dublurile. Pentru acest exemplu, permiteți-mi să încep cu coloana B.
    3. În Reguli de format alege Formula personalizată este și introduceți același COUNTIF pe care l-am introdus mai sus:

      =COUNTIF($B$2:$B$10,$B2)>1

    Odată ce localizează înregistrările care apar de cel puțin două ori în coloana B, acestea vor fi colorate cu o nuanță la alegere:

    O altă opțiune ar fi evidențierea rândurilor duplicate. Pur și simplu ajustați intervalul la care să aplicați regula:

    Sfat: După ce ați evidențiat duplicatele din Google Sheets, puteți filtra datele în funcție de culoare:

    • Pe de o parte, puteți filtra coloana astfel încât să rămână vizibile numai celulele cu culoarea albă de umplere. În acest fel, veți șterge duplicatele din vizualizare:

    • Pe de altă parte, puteți păstra vizibile doar celulele colorate:

    și apoi selectați aceste rânduri și ștergeți complet aceste duplicate din Google Sheets:

    Sfat. Vizitați acest tutorial pentru mai multe formule de evidențiere a duplicatelor în Google Sheets.

    Modalități fără formule pentru a găsi și elimina duplicatele în Google Sheets

    Formulele și formatarea condiționată sunt bune, dar există și alte instrumente care vă vor ajuta să găsiți duplicate. Două dintre ele au fost concepute pentru această problemă specială.

    Identificați duplicatele cu tabelul pivot pentru Google Sheets

    Tabelul pivot este utilizat în foile de calcul pentru a vă întoarce datele și a face tabelele ușor de citit și de înțeles. Este un fel de modalitate alternativă de prezentare a seturilor de date.

    Ceea ce este cel mai atractiv aici este faptul că datele originale nu se schimbă. Tabelul pivot le folosește ca referință și oferă rezultatul într-o filă separată.

    Apropo, acest rezultat se va schimba în mod dinamic în funcție de setările pe care le puteți modifica în timp ce vă deplasați.

    În cazul înregistrărilor repetate, tabelul pivot vă va ajuta să numărați și să eliminați dublurile în Google Sheets.

    Exemplul 1. Cum se numără duplicatele în tabelul pivot în Google Sheets

    1. Mergeți la Inserare> Tabel pivotant , specificați intervalul de date și un loc pentru tabelul pivot:

    2. În editorul tabelului pivot, adăugați o coloană cu duplicatele dvs. ( Nume în exemplul meu) pentru Rânduri și pentru Valori .

      Dacă coloana dvs. conține înregistrări numerice, alegeți COUNT ca funcție de rezumat pentru Valori pentru a număra dublurile în Google Sheets. Dacă aveți text, selectați COUNTA în loc de COUNTA:

    Dacă faceți totul corect, tabelul pivot va prezenta fiecare element din lista dvs. și vă va indica numărul de ori de câte ori apare acolo:

    După cum puteți vedea, acest tabel pivot arată că doar blackberry și cherry reapar în setul meu de date.

    Exemplul 2. Eliminarea duplicatelor în Google Sheets folosind tabelul pivotant

    Pentru a șterge duplicatele folosind tabelul pivot, trebuie să adăugați restul coloanelor (2 în exemplul meu) ca Rânduri pentru tabelul pivot:

    Veți vedea tabelul cu rânduri duplicate, dar numerele vă vor spune care dintre ele se repetă în setul de date original:

    Sfat: Dacă nu mai aveți nevoie de numere, închideți pur și simplu fereastra Valori din tabelul pivotant, apăsând pictograma corespunzătoare din colțul său din dreapta sus:

    Așa va arăta tabelul pivot în cele din urmă:

    Nu există dubluri, nu există calcule suplimentare, ci doar înregistrări unice sortate într-un singur tabel.

    Eliminarea duplicatelor - instrument standard de curățare a datelor

    Google Sheets dispun de instrumentul lor mic, simplu și fără complicații pentru a elimina duplicatele. Se numește după operațiunea sa și se află în cadrul Date> Curățarea datelor tab:

    Nu veți găsi nimic sofisticat aici, totul este foarte simplu. Trebuie doar să specificați dacă tabelul dvs. are un rând de antet și să selectați toate acele coloane care trebuie verificate pentru duplicate:

    După ce sunteți gata, faceți clic pe butonul verde mare, iar instrumentul va găsi și va șterge rândurile duplicate din tabelul Google Sheets și vă va spune câte rânduri unice au rămas:

    Din păcate, până aici merge acest instrument. De fiecare dată când va trebui să vă ocupați de duplicate, va trebui să rulați manual acest utilitar. De asemenea, asta este tot ceea ce face: șterge duplicatele. Nu există nicio opțiune pentru a le procesa diferit.

    Din fericire, toate aceste dezavantaje au fost rezolvate în add-on-ul Remove Duplicates pentru Google Sheets de la Ablebits.

    Eliminarea duplicatelor add-on pentru Google Sheets

    Add-on-ul Remove Duplicates este un adevărat schimbător de joc. Pentru început, conține 5 instrumente diferite pentru a identifica duplicatele în Google Sheets. Dar pentru astăzi să aruncăm o privire la Găsiți rânduri duplicate sau unice .

    Acesta oferă singur 7 moduri diferite de a gestiona duplicatele și nu doar accelerează întregul proces, ci știe cum să îl automatizeze în întregime.

    După ce îl instalați din Google Workspace Marketplace, acesta va apărea în secțiunea Extensii :

    Ca și instrumentul standard Google Sheets, vă permite, de asemenea, să selectați intervalul și coloanele de procesat, dar mai elegant :)

    Toate setările sunt împărțite în 4 pași ușor de utilizat, în care trebuie să selectați:

    1. gama
    2. ce să găsești: dubluri sau unici
    3. coloanele
    4. ce se face cu înregistrările găsite

    Puteți chiar să aruncați o privire la imaginile speciale, astfel încât să vă fie întotdeauna clar ce aveți de făcut:

    Poate vă gândiți că, spre deosebire de instrumentul standard, acest add-on oferă mult mai multe:

    • găsiți duplicate precum și unici, inclusiv sau excluzând primele apariții
    • evidențiați duplicate în Google Sheets
    • adăugarea unei coloane de stare
    • copiere/ mutare rezultatele la o nouă foaie/foaie de parcurs sau în orice loc specific din foaia de calcul
    • clar găsit valori din celule
    • ștergerea rândurilor duplicate din foaia Google Sheet complet

    Alegeți doar modul care vi se potrivește cel mai bine, selectați opțiunile și lăsați add-on-ul să facă treaba.

    Sfat. Acest videoclip poate fi un pic mai vechi, dar demonstrează perfect cât de ușor este să lucrați cu acest add-on:

    Faceți ca add-on-ul să elimine automat duplicatele

    Ca o cireașă de pe tort, veți putea salva toate setările din toate cele 4 etape în scenarii și le veți putea rula ulterior pe orice masă cu un simplu clic.

    Sau - și mai bine - programați aceste scenarii pentru a porni automat la o anumită oră în fiecare zi:

    Prezența dvs. nu este necesară, iar add-on-ul va șterge automat duplicatele chiar și atunci când fișierul este închis sau sunteți offline. Pentru a afla mai multe despre el, vă rugăm să vizitați acest tutorial detaliat și să urmăriți acest videoclip demonstrativ:

    Vă încurajez să instalați add-on-ul din magazinul Google Sheets și să vă familiarizați cu el. Veți vedea cât de ușor este să găsiți, să eliminați și să evidențiați duplicatele fără formule în doar câteva clicuri.

    Foaie de calcul cu exemple de formule

    Găsiți & eliminați duplicatele în Google Sheets - exemple de formule (faceți o copie a foii de calcul)

    Michael Brown este un pasionat de tehnologie dedicat, cu o pasiune pentru simplificarea proceselor complexe folosind instrumente software. Cu mai mult de un deceniu de experiență în industria tehnologiei, el și-a perfecționat abilitățile în Microsoft Excel și Outlook, precum și în Google Sheets și Docs. Blogul lui Michael este dedicat împărtășirii cunoștințelor și experienței sale cu alții, oferind sfaturi și tutoriale ușor de urmat pentru îmbunătățirea productivității și eficienței. Indiferent dacă sunteți un profesionist experimentat sau un începător, blogul lui Michael oferă informații valoroase și sfaturi practice pentru a profita la maximum de aceste instrumente software esențiale.