Indholdsfortegnelse
Leder du efter en enkel måde at finde dubletter i Google Sheets på? Hvad med 7 måder? :) Det er alt, hvad du behøver til mange anvendelsestilfælde :) Jeg vil vise dig, hvordan du bruger formelfrie værktøjer (ingen kodning - det lover jeg!), betinget formatering og et par nemme funktioner for entusiaster af formler.
Uanset hvor ofte du bruger Google Sheets, er der stor sandsynlighed for, at du skal håndtere duplikerede data. Sådanne poster kan forekomme i en kolonne eller fylde hele rækker.
Ved slutningen af denne artikel vil du vide alt, hvad du behøver for at fjerne dubletter, tælle dem, fremhæve og identificere dem med en status. Jeg vil vise nogle eksempler på formler og dele forskellige værktøjer. Et af dem finder og fjerner endda dubletter i dine Google Sheets efter planen! Betinget formatering vil også være praktisk.
Bare vælg din gift og lad os komme i gang :)
Sådan finder du dubletter i Google Sheets ved hjælp af formler
Traditionelt set starter jeg med formler. Deres største fordel er, at din oprindelige tabel forbliver intakt. Formlerne identificerer dubletter og returnerer resultatet til et andet sted i dit Google Sheets. Og baseret på det ønskede resultat gør forskellige funktioner tricket.
Sådan fjernes dubletter i Google Sheets ved hjælp af funktionen UNIQUE
Funktionen UNIQUE scanner dine data, sletter dubletter og returnerer præcis det, som navnet siger - unikke værdier/rækker.
Her er et lille eksempel på en tabel, hvor forskellige rækker går igen:
Eksempel 1. Slet dobbeltrækker, behold de første forekomster
På den ene side kan du have brug for at fjerne alle dubletter fra denne Google Sheets-tabel og kun beholde de første poster.
For at gøre det skal du blot indtaste intervallet for dine data i UNIQUE:
=UNIK(A1:C10)
Denne lille formel returnerer alle unikke rækker og alle 1. forekomster og ignorerer 2., 3. osv.
Eksempel 2. Slet alle duplikerede rækker, selv de første forekomster
På den anden side vil du måske kun have de "rigtige" unikke rækker. Med "rigtige" mener jeg dem, der ikke forekommer igen - ikke en eneste gang. Hvad gør du så?
Lad os tage et øjeblik og gennemgå alle UNIKKE argumenter:
UNIQUE(range,[by_column],[exactly_once])- rækkevidde - er de data, du ønsker at behandle.
- [by_column] - angiver, om du kontrollerer, om der er fuldstændigt matchende rækker eller celler i individuelle kolonner. Hvis det er kolonner, skal du angive TRUE. Hvis det er rækker, skal du angive FALSE eller bare springe argumentet over.
- [exactly_once] - denne fortæller funktionen, at den ikke kun skal slette dubletter i Google Sheets, men også deres 1. poster. Eller med andre ord, at den kun skal returnere poster uden dubletter overhovedet. For at gøre det, skal du angive TRUE, ellers FALSE eller springe argumentet over.
Det sidste argument er din løftestang her.
Hvis du vil fjerne alle dubletrækker fuldstændigt fra dit Google Sheets (sammen med deres 1.), skal du springe det andet argument i formlen over, men tilføje det tredje:
=UNIK(A1:C10,,SAND)
Kan du se, at tabellen til højre er meget kortere? Det skyldes, at UNIQUE har fundet og fjernet dubletter og deres første forekomst fra den oprindelige Google Sheets-tabelle. Nu er der kun unikke rækker tilbage.
Identificer dubletter ved hjælp af Google Sheets COUNTIF-funktionen
Hvis det ikke er en del af din plan at optage plads med et andet datasæt, kan du tælle dubletter i Google Sheets i stedet (og derefter slette dem manuelt). Det kræver kun én ekstra kolonne, og funktionen COUNTIF hjælper dig.
Tip. Hvis du ikke er bekendt med denne funktion, har vi et helt blogindlæg om den, du er velkommen til at kigge på det.
Eksempel 1. Få det samlede antal forekomster
Lad os identificere alle dubletter med deres første forekomst i Google Sheets og kontrollere det samlede antal af hvert bær på listen. Jeg vil bruge følgende formel i D2 og derefter kopiere den ned i kolonnen:
=COUNTIF($B$2:$B$10,$B2)
Tip. Hvis du vil have formlen til at håndtere hver række i kolonnen automatisk, skal du pakke det hele ind i ArrayFormula og ændre $B2 til $B2:$B10 (hele kolonnen). Du behøver således ikke at kopiere formlen ned:
Hvis du efterfølgende filtrerer dette datasæt efter tallene, kan du se og endda manuelt fjerne alle overskydende dubletter fra din Google Sheets-tabelle:
Eksempel 2. Find og opregne alle dubletter i Google Sheets
Hvis det samlede antal forekomster ikke er dit mål, og du hellere vil vide, om denne bestemte post i denne bestemte række er den første, anden osv. post, skal du foretage en lille justering af formlen.
Ændre intervallet fra hele kolonnen ($B$2:$B$10) til kun én celle ($B$2:$B2) .
Bemærk. Vær opmærksom på brugen af absolutte referencer.
=COUNTIF($B$2:$B2,$B2)
Denne gang vil det være endnu nemmere at slette alle dubletter fra denne Google Sheets-tabel, fordi du kan skjule alle poster undtagen de første:
Eksempel 3. Tæl dubletter i Google Sheets
Mens ovenstående formler kun tæller dubletter i én Google Sheets-kolonne, kan du have brug for en formel, der tager højde for alle kolonner og dermed identificerer dubletter i alle rækker.
I dette tilfælde vil COUNTIFS være bedre egnet. Du skal blot opregne hver kolonne i din tabel sammen med de tilsvarende kriterier:
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
Tip. Der findes en anden måde at beregne dubletter på - uden formler. Det involverer en Pivot tabel, og jeg beskriver den yderligere.
Markér dubletter i en statuskolonne - IF-funktion
Nogle gange er tal bare ikke nok. Nogle gange er det bedre at finde dubletter og markere dem i en statuskolonne. Igen: Ved at filtrere dine Google Sheets-data efter denne kolonne senere kan du fjerne de dubletter, du ikke længere har brug for.
Eksempel 1. Find dubletter i 1 Google Sheets-kolonne
Til denne opgave skal du bruge den samme COUNTIF-funktion, men denne gang pakket ind i IF-funktionen, som f.eks. således:
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplikat", "Unik")
Lad os se, hvad der sker i denne formel:
- Først søger COUNTIF i hele kolonne B efter bæret fra B2. Når det er fundet, summeres det.
- Derefter kontrollerer IF denne sum, og hvis den er større end 1, siger den Duplikat , ellers, Unik .
Du kan naturligvis få formlen til at returnere dine egne status, eller f.eks. finde & identificer kun dubletter i dine Google Sheets-data:
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplikat",""")
Tip. Så snart du finder disse dubletter, kan du filtrere tabellen efter statuskolonnen. På denne måde kan du skjule gentagne eller unikke poster og endda vælge hele rækker & slet disse dubletter helt fra dit Google Sheets:
Eksempel 2. Identificering af dobbelte rækker
På samme måde kan du markere absolutte dubletrækker - rækker, hvor alle poster i alle kolonner optræder flere gange i tabellen:
- Start med den samme COUNTIFS som før - den, der scanner hver kolonne for dens første værdi og kun tæller de rækker, hvor alle 3 poster i alle 3 kolonner gentager sig selv:
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
- Derefter omslutter du formlen med IF. Den kontrollerer antallet af gentagne rækker, og hvis det overstiger 1, betegner formlen rækken som en dublet:
=IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplikat",""")
Der er nu kun 2 dupes, for selv om cherry forekommer 3 gange i en tabel, er der kun to af dem, hvor alle 3 kolonner er identiske.
Eksempel 3. Find dobbeltrækker, ignorer de første poster
Hvis du vil ignorere den første forekomst og kun markere den anden og de andre forekomster, skal du henvise til de første celler i tabellen i stedet for til hele kolonnerne:
=IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplikat",""")
Tip. Hvis du bruger Microsoft Excel, kan følgende eksempler være nyttige: Sådan finder du du dubletter i Excel.
Identificer og fremhæv dubletter i Google Sheets med betingede formateringsregler
Der er mulighed for at behandle gentagne data på en sådan måde, at et enkelt blik på din tabel vil give dig en klar forståelse af, om der er tale om en dupe record.
Jeg taler om at fremhæve dubletter i Google Sheets. Betinget formatering vil hjælpe dig med dette.
Tip. Har du aldrig prøvet betinget formatering? Bare rolig, vi har forklaret, hvordan det fungerer i denne artikel.
Her er, hvad du skal gøre:
- Åbn indstillingerne for betinget formatering: Format> Betinget formatering .
- Sørg for, at den Ansøg til sortiment feltet indeholder det område, hvor du ønsker at fremhæve dubletter. I dette eksempel starter jeg med kolonne B.
- På Formatregler vælg Den brugerdefinerede formel er og indtast den samme COUNTIF som ovenfor:
=COUNTIF($B$2:$B$10,$B2)>1
Når den finder poster, der optræder mindst to gange i kolonne B, farves de med en farve efter eget valg:
En anden mulighed ville være at fremhæve dubletrækker. Du skal blot justere det område, som reglen skal anvendes på:
Tip. Når du markerer dubletter i dit Google Sheets, kan du filtrere dataene efter farve:
- På den ene side kan du filtrere kolonnen, så kun celler med den hvide fyldfarve forbliver synlige. På denne måde sletter du dubletter fra visningen:
- På den anden side kan du kun lade farvede celler være synlige:
og vælg derefter disse rækker, og slet disse dubletter fuldstændigt fra dit Google Sheets:
Tip. Besøg denne vejledning for at få flere formler til at fremhæve dubletter i Google Sheets.
Formelfrie måder at finde og fjerne dubletter i Google Sheets på
Formler og betinget formatering er gode, men der er andre værktøjer, der kan hjælpe dig med at finde dubletter. To af dem er udviklet til netop dette problem.
Identificer dubletter med pivottabel til Google Sheets
Pivottabeller bruges i regneark til at vende dine data og gøre dine tabeller nemme at læse & amp; forstå. Det er en slags alternativ måde at præsentere dine datasæt på.
Det mest attraktive her er, at dine oprindelige data ikke ændres. Pivottabellen bruger dem som reference og giver resultatet i en separat fane.
Dette resultat ændrer sig i øvrigt dynamisk afhængigt af de indstillinger, du kan justere undervejs.
Hvis der er tale om gentagne poster, hjælper pivottabellen dig med at tælle og fjerne dubletter i Google Sheets.
Eksempel 1. Hvordan en pivottabel tæller dubletter i Google Sheets
- Gå til Indsæt> Pivottabel , angiv dit dataramme og et sted for pivottabellen:
- Tilføj en kolonne med dine dubletter i pivottabellen editor ( Navn i mit eksempel) for Rækker og for Værdier .
Hvis kolonnen indeholder numeriske poster, skal du vælge COUNT som en oversigtsfunktion for Værdier for at tælle dubletter i Google Sheets. Hvis du har tekst, skal du vælge COUNTA i stedet:
Hvis du gør alt korrekt, vil pivottabellen indeholde hvert element fra din liste og vise, hvor mange gange det optræder på listen:
Som du kan se, viser denne pivottabel, at det kun er brombær og kirsebær, der forekommer igen i mit datasæt.
Eksempel 2. Fjern dubletter i Google Sheets ved hjælp af pivottabel
For at slette dubletter ved hjælp af pivottabellen skal du tilføje resten af dine kolonner (2 i mit eksempel) som Rækker til din pivottabel:
Du vil se tabellen med dublerede rækker, men numre vil fortælle, hvilke af dem der går igen i det oprindelige datasæt:
Tip. Hvis du ikke længere har brug for tallene, skal du blot lukke Værdier boksen i Pivot-tabellen ved at trykke på det tilsvarende ikon i øverste højre hjørne:
Sådan vil din pivottabel i sidste ende se ud:
Der er ingen dubletter, ingen ekstra beregninger, men blot unikke poster sorteret i én tabel.
Fjern dubletter - standard værktøj til oprydning af data
Google Sheets har deres lille, enkle og ubesværet værktøj til at fjerne dubletter. Det hedder efter sin funktion og ligger under Data> Oprydning af data fanebladet:
Du finder ikke noget smart her, alt er super ligetil. Du skal blot angive, om din tabel har en overskriftsrække, og vælge alle de kolonner, der skal kontrolleres for dubletter:
Når du er klar, skal du klikke på den store grønne knap, og værktøjet finder og sletter dublerede rækker fra din Google Sheets-tabelle og fortæller, hvor mange unikke rækker der er tilbage:
Desværre er dette værktøj ikke længere end det. Hver gang du skal håndtere dubletter, skal du køre dette værktøj manuelt. Det er også alt, hvad det gør: sletter dubletter. Der er ingen mulighed for at behandle dem anderledes.
Heldigvis er alle disse ulemper blevet løst i tilføjelsesprogrammet Remove Duplicates add-on for Google Sheets fra Ablebits.
Tilføjelse til Google Sheets: Fjern dubletter
Add-on'et Remove Duplicates er en ægte spilforandrer. Til at starte med indeholder det 5 forskellige værktøjer til at identificere dubletter i Google Sheets. Men i dag skal vi se på Find dubletter eller unikke rækker .
Den tilbyder alene 7 forskellige måder at håndtere dubletter på, og den fremskynder ikke bare hele processen, den kan automatisere den helt.
Når du har installeret det fra Google Workspace Marketplace, vises det under Udvidelser :
Som standardværktøjet i Google Sheets kan du også vælge det område og de kolonner, der skal behandles, men det er mere elegant :)
Alle indstillinger er opdelt i 4 brugervenlige trin, hvor du skal vælge:
- området
- hvad du skal finde: dupes eller uniques
- kolonnerne
- hvad der skal ske med de fundne optegnelser
Du kan endda kigge på særlige billeder, så det altid er klart, hvad du skal gøre:
Hvad er pointen, tænker du måske, men i modsætning til standardværktøjet tilbyder denne tilføjelse meget mere:
- finde dubletter samt uniques, inklusive eller eksklusive 1. forekomster
- fremhæve dubletter i Google Sheets
- tilføje en statuskolonne
- kopiere/flytte resultaterne til et nyt ark/regneark eller et bestemt sted i dit regneark
- klar fundet værdier fra celler
- slette dubletter af rækker helt fra dit Google-ark
Du skal bare vælge den måde, der passer dig bedst, vælge indstillingerne og lade tilføjelsen gøre arbejdet.
Tip. Denne video er måske lidt gammel, men den viser perfekt, hvor nemt det er at arbejde med tilføjelsen:
Få tilføjelsen til at fjerne dubletter automatisk
Som prikken over i'et kan du gemme alle indstillingerne fra alle 4 trin i scenarier og køre dem senere på et hvilket som helst bord med et enkelt klik.
Eller - endnu bedre - planlæg disse scenarier til at starte automatisk på et bestemt tidspunkt hver dag:
Din tilstedeværelse er ikke nødvendig, og tilføjelsen sletter automatisk dubletter, selv når filen er lukket, eller du er offline. Hvis du vil vide mere om den, kan du besøge denne detaljerede vejledning og se denne demovideo:
Jeg opfordrer dig til at installere tilføjelsen fra Google Sheets-butikken og kigge lidt rundt i den. Du vil se, hvor nemt det er at finde, fjerne og fremhæve dubletter uden formler med få klik.
Regneark med eksempler på formler
Find & fjern dubletter i Google Sheets - eksempler på formler (lav en kopi af regnearket)