Spis treści
Szukasz prostego sposobu na znalezienie duplikatów w Google Sheets? A może 7 sposobów? :) To wszystko czego potrzebujesz do wielu zastosowań :) Pokażę Ci jak używać narzędzi bez formuł (bez kodowania - obiecuję!), formatowania warunkowego i kilku prostych funkcji dla zapalonych fanów formuł.
Niezależnie od tego, jak często korzystasz z Arkuszy Google, istnieje szansa, że masz do czynienia ze zduplikowanymi danymi. Takie rekordy mogą pojawiać się w jednej kolumnie lub zajmować całe wiersze.
Pod koniec tego artykułu, będziesz wiedział wszystko, czego potrzebujesz, aby usunąć duplikaty, policzyć je, podkreślić i zidentyfikować za pomocą statusu. Pokażę kilka przykładów formuł i podzielę się różnymi narzędziami. Jedno z nich nawet wyszukuje i usuwa duplikaty w Twoich Arkuszach Google zgodnie z harmonogramem! Formatowanie warunkowe również się przyda.
Po prostu wybierz swoją truciznę i niech się toczy :)
Jak znaleźć duplikaty w arkuszach Google przy użyciu formuł
Tradycyjnie zacznę od formuł. Ich główną zaletą jest to, że twoja oryginalna tabela pozostaje nienaruszona. Formuły identyfikują duplikaty i zwracają wynik do jakiegoś innego miejsca w twoich Arkuszach Google. I w oparciu o pożądany wynik, różne funkcje wykonują sztuczkę.
Jak usunąć duplikaty w Google Sheets za pomocą funkcji UNIQUE
Funkcja UNIQUE skanuje Twoje dane, usuwa duplikaty i zwraca dokładnie to, co mówi jej nazwa - unikalne wartości/wiersze.
Oto mała przykładowa tabela, w której powtarzają się różne wiersze:
Przykład 1. Usuń zduplikowane wiersze, zachowaj pierwsze wystąpienie
Z jednej strony możesz potrzebować usunąć wszystkie zduplikowane wiersze z tej tabeli Google Sheets i zachować tylko pierwsze wpisy.
Aby to zrobić, po prostu wprowadź zakres dla swoich danych wewnątrz UNIQUE:
=UNIQUE(A1:C10)
Ta mała formuła zwraca wszystkie unikalne wiersze i wszystkie pierwsze wystąpienia ignorując drugie, trzecie itd.
Przykład 2. Usuń wszystkie zduplikowane wiersze, nawet te, które występują po raz pierwszy
Z drugiej strony, możesz chcieć uzyskać tylko "prawdziwe" unikalne wiersze. Przez "prawdziwe" rozumiem te, które nie powtarzają się - nawet raz. Więc co robisz?
Poświęćmy chwilę i przejrzyjmy wszystkie argumenty UNIQUE:
UNIQUE(range,[by_column],[exactly_once])- zakres - to dane, które chcesz przetworzyć.
- [by_column] - określa, czy sprawdzane są całkowicie pasujące wiersze czy komórki w poszczególnych kolumnach. Jeśli są to kolumny, wpisz TRUE. Jeśli są to wiersze, wpisz FALSE lub po prostu pomiń ten argument.
- [exactly_once] - ten mówi funkcji, aby usunęła nie tylko duplikaty w Google Sheets, ale także ich 1. wpisy. Lub, innymi słowy, zwróć tylko rekordy bez jakichkolwiek duplikatów. W tym celu umieszczasz TRUE, w przeciwnym razie FALSE lub pomijasz argument.
Ten ostatni argument jest tutaj twoją dźwignią.
Stąd, aby całkowicie usunąć wszystkie zduplikowane wiersze z Twojego Google Sheets (wraz z ich 1.), pomiń drugi argument w formule, ale dodaj trzeci:
=UNIQUE(A1:C10,,TRUE)
Widzisz, że tabela po prawej stronie jest znacznie krótsza? To dlatego, że UNIQUE znalazł i usunął duplikaty wierszy, jak również ich pierwsze wystąpienia z oryginalnej tabeli Google Sheets. Teraz pozostały tylko unikalne wiersze.
Identyfikacja duplikatów przy użyciu funkcji COUNTIF z arkusza Google
Jeśli zajmowanie miejsca z innym zestawem danych nie jest częścią twojego planu, możesz zamiast tego policzyć duplikaty w Google Sheets (a następnie usunąć je ręcznie). Zajmie to tylko jedną dodatkową kolumnę, a funkcja COUNTIF pomoże.
Wskazówka. Jeśli nie jesteś zaznajomiony z tą funkcją, mamy cały wpis na blogu o tym, zapraszam do obejrzenia.
Przykład 1. Uzyskaj całkowitą liczbę wystąpień
Zidentyfikujmy wszystkie duplikaty z ich 1. wystąpieniem w Google Sheets i sprawdźmy całkowitą liczbę każdej jagody pojawiającej się na liście. Użyję następującej formuły w D2, a następnie skopiuję ją w dół kolumny:
=COUNTIF($B$2:$B$10,$B2)
Wskazówka. Aby formuła ta automatycznie obsługiwała każdy wiersz w kolumnie, należy zawinąć wszystko w ArrayFormula i zmienić $B2 do $B2:$B10 (cała kolumna). W ten sposób nie będziesz musiał kopiować formuły w dół:
Jeśli potem przefiltrujesz ten zbiór danych według liczb, będziesz mógł zobaczyć, a nawet ręcznie usunąć wszystkie nadmiarowe zduplikowane wiersze z tabeli Google Sheets:
Przykład 2. Znajdź i wylicz wszystkie duplikaty w Google Sheets
W przypadku, gdy całkowita liczba wystąpień nie jest twoim celem i wolisz wiedzieć, czy ten konkretny rekord w tym konkretnym wierszu jest 1, 2, itp wpisem, będziesz musiał dokonać niewielkiej korekty formuły.
Zmiana zakresu z całej kolumny ($B$2:$B$10) tylko do jednej komórki ($B$2:$B2) .
Uwaga, zwróć uwagę na stosowanie odwołań bezwzględnych.
=COUNTIF($B$2:$B2,$B2)
Tym razem usuwanie jakichkolwiek lub wszystkich duplikatów z tej tabeli Google Sheets będzie jeszcze łatwiejsze, ponieważ będziesz mógł ukryć wszystkie wpisy oprócz 1:
Przykład 3. Liczenie zduplikowanych wierszy w Google Sheets
Podczas gdy powyższe formuły zliczają duplikaty tylko w jednej kolumnie Google Sheets, możesz potrzebować formuły, która uwzględnia wszystkie kolumny, a tym samym identyfikuje zduplikowane wiersze.
W tym przypadku lepiej sprawdzi się COUNTIFS. Po prostu wymień każdą kolumnę swojej tabeli wraz z odpowiadającymi jej kryteriami:
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
Podpowiedź. Jest jeszcze jeden dostępny sposób obliczania duplikatów - bez formuł. Polega on na zastosowaniu tabeli przestawnej i opisuję go dalej.
Oznaczanie duplikatów w kolumnie statusu - funkcja IF
Czasami liczby po prostu nie wystarczają. Czasami lepiej jest znaleźć duplikaty i zaznaczyć je w kolumnie statusu. Ponownie: filtrowanie danych w Arkuszach Google według tej kolumny później pozwoli Ci usunąć te duplikaty, których już nie potrzebujesz.
Przykład 1. Znajdź duplikaty w 1 kolumnie Google Sheets
Do tego zadania potrzebna będzie ta sama funkcja COUNTIF, ale tym razem opakowana w funkcję IF. Tak po prostu:
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate", "Unique")
Zobaczmy, co się dzieje w tej formule:
- Najpierw COUNTIF przeszukuje całą kolumnę B w poszukiwaniu jagody z B2. Po znalezieniu sumuje je.
- Następnie IF sprawdza tę sumę i jeśli jest ona większa niż 1, mówi Duplikat , inaczej, Wyjątkowa .
Oczywiście, możesz uzyskać formułę, aby zwrócić własne statusy lub, na przykład, znaleźć & zidentyfikować tylko duplikaty w swoich danych Google Sheets:
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate",")
Wskazówka. Jak tylko znajdziesz te duplikaty, możesz filtrować tabelę według kolumny statusu. Ten sposób pozwala ukryć powtarzające się lub unikalne rekordy, a nawet wybrać całe wiersze & usuń te duplikaty z arkusza Google całkowicie:
Przykład 2. Identyfikacja zduplikowanych wierszy
Podobnie można zaznaczyć wiersze bezwzględnie zduplikowane - wiersze, w których wszystkie rekordy we wszystkich kolumnach pojawiają się w tabeli kilka razy:
- Zacznij od tego samego COUNTIFS z wcześniej - tego, który skanuje każdą kolumnę dla jej pierwszej wartości i liczy tylko te wiersze, w których powtarzają się wszystkie 3 rekordy we wszystkich 3 kolumnach:
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
- Następnie zamknij tę formułę w IF. Sprawdza ona liczbę powtarzających się wierszy i jeśli przekracza ona 1, formuła nazywa wiersz duplikatem:
=IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate",")
Teraz są tylko 2 duplikaty, ponieważ nawet jeśli wiśnia występuje 3 razy w tabeli, tylko dwa z nich mają wszystkie 3 kolumny identyczne.
Przykład 3. Znajdź zduplikowane wiersze, zignoruj pierwsze wpisy
Aby zignorować 1. wystąpienie i zaznaczyć tylko 2. i pozostałe, odwołaj się do pierwszych komórek tabeli zamiast do całych kolumn:
=IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicate",")
Wskazówka. Jeśli korzystasz z programu Microsoft Excel, pomocne mogą być następujące przykłady: Jak znaleźć duplikaty w programie Excel.
Identyfikacja i wyróżnianie duplikatów w Arkuszach Google za pomocą reguł formatowania warunkowego
Istnieje możliwość przetworzenia powtarzających się danych w taki sposób, że jeden rzut oka na Twoją tabelę da Ci jasny obraz tego, czy jest to rekord dupe.
Mówię o podświetlaniu duplikatów w Google Sheets. Formatowanie warunkowe pomoże ci w tym.
Wskazówka: Nigdy nie próbowałeś formatowania warunkowego? Nie ma obaw, wyjaśniliśmy jak to działa w tym artykule.
Oto, co musisz zrobić:
- Otwórz ustawienia formatowania warunkowego: Format> Formatowanie warunkowe .
- Upewnij się, że Zastosuj się do zakresu Pole zawiera zakres, w którym chcesz podświetlić duplikaty. Dla tego przykładu zacznę od kolumny B.
- W Zasady dotyczące formatu wybierz Wzór własny to. i wpisać ten sam COUNTIF, który wprowadziłem powyżej:
=COUNTIF($B$2:$B$10,$B2)>1
Gdy zlokalizuje rekordy, które pojawiają się co najmniej dwa razy w kolumnie B, zostaną one pokolorowane wybranym przez użytkownika odcieniem:
Inną opcją byłoby zaznaczenie zduplikowanych wierszy. Wystarczy dostosować zakres, do którego ma być zastosowana reguła:
Wskazówka. Po zaznaczeniu duplikatów w Arkuszach Google możesz filtrować dane według kolorów:
- Z jednej strony możesz filtrować kolumnę tak, aby widoczne pozostały tylko komórki z białym kolorem wypełnienia. W ten sposób usuniesz z widoku duplikaty:
- Z drugiej strony, możesz zachować widoczność tylko kolorowych komórek:
a następnie wybierz te wiersze i usuń te duplikaty ze swojego Google Sheets całkowicie:
Wskazówka. Odwiedź ten samouczek, aby uzyskać więcej formuł do zaznaczania duplikatów w arkuszach Google.
Pozbawione formuł sposoby znajdowania i usuwania duplikatów w arkuszach Google
Formuły i formatowanie warunkowe są dobre, ale istnieją inne narzędzia, które pomogą Ci znaleźć duplikaty. Dwa z nich zostały zaprojektowane dla tego konkretnego problemu.
Identyfikacja duplikatów za pomocą tabeli przestawnej dla Google Sheets
Tabela przestawna jest używana w arkuszach kalkulacyjnych, aby odwrócić dane i sprawić, że tabele będą łatwe do odczytania & zrozumienia. Jest to rodzaj alternatywnego sposobu prezentacji zbiorów danych.
Najbardziej atrakcyjne jest to, że Twoje oryginalne dane nie ulegają zmianie. Tabela przestawna wykorzystuje je jako odniesienie i podaje wynik w osobnej zakładce.
Wynik ten, nawiasem mówiąc, będzie się dynamicznie zmieniał w zależności od ustawień, które możesz zmieniać w trakcie podróży.
W przypadku powtarzających się rekordów, tabela przestawna pomoże Ci policzyć i usunąć duplikaty w Google Sheets.
Przykład 1. Jak tabela przestawna liczy duplikaty w Google Sheets
- Idź do Wstaw> Tabela przestawna , określ swój zakres danych i miejsce dla tabeli przestawnej:
- W edytorze tabeli przestawnej dodaj kolumnę ze swoimi duplikatami ( Nazwa w moim przykładzie) dla Rzędy i za Wartości .
Jeśli kolumna zawiera rekordy numeryczne, wybierz COUNT jako funkcję podsumowującą dla Wartości aby policzyć duplikaty w Arkuszach Google. Jeśli masz tekst, wybierz COUNTA zamiast:
Jeśli wszystko zrobisz poprawnie, w tabeli przestawnej pojawi się każdy element z Twojej listy i otrzymasz liczbę razy, w których się tam pojawia:
Jak widać, ta tabela przestawna pokazuje, że tylko jeżyna i wiśnia powtarzają się w moim zestawie danych.
Przykład 2. Usuń duplikaty w Google Sheets za pomocą tabeli przestawnej
Aby usunąć duplikaty za pomocą tabeli przestawnej, musisz dodać pozostałe kolumny (2 w moim przykładzie) jako Rzędy dla twojej tabeli przestawnej:
Zobaczysz tabelę ze zduplikowanymi wierszami, jednak liczby powiedzą, które z nich pojawiają się ponownie w oryginalnym zbiorze danych:
Wskazówka. Jeśli nie potrzebujesz już tych liczb, po prostu zamknij Wartości pole w tabeli przestawnej poprzez naciśnięcie odpowiedniej ikony w jej prawym górnym rogu:
Tak ostatecznie będzie wyglądać twoja tabela przestawna:
Nie ma duplikatów, nie ma dodatkowych obliczeń, są tylko unikalne rekordy posortowane w jednej tabeli.
Usuń duplikaty - standardowe narzędzie do oczyszczania danych
Google Sheets posiada swoje małe, proste i nieporęczne narzędzie do usuwania duplikatów. Nazywa się ono tak samo jak jego działanie i znajduje się pod Czyszczenie danych> Czyszczenie danych tab:
Nie znajdziesz tu nic wymyślnego, wszystko jest super proste. Wystarczy określić, czy twoja tabela ma wiersz nagłówka i wybrać wszystkie te kolumny, które powinny być sprawdzane pod kątem duplikatów:
Gdy będziesz gotowy, kliknij ten duży zielony przycisk, a narzędzie znajdzie i usunie zduplikowane wiersze z Twojej tabeli Google Sheets i powie, ile unikalnych wierszy pozostało:
Za każdym razem, gdy będziesz musiał poradzić sobie z duplikatami, będziesz musiał uruchomić to narzędzie ręcznie. Ponadto, to wszystko, co robi: usuwa duplikaty. Nie ma opcji, aby przetworzyć je w inny sposób.
Na szczęście wszystkie te wady zostały rozwiązane w dodatku Remove Duplicates dla Google Sheets od Ablebits.
Dodatek Remove Duplicates dla Arkuszy Google
Dodatek Remove Duplicates to prawdziwy zmieniacz gry. Na początek zawiera on 5 różnych narzędzi do identyfikacji duplikatów w Google Sheets. Ale na dziś przyjrzyjmy się Znajdź zduplikowane lub unikalne wiersze .
Sam oferuje 7 różnych sposobów obsługi duplikatów i nie tylko przyspiesza cały proces, ale wie jak go całkowicie zautomatyzować.
Po zainstalowaniu go z Google Workspace Marketplace, pojawi się on pod Przedłużenia :
Jako standardowe narzędzie Google Sheets również pozwala wybrać zakres i kolumny do przetworzenia, ale bardziej elegancko :)
Wszystkie ustawienia są podzielone na 4 przyjazne dla użytkownika kroki, w których należy wybrać:
- zakres
- co znaleźć: duplikaty czy unikaty
- kolumny
- co zrobić z odnalezioną dokumentacją
Możesz nawet podglądać specjalne zdjęcia, aby zawsze było jasne, co należy zrobić:
O co chodzi, możesz pomyśleć? Cóż, w przeciwieństwie do standardowego narzędzia, ten dodatek oferuje o wiele więcej:
- znaleźć duplikaty jak również unikaty, w tym lub z wyłączeniem pierwszego wystąpienia
- podkreślenie duplikaty w Google Sheets
- dodać kolumnę statusu
- kopiowanie/przenoszenie wyniki do nowego arkusza/arkusza kalkulacyjnego lub w dowolnym miejscu arkusza kalkulacyjnego
- jasne znaleziono wartości z komórek
- usuwanie zduplikowanych wierszy z arkusza Google całkowicie
Po prostu wybierz sposób, który najbardziej Ci odpowiada, wybierz opcje i pozwól, aby dodatek wykonał pracę.
Wskazówka. Ten film może być nieco stary, ale doskonale pokazuje, jak łatwo jest pracować z tym dodatkiem:
Spraw, by dodatek automatycznie usuwał duplikaty
Jako wisienkę na torcie, będziesz mógł zapisać wszystkie ustawienia ze wszystkich 4 kroków w scenariuszach i uruchomić je później na dowolnym stole za pomocą jednego kliknięcia.
Albo - jeszcze lepiej - zaplanuj te scenariusze, aby automatycznie uruchamiały się codziennie o określonej godzinie:
Twoja obecność nie jest konieczna, a dodatek będzie usuwał duplikaty automatycznie, nawet gdy plik jest zamknięty lub jesteś offline. Aby dowiedzieć się więcej na ten temat, odwiedź ten szczegółowy samouczek i obejrzyj ten film demonstracyjny:
Zachęcam do zainstalowania dodatku ze sklepu Google Sheets i pokręcenia się po nim. Zobaczysz, jak łatwo jest znaleźć, usunąć i zaznaczyć duplikaty bez formuł w zaledwie kilku kliknięciach.
Arkusz kalkulacyjny z przykładami formuł
Znajdź & usuń duplikaty w Google Sheets - przykłady formuł (zrób kopię arkusza kalkulacyjnego)