Съдържание
Търсите прост начин за намиране на дубликати в Google Sheets? Какво ще кажете за 7 начина? :) Това е всичко, от което се нуждаете за многобройни случаи на употреба :) Ще ви покажа как да използвате инструменти без формули (без кодиране - обещавам!), условно форматиране и няколко лесни функции за запалените фенове на формулите.
Без значение колко често използвате Google Sheets, има вероятност да ви се налага да се справяте с дублирани данни. Такива записи могат да се появят в една колона или да заемат цели редове.
В края на тази статия ще знаете. всичко, което ви е необходимо, за да премахнете дубликатите, да ги преброите, подчертаете и идентифицирате със статус. Ще покажа някои примери за формули и ще споделя различни инструменти. Един от тях дори намира и премахва дубликати в Google Sheets по график! Условното форматиране също ще ви бъде от полза.
Просто изберете отровата си и да се търкаляме :)
Как да намерите дубликати в Google Sheets с помощта на формули
По традиция ще започна с формулите. Основното им предимство е, че оригиналната ви таблица остава непокътната. Формулите идентифицират дублиращите се елементи и връщат резултата на друго място в Google Sheets. И в зависимост от желания резултат различни функции вършат работа.
Как да премахнете дублиранията в Google Sheets с помощта на функцията UNIQUE
Функцията UNIQUE сканира данните ви, изтрива дублиращите се и връща точно това, което казва името ѝ - уникални стойности/редове.
Ето една малка примерна таблица, в която се повтарят различни редове:
Пример 1. Изтриване на дублиращите се редове, запазване на първите срещания
От една страна, може да се наложи да премахнете всички дублиращи се редове от тази таблица в Google Sheets и да запазите само първите записи.
За да направите това, просто въведете диапазона на данните си в UNIQUE:
=UNIQUE(A1:C10)
Тази малка формула връща всички уникални редове и всички първи срещания, без да се вземат предвид второ, трето и т.н.
Пример 2. Изтриване на всички дублиращи се редове, дори и на първите срещания
От друга страна, може да искате да получите само "истинските" уникални редове. Под "истински" имам предвид тези, които не се повтарят - дори веднъж. И така, какво правите?
Нека да разгледаме за момент всички УНИКАЛНИ аргументи:
UNIQUE(range,[by_column],[exactly_once])- обхват - са данните, които искате да обработите.
- [by_column] - указва дали се проверяват напълно съвпадащи редове или клетки в отделни колони. Ако става въпрос за колони, въведете TRUE. Ако става въпрос за редове, въведете FALSE или просто пропуснете аргумента.
- [exactly_once] - Този аргумент указва на функцията да изтрие не само дубликатите в Google Sheets, но и техните 1-ви записи. Или, с други думи, да върне само записи без никакви дубликати. За тази цел поставяте TRUE, в противен случай FALSE или пропускате аргумента.
Последният аргумент е вашият лост тук.
Следователно, за да премахнете напълно всички дублиращи се редове от Google Sheets (заедно с техния 1-ви ред), пропуснете втория аргумент във формулата, но добавете третия:
=UNIQUE(A1:C10,,TRUE)
Виждате ли, че таблицата вдясно е много по-къса? Това е така, защото UNIQUE намери и премахна дублиращите се редове, както и техните първи срещания от оригиналната таблица в Google Sheets. Сега остават само уникалните редове.
Идентифициране на дубликати с помощта на функцията COUNTIF на Google Sheets
Ако заемането на място с друг набор от данни не е част от плана ви, вместо това можете да преброите дублиранията в Google Sheets (и след това да ги изтриете ръчно). Това ще отнеме само една допълнителна колона, а функцията COUNTIF ще ви помогне.
Съвет. Ако не сте запознати с тази функция, имаме цяла публикация в блога за нея, не се колебайте да я разгледате.
Пример 1. Получаване на общия брой случаи на поява
Нека да идентифицираме всички дубликати с техните 1-ви появявания в Google Sheets и да проверим общия брой на всеки плод, който се появява в списъка. Ще използвам следната формула в D2 и след това ще я копирам надолу по колоната:
=COUNTIF($B$2:$B$10,$B2)
Съвет. За да накарате тази формула да обработва автоматично всеки ред в колоната, обвийте всичко в ArrayFormula и променете $B2 към $B2:$B10 (цялата колона). По този начин няма да е необходимо да копирате формулата надолу:
Ако след това филтрирате тази съвкупност от данни по числа, ще можете да видите и дори да премахнете ръчно всички излишни дублиращи се редове от таблицата в Google Sheets:
Пример 2. Намиране и изброяване на всички дубликати в Google Sheets
В случай че общият брой случаи не е ваша цел, а предпочитате да знаете дали този конкретен запис в този конкретен ред е първият, вторият и т.н. запис, ще трябва да направите малка корекция във формулата.
Промяна на обхвата от цялата колона ($B$2:$B$10) само до една клетка ($B$2:$B2) .
Забележка: Обърнете внимание на използването на абсолютни препратки.
=COUNTIF($B$2:$B2,$B2)
Този път изтриването на всички дубликати от тази таблица в Google Sheets ще бъде още по-лесно, защото ще можете да скриете всички записи, освен първите:
Пример 3. Преброяване на дублиращи се редове в Google Sheets
Въпреки че горните формули отчитат дублиранията само в една колона на Google Sheets, може да ви е необходима формула, която отчита всички колони и по този начин идентифицира дублиращите се редове.
В този случай COUNTIFS ще е по-подходящ. Просто избройте всяка колона от таблицата си заедно със съответния критерий:
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
Съвет: Има и друг начин за изчисляване на дубликати - без формули. Той включва таблица Pivot и го описвам по-нататък.
Маркиране на дубликати в колона със статус - функция IF
Понякога числата просто не са достатъчни. Понякога е по-добре да откриете дублиранията и да ги отбележите в колона за състоянието. Отново: филтрирането на данните в Google Sheets по тази колона по-късно ще ви позволи да премахнете тези дублирания, които вече не са ви необходими.
Пример 1. Намиране на дубликати в 1 колона в Google Sheets
За тази задача ще ви е необходима същата функция COUNTIF, но този път обвита във функцията IF:
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate", "Unique")
Нека да видим какво се случва в тази формула:
- Първо, COUNTIF претърсва цялата колона B за плода от B2. След като го намери, той ги сумира.
- След това IF проверява тази обща стойност и ако тя е по-голяма от 1, казва Дублиране на , в противен случай, Уникален .
Разбира се, можете да използвате формулата за връщане на собствени статуси или например за намиране на & идентифициране само на дубликати в данните в Google Sheets:
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate","")
Съвет: Веднага щом откриете тези дубликати, можете да филтрирате таблицата по колоната за състояние. Този начин ви позволява да скриете повтарящи се или уникални записи и дори да изберете цели редове & да изтриете напълно тези дубликати от вашите Google Sheets:
Пример 2. Идентифициране на дублиращи се редове
По подобен начин можете да маркирате абсолютни дублиращи се редове - редове, в които всички записи във всички колони се появяват няколко пъти в таблицата:
- Започнете със същия COUNTIFS отпреди - този, който сканира всяка колона за първата ѝ стойност и преброява само онези редове, в които се повтарят всичките 3 записа в трите колони:
=COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)
- След това затворете тази формула в IF. Тя проверява броя на повтарящите се редове и ако той надвишава 1, формулата назовава реда като дублиран:
=IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate",")
Сега има само 2 дублирания, защото въпреки че черешата се среща 3 пъти в таблицата, само две от тях имат еднакви 3 колони.
Пример 3. Намиране на дублиращи се редове, пренебрегване на първите записи
За да пренебрегнете първата поява и да отбележите само втората и останалите, се обърнете към първите клетки на таблицата вместо към целите колони:
=IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicate",")
Съвет. Ако използвате Microsoft Excel, следните примери могат да ви бъдат полезни: Как да откриваме дубликати в Excel.
Идентифициране и подчертаване на дубликати в Google Sheets с правила за условно форматиране
Има възможност да обработвате повтарящи се данни по такъв начин, че само с един поглед към таблицата да разберете дали става въпрос за дублиращ се запис.
Говоря за подчертаване на дубликати в Google Sheets. Условното форматиране ще ви помогне за това.
Съвет. Никога не сте опитвали условно форматиране? Не се притеснявайте, обяснихме как работи то в тази статия.
Ето какво трябва да направите:
- Отворете настройките за условно форматиране: Format> Условно форматиране .
- Уверете се, че Кандидатствайте за обхват полето съдържа диапазона, в който искате да маркирате дублиранията. За този пример нека започна с колона B.
- В Правила за формата изберете Потребителската формула е и въведете същия COUNTIF, който въведох по-горе:
=COUNTIF($B$2:$B$10,$B2)>1
След като открие записи, които се появяват поне два пъти в колона Б, те ще бъдат оцветени в избран от вас нюанс:
Друга възможност е да се подчертаят дублиращите се редове. Просто настройте обхвата, към който да се приложи правилото:
Съвет: След като маркирате дублиранията в Google Sheets, можете да филтрирате данните по цвят:
- От една страна, можете да филтрирате колоната така, че да останат видими само клетките с бял цвят на запълване. По този начин ще изтриете дублиранията от изгледа:
- От друга страна, можете да оставите видими само цветните клетки:
и след това изберете тези редове и изтрийте напълно тези дубликати от Google Sheets:
Съвет. Посетете този урок за повече формули за подчертаване на дубликати в Google Sheets.
Начини за намиране и премахване на дубликати в Google Sheets без формули
Формулите и условното форматиране са добри, но има и други инструменти, които ще ви помогнат да откриете дубликати. Два от тях са предназначени за този конкретен проблем.
Идентифициране на дубликати с Pivot таблица за Google Sheets
Таблицата Pivot се използва в електронните таблици, за да обърне данните ви и да направи таблиците ви лесни за четене и разбиране. Това е алтернативен начин за представяне на наборите от данни.
Най-привлекателното тук е, че първоначалните ви данни не се променят. Pivot table ги използва като референция и предоставя резултата в отделен раздел.
Между другото, този резултат ще се променя динамично в зависимост от настройките, които можете да променяте в движение.
В случай на повтарящи се записи въртящата се таблица ще ви помогне да преброите и премахнете дубликатите в Google Sheets.
Пример 1. Как таблицата Pivot брои дубликатите в Google Sheets
- Отидете на Вмъкване> Pivot таблица , посочете диапазона на данните и мястото за таблицата на въртене:
- В редактора на таблицата за завъртане добавете колона с вашите дубликати ( Име в моя пример) за Редове и за Стойности .
Ако колоната ви съдържа числови записи, изберете COUNT като обобщаваща функция за Стойности за преброяване на дублиранията в Google Sheets. Ако имате текст, изберете COUNTA вместо това:
Ако направите всичко правилно, в таблицата с въртящи се елементи ще бъде представен всеки елемент от списъка и ще получите броя на появяванията му:
Както можете да видите, тази въртяща се таблица показва, че само къпина и череша се повтарят в моя набор от данни.
Пример 2. Премахване на дубликати в Google Sheets с помощта на таблица Pivot
За да изтриете дублиранията с помощта на таблицата за завъртане, трябва да добавите останалите колони (2 в моя пример) като Редове за вашата въртяща се таблица:
Ще видите таблицата с дублирани редове, но числата ще показват кои от тях се повтарят в оригиналния набор от данни:
Съвет. Ако числата вече не са ви необходими, просто затворете Стойности в таблицата Pivot, като натиснете съответната икона в горния ѝ десен ъгъл:
Ето как ще изглежда вашата въртяща се таблица в крайна сметка:
Няма дубликати, няма допълнителни изчисления. Има само уникални записи, подредени в една таблица.
Премахване на дубликати - стандартен инструмент за почистване на данни
Таблиците на Google разполагат с малък, прост и лесен инструмент за премахване на дубликати. Той се нарича по името на операцията си и се намира под Данни> Почистване на данни таб:
Тук няма да откриете нищо причудливо, всичко е много просто. Просто посочвате дали таблицата ви има заглавен ред и избирате всички колони, които трябва да бъдат проверени за дублиране:
След като сте готови, щракнете върху големия зелен бутон и инструментът ще открие и изтрие дублиращите се редове от таблицата в Google Sheets и ще каже колко уникални редове са останали:
Уви, това е всичко, до което стига този инструмент. Всеки път, когато трябва да се справите с дубликати, ще трябва да стартирате тази програма ръчно. Освен това тя прави само това: изтрива дубликати. Няма опция да ги обработва по различен начин.
За щастие всички тези недостатъци са решени в добавката Remove Duplicates (Премахване на дубликати) за Google Sheets от Ablebits.
Премахване на дубликати - добавка за Google Sheets
Добавката "Премахване на дубликати" е истинска промяна в играта. Като начало тя съдържа 5 различни инструмента за идентифициране на дубликати в Google Sheets. Но днес нека разгледаме Намиране на дублиращи се или уникални редове .
Само той предлага 7 различни начина за обработка на дубликати и не просто ускорява целия процес, а знае как да го автоматизира изцяло.
След като го инсталирате от Google Workspace Marketplace, той ще се появи в Удължения :
Както и стандартният инструмент на Google Sheets, той също ви позволява да изберете диапазона и колоните за обработка, но по-елегантно :)
Всички настройки са разделени на 4 лесни за използване стъпки, в които трябва да изберете:
- обхватът
- какво да намерите: дубликати или уникати
- колоните
- какво да се прави с намерените записи
Можете дори да надникнете в специални снимки, така че винаги да е ясно какво да правите:
Какъв е смисълът, може би си мислите? Е, за разлика от стандартния инструмент, тази добавка предлага много повече:
- намиране на дубликати както и уникати, включително или с изключение на първите срещания
- подчертайте дубликати в Google Sheets
- добавяне на колона за състоянието
- копиране/преместване резултатите към нов лист/пространство или всяко конкретно място в електронната таблица
- ясно намерени стойности от клетки
- изтриване на дублиращи се редове от вашия лист в Google напълно
Просто изберете най-подходящия за вас начин, изберете опциите и оставете добавката да свърши работата.
Съвет: Този видеоклип може да е малко по-стар, но отлично показва колко лесно е да се работи с добавката:
Накарайте добавката да премахва дубликатите автоматично
Като черешка на тортата ще можете да запазите всички настройки от всички 4 стъпки в сценарии и да ги стартирате по-късно на всяка маса само с едно кликване.
Или - още по-добре - планирайте тези сценарии да се стартират автоматично в определено време всеки ден:
Вашето присъствие не е необходимо, а добавката ще изтрие дубликатите автоматично, дори когато файлът е затворен или сте офлайн. За да научите повече за нея, посетете този подробен урок и гледайте това демо видео:
Препоръчвам ви да инсталирате добавката от магазина на Google Sheets и да я разгледате. Ще видите колко лесно е да откривате, премахвате и подчертавате дубликати без формули само с няколко кликвания.
Електронна таблица с примери за формули
Намиране и премахване на дубликати в Google Sheets - примери за формули (направете копие на електронната таблица)