7 лесни начина за намиране и премахване на дубликати в Google Sheets

  • Споделя Това
Michael Brown

Съдържание

Търсите прост начин за намиране на дубликати в Google Sheets? Какво ще кажете за 7 начина? :) Това е всичко, от което се нуждаете за многобройни случаи на употреба :) Ще ви покажа как да използвате инструменти без формули (без кодиране - обещавам!), условно форматиране и няколко лесни функции за запалените фенове на формулите.

Без значение колко често използвате Google Sheets, има вероятност да ви се налага да се справяте с дублирани данни. Такива записи могат да се появят в една колона или да заемат цели редове.

В края на тази статия ще знаете. всичко, което ви е необходимо, за да премахнете дубликатите, да ги преброите, подчертаете и идентифицирате със статус. Ще покажа някои примери за формули и ще споделя различни инструменти. Един от тях дори намира и премахва дубликати в Google Sheets по график! Условното форматиране също ще ви бъде от полза.

Просто изберете отровата си и да се търкаляме :)

    Как да намерите дубликати в Google Sheets с помощта на формули

    По традиция ще започна с формулите. Основното им предимство е, че оригиналната ви таблица остава непокътната. Формулите идентифицират дублиращите се елементи и връщат резултата на друго място в Google Sheets. И в зависимост от желания резултат различни функции вършат работа.

    Как да премахнете дублиранията в Google Sheets с помощта на функцията UNIQUE

    Функцията UNIQUE сканира данните ви, изтрива дублиращите се и връща точно това, което казва името ѝ - уникални стойности/редове.

    Ето една малка примерна таблица, в която се повтарят различни редове:

    Пример 1. Изтриване на дублиращите се редове, запазване на първите срещания

    От една страна, може да се наложи да премахнете всички дублиращи се редове от тази таблица в Google Sheets и да запазите само първите записи.

    За да направите това, просто въведете диапазона на данните си в UNIQUE:

    =UNIQUE(A1:C10)

    Тази малка формула връща всички уникални редове и всички първи срещания, без да се вземат предвид второ, трето и т.н.

    Пример 2. Изтриване на всички дублиращи се редове, дори и на първите срещания

    От друга страна, може да искате да получите само "истинските" уникални редове. Под "истински" имам предвид тези, които не се повтарят - дори веднъж. И така, какво правите?

    Нека да разгледаме за момент всички УНИКАЛНИ аргументи:

    UNIQUE(range,[by_column],[exactly_once])
    • обхват - са данните, които искате да обработите.
    • [by_column] - указва дали се проверяват напълно съвпадащи редове или клетки в отделни колони. Ако става въпрос за колони, въведете TRUE. Ако става въпрос за редове, въведете FALSE или просто пропуснете аргумента.
    • [exactly_once] - Този аргумент указва на функцията да изтрие не само дубликатите в Google Sheets, но и техните 1-ви записи. Или, с други думи, да върне само записи без никакви дубликати. За тази цел поставяте TRUE, в противен случай FALSE или пропускате аргумента.

    Последният аргумент е вашият лост тук.

    Следователно, за да премахнете напълно всички дублиращи се редове от Google Sheets (заедно с техния 1-ви ред), пропуснете втория аргумент във формулата, но добавете третия:

    =UNIQUE(A1:C10,,TRUE)

    Виждате ли, че таблицата вдясно е много по-къса? Това е така, защото UNIQUE намери и премахна дублиращите се редове, както и техните първи срещания от оригиналната таблица в Google Sheets. Сега остават само уникалните редове.

    Идентифициране на дубликати с помощта на функцията COUNTIF на Google Sheets

    Ако заемането на място с друг набор от данни не е част от плана ви, вместо това можете да преброите дублиранията в Google Sheets (и след това да ги изтриете ръчно). Това ще отнеме само една допълнителна колона, а функцията COUNTIF ще ви помогне.

    Съвет. Ако не сте запознати с тази функция, имаме цяла публикация в блога за нея, не се колебайте да я разгледате.

    Пример 1. Получаване на общия брой случаи на поява

    Нека да идентифицираме всички дубликати с техните 1-ви появявания в Google Sheets и да проверим общия брой на всеки плод, който се появява в списъка. Ще използвам следната формула в D2 и след това ще я копирам надолу по колоната:

    =COUNTIF($B$2:$B$10,$B2)

    Съвет. За да накарате тази формула да обработва автоматично всеки ред в колоната, обвийте всичко в ArrayFormula и променете $B2 към $B2:$B10 (цялата колона). По този начин няма да е необходимо да копирате формулата надолу:

    Ако след това филтрирате тази съвкупност от данни по числа, ще можете да видите и дори да премахнете ръчно всички излишни дублиращи се редове от таблицата в Google Sheets:

    Пример 2. Намиране и изброяване на всички дубликати в Google Sheets

    В случай че общият брой случаи не е ваша цел, а предпочитате да знаете дали този конкретен запис в този конкретен ред е първият, вторият и т.н. запис, ще трябва да направите малка корекция във формулата.

    Промяна на обхвата от цялата колона ($B$2:$B$10) само до една клетка ($B$2:$B2) .

    Забележка: Обърнете внимание на използването на абсолютни препратки.

    =COUNTIF($B$2:$B2,$B2)

    Този път изтриването на всички дубликати от тази таблица в Google Sheets ще бъде още по-лесно, защото ще можете да скриете всички записи, освен първите:

    Пример 3. Преброяване на дублиращи се редове в Google Sheets

    Въпреки че горните формули отчитат дублиранията само в една колона на Google Sheets, може да ви е необходима формула, която отчита всички колони и по този начин идентифицира дублиращите се редове.

    В този случай COUNTIFS ще е по-подходящ. Просто избройте всяка колона от таблицата си заедно със съответния критерий:

    =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    Съвет: Има и друг начин за изчисляване на дубликати - без формули. Той включва таблица Pivot и го описвам по-нататък.

    Маркиране на дубликати в колона със статус - функция IF

    Понякога числата просто не са достатъчни. Понякога е по-добре да откриете дублиранията и да ги отбележите в колона за състоянието. Отново: филтрирането на данните в Google Sheets по тази колона по-късно ще ви позволи да премахнете тези дублирания, които вече не са ви необходими.

    Пример 1. Намиране на дубликати в 1 колона в Google Sheets

    За тази задача ще ви е необходима същата функция COUNTIF, но този път обвита във функцията IF:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate", "Unique")

    Нека да видим какво се случва в тази формула:

    1. Първо, COUNTIF претърсва цялата колона B за плода от B2. След като го намери, той ги сумира.
    2. След това IF проверява тази обща стойност и ако тя е по-голяма от 1, казва Дублиране на , в противен случай, Уникален .

    Разбира се, можете да използвате формулата за връщане на собствени статуси или например за намиране на & идентифициране само на дубликати в данните в Google Sheets:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate","")

    Съвет: Веднага щом откриете тези дубликати, можете да филтрирате таблицата по колоната за състояние. Този начин ви позволява да скриете повтарящи се или уникални записи и дори да изберете цели редове & да изтриете напълно тези дубликати от вашите Google Sheets:

    Пример 2. Идентифициране на дублиращи се редове

    По подобен начин можете да маркирате абсолютни дублиращи се редове - редове, в които всички записи във всички колони се появяват няколко пъти в таблицата:

    1. Започнете със същия COUNTIFS отпреди - този, който сканира всяка колона за първата ѝ стойност и преброява само онези редове, в които се повтарят всичките 3 записа в трите колони:

      =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    2. След това затворете тази формула в IF. Тя проверява броя на повтарящите се редове и ако той надвишава 1, формулата назовава реда като дублиран:

      =IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate",")

    Сега има само 2 дублирания, защото въпреки че черешата се среща 3 пъти в таблицата, само две от тях имат еднакви 3 колони.

    Пример 3. Намиране на дублиращи се редове, пренебрегване на първите записи

    За да пренебрегнете първата поява и да отбележите само втората и останалите, се обърнете към първите клетки на таблицата вместо към целите колони:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Duplicate",")

    Съвет. Ако използвате Microsoft Excel, следните примери могат да ви бъдат полезни: Как да откриваме дубликати в Excel.

    Идентифициране и подчертаване на дубликати в Google Sheets с правила за условно форматиране

    Има възможност да обработвате повтарящи се данни по такъв начин, че само с един поглед към таблицата да разберете дали става въпрос за дублиращ се запис.

    Говоря за подчертаване на дубликати в Google Sheets. Условното форматиране ще ви помогне за това.

    Съвет. Никога не сте опитвали условно форматиране? Не се притеснявайте, обяснихме как работи то в тази статия.

    Ето какво трябва да направите:

    1. Отворете настройките за условно форматиране: Format> Условно форматиране .
    2. Уверете се, че Кандидатствайте за обхват полето съдържа диапазона, в който искате да маркирате дублиранията. За този пример нека започна с колона B.
    3. В Правила за формата изберете Потребителската формула е и въведете същия COUNTIF, който въведох по-горе:

      =COUNTIF($B$2:$B$10,$B2)>1

    След като открие записи, които се появяват поне два пъти в колона Б, те ще бъдат оцветени в избран от вас нюанс:

    Друга възможност е да се подчертаят дублиращите се редове. Просто настройте обхвата, към който да се приложи правилото:

    Съвет: След като маркирате дублиранията в Google Sheets, можете да филтрирате данните по цвят:

    • От една страна, можете да филтрирате колоната така, че да останат видими само клетките с бял цвят на запълване. По този начин ще изтриете дублиранията от изгледа:

    • От друга страна, можете да оставите видими само цветните клетки:

    и след това изберете тези редове и изтрийте напълно тези дубликати от Google Sheets:

    Съвет. Посетете този урок за повече формули за подчертаване на дубликати в Google Sheets.

    Начини за намиране и премахване на дубликати в Google Sheets без формули

    Формулите и условното форматиране са добри, но има и други инструменти, които ще ви помогнат да откриете дубликати. Два от тях са предназначени за този конкретен проблем.

    Идентифициране на дубликати с Pivot таблица за Google Sheets

    Таблицата Pivot се използва в електронните таблици, за да обърне данните ви и да направи таблиците ви лесни за четене и разбиране. Това е алтернативен начин за представяне на наборите от данни.

    Най-привлекателното тук е, че първоначалните ви данни не се променят. Pivot table ги използва като референция и предоставя резултата в отделен раздел.

    Между другото, този резултат ще се променя динамично в зависимост от настройките, които можете да променяте в движение.

    В случай на повтарящи се записи въртящата се таблица ще ви помогне да преброите и премахнете дубликатите в Google Sheets.

    Пример 1. Как таблицата Pivot брои дубликатите в Google Sheets

    1. Отидете на Вмъкване> Pivot таблица , посочете диапазона на данните и мястото за таблицата на въртене:

    2. В редактора на таблицата за завъртане добавете колона с вашите дубликати ( Име в моя пример) за Редове и за Стойности .

      Ако колоната ви съдържа числови записи, изберете COUNT като обобщаваща функция за Стойности за преброяване на дублиранията в Google Sheets. Ако имате текст, изберете COUNTA вместо това:

    Ако направите всичко правилно, в таблицата с въртящи се елементи ще бъде представен всеки елемент от списъка и ще получите броя на появяванията му:

    Както можете да видите, тази въртяща се таблица показва, че само къпина и череша се повтарят в моя набор от данни.

    Пример 2. Премахване на дубликати в Google Sheets с помощта на таблица Pivot

    За да изтриете дублиранията с помощта на таблицата за завъртане, трябва да добавите останалите колони (2 в моя пример) като Редове за вашата въртяща се таблица:

    Ще видите таблицата с дублирани редове, но числата ще показват кои от тях се повтарят в оригиналния набор от данни:

    Съвет. Ако числата вече не са ви необходими, просто затворете Стойности в таблицата Pivot, като натиснете съответната икона в горния ѝ десен ъгъл:

    Ето как ще изглежда вашата въртяща се таблица в крайна сметка:

    Няма дубликати, няма допълнителни изчисления. Има само уникални записи, подредени в една таблица.

    Премахване на дубликати - стандартен инструмент за почистване на данни

    Таблиците на Google разполагат с малък, прост и лесен инструмент за премахване на дубликати. Той се нарича по името на операцията си и се намира под Данни> Почистване на данни таб:

    Тук няма да откриете нищо причудливо, всичко е много просто. Просто посочвате дали таблицата ви има заглавен ред и избирате всички колони, които трябва да бъдат проверени за дублиране:

    След като сте готови, щракнете върху големия зелен бутон и инструментът ще открие и изтрие дублиращите се редове от таблицата в Google Sheets и ще каже колко уникални редове са останали:

    Уви, това е всичко, до което стига този инструмент. Всеки път, когато трябва да се справите с дубликати, ще трябва да стартирате тази програма ръчно. Освен това тя прави само това: изтрива дубликати. Няма опция да ги обработва по различен начин.

    За щастие всички тези недостатъци са решени в добавката Remove Duplicates (Премахване на дубликати) за Google Sheets от Ablebits.

    Премахване на дубликати - добавка за Google Sheets

    Добавката "Премахване на дубликати" е истинска промяна в играта. Като начало тя съдържа 5 различни инструмента за идентифициране на дубликати в Google Sheets. Но днес нека разгледаме Намиране на дублиращи се или уникални редове .

    Само той предлага 7 различни начина за обработка на дубликати и не просто ускорява целия процес, а знае как да го автоматизира изцяло.

    След като го инсталирате от Google Workspace Marketplace, той ще се появи в Удължения :

    Както и стандартният инструмент на Google Sheets, той също ви позволява да изберете диапазона и колоните за обработка, но по-елегантно :)

    Всички настройки са разделени на 4 лесни за използване стъпки, в които трябва да изберете:

    1. обхватът
    2. какво да намерите: дубликати или уникати
    3. колоните
    4. какво да се прави с намерените записи

    Можете дори да надникнете в специални снимки, така че винаги да е ясно какво да правите:

    Какъв е смисълът, може би си мислите? Е, за разлика от стандартния инструмент, тази добавка предлага много повече:

    • намиране на дубликати както и уникати, включително или с изключение на първите срещания
    • подчертайте дубликати в Google Sheets
    • добавяне на колона за състоянието
    • копиране/преместване резултатите към нов лист/пространство или всяко конкретно място в електронната таблица
    • ясно намерени стойности от клетки
    • изтриване на дублиращи се редове от вашия лист в Google напълно

    Просто изберете най-подходящия за вас начин, изберете опциите и оставете добавката да свърши работата.

    Съвет: Този видеоклип може да е малко по-стар, но отлично показва колко лесно е да се работи с добавката:

    Накарайте добавката да премахва дубликатите автоматично

    Като черешка на тортата ще можете да запазите всички настройки от всички 4 стъпки в сценарии и да ги стартирате по-късно на всяка маса само с едно кликване.

    Или - още по-добре - планирайте тези сценарии да се стартират автоматично в определено време всеки ден:

    Вашето присъствие не е необходимо, а добавката ще изтрие дубликатите автоматично, дори когато файлът е затворен или сте офлайн. За да научите повече за нея, посетете този подробен урок и гледайте това демо видео:

    Препоръчвам ви да инсталирате добавката от магазина на Google Sheets и да я разгледате. Ще видите колко лесно е да откривате, премахвате и подчертавате дубликати без формули само с няколко кликвания.

    Електронна таблица с примери за формули

    Намиране и премахване на дубликати в Google Sheets - примери за формули (направете копие на електронната таблица)

    Майкъл Браун е отдаден технологичен ентусиаст със страст към опростяване на сложни процеси с помощта на софтуерни инструменти. С повече от десетилетие опит в технологичната индустрия, той е усъвършенствал уменията си в Microsoft Excel и Outlook, както и в Google Sheets и Docs. Блогът на Майкъл е посветен на споделянето на неговите знания и опит с други, предоставяйки лесни за следване съвети и уроци за подобряване на продуктивността и ефективността. Независимо дали сте опитен професионалист или начинаещ, блогът на Michael предлага ценни прозрения и практически съвети за извличане на максимума от тези основни софтуерни инструменти.