Как да идентифицирате дубликати в Excel: намиране, подчертаване, броене, филтриране

  • Споделя Това
Michael Brown

Съдържание

В урока е обяснено как да търсите дубликати в Excel. Ще научите няколко формули за идентифициране на дублиращи се стойности или за намиране на дублиращи се редове със или без първи появявания. Ще научите също как да преброите случаите на всеки дублиращ се запис поотделно и да намерите общия брой дубликати в колона, как да филтрирате дубликатите и др.

Докато работите с голям работен лист на Excel или обединявате няколко малки таблици в по-голяма, може да откриете много дублиращи се редове в него. В един от предишните ни уроци разгледахме различни начини за сравняване на две таблици или колони за дублиращи се редове.

А днес бих искал да споделя няколко бързи и ефективни метода за идентифициране на дубликати в един списък. Тези решения работят във всички версии на Excel 365, Excel 2021, Excel 2019, Excel 2016, Excel 2013 и по-ниски.

    Как да идентифицирате дубликати в Excel

    Най-лесният начин за откриване на дублиращи се стойности в Excel е с помощта на функцията COUNTIF. В зависимост от това дали искате да откриете дублиращи се стойности с или без първи появявания, ще има малки разлики във формулата, както е показано в следните примери.

    Как да откриете дублиращи се записи, включително първите повторения

    Да предположим, че имате списък с елементи в колона А, които искате да проверите за дублиране. Това могат да бъдат фактури, идентификатори на продукти, имена или други данни.

    Ето една формула за намиране на дубликати в Excel, включително и на първите срещания (където A2 е най-горната клетка):

    =COUNTIF(A:A, A2)>1

    Въведете горната формула в B2, след което изберете B2 и плъзнете дръжката за запълване, за да копирате формулата надолу към други клетки:

    Както можете да видите на снимката по-горе, формулата връща TRUE за дублиращи се стойности и FALSE за уникални стойности.

    Забележка. Ако трябва да намерите дубликати в обхват на клетките а не в цяла колона, не забравяйте да заключите този диапазон със знака $. Например, за да търсите дубликати в клетките A2:A8, използвайте тази формула:

    =COUNTIF( $A$2:$A$8 , A2)>1

    За да може дублиращата се формула да връща нещо по-значимо от булевите стойности TRUE и FALSE, включете я във функцията IF и въведете всички желани етикети за дублиращи се и уникални стойности:

    =IF(COUNTIF($A$2:$A$8, $A2)>1, "Duplicate", "Unique")

    В случай че искате формулата на Excel да намира само дубликати, заменете "Unique" с празен низ ("") по следния начин:

    =IF(COUNTIF($A$2:$A$8, $A2)>1, "Duplicate", "")

    Формулата ще върне "Duplicates" за дублиращи се записи и празна клетка за уникални записи:

    Как да търсите дубликати в Excel без 1-ви случаи

    В случай че планирате да филтрирате или премахнете дубликатите, след като ги откриете, използването на горната формула не е безопасно, защото тя маркира всички идентични записи като дубликати. А ако искате да запазите уникалните стойности в списъка си, тогава не можете да изтриете всички дублиращи се записи, трябва да изтриете само втория и всички следващи случаи.

    Така че нека да модифицираме нашата формула за дублиране на Excel, като използваме абсолютни и относителни препратки към клетките, където е подходящо:

    =IF(COUNTIF($A$2:$A2, $A2)>1, "Duplicate", "")

    Както можете да видите на следващата снимка на екрана, тази формула не идентифицира първата поява на " Ябълки " като дубликат:

    Как да откриете дубликати в Excel с отчитане на големината на буквите

    В ситуации, в които трябва да идентифицирате точни дубликати, включително текстовия корпус, използвайте тази обща формула за масиви (въвежда се с натискане на Ctrl + Shift + Enter ):

    IF( SUM(( --EXACT( обхват , най-горната _клетка )))<=1, "", "Duplicate")

    В основата на формулата е функцията EXACT, която сравнява точно целевата клетка с всяка клетка от посочения диапазон. Резултатът от тази операция е масив от TRUE (съвпадение) и FALSE (несъвпадение), който се превръща в масив от 1 и 0 с помощта на едносричния оператор (--). След това функцията SUM сумира числата и ако сумата е по-голяма от 1, функцията IF съобщава за"Дублиране".

    За нашия примерен набор от данни формулата е следната:

    =IF(SUM((--EXACT($A$2:$A$8,A2)))<=1,"", "Дубликат")

    Както е показано на скрийншота по-долу, тя третира малките и големите букви като различни символи (APPLES не се идентифицира като дубликат):

    Съвет. Ако използвате електронни таблици на Google, може да ви бъде полезна следната статия: Как да откривате и премахвате дубликати в Google Sheets.

    Как да намерите дублиращи се редове в Excel

    Ако целта ви е да дедуцирате таблица, състояща се от няколко колони, тогава ви е необходима формула, която може да проверява всяка колона и да идентифицира само абсолютни дублиращи се редове , т.е. редове, които имат напълно равни стойности във всички колони.

    Нека разгледаме следния пример. Да предположим, че имате номера на поръчки в колона A, дати в колона B и поръчани артикули в колона C и искате да намерите дублиращи се редове с един и същ номер на поръчка, дата и артикул. За тази цел ще създадем формула за дублиране, базирана на функцията COUNTIFS, която позволява проверка на няколко критерия едновременно:

    За търсене на дублиращи се редове с първо появяване , използвайте тази формула:

    =IF(COUNTIFS($A$2:$A$8,$A2,$B$2:$B$8,$B2,$C$2:$C$8,$C2)>1, "Duplicate row", "")

    Следващата снимка показва, че формулата наистина открива само редове, които имат идентични стойности във всички 3 колони. Например ред 8 има същия номер на поръчката и дата като редове 2 и 5, но различен елемент в колона C, поради което не е отбелязан като дублиращ се ред:

    За да покажете дублиращи се редове без 1-ва поява , направете малка корекция в горната формула:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$B$2:$B2,$B2,$C$2:$C2,$C2,)>1, "Дублиращ ред", "")

    Как да преброите дубликатите в Excel

    Ако искате да знаете точния брой на идентичните записи в листа на Excel, използвайте една от следните формули за преброяване на дубликатите.

    Преброяване на случаите на всеки дублиран запис поотделно

    Когато имате колона с дублиращи се стойности, често ви е необходимо да знаете колко дублирания има за всяка от тези стойности.

    За да разберете колко пъти този или онзи запис се среща в работния лист на Excel, използвайте обикновена формула COUNTIF, където A2 е първият, а A8 - последният елемент от списъка:

    =COUNTIF($A$2:$A$8, $A2)

    Както е показано на следната снимка, формулата преброява срещите на всеки елемент: " Ябълки " се среща 3 пъти, " Зелени банани " - 2 пъти, " Банани " и " Портокали " само веднъж.

    Ако искате да определите първото, второто, третото и т.н. появяване на всеки елемент, използвайте следната формула:

    =COUNTIF($A$2:$A2, $A2)

    По подобен начин можете да преброите случаи на дублирани редове Единствената разлика е, че ще трябва да използвате функцията COUNTIFS вместо COUNTIF. Например:

    =COUNTIFS($A$2:$A$8, $A2, $B$2:$B$8, $B2)

    След като дублиращите се стойности бъдат преброени, можете да скриете уникалните стойности и да видите само дублиращите се стойности, или обратното. За да направите това, приложете автоматичния филтър на Excel, както е показано в следния пример: Как да филтрираме дублиращите се стойности в Excel.

    Преброяване на общия брой дублирания в колона(и)

    Най-лесният начин да преброите дублиращите се стойности в дадена колона е да използвате някоя от формулите, които използвахме за идентифициране на дублиращи се стойности в Excel (със или без първи появявания). След това можете да преброите дублиращите се стойности, като използвате следната формула COUNTIF:

    =COUNTIF(обхват, "дублиране")

    Къде " дублиране на " е етикетът, който сте използвали във формулата за откриване на дубликати.

    В този пример дублиращата ни формула има следната форма:

    =COUNTIF(B2:B8, "duplicate")

    Друг начин за преброяване на дублиращи се стойности в Excel чрез използване на по-сложна формула за масиви. Предимството на този подход е, че не изисква помощна колона:

    =ROWS($A$2:$A$8)-SUM(IF( COUNTIF($A$2:$A$8,$A$2:$A$8)=1,1,0))

    Тъй като това е формула за масив, не забравяйте да натиснете Ctrl + Shift + Enter, за да я завършите. Също така имайте предвид, че тази формула отчита всички дублиращи се записи, включително първите появявания :

    За да намерите общ брой дублиращи се редове , вградете функцията COUNTIFS вместо COUNTIF в горната формула и посочете всички колони, които искате да проверите за дублирания. Например, за да преброите дублираните редове въз основа на колони A и B, въведете следната формула в листа на Excel:

    =ROWS($A$2:$A$8)-SUM(IF( COUNTIFS($A$2:$A$8,$A$2:$A$8, $B$2:$B$8,$B$2:$B$8)=1,1,0))

    Как да филтрирате дубликати в Excel

    За по-лесен анализ на данните може да искате да филтрирате данните си, за да се показват само дубликати. В други ситуации може да ви е необходимо обратното - да скриете дубликатите и да видите уникалните записи. По-долу ще намерите решения и за двата сценария.

    Как да показвате и скривате дубликати в Excel

    Ако искате да видите всички дубликати от пръв поглед, използвайте една от формулите за намиране на дубликати в Excel, която отговаря по-добре на нуждите ви. След това изберете таблицата си, преминете към Данни и щракнете върху Филтър Алтернативно можете да щракнете върху Сортиране и филтриране > Филтър на Начало в раздела Редактиране на група.

    Съвет: За да активирате филтрирането автоматично, преобразувайте данните си в напълно функционална таблица на Excel. Просто изберете всички данни и натиснете клавишната комбинация Ctrl + T.

    След това щракнете върху стрелката в заглавието на Дублиране на колона и проверете " Дублиращ се ред " в полето показване на дубликати . Ако искате да филтрирате, т.е. скриване на дубликати , изберете " Уникален ", за да видите само уникални записи:

    Сега можете да сортирате дублиращите се редове по ключовата колона, за да ги групирате за по-лесен анализ. В този пример можем да сортираме дублиращите се редове по Номер на поръчката колона:

    Как да филтрирате дубликати по техните срещания

    Ако искате да покажете второто, третото или N-тото появяване на дублиращи се стойности, използвайте формулата за броене на дублиращи се стойности, която разгледахме по-рано:

    =COUNTIF($A$2:$A2, $A2)

    След това приложете филтриране към таблицата и изберете само появата(ите), която(ито) искате да видите. Например можете да филтрирате втората поява, както е показано на следващата снимка:

    За да покажете всички дублиращи се записи, т.е. случаи, по-големи от 1 , щракнете върху стрелката за филтриране в заглавието на Случаи (колоната с формулата), след което щракнете върху Брой филтри > По-голямо от .

    Изберете " е по-голям от " в първото поле, въведете 1 в полето до него и щракнете върху ОК бутон:

    По подобен начин можете да покажете 2-ро, 3-то и всички следващи дублирания. Просто въведете необходимия брой в полето до " е по-голям от ".

    Маркирайте, изберете, изчистете, изтрийте, копирайте или преместете дубликати

    След като сте филтрирали дубликатите, както е показано по-горе, имате различни възможности за справяне с тях.

    Как да изберете дубликати в Excel

    Избиране на дубликати, включително заглавия на колони , филтрирайте ги, щракнете върху всяка филтрирана клетка, за да я изберете, и след това натиснете Ctrl + A .

    Избиране на дублиращи се записи без заглавия на колони , изберете първата (горна лява) клетка и натиснете Ctrl + Shift + End, за да разширите избора до последната клетка.

    Съвет. В повечето случаи горните бързи клавиши работят добре и избират само филтрирани (видими) редове. В някои редки случаи, най-вече при много големи работни книги, могат да бъдат избрани както видими, така и невидими клетки. За да поправите това, първо използвайте един от горните бързи клавиши, а след това натиснете Alt + ;, за да изберете само видими клетки , като се игнорират скритите редове.

    Как да изчистите или премахнете дубликатите в Excel

    За изчистване на дубликати в Excel , изберете ги, щракнете с десния бутон на мишката и след това щракнете върху Ясно съдържание (или щракнете върху Clear бутон> Ясно съдържание на Начало в раздела Редактиране на Това ще изтрие само съдържанието на клетките и в резултат ще имате празни клетки. Избиране на филтрираните дублирани клетки и натискане на бутона Изтриване на ще има същия ефект.

    За премахване на цели дублиращи се редове , филтриране на дубликати, изберете редовете, като плъзнете мишката по заглавията на редовете, щракнете с десния бутон на мишката върху избора и след това изберете Изтриване на ред от контекстното меню.

    Как да подчертаете дубликатите в Excel

    За да маркирате дублираните стойности, изберете филтрираните дублирани стойности, щракнете върху Цвят на запълване бутон на Начало в раздела Шрифт и след това изберете избрания от вас цвят.

    Друг начин за подчертаване на дубликати в Excel е използването на вградено правило за условно форматиране на дубликати или създаването на потребителско правило, специално пригодено за вашия лист. Опитните потребители на Excel няма да имат проблем със създаването на такова правило въз основа на формулите, които използвахме за проверка на дубликати в Excel. Ако все още не се чувствате много комфортно с формулите или правилата на Excel, ще намерите подробнитестъпки в този урок: Как да подчертаете дубликатите в Excel.

    Как да копирате или преместите дубликати в друг лист

    За копие дубликати, маркирайте ги, натиснете Ctrl + C , след което отворете друг лист (нов или съществуващ), маркирайте горната лява клетка на диапазона, в който искате да копирате дубликатите, и натиснете Ctrl + V, за да ги поставите.

    За преместване дублиране на друг лист, изпълнете същите стъпки с единствената разлика, че натискате Ctrl + X (изрязване) вместо Ctrl + C (копиране).

    Премахване на дубликати - бърз и ефективен начин за откриване на дубликати в Excel

    Сега, след като знаете как да използвате дублиращи се формули в Excel, нека ви демонстрирам друг бърз, ефективен и свободен от формули начин - Duplicate Remover for Excel.

    Този универсален инструмент може да търси дублиращи се или уникални стойности в една колона или да сравнява две колони. Той може да открива, избира и подчертава дублиращи се записи или цели дублиращи се редове, да премахва намерените дублиращи се записи, да ги копира или премества в друг лист. Мисля, че един пример за практическо използване струва много думи, така че нека преминем към него.

    Как да намерите дублиращи се редове в Excel в 2 бързи стъпки

    За да тествам възможностите на нашата добавка за премахване на дубликати, създадох таблица с няколкостотин реда, която изглежда по следния начин:

    Както виждате, таблицата има няколко колони. Първите три колони съдържат най-подходящата информация, така че ще търсим дублиращи се редове само въз основа на данните в колони A - C. За да намерите дублиращи се записи в тези колони, просто направете следното:

    1. Изберете която и да е клетка в таблицата и щракнете върху Таблица Dedupe След като инсталирате нашия Ultimate Suite за Excel, ще го намерите в лентата на Excel. Данни от Ablebits в раздела Dedupe група.

    2. Интелигентната добавка ще вземе цялата таблица и ще ви помоли да посочите следните две неща:
      • Изберете колони за проверка за дубликати (в този пример това са Номер на поръчката, Дата на поръчката и Артикул колони).
      • Изберете действие, което да се извърши при дубликати Тъй като целта ни е да идентифицираме дублиращи се редове, избрах Добавяне на колона за състоянието

      Освен добавянето на колона за състоянието, имате на разположение и редица други опции:

      • Изтриване на дубликати
      • Оцветяване (подчертаване) на дубликати
      • Избиране на дубликати
      • Копиране на дубликати в нов работен лист
      • Преместване на дубликати в нов работен лист

      Щракнете върху ОК и изчакайте няколко секунди. Готово!

    Както можете да видите на долната снимка, всички редове, които имат идентични стойности в първите 3 колони, са локализирани (първите случаи не са идентифицирани като дубликати).

    Ако искате повече възможности за дедуциране на работните листове, използвайте Съветник за премахване на дубликати която може да открива дубликати с или без първи появявания, както и уникални стойности. Подробните стъпки следват по-долу.

    Съветник за премахване на дубликати - повече възможности за търсене на дубликати в Excel

    В зависимост от конкретния лист, с който работите, може да искате или да не искате да третирате първите случаи на идентични записи като дубликати. Едно от възможните решения е да използвате различна формула за всеки сценарий, както обсъдихме в Как да идентифицираме дубликати в Excel. Ако търсите бърз, точен и свободен от формули метод, опитайте Съветник за премахване на дубликати :

    1. Изберете която и да е клетка в таблицата и щракнете върху Премахване на дубликати на бутона Данни от Ablebits Съветникът ще се стартира и цялата таблица ще бъде избрана.

    2. На следващата стъпка ще ви бъдат представени 4 опции за проверка на дубликатите в листа на Excel:
      • Дубликати без първо появяване
      • Дубликати с първо появяване
      • Уникални стойности
      • Уникални стойности и първи дублиращи се случаи

      За този пример ще изберем втория вариант, т.е. Дубликати + първи повторения :

    3. Сега изберете колоните, в които искате да проверите дублиранията. Както в предишния пример, ние избираме първите 3 колони:

    4. Накрая изберете действието, което искате да извършите върху дубликатите. Както и при инструмента за таблицата за дублиране, съветникът за премахване на дубликати може да идентифициране на , изберете , подчертайте , изтриване на , копие или преместване дубликати.

      Тъй като целта на този урок е да демонстрира различни начини за идентифициране на дубликати в Excel, нека отбележим съответната опция и щракнем върху Завършете :

    Само за част от секундата съветникът за премахване на дубликати проверява стотици редове и дава следния резултат:

    Без формули, без стрес, без грешки - винаги бързи и безупречни резултати :)

    Ако се интересувате да изпробвате тези инструменти за намиране на дубликати в листовете на Excel, можете да изтеглите версията за оценка по-долу. Вашите отзиви в коментарите ще бъдат високо оценени!

    Налични изтегляния

    Идентифициране на дубликати - примери за формули (.xlsx файл)

    Ultimate Suite - пробна версия (.exe файл)

    Майкъл Браун е отдаден технологичен ентусиаст със страст към опростяване на сложни процеси с помощта на софтуерни инструменти. С повече от десетилетие опит в технологичната индустрия, той е усъвършенствал уменията си в Microsoft Excel и Outlook, както и в Google Sheets и Docs. Блогът на Майкъл е посветен на споделянето на неговите знания и опит с други, предоставяйки лесни за следване съвети и уроци за подобряване на продуктивността и ефективността. Независимо дали сте опитен професионалист или начинаещ, блогът на Michael предлага ценни прозрения и практически съвети за извличане на максимума от тези основни софтуерни инструменти.