Оглавление
В учебнике рассказывается о том, как искать дубликаты в Excel. Вы узнаете несколько формул для определения дублирующихся значений или поиска дублирующихся строк с первыми вхождениями или без них. Вы также узнаете, как подсчитать экземпляры каждой дублирующейся записи по отдельности и найти общее количество дубликатов в столбце, как отфильтровать дубликаты и многое другое.
При работе с большой таблицей Excel или при объединении нескольких маленьких таблиц в одну большую, вы можете обнаружить в ней множество дублирующихся строк. В одном из наших предыдущих уроков мы обсуждали различные способы сравнения двух таблиц или столбцов на предмет дубликатов.
И сегодня я хочу поделиться несколькими быстрыми и эффективными методами выявления дубликатов в одном списке. Эти решения работают во всех версиях Excel 365, Excel 2021, Excel 2019, Excel 2016, Excel 2013 и ниже.
Как выявить дубликаты в Excel
Самым простым способом обнаружения дубликатов в Excel является использование функции COUNTIF. В зависимости от того, хотите ли вы найти дубликаты значений с первыми вхождениями или без них, формула будет немного отличаться, как показано в следующих примерах.
Как найти дубликаты записей, включая 1-е вхождения
Предположим, у вас есть список элементов в столбце A, которые вы хотите проверить на наличие дубликатов. Это могут быть счета-фактуры, идентификаторы товаров, имена или любые другие данные.
Вот формула для поиска дубликатов в Excel, включая первые вхождения (где A2 - самая верхняя ячейка):
=COUNTIF(A:A, A2)>1
Введите приведенную выше формулу в B2, затем выделите B2 и перетащите ручку заливки, чтобы скопировать формулу вниз в другие ячейки:
Как вы можете видеть на скриншоте выше, формула возвращает TRUE для дубликатов и FALSE для уникальных значений.
Примечание. Если вам нужно найти дубликаты в файле диапазон ячеек например, для поиска дубликатов в ячейках A2:A8 используйте эту формулу:
=COUNTIF( $A$2:$A$8 , A2)>1
Чтобы дублирующая формула возвращала что-то более значимое, чем булевы значения TRUE и FALSE, заключите ее в функцию IF и введите любые метки для дублирующих и уникальных значений:
=IF(COUNTIF($A$2:$A$8, $A2)>1, "Дубликат", "Уникальный")
Если вы хотите, чтобы формула Excel находила только дубликаты, замените "Unique" на пустую строку ("") следующим образом:
=IF(COUNTIF($A$2:$A$8, $A2)>1, "Дубликат", "")
Формула будет возвращать "Дубликаты" для дубликатов записей и пустую ячейку для уникальных записей:
Как искать дубликаты в Excel без 1-го вхождения
Если вы планируете фильтровать или удалять дубликаты после их обнаружения, использование приведенной выше формулы небезопасно, поскольку она помечает все одинаковые записи как дубликаты. А если вы хотите сохранить уникальные значения в вашем списке, то вы не можете удалить все дублирующие записи, вам нужно удалить только 2-й и все последующие экземпляры.
Итак, давайте изменим нашу дублирующую формулу Excel, используя абсолютные и относительные ссылки на ячейки там, где это необходимо:
=IF(COUNTIF($A$2:$A2, $A2)>1, "Дубликат", "")
Как вы можете видеть на следующем снимке экрана, эта формула не идентифицирует первое вхождение " Яблоки " как дубликат:
Как найти дубликаты с учетом регистра в Excel
В ситуациях, когда вам нужно определить точные дубликаты, включая текстовый регистр, используйте эту общую формулу массива (вводится нажатием Ctrl + Shift + Enter ):
IF( SUM(( --EXACT( ассортимент , самая верхняя _ячейка )))<=1, "", "Дубликат")В основе формулы лежит функция EXACT для точного сравнения целевой ячейки с каждой ячейкой в указанном диапазоне. Результатом этой операции является массив TRUE (совпадение) и FALSE (не совпадение), который принудительно преобразуется в массив 1 и 0 с помощью унарного оператора (--). После этого функция SUM складывает числа, и если сумма больше 1, то функция IF сообщает о"Дубликат".
Для нашего набора данных формула выглядит следующим образом:
=IF(SUM((--EXACT($A$2:$A$8,A2)))<=1,"", "Дубликат")
Как показано на скриншоте ниже, он рассматривает строчные и прописные буквы как разные символы (APPLES не идентифицируется как дубликат):
Совет. Если вы используете электронные таблицы Google, вам может быть полезна следующая статья: Как найти и удалить дубликаты в Google Sheets.
Как найти дублирующиеся строки в Excel
Если ваша цель - дедуцировать таблицу, состоящую из нескольких столбцов, то вам нужна формула, которая может проверить каждый столбец и определить только абсолютное дублирование строк т.е. строки, которые имеют полностью одинаковые значения во всех столбцах.
Предположим, у вас есть номера заказов в столбце A, даты в столбце B и заказанные товары в столбце C, и вы хотите найти дубликаты строк с одинаковыми номерами заказов, датами и товарами. Для этого мы создадим формулу дублирования на основе функции COUNTIFS, которая позволяет проверять несколько критериев одновременно:
На поиск дубликатов строк с 1-м вхождением , используйте эту формулу:
=IF(COUNTIFS($A$2:$A$8,$A2,$B$2:$B$8,$B2,$C$2:$C$8,$C2)>1, "Дублирующая строка", "")
Следующий снимок экрана демонстрирует, что формула действительно находит только те строки, которые имеют одинаковые значения во всех трех столбцах. Например, строка 8 имеет тот же номер заказа и дату, что и строки 2 и 5, но другой элемент в столбце C, и поэтому она не помечена как дублирующая строка:
Показать дублирование строк без первого вхождения Внесите небольшую поправку в приведенную выше формулу:
=IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$B$2:$B2,$B2,$C$2:$C2,$C2,)>1, "Дублирующая строка", "")
Как подсчитать дубликаты в Excel
Если вы хотите узнать точное количество одинаковых записей в вашем листе Excel, используйте одну из следующих формул для подсчета дубликатов.
Подсчитайте экземпляры каждой дублирующей записи по отдельности
Когда у вас есть столбец с дублирующимися значениями, вам часто может понадобиться узнать, сколько дубликатов имеется для каждого из этих значений.
Чтобы узнать, сколько раз та или иная запись встречается в рабочем листе Excel, используйте простую формулу COUNTIF, где A2 - первый, а A8 - последний элемент списка:
=COUNTIF($A$2:$A$8, $A2)
Как показано на следующем снимке экрана, формула подсчитывает количество вхождений каждого элемента: " Яблоки " встречается 3 раза, " Зеленые бананы " - 2 раза, " Бананы " и " Апельсины " только один раз.
Если вы хотите определить 1-е, 2-е, 3-е и т.д. вхождения каждого элемента, используйте следующую формулу:
=COUNTIF($A$2:$A2, $A2)
Аналогичным образом можно подсчитать случаи дублированные строки Единственное отличие заключается в том, что вам нужно будет использовать функцию COUNTIFS вместо COUNTIF. Например:
=COUNTIFS($A$2:$A$8, $A2, $B$2:$B$8, $B2)
После подсчета дубликатов вы можете скрыть уникальные значения и просмотреть только дубликаты, или наоборот. Для этого примените автофильтр Excel, как показано в следующем примере: Как отфильтровать дубликаты в Excel.
Подсчитать общее количество дубликатов в столбце (столбцах)
Самый простой способ подсчета дубликатов в столбце - использовать любую из формул, которые мы использовали для выявления дубликатов в Excel (с первыми вхождениями или без них). Затем вы можете подсчитать дубликаты значений с помощью следующей формулы COUNTIF:
=COUNTIF(диапазон, "дубликат")
Где " дубликат " - это метка, которую вы использовали в формуле для поиска дубликатов.
В данном примере наша дублирующая формула имеет следующий вид:
=COUNTIF(B2:B8, "дубликат")
Другой способ подсчета дубликатов значений в Excel - использование более сложной формулы массива. Преимущество этого подхода в том, что он не требует вспомогательного столбца:
=ROWS($A$2:$A$8)-SUM(IF( COUNTIF($A$2:$A$8,$A$2:$A$8)=1,1,0))
Поскольку это формула массива, не забудьте нажать Ctrl + Shift + Enter для ее завершения. Также имейте в виду, что эта формула подсчитывает все дубликаты записей, включая первые случаи :
Чтобы найти общее количество дубликатов строк Вставьте функцию COUNTIFS вместо COUNTIF в приведенную выше формулу и укажите все столбцы, которые вы хотите проверить на наличие дубликатов. Например, чтобы подсчитать дубликаты строк на основе столбцов A и B, введите в лист Excel следующую формулу:
=ROWS($A$2:$A$8)-SUM(IF( COUNTIFS($A$2:$A$8,$A$2:$A$8, $B$2:$B$8,$B$2:$B$8)=1,1,0))
Как отфильтровать дубликаты в Excel
Для упрощения анализа данных вы можете захотеть отфильтровать данные, чтобы отображать только дубликаты. В других ситуациях вам может понадобиться обратное - скрыть дубликаты и просмотреть уникальные записи. Ниже вы найдете решения для обоих сценариев.
Как показывать и скрывать дубликаты в Excel
Если вы хотите сразу увидеть все дубликаты, используйте одну из формул для поиска дубликатов в Excel, которая больше подходит для ваших целей. Затем выберите таблицу, переключитесь в меню Данные вкладку и нажмите кнопку Фильтр В качестве альтернативы вы можете нажать кнопку Сортировка и фильтр > Фильтр на Главная вкладка в Редактирование группа.
Совет. Чтобы фильтрация включалась автоматически, преобразуйте данные в полнофункциональную таблицу Excel. Просто выделите все данные и нажмите сочетание клавиш Ctrl + T.
После этого нажмите на стрелку в заголовке Дубликат столбец и проверьте " Дублирование строки " поле для показывать дубликаты Если вы хотите отфильтровать, т.е. скрывать дубликаты , выберите " Уникальный " для просмотра только уникальных записей:
И теперь вы можете отсортировать дубликаты по ключевому столбцу, чтобы сгруппировать их для более удобного анализа. В этом примере мы можем отсортировать дубликаты по столбцу Номер заказа колонна:
Как отфильтровать дубликаты по их встречаемости
Если вы хотите показать 2-е, 3-е или N-ое количество дубликатов значений, используйте формулу для подсчета дубликатов, которую мы обсуждали ранее:
=COUNTIF($A$2:$A2, $A2)
Затем примените фильтрацию к вашей таблице и выберите только те вхождения, которые вы хотите просмотреть. Например, вы можете отфильтровать 2-е вхождения, как показано на следующем снимке экрана:
Чтобы отобразить все дубликаты записей, т.е. случаев больше 1 , нажмите стрелку фильтрации в заголовке окна Происшествия столбец (столбец с формулой), а затем нажмите кнопку Номерные фильтры > Больше, чем .
Выбрать " больше, чем " в первом поле, введите 1 в поле рядом с ним и нажмите кнопку OK кнопка:
Аналогичным образом можно показать 2-е, 3-е и все последующие дубликаты. Просто введите нужное число в поле рядом с " больше, чем ".
Выделение, выбор, очистка, удаление, копирование или перемещение дубликатов
После того как вы отфильтровали дубликаты, как показано выше, у вас есть несколько вариантов, как с ними поступить.
Как выбрать дубликаты в Excel
Чтобы выбрать дубликаты, включая заголовки столбцов Отфильтруйте их, щелкните на любой отфильтрованной ячейке, чтобы выделить ее, а затем нажмите Ctrl + A .
Чтобы выбрать дубликаты записей без заголовков столбцов , выделите первую (левую верхнюю) ячейку и нажмите Ctrl + Shift + End, чтобы расширить выделение до последней ячейки.
Совет. В большинстве случаев вышеуказанные сочетания клавиш работают хорошо и выбирают только отфильтрованные (видимые) строки. В некоторых редких случаях, в основном в очень больших рабочих книгах, могут быть выбраны как видимые, так и невидимые ячейки. Чтобы исправить это, сначала используйте одно из вышеуказанных сочетаний клавиш, а затем нажмите Alt + ;, чтобы выбрать только видимые ячейки , игнорируя скрытые строки.
Как очистить или удалить дубликаты в Excel
На удаление дубликатов в Excel выберите их, щелкните правой кнопкой мыши, а затем щелкните Чистое содержимое (или нажмите кнопку Очистить кнопка> Чистое содержимое на Главная во вкладке Редактирование Это приведет к удалению только содержимого ячеек, и в результате вы получите пустые ячейки. Выделив отфильтрованные дубликаты ячеек и нажав клавишу Удалить будет иметь тот же эффект.
На удалить все дубликаты строк Чтобы отфильтровать дубликаты, выделите строки, перетащив мышь по заголовкам строк, щелкните выделение правой кнопкой мыши, а затем выберите пункт Удалить строку из контекстного меню.
Как выделить дубликаты в Excel
Чтобы выделить дубликаты значений, выберите отфильтрованные дубликаты, нажмите кнопку Цвет заливки кнопка на Главная во вкладке Шрифт группу, а затем выберите нужный цвет.
Другим способом выделения дубликатов в Excel является использование встроенного правила условного форматирования для дубликатов или создание собственного правила специально для вашего листа. Опытным пользователям Excel не составит труда создать такое правило на основе формул, которые мы использовали для проверки дубликатов в Excel. Если вам пока не очень удобно работать с формулами и правилами Excel, вам поможет подробная информация о том, как создать правило для дубликатов в Excel.шаги в этом уроке: Как выделить дубликаты в Excel.
Как скопировать или переместить дубликаты на другой лист
На копия дубликаты, выделите их, нажмите Ctrl + C , затем откройте другой лист (новый или существующий), выделите левую верхнюю ячейку диапазона, куда нужно скопировать дубликаты, и нажмите Ctrl + V, чтобы вставить их.
На перейти дубликаты на другой лист, выполните те же действия с той лишь разницей, что вместо Ctrl + C (копирование) нажмите Ctrl + X (вырезать).
Duplicate Remover - быстрый и эффективный способ обнаружения дубликатов в Excel
Теперь, когда вы знаете, как использовать формулы дублирования в Excel, позвольте мне продемонстрировать вам другой быстрый, эффективный и свободный от формул способ - Duplicate Remover for Excel.
Этот универсальный инструмент позволяет искать дубликаты или уникальные значения в одном столбце или сравнивать два столбца. Он может находить, выбирать и выделять дубликаты записей или целые дубликаты строк, удалять найденные дубликаты, копировать или перемещать их на другой лист. Я думаю, что пример практического использования стоит многих слов, поэтому давайте перейдем к нему.
Как найти дубликаты строк в Excel за 2 быстрых шага
Чтобы проверить возможности нашей надстройки Duplicate Remover, я создал таблицу с несколькими сотнями строк, которая выглядит следующим образом:
Как вы видите, таблица имеет несколько столбцов. Первые 3 столбца содержат самую важную информацию, поэтому мы будем искать дубликаты строк, основываясь исключительно на данных в столбцах A - C. Чтобы найти дубликаты записей в этих столбцах, просто сделайте следующее:
- Выберите любую ячейку в таблице и нажмите кнопку Dedupe Table После установки нашего пакета Ultimate Suite для Excel вы найдете его на ленте Excel. Ablebits Data во вкладке Dedupe группа.
- Интеллектуальная надстройка возьмет всю таблицу и попросит вас указать следующие две вещи:
- Выберите столбцы для проверки дубликатов (в данном примере это Номер заказа, Дата заказа и Пункт колонны).
- Выберите действие, которое необходимо выполнить для дубликатов Поскольку нашей целью является выявление дубликатов строк, я выбрал параметр Добавьте колонку состояния
Помимо добавления колонки статуса, вам доступен целый ряд других опций:
- Удаление дубликатов
- Раскрасить (выделить) дубликаты
- Выберите дубликаты
- Копирование дубликатов на новый рабочий лист
- Перемещение дубликатов на новый рабочий лист
Нажмите кнопку OK и подождите несколько секунд. Готово!
Как вы можете видеть на скриншоте ниже, все строки, имеющие одинаковые значения в первых 3 столбцах, были найдены (первые вхождения не идентифицируются как дубликаты).
Если вам нужно больше возможностей для дедупликации рабочих листов, используйте функцию Мастер удаления дубликатов который может найти дубликаты с первым вхождением или без него, а также уникальные значения. Подробные шаги следуют ниже.
Мастер удаления дубликатов - больше возможностей для поиска дубликатов в Excel
В зависимости от конкретного листа, с которым вы работаете, вы можете или не хотите рассматривать первые экземпляры одинаковых записей как дубликаты. Одним из возможных решений является использование отдельной формулы для каждого сценария, как мы обсуждали в статье Как определить дубликаты в Excel. Если вы ищете быстрый, точный и не требующий формул метод, попробуйте Мастер удаления дубликатов :
- Выберите любую ячейку в таблице и нажмите кнопку Удаление дубликатов кнопка на Ablebits Data Запустится мастер, и вся таблица будет выбрана.
- На следующем шаге вам будет предложено 4 варианта проверки дубликатов в листе Excel:
- Дубликаты без первого вхождения
- Дубликаты с 1-м вхождением
- Уникальные значения
- Уникальные значения и 1-е дублирующие вхождения
Для данного примера выберем второй вариант, т.е. Дубликаты + 1-е вхождения :
- Теперь выберите столбцы, в которых вы хотите проверить дубликаты. Как и в предыдущем примере, мы выбираем первые 3 столбца:
- Наконец, выберите действие, которое вы хотите выполнить для дубликатов. Как и в случае с инструментом Dedupe Table, мастер Duplicate Remover может определить , выберите , выделить , удалить , копия или перейти дубликаты.
Поскольку целью данного учебника является демонстрация различных способов выявления дубликатов в Excel, давайте отметим соответствующую опцию и нажмем кнопку Отделка :
Мастеру удаления дубликатов требуется всего лишь доля секунды, чтобы проверить сотни строк и выдать следующий результат:
Никаких формул, никакого стресса, никаких ошибок - всегда быстрый и безупречный результат :)
Если вам интересно попробовать эти инструменты для поиска дубликатов в ваших листах Excel, вы можете скачать ознакомительную версию ниже. Ваши отзывы в комментариях будут высоко оценены!
Доступные загрузки
Выявление дубликатов - примеры формул (файл.xlsx)
Ultimate Suite - пробная версия (файл .exe)