Порівняння двох стовпців і видалення дублікатів в Excel

  • Поділитися Цим
Michael Brown

На прочитання цієї статті у Вас піде близько 10 хвилин, а в наступні 5 хвилин (або навіть швидше, якщо Ви оберете 2-е рішення, описане в статті) Ви з легкістю порівняєте два стовпчики Excel на наявність дублікатів і видалите або виділите знайдені дублі. Отже, зворотний відлік розпочато!

Excel - це дуже потужна і дійсно крута програма для створення і обробки великих масивів даних. Тепер, коли у вас є багато книг з пулом даних, або, можливо, просто одна величезна таблиця, ви можете захотіти порівняти 2 стовпці на наявність дублікатів, а потім щось зробити зі знайденими записами, наприклад, видалити повторювані рядки, зафарбувати дублікати або очистити вміст повторюваних комірок. Цими двома стовпчиками можуть бутирозташовані в одній таблиці, суміжно або несуміжно, або вони можуть знаходитися на 2 різних робочих аркушах або навіть робочих книгах.

Скажімо, у вас є 2 стовпчики з іменами людей - 5 імен у стовпчику А і 3 імена у стовпчику Б, і ви хочете порівняти дані між цими двома стовпчиками, щоб знайти дублікати. Як ви розумієте, це фіктивні дані лише для короткого прикладу; в реальних робочих таблицях зазвичай є тисячі і десятки тисяч записів.

Варіант А Пояснення: Обидві колонки розташовані на одному аркуші, в одній таблиці: Колонка А і Колонка Б

Варіант Б Пояснення: Дві колонки розташовані на різних аркушах: Колонка А в аркуші 2 і Колонка А в аркуші 3

Вбудований інструмент "Видалити дублікати", доступний в Excel 2016, Excel 2013 і 2010, не може впоратися з цим сценарієм, оскільки він не може порівнювати дані між 2 стовпцями. Крім того, він може лише видаляти дублікати, ніяких інших варіантів, таких як виділення або фарбування, на жаль, не передбачено :-(.

Далі я опишу 2 можливих способи порівняння двох стовпців Excel, які дозволяють знайти і видалити дублікати записів:

    Порівняння 2 стовпців для пошуку дублікатів за допомогою формул Excel

    Варіант А: обидві колонки в одному списку

    1. У першу порожню комірку, в нашому прикладі це комірка С1, вводимо наступну формулу:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Унікальний", "Дублікат")

      У нашій формулі, A1 перша комірка першого стовпчика, яку ми хочемо використати для порівняння. $B$1 і $B$10000 це адреси першої та останньої комірки 2-го стовпчика, з якими потрібно порівняти. Зверніть увагу на абсолютне посилання на комірку - знаки долара ($), що стоять перед буквами стовпчика та номерами рядків. Я навмисно використовую абсолютне посилання, щоб при копіюванні формули адреси комірок залишалися незмінними.

      Якщо ви хочете знайти дублі в колонці B, поміняйте місцями назви колонок так, щоб формула виглядала наступним чином:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Унікальний", "Дублікат")

      Замість " Унікальний "/" Дублікат " можна писати власні мітки, наприклад, " Не знайдено "/" Знайдено ", або залишити тільки " Дублікат "В останньому випадку у Вас будуть порожні комірки поруч з комірками, для яких не було знайдено дублікатів, вважаю таке представлення більш зручним для аналізу даних.

    2. Тепер скопіюємо формулу в усі комірки колонка С до останнього рядка, що містить дані в стовпчику A. Для цього необхідно підвести курсор до правого нижнього кута комірки C1 і курсор зміниться на чорний хрестик, як показано на зображенні нижче:

      Натисніть ліву кнопку миші і, не відпускаючи її, перетягніть границю вниз, виділяючи всі комірки, в які потрібно скопіювати формулу. Коли всі потрібні комірки будуть виділені, відпустіть ліву кнопку миші:

      Порада: У великих таблицях швидше копіювати формулу за допомогою комбінацій клавіш. Клацніть по комірці C1 виділити його і натиснути Ctrl + C (для копіювання формули в буфер обміну), потім Ctrl + Shift + End (для виділення всіх непорожніх комірок у стовпчику С), і, нарешті, натиснути Ctrl + V (для вставки формули в усі виділені комірки).

    3. Чудово, всі комірки, що дублюються, позначені як "Дублікат":

    Варіант Б: дві колонки знаходяться на різних аркушах (робочих зошитах)

    1. У 1-у комірку 1-го порожнього стовпчика на Аркуші2 (стовпчик В у нашому випадку) вводимо формулу:

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Дублікат")

      Де Лист3 назва аркуша, на якому розташована 2-га колонка, та $1:$10000 адреси першої та останньої комірок цього 2-го стовпчика.

    2. Аналогічно до варіанту А.
    3. Маємо наступний результат:

    Натисніть, щоб завантажити робочий аркуш з наведеними вище прикладами та формулою для порівняння 2 колонок для пошуку дублікатів.

    Робота з виявленими дублікатами

    Чудово, ми знайшли записи в першому стовпчику (стовпчик А), які також існують у другому стовпчику (стовпчик Б). Тепер нам потрібно з ними щось зробити :)

    Переглядати всю таблицю і перевіряти дублікати вручну було б досить неефективно і зайняло б занадто багато часу. Існують набагато кращі способи.

    Відображати тільки рядки, що повторюються в колонці A

    Якщо у Ваших стовпцях немає заголовків, Вам необхідно їх додати. Для цього наведіть курсор на цифру, що позначає 1-й рядок і він зміниться на чорна стрілка як показано на скріншоті:

    Клацніть правою кнопкою миші по виділеному рядку і виберіть " Вставка " з контекстного меню:

    Дайте назви своїм колонкам, наприклад, " Ім'я та прізвище " і " Дублікат? "Потім переключіться на Дані вкладку та натисніть Фільтр :

    Після цього натисніть маленьку сіру стрілочку навпроти " Дублікат? ", щоб відкрити випадаючий список, зніміть прапорець з усіх пунктів цього списку, крім пункту "Дублювати", і натисніть кнопку ГАРАЗД. :

    Все, тепер ви бачите тільки ті клітинки стовпчика А, які мають значення, що дублюються в стовпчику В. У нашому тестовому аркуші таких клітинок всього три, як ви розумієте, в реальних аркушах їх, швидше за все, буде більше, набагато більше:

    Для того, щоб знову відобразити всі рядки колонки А, натисніть на символ фільтра в колонці В, який тепер має вигляд воронки з маленькою стрілкою і поставте галочку "Виділити все". Крім того, ви можете зробити те ж саме за допомогою Вкладка "Дані -> -> -> -> -> Вибрати & Фільтр -> -> -> -> -> Чисто як показано на скріншоті:

    Розфарбувати або виділити знайдені дублікати

    Якщо " Дублікат " недостатньо для Ваших цілей і Ви хочете позначити повторювані комірки кольором шрифту або кольором заливки, або якимось іншим чином...

    Потім відфільтруйте дублікати, як описано вище, виділіть всі відфільтровані комірки і натисніть Ctrl + F1, щоб відкрити вікно Формат комірок Для прикладу змінимо колір фону дубльованих рядків на яскраво-жовтий. Звичайно, змінити колір фону комірок можна за допомогою кнопки Колір заливки опція на Головна сторінка але перевага діалогового вікна Формат клітинок полягає в тому, що воно дозволяє вносити всі зміни форматування за один раз:

    Тепер ви точно не пропустите жодної продубльованої комірки:

    Видалити дублікати з першої колонки

    Відфільтруйте таблицю так, щоб відобразилися тільки клітинки з повторюваними значеннями, і виберіть всі ці клітинки.

    Якщо 2 стовпці, які ви порівнюєте, знаходяться на різних аркушах тобто в окремих таблицях клацніть правою кнопкою миші по виділеному діапазону і виберіть " Видалити рядок " з контекстного меню:

    Натисніть ГАРАЗД. коли Excel попросить підтвердити, що ви дійсно хочете "Видалити весь рядок аркуша", а потім очистить фільтр. Як бачите, залишаться тільки рядки з унікальними значеннями:

    Якщо 2 колонки розташовані на одному аркуші поруч один з одним (суміжні) або не торкаються один одного (несуміжні), то видалення дублікатів є дещо складнішим. Ми не можемо видалити цілі рядки, які містять повторювані значення, оскільки це призведе до видалення відповідних комірок і в 2-му стовпчику. Отже, для того, щоб залишити в стовпчику А тільки унікальні записи, необхідно зробити наступне:

    1. Відфільтруйте таблицю так, щоб відобразилися тільки комірки, що повторюються, і виділіть всі ці комірки. Клацніть правою кнопкою миші по виділенню і виберіть " Зрозумілий зміст ":
    2. Очистити фільтр.
    3. Виділіть усі клітинки стовпчика A, починаючи з клітинки A1 і до останньої клітинки, яка містить дані.
    4. Перейдіть на сторінку Дані вкладку та натисніть Сортування від А до Я У діалоговому вікні, що відкрилося, виберіть " Продовжити поточний вибір " і натисніть Сортування :
    5. Видаліть стовпчик з формулою, оскільки він Вам більше не потрібен, там вже залишилися тільки "Унікальні".
    6. Це все, тепер колонка А містить тільки унікальні дані, яких немає в колонці Б :

    Як бачите, видалити дублікати між двома стовпчиками Excel за допомогою формул не так вже й складно. Хоча писати і копіювати формулу, застосовувати і очищати фільтр кожен раз, коли вам потрібно порівняти 2 стовпчики на ваших робочих аркушах, дуже трудомісткий і нудний процес. Інше рішення, яке я збираюся запропонувати вашій увазі, набагато простіше і займе лише малу частину часу, який ми витратили наперший спосіб. Думаю, ви знайдете більш приємні речі, на які можна витратити зекономлений час ;)

    Порівняння 2 стовпців Excel на наявність дублікатів за допомогою візуального майстра

    А зараз я покажу вам, як порівняти два стовпці на наявність дублікатів за допомогою наших інструментів Dedupe для Excel.

    1. Відкрийте робочий аркуш (або робочі аркуші), де розташовані стовпці, які ви хочете порівняти.
    2. Виділіть будь-яку комірку в 1-му стовпчику, перейдіть на вкладку Дані про абіти та натисніть на вкладку Порівняльні таблиці кнопку:
    3. На крок 1 майстра, ви побачите, що ваша перша колонка вже вибрана, тому просто натисніть Далі .

      Примітка: якщо потрібно порівняти не 2 стовпчики, а 2 таблиці, то на цьому кроці потрібно виділити всю першу таблицю.

    4. На крок 2 майстра вибираємо 2-й стовпець, з яким потрібно порівняти. Вибираємо Лист2 У більшості випадків інтелектуальний майстер вибирає 2-й стовпець автоматично, якщо з якихось причин цього не відбувається, виберіть цільовий стовпець за допомогою миші. Якщо ви порівнюєте цілі таблиці, виберіть всю 2-у таблицю.
    5. Виберіть, щоб знайти Повторювані значення :
    6. Виберіть пару стовпчиків, які ви хочете порівняти:

      Порада: якщо ви порівнюєте таблиці, ви можете вибрати кілька пар стовпців для порівняння, наприклад, ім'я та прізвище. Більш детально див. статтю Як видалити дублікати з двох таблиць Excel.

    7. І, нарешті, ви повинні вирішити, що ви хочете зробити зі знайденими дублікатами. Ви можете видалити повторювані записи, перемістити або скопіювати їх на інший аркуш, додати стовпець статусу (результат буде схожий на наше перше рішення з формулами Excel), виділити дублікати або просто виділити всі комірки з повторюваними значеннями:

      Порада. Не вибирайте видалення дублікатів, особливо якщо ви використовуєте інструмент вперше. Замість цього виберіть переміщення дублікатів на інший аркуш Це видалить дублікати з першої таблиці, але дасть можливість переглянути список записів, розпізнаних як дублікати. При порівнянні за кількома співпадаючими стовпчиками у великих таблицях може статися так, що Ви випадково забули виділити ключовий стовпець з унікальними даними, а переміщення дублікатів дозволить запобігти безповоротній втраті даних.

    8. Натисніть Фініш Ми отримали гарну, чисту таблицю без дублікатів:

    Згадайте попереднє рішення і відчуйте різницю :) Дійсно швидко і легко виводити робочі таблиці за допомогою Порівняйте дві таблиці Насправді, це займе у вас менше часу, ніж ви витратили на читання цієї статті.

    Наразі, Порівняльні таблиці є частиною нашого Ultimate Suite for Excel, колекції з понад 70 професійних інструментів, які охоплюють понад 300 варіантів використання. Час спливає, тож поспішайте завантажити його прямо зараз!

    Якщо у Вас виникли питання або щось залишилося незрозумілим, будь ласка, напишіть мені в коментарях, і я з радістю розповім детальніше. Дякую за увагу!

    Майкл Браун — відданий ентузіаст технологій із пристрастю до спрощення складних процесів за допомогою програмних засобів. Маючи понад десятирічний досвід роботи в технологічній індустрії, він відточив свої навички роботи з Microsoft Excel і Outlook, а також із Google Таблицями та Документами. Блог Майкла присвячений тому, щоб поділитися своїми знаннями та досвідом з іншими, надаючи прості поради та навчальні посібники для підвищення продуктивності та ефективності. Незалежно від того, чи є ви досвідченим професіоналом чи початківцем, блог Майкла пропонує цінну інформацію та практичні поради щодо отримання максимальної користі від цих основних програмних інструментів.